杰力皓博 – 安全无U

MicroThinker 微思想家的微调过程

发表评论 / ChatGPT, GPT, OpenAI, 信息安全文章 / chatGPT / 2025年1月2日

0. 简述现在的AI研究大部分都在专注于提升AI的推理能力，这里我们微调了一个更小的1B实验模型 Micro […]

MicroThinker 微思想家的微调过程 Read More »

chatGPT

将 LLMs 精调至 1.58 比特：使极端量化变简单

发表评论 / AI, LLM, LLMS / chatGPT, LLM, OpenAI API / 2024年12月22日

中文翻译: Zipxuan 本文也提供英文版本 English。随着大语言模型（LLMs

将 LLMs 精调至 1.58 比特：使极端量化变简单 Read More »

chatGPT, LLM, OpenAI API

python 任何有效的标识符作为变量名或函数名，包括中文字符

发表评论 / AI, AI 新闻 / AI / 2024年12月14日

作为一个C语言开发者，第一次知道 python 还能支持中文的参数和函数名，还要啥中文编译系统 User: 帮

python 任何有效的标识符作为变量名或函数名，包括中文字符 Read More »

使用GPU内存和CPU内存装载大模型

发表评论 / AI, AI 新闻, LLM, LLMS / met-llama / 2024年12月5日

这里测试的是开源模型是 meta-llama/Llama-3.1-405B-Instruct，属于开源模型里面

使用GPU内存和CPU内存装载大模型 Read More »

met-llama

科学 PDF 文档翻译及双语对照工具

发表评论 / AI, LLM, LLMS / 翻译 / 2024年12月3日

免费服务 (https://pdf2zh.com/) 你可以立即尝试免费公共服务而无需

科学 PDF 文档翻译及双语对照工具 Read More »

翻译

程序编码相关的训练数据集

发表评论 / AI, LLM, LLMS / Knowledge Distillation, 知识蒸馏 / 2024年12月2日

Hugging Face 的 Datasets 库中有多种针对编程语言和代码的公开数据集，以下是一些主要的代码

程序编码相关的训练数据集 Read More »

Knowledge Distillation, 知识蒸馏

将两个教师模型的知识蒸馏到一个学生模型中

发表评论 / AI, LLM, LLMS / AI, Knowledge Distillation, 知识蒸馏 / 2024年12月2日

一、描述：使用 AutoModelForCausalLM 来实现从两个教师模型（teacher1 和 tea

将两个教师模型的知识蒸馏到一个学生模型中 Read More »

AI, Knowledge Distillation, 知识蒸馏

Tülu 3: 开源语言模型后训练的下一个时代

发表评论 / AI, AI 新闻 / AI, LLM / 2024年11月22日

[ Ai2 最新发布 Tülu 3，基于 Llama 3.1 模型，首次完全开源了顶级语言模型的后训练全套方案

Tülu 3: 开源语言模型后训练的下一个时代 Read More »

AI, LLM

ChatGPT Plus 订阅教程

发表评论 / AI, AI 新闻 / chatGPT / 2024年11月21日

国内手机号注册海外信用卡，支付宝充值，费用极少。订阅 ChatGPT Plus GPT-4 最简单，成功率最高

ChatGPT Plus 订阅教程 Read More »

chatGPT

对话中微调，提高模型能力

发表评论 / AI, LLM, LLMS / LLM, 微调 / 2024年11月13日

支持用户反馈的收集，并在累积足够的高质量反馈数据后进行微调。这个版本的代码会在每次对话后，询问用户是否满意模型

对话中微调，提高模型能力 Read More »

LLM, 微调