将两个教师模型的知识蒸馏到一个学生模型中
一、描述: 使用 AutoModelForCausalLM 来实现从两个教师模型(teacher1 和 tea […]
将两个教师模型的知识蒸馏到一个学生模型中 Read More »
一、描述: 使用 AutoModelForCausalLM 来实现从两个教师模型(teacher1 和 tea […]
将两个教师模型的知识蒸馏到一个学生模型中 Read More »
[ Ai2 最新发布 Tülu 3,基于 Llama 3.1 模型,首次完全开源了顶级语言模型的后训练全套方案
Tülu 3: 开源语言模型后训练的下一个时代 Read More »
可以使用vllm部署LongWriter模型。请参考vllm_inference.py中的代码,体验闪电般快速
LongWriter:释放长上下文LLM的10,000+字生成能力 Read More »
6月 2, 2024 蒂莫西·普里克特·摩根 在计算、网络和图形的历史中,Nvidia 有许多独特之
NVIDIA 展开 GPU、互连路线图,推出 2027 年 Read More »
大型语言模型(LLM)在去年取得了很大进展。我们从没有 ChatGPT 的竞争对手变成了一整套 LLM 动物园
如何用 Hugging Face 微调 LLM Read More »