LLM – 杰力皓博

将 LLMs 精调至 1.58 比特：使极端量化变简单

发表评论 / AI, LLM, LLMS / chatGPT, LLM, OpenAI API / 2024年12月22日

中文翻译: Zipxuan 本文也提供英文版本 English。随着大语言模型（LLMs […]

将 LLMs 精调至 1.58 比特：使极端量化变简单 Read More »

chatGPT, LLM, OpenAI API

使用GPU内存和CPU内存装载大模型

发表评论 / AI, AI 新闻, LLM, LLMS / met-llama / 2024年12月5日

这里测试的是开源模型是 meta-llama/Llama-3.1-405B-Instruct，属于开源模型里面

使用GPU内存和CPU内存装载大模型 Read More »

met-llama

科学 PDF 文档翻译及双语对照工具

发表评论 / AI, LLM, LLMS / 翻译 / 2024年12月3日

免费服务 (https://pdf2zh.com/) 你可以立即尝试免费公共服务而无需

科学 PDF 文档翻译及双语对照工具 Read More »

翻译

程序编码相关的训练数据集

发表评论 / AI, LLM, LLMS / Knowledge Distillation, 知识蒸馏 / 2024年12月2日

Hugging Face 的 Datasets 库中有多种针对编程语言和代码的公开数据集，以下是一些主要的代码

程序编码相关的训练数据集 Read More »

Knowledge Distillation, 知识蒸馏

将两个教师模型的知识蒸馏到一个学生模型中

发表评论 / AI, LLM, LLMS / AI, Knowledge Distillation, 知识蒸馏 / 2024年12月2日

一、描述：使用 AutoModelForCausalLM 来实现从两个教师模型（teacher1 和 tea

将两个教师模型的知识蒸馏到一个学生模型中 Read More »

AI, Knowledge Distillation, 知识蒸馏

对话中微调，提高模型能力

发表评论 / AI, LLM, LLMS / LLM, 微调 / 2024年11月13日

支持用户反馈的收集，并在累积足够的高质量反馈数据后进行微调。这个版本的代码会在每次对话后，询问用户是否满意模型

对话中微调，提高模型能力 Read More »

LLM, 微调

模型在GPU内存的映射关系

发表评论 / AI, LLM, LLMS / 2024年10月22日

这里我们以 nvidia/Llama-3.1-Nemotron-70B-Instruct-HF 为例来说明问题

模型在GPU内存的映射关系 Read More »

多GPU情况下,如何处理GPU内存不够

发表评论 / AI, AI 新闻, LLM, LLMS / Transformers / 2024年10月22日

多GPU情况下，模型加载成功了，但是做推理的时候，还会使用GPU，导致GPU 不够，如何处理，卸载部分到CPU

多GPU情况下,如何处理GPU内存不够 Read More »

Transformers

Llama 3.2 3B Instruct 的未经审查版本

发表评论 / AI, AI 新闻, LLM, LLMS / abliterated, 未经审查版本 / 2024年9月28日

这是 Llama 3.2 3B Instruct 的未经审查版本，使用删减创建（请参阅本文以了解更多信息）。

Llama 3.2 3B Instruct 的未经审查版本 Read More »

abliterated, 未经审查版本

Llama 3.1 8B Instruct 的未经审查版本

发表评论 / AI, AI 新闻, LLM, LLMS / 未经审查版本 / 2024年9月26日

这是 Llama 3.1 8B Instruct 的未经审查版本，使用删减创建（请参阅本文以了解更多信息）。

Llama 3.1 8B Instruct 的未经审查版本 Read More »

未经审查版本