ChatGPT – 第 3 页 – 杰力皓博

了解 Qwen1.5模型

发表评论 / ChatGPT, GPT, OpenAI / Qwen1.5 / 2024年3月30日

Qwen1.5 是 Qwen2 的测试版，Qwen2 是一种基于 Transformer 的纯解码器语言模型， […]

了解 Qwen1.5模型 Read More »

Qwen1.5

grok-1 的一次有效输出结果

发表评论 / ChatGPT, GPT, OpenAI / grok-1 / 2024年3月28日

测试环境 windows, llama.cpp, cuda, 运行命令：

grok-1 的一次有效输出结果 Read More »

grok-1

Grok-1 的输出内容

发表评论 / ChatGPT, GPT, OpenAI / grok-1 / 2024年3月28日

这个输出是一直不停啊,这是要把他训练的内容全部输出来? 测试环境 windows, llama.cpp, cu

Grok-1 的输出内容 Read More »

grok-1

从头开始编写 LoRA 代码

发表评论 / ChatGPT, GPT, OpenAI / chatGPT, LLMS, Lora, OpenAI API, 微调 / 2024年3月25日

在 PyTorch 中实现 LLMs 的低阶适应 LoRA 代表低阶适应，是一种更有效地微调 LLMs 的流行

从头开始编写 LoRA 代码 Read More »

chatGPT, LLMS, Lora, OpenAI API, 微调

google/gemma-7b 的几种推理方法

2条评论 / ChatGPT, GPT, OpenAI / chatGPT, OpenAI API / 2024年3月15日

Gemma 是 Google 的一系列轻量级、最先进的开放式模型，基于用于创建双子座模型（state-of-

google/gemma-7b 的几种推理方法 Read More »

chatGPT, OpenAI API

用 bitsandbytes、4 比特量化和 QLoRA 打造亲民的 LLM

发表评论 / ChatGPT, GPT, OpenAI / bitsandbytes, chatGPT, OpenAI API / 2024年3月14日

Hugging Face 已认证账号 47 人赞同了该文章众所周知，LLM 规模庞大，如果在也能消费类硬件

用 bitsandbytes、4 比特量化和 QLoRA 打造亲民的 LLM Read More »

bitsandbytes, chatGPT, OpenAI API

了解 LLaMA-2 模型结构(8)

发表评论 / ChatGPT, GPT, OpenAI / chatGPT, OpenAI API / 2024年3月12日

13. 嵌入权重在自然语言处理(NLP)和机器学习中，嵌入权重(embedding weights)是用于将

了解 LLaMA-2 模型结构(8) Read More »

chatGPT, OpenAI API

了解 LLaMA-2 模型结构(7)

发表评论 / ChatGPT, GPT, OpenAI / chatGPT, OpenAI API / 2024年3月11日

12. 模型文件的配置信息根据前面保存的模型文件 output/model.bin 的内容，可以知道，模型配

了解 LLaMA-2 模型结构(7) Read More »

chatGPT, OpenAI API

了解 LLaMA-2 模型结构(6)

发表评论 / ChatGPT, GPT, OpenAI / chatGPT, OpenAI API / 2024年3月11日

11. 将字符串编码为令牌序列在聊天的时候，需要把字符串通过 tokenizer 进行编码，命名为 test

了解 LLaMA-2 模型结构(6) Read More »

chatGPT, OpenAI API

了解 LLaMA-2 模型结构(5)

发表评论 / ChatGPT, GPT, OpenAI / chatGPT, OpenAI API / 2024年3月11日

9. 转换 tokenizer.model 并保存前面的章节转换模型的所有权重后，还需要转换 tokeniz

了解 LLaMA-2 模型结构(5) Read More »

chatGPT, OpenAI API