LLMs-from-scratch：从零构建大模型

AI快讯 2025-05-07 16:27更新

“LLMs-from-scratch” 是一个开源项目，由 Sebastian Raschka 创建，目的是帮助开发者从零开始实现一个类似 ChatGPT 的大型语言模型。这个项目是与他的书籍《Build a Large Language Model (From Scratch)》配套的官方代码仓库。

项目目标

从零开始构建 LLM：通过逐步编码的方式，帮助读者深入理解 LLM 的内部机制。

预训练和微调：提供完整的代码示例，用于在未标记数据上进行预训练，以及针对特定任务进行微调。

教育目的：通过构建小型但功能完备的模型，帮助读者理解大型模型的开发过程。

LLMs-from-scratch：从零构建大模型.webp

主要功能结构

第 2 章：处理文本数据

实现从零开始的字节对编码（BPE）分词器。

提供数据加载器的实现和总结。

第 3 章：实现注意力机制

实现多头注意力机制。

第 4 章：从零开始实现 GPT 模型

提供完整的 GPT 模型代码。

第 5 章：在未标记数据上进行预训练

提供预训练代码和生成器代码。

第 6 章：针对文本分类进行微调

提供针对文本分类任务的微调代码。

第 7 章：针对指令跟随进行微调

提供指令微调代码和评估代码。

LLMs-from-scratch适合对自然语言处理和深度学习感兴趣的学习者，尤其是希望从零开始构建大型语言模型的开发者。

LLMs-from-scratch：从零构建大模型~tplv-tlddhu82om-image.webp

英文原版地址：https://github.com/rasbt/LLMs-from-scratch

中文资源地址：https://github.com/MLNLP-World/LLMs-from-scratch-CN

相关文章

LLMs-from-scratch：从零构建大模型

网络

2025-05-07

Subtitle Translator：一个免费、开源的批量字幕翻译工具

网络

2025-05-07

DeepSeek发布DeepSeek-Prover-V2-671B：基于6710亿参数MoE架构的下一代自动定理证明模型

网络

2025-05-07

Xiaomi MiMo：小米开源的首个“为推理而生”的大模型

网络

2025-05-07

PageTalk：一款开源的浏览器AI插件

网络

2025-05-07

Muyan-TTS：沐言智语发布的开源、可训练的TTS模型，专为播客而设计

网络

2025-05-07

URM：阿里妈妈发布的新型电商推荐模型

网络

2025-05-07

如何使用讯飞星火生成PPT教程指南

网络

2025-05-07

让AI帮助您提高工作或学习效率整理最优秀的AI绘画,AI聊天,AI提示词,AI办公,AIGC,文生图等网站

Copyright @ 智汇AI

联系方式QQ：3756153558 | 手机：17359272608 | 闽ICP备2024047188号-2 | 厦门点击创客网络科技有限公司
友情链接: 微米小说站 | 笔魂AI绘图 | 库宝ai工作助手 | 智搜AI导航站 | 快标书 AI | AI吧 | 邢台医院 | 声动视界 | 文多多AIPPT | HelpLook AI知识库 |
gitee AI | 笔格设计 | AIBOX创作平台 | 08AI导航网 | 零导航 | 下载之家 | 教程之家 | 系统之家 | 天极网 | 曲多多版权音乐