self-llm是什么
self-llm (开源大模型食用指南)是Datawhale专为国内初学者打造的开源大模型教程,基于Linux平台,提供从环境配置到模型部署、微调的全流程指导,涵盖LLaMA、ChatGLM等主流模型。项目能简化开源大模型的使用流程,帮助学生和研究者快速上手。教程提供多种模型的详细教程、微调方法(如LoRA、ptuning)及应用案例,适合不同层次的学习者。项目鼓励社区参与,共同完善内容,推动开源大模型的普及和应用。

self-llm的主要功能
环境配置指导:提供基于Linux平台的开源大模型环境配置指南,帮助用户搭建适合不同模型运行的基础环境。模型部署教程:涵盖国内外主流开源大模型(如LLaMA、ChatGLM、InternLM等)的本地部署方法,包括命令行调用、在线Demo部署等。微调方法指导:提供全量微调、LoRA微调、ptuning等高效微调方法的详细教程,帮助用户根据需求对模型进行定制化优化。应用开发指导:结合LangChain等框架,指导用户如何将开源大模型集成到实际应用中,打造领域特色的私域模型。社区共创与支持:鼓励用户提交问题(issue)或贡献代码(PR),共同完善教程内容,形成开源社区的协作与支持体系。
self-llm支持的模型
GLM-4.1-ThinkingGLM-4.1V-Thinking vLLM 部署调用GLM-4.1V-Thinking Gradio 部署GLM-4.1V-Thinking LoRA 微调及 SwanLab 可视化记录GLM-4.1V-Thinking Docker 镜像GLM-4.5-AirGLM-4.5-Air vLLM 部署调用GLM-4.5-Air EvalScope 智商情商评测GLM-4.5-Air LoRA 微调GLM-4.5-Air Ucloud Docker 镜像ERNIE-4.5ERNIE-4.5-0.3B-PT LoRA 微调及 SwanLab 可视化记录ERNIE-4.5-0.3B-PT LoRA Docker 镜像Hunyuan-A13B-InstructHunyuan-A13B-Instruct 模型架构解析Hunyuan-A13B-Instruct SGLang 部署调用Hunyuan-A13B-Instruct LoRA SwanLab 可视化微调Hunyuan-A13B-Instruct LoRA Docker 镜像Qwen3Qwen3 模型结构解析Qwen3-8B vllm 部署调用Qwen3-8B Windows LMStudio 部署调用Qwen3-8B Evalscope 智商情商评测Qwen3-8B LoRA 微调及 SwanLab 可视化记录Qwen3-30B-A3B 微调及 SwanLab 可视化记录Qwen3 Think 解密Qwen3-8B Docker 镜像Qwen3-0.6B 的小模型用途Qwen3-1.7B 医学推理式对话微调及 SwanLab 可视化记录Qwen3-8B GRPO 微调及 SwanLab 可视化Kimi-VL-A3BKimi-VL-A3B 技术报告解读Kimi-VL-A3B-Thinking WebDemo 部署(网页对话助手)Llama4Llama4 对话助手SpatialLMSpatialLM 3D点云理解与目标检测模型部署Hunyuan3D-2Hunyuan3D-2 系列模型部署Hunyuan3D-2 系列模型代码调用Hunyuan3D-2 系列模型 Gradio 部署Hunyuan3D-2 系列模型 API ServerHunyuan3D-2 Docker 镜像Gemma3Gemma-3-4b-it FastApi 部署调用Gemma-3-4b-it ollama + open-webui 部署Gemma-3-4b-it Evalscope 智商情商评测Gemma-3-4b-it LoRA 微调Gemma-3-4b-it Docker 镜像Gemma-3-4b-it GRPO 微调及 SwanLab 可视化DeepSeek-R1-DistillDeepSeek-R1-Distill-Qwen-7B FastApi 部署调用DeepSeek-R1-Distill-Qwen-7B Langchain 接入DeepSeek-R1-Distill-Qwen-7B WebDemo 部署DeepSeek-R1-Distill-Qwen-7B vLLM 部署调用DeepSeek-R1-0528-Qwen3-8B-GRPO 及 SwanLab 可视化MiniCPM-o-2_6MiniCPM-o-2.6 FastApi 部署调用MiniCPM-o-2.6 WebDemo 部署MiniCPM-o-2.6 多模态语音能力MiniCPM-o-2.6 可视化 LaTeX_OCR LoRA 微调InternLM3InternLM3-8b-instruct FastApi 部署调用InternLM3-8b-instruct Langchain 接入InternLM3-8b-instruct WebDemo 部署InternLM3-8b-instruct LoRA 微调InternLM3-8b-instruct o1-like 推理链实现phi4phi4 FastApi 部署调用phi4 Langchain 接入phi4 WebDemo 部署phi4 LoRA 微调phi4 LoRA 微调 NER任务 SwanLab 可视化记录版phi4 GRPO 微调及 SwanLab 可视化Qwen2.5-CoderQwen2.5-Coder-7B-Instruct FastApi 部署调用Qwen2.5-Coder-7B-Instruct Langchain 接入Qwen2.5-Coder-7B-Instruct WebDemo 部署Qwen2.5-Coder-7B-Instruct vLLM 部署Qwen2.5-Coder-7B-Instruct LoRA 微调Qwen2.5-Coder-7B-Instruct LoRA 微调 SwanLab 可视化记录版Qwen2-vlQwen2-vl-2B FastApi 部署调用Qwen2-vl-2B WebDemo 部署Qwen2-vl-2B vLLM 部署Qwen2-vl-2B LoRA 微调Qwen2-vl-2B LoRA 微调 SwanLab 可视化记录版Qwen2-vl-2B LoRA 微调案例 – LaTeXOCRQwen2.5Qwen2.5-7B-Instruct FastApi 部署调用Qwen2.5-7B-Instruct Langchain 接入Qwen2.5-7B-Instruct vLLM 部署调用Qwen2.5-7B-Instruct WebDemo 部署Qwen2.5-7B-Instruct LoRA 微调Qwen2.5-7B-Instruct o1-like 推理链实现Qwen2.5-7B-Instruct LoRA 微调 SwanLab 可视化记录版Apple OpenELMOpenELM-3B-Instruct FastApi 部署调用OpenELM-3B-Instruct LoRA 微调Llama3_1-8B-InstructLlama3_1-8B-Instruct FastApi 部署调用Llama3_1-8B-Instruct Langchain 接入Llama3_1-8B-Instruct WebDemo 部署Llama3_1-8B-Instruct LoRA 微调动手转换 GGUF 模型并使用 Ollama 本地部署Gemma-2-9b-itGemma-2-9b-it FastApi 部署调用Gemma-2-9b-it Langchain 接入Gemma-2-9b-it WebDemo 部署Gemma-2-9b-it Peft LoRA 微调Yuan2.0Yuan2.0-2B FastApi 部署调用Yuan2.0-2B Langchain 接入Yuan2.0-2B WebDemo 部署Yuan2.0-2B vLLM 部署调用Yuan2.0-2B LoRA 微调Yuan2.0-M32Yuan2.0-M32 FastApi 部署调用Yuan2.0-M32 Langchain 接入Yuan2.0-M32 WebDemo 部署DeepSeek-Coder-V2DeepSeek-Coder-V2-Lite-Instruct FastApi 部署调用DeepSeek-Coder-V2-L
self-llm的项目地址
GitHub仓库:https://github.com/datawhalechina/self-llm
self-llm的应用场景
教育与学习:为初学者提供从环境配置到模型微调的全流程指导,助力学生和开发者快速掌握开源大模型的使用方法。企业应用开发:帮助企业根据自身业务需求对开源大模型进行定制化微调,开发智能客服、知识管理等专属应用。个人项目开发:支持个人开发者利用开源大模型开发智能写作助手、个人智能助手等项目,提升个人生产力。研究与创新:为研究人员提供实验平台,支持对开源大模型的架构优化、训练方法改进等研究工作。