微调框架介绍

CSGHub 支持以下微调框架，以满足不同场景的微调需求。

LLaMA-Factory

LLaMA-Factory 是一个统一且高效的微调框架，支持超过 100 种大型语言模型（LLMs）和视觉语言模型（VLMs）。该框架提供了多种微调方法，包括 LoRA、QLoRA 等，能够显著提升训练速度和效率。例如，与 ChatGLM 的 P-Tuning 相比，LLaMA-Factory 的 LoRA 微调在广告文案生成任务中训练速度提高了 3.7 倍，且取得了更好的 Rouge 得分。此外，LLaMA-Factory 还支持 4-bit 量化技术（QLoRA），进一步优化 GPU 内存使用效率。

链接

MS-SWIFT

MS-SWIFT 是一个灵活且高效的微调框架，支持 PEFT（参数高效微调）和全参数微调两种方式。该框架兼容多种模型和数据集，用户可以根据需求选择适合的微调方法。MS-SWIFT 提供了丰富的功能，包括对嵌入模型的微调、支持 GRPO（Group Relative Policy Optimization）算法，以及与 LMDeploy 的集成等。此外，MS-SWIFT 还提供了详细的文档和示例，帮助用户快速上手并解决常见问题。

链接

LLaMA-Factory​

MS-SWIFT​

LLaMA-Factory

MS-SWIFT