跳到主要内容

导出微调模型

训练完成后,您可以将收敛后的模型导出并以全新仓库的形式推送至目标平台空间。以下是对应主流框架的基础导出路径说明。


方案 A:通过 LLama-Factory 导出

在 Web 界面完成训练周期后,点击导航列表中的 [Export] 进入配置项:

  1. 选择表现最佳的检查点 在训练快照列表中选择要转换导出的最优目标版本。

    checkpoint

  2. 设置导出路径及目标 ID

    • Export dir:保存结果的本地零时目录路径。
    • CSGHub ID:该值是保存新成果的目标存储库名称。填写格式必须包含命名空间(例如:您的用户名/全新模型名称)。

    checkpoint

  3. 执行导出 点击界面导出执行。随后系统将合并底层框架和微调层并自动推送至新仓库内。


方案 B:通过 MS-Swift 进行命令行参数配置

若您在控制台使用 MS-Swift 等运行脚本框架,需执行类似的导出参数指令:

  1. 配置主干目录路径 (--model) 样例:

    output/v0-20250715-175923/checkpoint-93/
  2. 勾选合并 LoRA 复查 除非有叠加需求,为保证结果能在一般环境中独立运行,建议统一合并所有附加层参数。

    merge-lora

  3. 设置推送目标参数 填写执行项以开启远程地址并设定具体目标仓名称 (hub_model_id)。 样例:

    --push_to_hub true --hub_model_id xzgan001/Qwen2.5-0.5B-Instruct-self3 --use_hf true 

    提示:MS-Swift 配置不能覆盖现存数据,您在 --hub_model_id 中必须填入一个平台内尚未被占用的新模型仓库标识。

    Ms-swift

  4. 开始运行 开始执行直至系统返回上传结束日志,并前往平台主页确认查收。