Overview

SWIFT(Scalable lightWeight Infrastructure for Fine-Tuning)是阿里巴巴达摩院开发的大模型微调框架。支持LoRA、QLoRA等PEFT方法,训练产出的swift_output文件夹中存储的是轻量级适配器(增量权重),需与基础模型合并后才能独立使用。

Key Concepts

  • swift_output:微调后生成的适配器权重文件,通常几十到几百MB
  • 适配器(Adapter):记录模型为适应新任务而进行的”增量调整”,仅训练约0.1%参数
  • 合并(Merge):将适配器权重合并到基础模型中,生成完整的可用模型

Merge Strategies

  • 加载时合并(Inference-time Merge):推理时同时加载基础模型和适配器
  • 物理合并(Physical Merge):预先合并为完整模型,简化部署和推理

Standard Practice

“训练时分离,部署时合并”(Train separate, merge for deployment)

Relationships

  • LoRA — SWIFT支持LoRA低秩适配
  • QLoRA — SWIFT支持QLoRA量化适配
  • FineTuning — SWIFT是PEFT微调框架
  • XTuner — 另一个大模型微调工具,功能定位类似

Sources