SWIFT

Overview

SWIFT（Scalable lightWeight Infrastructure for Fine-Tuning）是阿里巴巴达摩院开发的大模型微调框架。支持LoRA、QLoRA等PEFT方法，训练产出的swift_output文件夹中存储的是轻量级适配器（增量权重），需与基础模型合并后才能独立使用。

Key Concepts

swift_output：微调后生成的适配器权重文件，通常几十到几百MB
适配器（Adapter）：记录模型为适应新任务而进行的”增量调整”，仅训练约0.1%参数
合并（Merge）：将适配器权重合并到基础模型中，生成完整的可用模型

Merge Strategies

加载时合并（Inference-time Merge）：推理时同时加载基础模型和适配器
物理合并（Physical Merge）：预先合并为完整模型，简化部署和推理

Standard Practice

“训练时分离，部署时合并”（Train separate, merge for deployment）

Relationships

LoRA — SWIFT支持LoRA低秩适配
QLoRA — SWIFT支持QLoRA量化适配
FineTuning — SWIFT是PEFT微调框架
XTuner — 另一个大模型微调工具，功能定位类似

Sources

swift-output-explained — swift_output输出内容的详细解释

JRY's digital garden

Explorer