JRY's digital garden

❯

❯

❯

DecodingStrategy

DecodingStrategy

Jul 09, 20262 min read

decoding
inference
text-generation

Overview

解码策略决定了语言模型在生成文本时如何从概率分布中选取下一个 token。不同的解码策略在生成质量、多样性和计算效率之间做出不同权衡。从确定性的 Greedy Search 到随机采样的 Top-K/Top-P，再到调节分布形态的 Temperature，每种策略都有其适用场景。

Key Ideas

Greedy Search：每步选择概率最大的 token（argmax），速度快但容易产生重复和退化文本
Beam Search：同时维护多个候选序列（beam width），在多路径中探索最优解，平衡质量与多样性
Top-K 采样：从概率最高的 K 个候选中随机采样，K 为固定值，候选池大小不随分布变化
Top-P（Nucleus Sampling）：选取累积概率达到 P 的最小候选集，候选池大小随分布动态调整
Temperature：通过调节 logits 的缩放系数控制分布的”尖锐度”，T 越高分布越平坦（更多样），T 越低分布越集中（更确定）

Related Concepts

TrainingPipeline — 训练阶段与解码策略的选择密切相关
Transformer — Transformer 的解码器输出 logits 用于解码策略

Graph View

Overview
Key Ideas
Related Concepts

Backlinks

JRY's wiki
ModelQuantization
Overview
AI的'语言通胀'
解码策略：从贪心到采样

Created with Quartz v4.5.1 © 2026

GitHub
Discord Community