知识蒸馏

定义

知识蒸馏(Knowledge Distillation)是一种模型压缩技术,通过将大型教师模型(teacher model)的知识迁移到小型学生模型(student model)中,使学生模型在保持较小规模的同时获得接近教师模型的性能。其核心思想是利用教师模型的软标签(soft labels)或中间表示来指导学生模型的学习,而不仅仅是使用硬标签(hard labels)。在大语言模型时代,知识蒸馏已成为模型部署和能力迁移的关键技术。

关键文献与发现

PRISM: 黑箱在线策略蒸馏的预对齐方法

Wang et al. (2026). PRISM: Pre-alignment via Black-box On-policy Distillation for Multimodal Reinforcement Learning. arXiv:2604.28123v1

PRISM 揭示了标准 LMM 训练流程(SFT→RLVR)中的一个关键问题:监督微调(SFT)会引入分布漂移(distribution drift),导致模型既不能保留预训练能力,也无法忠实匹配监督分布。在多模态推理场景中,这一问题被进一步放大——感知错误和推理失败遵循不同的漂移模式,并在后续 RL 阶段复合。

方法:PRISM 提出三阶段训练管道(SFT→对齐→RLVR),在 SFT 和 RLVR 之间插入显式分布对齐阶段。对齐阶段基于在线策略蒸馏(OPD)原理,将策略与一个 MoE 判别器之间的交互建模为黑盒响应级对抗博弈。判别器包含专门的感知专家和推理专家,从不同维度提供解耦的纠正信号。该方法无需访问教师模型的 logits,仅需响应级别的交互即可工作。为此,作者从 Gemini 3 Flash 策划了 11.3 万条高保真演示。

发现:在 Qwen3-VL 上,PRISM 在 GRPO、DAPO、GSPO 等多种 RL 算法和多模态基准测试中持续改进了下游 RLVR 性能,验证了分布对齐阶段对减轻 SFT 漂移的有效性。

知识蒸馏的文献脉络

PRISM 的工作建立在知识蒸馏领域的长期研究基础上:

技术图景

蒸馏范式

蒸馏目标

在线策略蒸馏(OPD)

PRISM 提出的黑箱 OPD 是当前蒸馏技术的前沿方向:

研究前沿

基于 PRISM 及现有文献,以下问题仍待解决:

  1. 蒸馏税:学生模型在蒸馏后可能出现能力退化,如何最小化性能损失仍是核心挑战
  2. 分布偏移:PRISM 虽缓解了离线蒸馏中的分布偏移,但在线蒸馏的理论保证仍不完善
  3. 可扩展性:对于超大模型,完全蒸馏所有知识的计算成本依然很高
  4. 评估标准:如何全面评估蒸馏后模型的能力保持程度仍缺乏统一标准
  5. 安全性:蒸馏可能转移教师模型的安全对齐问题,如何保证蒸馏后的安全性
  6. 法律与伦理:通过 API 输出蒸馏商业模型可能涉及知识产权问题
  7. 多任务蒸馏:同时从多个教师模型蒸馏不同能力的挑战

相关论文

相关概念