无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%

机器之心 2025-11-21 10:03

专注推理任务的 Large Reasoning Models 在数学基准上不断取得突破,但也带来了一个重要问题:越想越长、越长越错。本文解读由 JHU、UNC Charlotte 等机构团队的最新工作 DTS(Decoding Tree Sketching):一种即插即用的模型推理框架,依靠高不确定度分支推理和最先完成路径早停两个关键策略,以近似找到最短且正确的推理路径。

 

无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%图2

 

 

在 AIME2024/2025 上,DTS 在 DeepSeek-R1-Distill-Qwen-7B/1.5B 上准确率平均提升 6%、平均推理长度下降约 23%,无尽重复率平均减少 10%。

 

无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%图3

 

背景:推理大模型的「过度思考」问题

 

CoT / 多步推理让模型更会「想」,但也带来很重要的问题:越长越易偏离正确答案或陷入自我重复,正确率反而下降,如下图所示。现有方法多依赖额外训练(SFT/RL)或激进剪枝,落地成本高或稳定性不佳。DTS 开辟了一条全新的技术路线:不训练,只优化解码策略,把「想得又短又准」转变为解码中的搜索问题。

 

无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%图4

 

关键实证:最短那条,往往是对的

 

作者对 AIME24 上的题目做了密集采样:每题 100 次随机解码。结果非常直观:

 

无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%图5

 

并且,长度与准确率呈明显负相关:样本点越靠右(越长),正确率越低。这直接催生了 DTS 的目标:以尽可能小的代价,逼近「最短且正确」的那条路径。

 

Decoding Tree Sketching(稀疏化接码树)

 

把推理过程看成一棵解码树:节点是已生成 token,路径是一次完整 CoT,叶子节点就是该 CoT 的终止符()。寻找最短的推理路径相当于搜索从根节点到最浅层的叶子节点的路径。在这个问题中,穷举搜索可以得到最理想的路径,但是这回造成树分支有指数爆炸的复杂度,因此不可行。DTS 的思路是:只在「关键 token」考虑多种可能的结果从而分支构造树结构,如图所示:

 

无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%图6

 

在高熵处产生分支

核心思想:不确定才需要分支;确定时不分支,避免解码树乱枝蔓生。

 

最先完成即早停

核心思想:把「短即优」的统计规律写进了停止准则。

 

实验:更准、少复读

 

QA 准确率提升

DTS 在 AIME2024 和 AIME2025 与传统自回归解码的对比:

 

无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%图7

 

结论: 稀疏化解码树 + 早停稳定提升模型最终回答的准确率。

 

有效抑制模型的「无尽复读」

统计「无法在最大长度内收敛、陷入循环」的比例:

 

无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%图8

 

结论:稀疏化解码树 + 早停让「自我复读」的路径被更短的完成路径代替。

 

一键复现结果

 

在 Colab 上试运行 DTS: https://colab.research.google.com/github/ZichengXu/Decoding-Tree-Sketching/blob/main/notebooks/example_DeepSeek_R1_Distill_Qwen_1_5B.ipynb

 

克隆 DTS 的开源项目,并且安装环境:

 

无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%图9

 

复现论文中的结果:

 

无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%图10

 

结论

 

DTS 以极低的工程成本,为推理型大模型提供了一种「更聪明」的思考方式。它不依赖后训练,不修改模型参数,仅通过稀疏化的解码树探索最短的推理路径,就能显著提高准确率、减少复读。这种「在不确定处分支、在确定处直行」的设计,使得大模型的推理过程更像人类的理性思考:在模糊时多想几步,在明确时迅速收敛。

 

DTS 的核心贡献在于:

 

从更长远的角度看,DTS 展示了一种轻量化的推理优化路线:让模型「想得更少但更准」。未来,类似的解码层优化有望与多步推理、校准与不确定性估计等方向结合,为 Large Reasoning Models 的高效与可靠推理开辟新的路径。

 

作者介绍

 

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
大模型
more
无需训练、只优化解码策略,DTS框架让大模型推理准确率提升6%,推理长度缩短23%
罗福莉官宣后,小米放出首个AI大招!10亿IoT设备一键接入大模型
夸克AI眼镜,把千问大模型「戴」在眼前
Karpathy组建大模型「议会」,GPT-5.1、Gemini 3 Pro等化身最强智囊团
从 Others 到挑战者第一,火山引擎没有错过大模型
8点1氪:西贝回应门店一线全员涨薪;谷歌发布Gemini 3;苹果回应iPhone 17 Pro Max掉色;
ChatGPT 三周年遭 DeepSeek 暴击,23 页技术报告藏着开源登顶的全部秘密
刚刚上线的千问App,可能是我用过最聪明的AI工具!
4.3亿大模型大单!讯飞拿下
⽆需任何监督信号!自博弈机制让深度搜索Agent实现自我进化
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号