解码之Beam Search算法

解码是seq2seq模型的常见问题，常用方法有贪心搜索（Greedy Search）集束搜索（Beam Search）。简单贪心搜索From [1]如图，Decoder根据Encoder的中间语义编码向量ccc和<s>标签得到第一个输出的概率分布[0.1,0.1,0.3,0.4,0.1][0.1,0.1,0.3,0.4,0.1][0.1, 0.1, 0.3, 0.4,

手撕机

16627人浏览 · 2018-04-14 11:49:24

手撕机 · 2018-04-14 11:49:24 发布

解码是seq2seq模型的常见问题，常用方法有贪心搜索（Greedy Search）集束搜索（Beam Search）。

简单贪心搜索

From [1]

如图，Decoder根据Encoder的中间语义编码向量 c <script type="math/tex" id="MathJax-Element-398">c</script>和<s>标签得到第一个输出的概率分布 $[0.1, 0.1, 0.3, 0.4, 0.1]$ <script type="math/tex" id="MathJax-Element-399">[0.1, 0.1, 0.3, 0.4, 0.1]</script>，选择概率最大的0.4，即moi。

根据隐向量 h1 <script type="math/tex" id="MathJax-Element-400">h_1</script>和moi得到第二个输出的概率分布 [0.1,0.1,0.1,0.1,0.6] <script type="math/tex" id="MathJax-Element-401">[0.1, 0.1, 0.1, 0.1, 0.6]</script>，选择概率最大的0.6，即suis。

以此类推，直到遇到<\s>标签，得到最终的序列moi suis étudiant。

集束搜索

上面的贪心搜索只选择了概率最大的一个，而集束搜索则选择了概率最大的前k个。这个k值也叫做集束宽度（Beam Width）。

还是以上面的例子作为说明，k值等于2，则集束搜索的过程如下图：

这里写图片描述

得到第一个输出的概率分布 [0.1,0.1,0.3,0.4,0.1] <script type="math/tex" id="MathJax-Element-410">[0.1,0.1,0.3,0.4,0.1]</script>，选择概率最大的前两个，0.3和0.4，即Je和moi。

然后Je和moi分别作为Decoder的输入，得到两个概率分布，然后再选择概率和最大的前两个序列，0.3+0.8和0.4+0.6，即Je suis和moi suis。

以此类推，最终可以得到两个序列，即Je suis étudiant和moi suis étudiant，很明显前者的概率和最大，为2.2，所以这个序列是最终得到的结果。

集束搜索本质上也是贪心的思想，只不过它考虑了更多的候选搜索空间，因此可以得到更多的翻译结果。

References

[1] https://www.tensorflow.org/tutorials/seq2seq

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

8种封装的1700V国产碳化硅(SiC)功率模块产品介绍及应用

MCP技术社区

（一篇入门）汽车电子电器之电机MCU控制器四

MCP技术社区

基于Echarts的甘特图实现与封装实战

Echarts（Enterprise Charts）是由百度开源的一款功能强大、高度可定制的JavaScript数据可视化库，广泛应用于各类企业级Web应用中。其核心设计理念是“以数据驱动视图”，通过声明式配置即可实现复杂图表的渲染与交互。在现代前端工程化背景下，Echarts不仅支持静态图表展示，更具备动态更新、大数据量处理和跨平台兼容等高级能力，成为构建高性能数据看板、实时监控系统和项目管理工