Probabilistic Inference for Machine Translation
Phil Blunsom; Miles Osborne. Probabilistic Inference for Machine Translation.
A Discriminative Latent Variable Model for Statistical Machine Translation (Blunsom et. al., 2008) の続編.前作では,synchronus context free grammar (SCFG) に基づく機械翻訳システムを,導出dを隠れ変数とするlog-linearモデルで定式化し,識別モデルで大域最適化を行う方法を示した.しかし,パラメータ推定(具体的には正則化項の計算)を可能にするため,翻訳システムから言語モデルを省略していた.
本論文では,言語モデルを確率的識別モデルに取り込むため,モンテカルロ法に基づいて正則化項を計算する.つまり,可能な導出をすべて列挙するのではなく,その部分集合をサンプリングして正則化項を近似する.本論文では,その部分集合を求めるアルゴリズムとして,ビーム探索を用いる方法,Markov Chain Monte Carlo (MCMC)を用いる方法を提案している.
トラックバック URL :