TOPIC CACHE LANGUAGE MODEL FOR SPEECH RECOGNITION

ICCASP 2010
著者：Chuang-Hua Chueh and Jen-Tzung Chien
アブストラクト：伝統的なN-Gram 言語モデルは長距離の文脈情報を考慮できない。キャッシュモデルはこの弱点を補うのに適している。この論文では、音声認識タスクにおいて潜在ディリクレ言語モデル(latent dirichlet language model)に基づいた新しいトピックキャッシュモデルを提案する。潜在ディリクレ言語モデルでは、潜在的なトピック構造がn-gramイベントから推定され、単語の予測に置いて用いられる。特に、長距離のトピック情報は広い区間の単語履歴から連続的に更新され、ベイズ学習を通してトピックの混合を生成するときに動的に統合される。トピックキャッシュ言語モデルは未知のn-gramイベントに対しても効果的に特徴付けることができ、長距離の言語モデルに対するトピックのキャッシュを捉えることができる。Wall Street Journal コーパスにおける実験で、提案手法はベースラインのn-gara言語モデルなどと比較して、パープレキシティと認識精度においてより良い精度を達成した。
キーワード：Natural language, Bayes procedure, clustering method, smoothing method, speech recognition
状態：未読