Home > Conferences > EMNLP2008

2008.11.01

Revealing the Structure of Medical Dictations with Conditional Random Fields

Jeremy Jancsary; Johannes Matiasek; Harald Trost. Revealing the Structure of Medical Dictations with Conditional Random Fields.

自動音声認識で書き起こしたカルテ(medical dictation)を構造化するため,セグメンテーションとセクション名推定を同時に行う.入力文書として自動音声認識で書き起こされたテキストを想定しているため,文の境界情報を信頼せず,入力文書のそれぞれの単語に対して”CHIEF-COMPLAINT”, “HISTORY-OF-PRESENT-ILLNESS”, “PHYSICAL-EXAMINATION”のようなセクション・ラベルを,BIO表記で付与する.また,”PHYSICAL-EXAMINATION”セクションの一部に”VITAL SIGN”というサブセクションがあるという,セクションの階層構造も考慮するため,セクション名の線形連鎖に加えて,セクション-サブセクションの依存構造をモデルに取り込み,格子型のCRFを用いてタグ付けを行う.CRFのグラフィカルモデル中にループができるので,loopy brief propagationを使ってパラメータ推定を行う.

2008.10.27

ハワイ出張

おとといまでのハワイは,まさに地上の楽園.こんな感じ.

金融危機の影響で,観光客は例年の20%減らしい.観光地ということもあって,賑わっている印象を受けるが,ホームレスの人も結構見かける.

EMNLPが始まってからのハワイは,雨期モードに突入.

学会に出るには誘惑が減ってちょうど良いけど,週末を狙って日本からはるばるやってきた人はかわいそう.ハワイ観光の醍醐味はビーチでぼーっとすることなのに・・・.

« Previous