Revealing the Structure of Medical Dictations with Conditional Random Fields
Jeremy Jancsary; Johannes Matiasek; Harald Trost. Revealing the Structure of Medical Dictations with Conditional Random Fields.
自動音声認識で書き起こしたカルテ(medical dictation)を構造化するため,セグメンテーションとセクション名推定を同時に行う.入力文書として自動音声認識で書き起こされたテキストを想定しているため,文の境界情報を信頼せず,入力文書のそれぞれの単語に対して”CHIEF-COMPLAINT”, “HISTORY-OF-PRESENT-ILLNESS”, “PHYSICAL-EXAMINATION”のようなセクション・ラベルを,BIO表記で付与する.また,”PHYSICAL-EXAMINATION”セクションの一部に”VITAL SIGN”というサブセクションがあるという,セクションの階層構造も考慮するため,セクション名の線形連鎖に加えて,セクション-サブセクションの依存構造をモデルに取り込み,格子型のCRFを用いてタグ付けを行う.CRFのグラフィカルモデル中にループができるので,loopy brief propagationを使ってパラメータ推定を行う.
TrackBack URL :
Comments (0)
