D論の中間審査
D論の中間審査が終了した.準備不足だったので,スライドに間違いがあったり,いろいろと突っ込みを貰ったが,さほど問題なく2時間が過ぎた.以下は,突っ込まれた内容のまとめ.
- 要約という問題をどのように「定義」したかに関する議論が不足している.この分野での本当の「課題」は何なのか?
- 入力文書集合に矛盾する知識があるときに,果たしてシステムはうまく動作するのか(定式化の限界について)
- 重要文抽出というタスクの上限(人間がやった場合での限界など)に関する説明がない
- スライドには,重要文抽出の実験の設定が説明されていなかった
- bestシステムとの比較が明確ではなかった
- 重要文抽出の失敗解析が不十分
- 重要文抽出をやるときに,メタ情報(出典など)を明らかにするとどうなるのか?
- 文を並べるというタスクの限界について
- 情報を並べるタスクから文を並べるタスクに持っていくにはちょっと飛躍がある
- P38スライドの例がおかしい
- 要約の各コンポーネントを統合すると,当然うまくいかないケースが出てくるはずだが,その「ギクシャク感」についての説明があった方がおもしろい
- 略語の定義を括弧を用いて抽出しているのでさほど問題が生じていないが,例えば「~とは○○」という表現に着目して共起する表現を抜き出すと,定義の置換が100%成功するわけではなくなるが,そういうのは参考にならないか?
TrackBack URL :
Comments (0)