2008.11.06
Topic-Driven Multi-Document Summarization with Encyclopedic Knowledge and Spreading Activation
Vivi Nastase. Topic-Driven Multi-Document Summarization with Encyclopedic Knowledge and Spreading Activation.
本論文は,Document Understanding Conferences (DUC) のquery-focused summarizationタスクのように,要約対象文書集合と検索欲求が与えられているとき,その検索欲求に含まれるエンティティに関連するエンティティを収集し,検索クエリ拡張を行う手法を提案している.クエリ拡張のためのリソースとして,WikipediaとWordNetを比較している.
Wikipediaを用いたクエリ拡張では,検索欲求に含まれるエンティティをタイトルに含むWikipedia記事を検索し,その記事の最初のパラグラフに含まれるアンカーテキストを,拡張されたクエリと見なし,文書を収集する.収集された文書に対して,係り受け解析を行い,ノードを語,エッジを係り受け関係としたグラフ上で,PageRankアルゴリズムを適用し,活性値の高い語を拡張トピック語として取り出す.重要文抽出では,トピック語,拡張クエリ語,拡張トピック語,係り受け関係に関するスコアの和を,文のスコアとしている.
Trackback URL
Comment & Trackback
Comment feed
Comment