コンテンツにスキップ

利用者:やすやけ/Explicit semantic analysis

自然言語処理および情報検索において、明示的意味分析 (ESA)は、ドキュメントコーパスを知識ベースとして使用するテキスト(個々の単語またはドキュメント全体)のベクトル表現です。具体的には、ESAでは、単語はテキストコーパスのtf–idf行列の列ベクトルとして表され、ドキュメント(単語の文字列)はその単語を表すベクトルの重心として表されます。通常、テキストコーパスは英語版ウィキペディアですが、 Open Directory Projectなどの他のコーパスが使用されています。[1]

ESAは、テキストの分類を改善する手段としてEvgeniy GabrilovichとShaul Markovitchによって設計され、前述のベクトル間のコサイン類似性によって「意味的関連性」と呼ばれるものを計算するためにこのペアの研究者によって使用されています。ウィキペディアの記事(またはODPエントリ、または知識ベースコーパス内のドキュメントのタイトル)が概念と同一視される「人間によって明示的に定義および記述された概念」の空間。 「明示的な意味解析」という名前はlatent semantic analysis(LSA)とは対照的です。なぜなら、知識ベースを使用すると、人間が読めるラベルをベクトル空間を構成する概念に割り当てることができるからです。[1][2]


[[Category:自然言語処理]]

  1. ^ a b Egozi, Ofer; Markovitch, Shaul; Gabrilovich, Evgeniy (2011). “Concept-Based Information Retrieval using Explicit Semantic Analysis”. ACM Transactions on Information Systems 29 (2): 1–34. doi:10.1145/1961209.1961211. https://www.cs.technion.ac.il/~gabr/publications/papers/Egozi2011CBI.pdf 2015年1月3日閲覧。. 
  2. ^ Gabrilovich, Evgeniy; Markovitch, Shaul (2007). Computing semantic relatedness using Wikipedia-based Explicit Semantic Analysis (PDF). Proc. 20th Int'l Joint Conf. on Artificial Intelligence (IJCAI). pp. 1606–1611.