自然言語処理

Word Rotator’s Distance

Word Rotator’s Distance とは 2つの自然言語文あるいは文書が与えられたとき,それらの(非)類似度を測る尺度として Word Mover’s Distance (WMD)*1と呼ばれる手法が提案されている。 これは文を構成する単語ベクトルのアラインメントを最適輸送コストに基…

All-but-the-top: 単語分散表現の上位主成分がノイズな件

Skip-gramやGloVeで学習した単語分散表現に簡単な後処理を施すことで後段タスクの性能を向上させる手法が提案されている。 この論文。論文タイトルが提案手法を一言で表現していて洒落ている。 All-but-the-Top: Simple and Effective Postprocessing for Wo…