手法としては、
LexRank(TexRankの派生)
EmbedRank(埋め込みベクトルを使う)
があるらしい。
GoogleのPageRankの考え方をベースにして、
文章単位毎に、ノード(文章ベクトル)とエッジ(類似性)を数式化し、
類似度=遷移確率から、ノード遷移確率が高いものを重要文章として
抽出するもの。
LexRank(TexRankの派生)
EmbedRank(埋め込みベクトルを使う)
があるらしい。
GoogleのPageRankの考え方をベースにして、
文章単位毎に、ノード(文章ベクトル)とエッジ(類似性)を数式化し、
類似度=遷移確率から、ノード遷移確率が高いものを重要文章として
抽出するもの。
コメント