t_wの輪郭

類似度継承

2023/11/9 23:23:00

検索語と検索対象の類似度によって順位付けを行う検索において、検索対象の上位に紐付けられたものの類似度を、検索対象の類似度として合算してしまうという手法

ある検索対象自身の類似度がたまたま高くなってしまって、検索結果においてノイズとなる可能性があるが、複数の類似度の合算とすることで、類似度のブレを抑えることが出来る。

コサイン類似度

2023/9/5 22:51:00

二つのベクトルの成す角を類似度として扱うやつ

1:似てる
0:無関係
-1:似てない

$$ cos(X, Y) = \frac{\sum_{i=1}^{N}(X_i Y_i)}{\sqrt{\sum_{i=1}^{N}(X_i^2)} \sqrt{\sum_{i=1}^{N}(Y_i^2)}} $$