応向分離
Retriever
類似度継承
検索語と検索対象の類似度によって順位付けを行う検索において、検索対象の上位に紐付けられたものの類似度を、検索対象の類似度として合算してしまうという手法
ある検索対象自身の類似度がたまたま高くなってしまって、検索結果においてノイズとなる可能性があるが、複数の類似度の合算とすることで、類似度のブレを抑えることが出来る。
輪郭法によるSentence Embeddingを用いた検索の強化
検索結果の候補として、知名とトークンが一致した輪郭に加えて、そこから前景後景を2回まで辿った輪郭も、検索候補とする。これにより、類義語を考慮した検索となる。
ベクトル検索と比較して、実装が簡単。ベクトル検索がまだ簡単ではないので。
輪郭の順位づけに、輪郭本体のSentence Embeddingに加えて、前景後景のSentence Embeddingを用いる。輪郭単体のSentence Embeddingでは、意図せず順位が高くなる恐れがあるが、互助的に順位を出すことで、より安定した順位付けとなる。
輪郭本体のSentence Embeddingがまだ計算されていない間も、前景後景から補完されて順位付けができる利点もある。
ベクトル検索
類似検索
あれ
もう少ししたらAIとのやり取りも飽きそう
大体分かってきたし、「AIが書いてるから面白い」の効果も薄れつつある。
普通に検索するみたいに、「何かが知りたい」となったタイミングで使う形に落ち着きそう。
手書き検索
あれ
全知検索
デライトで前に書いた投稿(輪郭)が見つからない
輪郭が見つからなかったとき、以下の方法で探すことができます。
- 「検索したい単語 site:dlt.kitetu.com」のようにGoogleで検索すると、Google上でデライトの輪郭を検索できます。
- デライトの検索欄で、「検索したい単語!?」のように検索するとより多くの検索結果が表示されます。
検索サイト
知名
連続検索
『Twitterのプロフィール画面に「ツイート検索機能」がテスト搭載 自分や他人の過去ツイートを検索可能』
注意→興味→検索→比較→検討→購買→情報共有
『DMMの検索に機械学習を導入して、A/B テストで圧勝した考え方』
書き検索
検索して一致するページがなかった場合は新しいページを作成する仕組み。
Scrapboxやデライトで実装されている。
接触元:失念
引き入れられの効用
あれ
本はAmazonの欲しいものリストにどんどん入れておいて、読みたくなった時に % で検索している。割引されてる商品だけ見られる。
転置インデックスでどう検索しているか
ツイート検索
Googleを使ったデライトの全文検索
検索キーワード site:dlt.kitetu.com
で検索
自分の輪郭だけを検索するときは
検索キーワード site:https://dlt.kitetu.com/利用者番号
例:検索キーワード site:https://dlt.kitetu.com/KNo.9-EDD2
のようにすると検索できる