レコメンドシステムにおいて、ユーザーのEmbeddingを計算するモデル(Query Tower)と、推薦対象のEmbeddingを検索するモデル(Candidate TowerあるいはDocument Tower)の2つを使う手法。
検索システムにおいてはQuery towerで検索文のEmbeddingを生成する。
dual encoderとも呼ばれている。
レコメンドシステムにおいて、ユーザーのEmbeddingを計算するモデル(Query Tower)と、推薦対象のEmbeddingを検索するモデル(Candidate TowerあるいはDocument Tower)の2つを使う手法。
検索システムにおいてはQuery towerで検索文のEmbeddingを生成する。
dual encoderとも呼ばれている。
Multilingual-E5でも実は入力文に"query:" "document:"というプロンプトを入れて、2つ(検索文と検索対象)を識別できる
結論としてはHyDEはそれほど有効ではないことです。少し改善すれば性能は良くなりますが、検索スピードは非常に遅いですし、コストも大幅増加するので、ほぼ実用ではない手法といえます。
HyDEはLLMで質問文を生成するので、遅いし費用も掛かる。
モデルの学習のコストを掛けられるのであれば、Two-Towerモデルのほうが早く検索できて良さそうに思える。