おそらく一般的には応類と向類は同じ言語モデルで生成して検索に用いるのだが、応類と向類で異なる言語モデルを用いることで以下の利点が得られる。
- 利用者の動向から向類を学習させ、漸次的に検索精度を向上させる
- 利用者の動向から向類を学習させ、漸次的に個々の利用者に対して検索結果を変化させる
- 上記をしつつ、更新費用が高くなる応類を不変あるいは低頻度での更新と出来る
レコメンドにおいても同様のことができ、同じような利点が得られる。
Two-Towerモデルと同一。
手書き検索の処理をローカルPCで試してるんだけど、1つ書くごとにPCがうなりを投げてる。その割に検索精度が低い。
検索に使う特徴量を事前計算して、さらに索引にすれば処理の負荷が減らせそうなんだけど、現時点では検索精度向上に向けた開発を高速化するために毎回特徴量を計算してる。
手書きの図の類似度判定は、離散コサイン変換してその係数のユークリッド距離を取ってる。いろいろ試したけどこれが一番精度が良い(なお精度が低い)。オートエンコーダーが脳裏をよぎる。ニューラルネットワークやりたくねぇずら。
検索精度向上のために、手書きの軌跡を結合してたらサーバープログラムが落ちた😇