t_wの輪郭
フォローする
このサイトについて
7/14/2023, 12:00:00 AM
Amazonで検索:gzip
7/14/2023, 1:24:00 AM

そういうわけでgzipでSentence Embeddingが作れるんじゃないかと予備実験してみるとこんな感じ。そこまでパキッとしてないのでそんなに精度が出なさそうな感じがある。類義語をうまく取り扱えてないという感触。

類義語はともあれ、同じ文字が使われていれば類似度が出るので、最低限のベースラインとしては使えそう。

ちなみに、「類似度」というラベルで出しているが、サイズの比になるので、この値は小さいほど類似度が高いということになっている。

Amazonで検索:あれ
7/14/2023, 12:02:00 AM
Amazonで検索:『“Low-Resource” Text Classification: A Parameter-Free Classification Method with Compressors』
7/14/2023, 12:00:00 AM
Amazonで検索:あれ