t_wの輪郭

RSS

gzip

2023/7/14 0:00:00

『“Low-Resource” Text Classification: A Parameter-Free Classification Method with Compressors』あれ onnxruntime-nodeでgzipで圧縮したonnxファイルを読み込むあれ gzipでスパム判定 CompressionStream 『CompressionStream でブラウザで gzip 圧縮する』

CompressionStream

2024/9/4 23:21:00

『CompressionStream でブラウザで gzip 圧縮する』『Compression Streams API - Web API | MDN』DecompressionStream 『Compression Standard』

gzip CompressionStream

『CompressionStream でブラウザで gzip 圧縮する』

2024/9/4 23:20:00

https://zenn.dev/mizchi/articles/browser-gzip-inflate-deflate

gzipでスパム判定

2024/2/19 12:41:00

ONNX gzip onnxruntime-node

onnxruntime-nodeでgzipで圧縮したonnxファイルを読み込む

2023/12/3 0:17:00

const onnx_zip = fs.readFileSync('./sonoisa_sentence-bert-base-ja-mean-tokens-v2_onnx/model_quantized.gz');
const onnx_buffer = zlib.unzipSync(onnx_zip)
const session = await ort.InferenceSession.create(onnx_buffer);

Sentence Embedding gzip あれ

あれ

2023/7/14 1:24:00

そういうわけでgzipでSentence Embeddingが作れるんじゃないかと予備実験してみるとこんな感じ。そこまでパキッとしてないのでそんなに精度が出なさそうな感じがある。類義語をうまく取り扱えてないという感触。

類義語はともあれ、同じ文字が使われていれば類似度が出るので、最低限のベースラインとしては使えそう。

ちなみに、「類似度」というラベルで出しているが、サイズの比になるので、この値は小さいほど類似度が高いということになっている。

sentence classification gzip

『“Low-Resource” Text Classification: A Parameter-Free Classification Method with Compressors』

2023/7/14 0:02:00

https://aclanthology.org/2023.findings-acl.426/

sentence classification 『“Low-Resource” Text Classification: A Parameter-Free Classification Method with Compressors』kNN gzip

あれ

2023/7/14 0:00:00