t_wの輪郭

Feedlyでフォローするボタン

あれ

2023/7/19 21:52:00

Wikipediaを学習データとしてメモリーに全文展開しようというのは、おこがましいとは思わんかね

あれ

2023/9/9 10:20:00

今日は朝から学習データのクレンジングをした

あれ

2023/8/27 20:06:00

SNSの運営は当行の通報・監査に関するデータを持っているだろうから、ChatGPT的なものの強化学習に使うデータが豊富そう

あれ

2023/7/3 9:02:00

末尾の「だ、である」調と「です、ます」調 で Sentence Embeddingが極端に変わってしまって、類似度が低くなるのは、学習データの偏りもありそう。私t_wがデライトに投稿した文章から学習させているので、「だ、である」の文章が偏って多い。