t_wの輪郭

言語モデル

2022/6/11 8:40:00

LLM 小規模言語モデル応向分離 T5 あれあれ n-gram言語モデル『Xichuan: "逆に言えば LLM は単に言語モデルの一実装形態に過ぎないので、論理的推論とか...『Xichuan: "そもそもまず言語モデルという抽象的な概念があって、それをどのように実装するか、...拡散言語モデル言語モデルの物理学『言語モデルの内部機序：解析と解釈 - Speaker Deck』LM バリエーションセットは言語モデルの学習に効果がある言語モデルと人間は言語の使用を多重実現している

言語モデル多重実現

言語モデルと人間は言語の使用を多重実現している

2025/8/22 20:35:00

『言語モデルのふるまいと多重実現』

言語モデルバリエーションセット

バリエーションセットは言語モデルの学習に効果がある

2025/8/20 22:30:00

『言語モデルの事前学習におけるバリエーションセットの効果』

言語モデル

LM

2025/5/20 17:29:00

LLM 言語モデル GLM

言語モデル

『言語モデルの内部機序：解析と解釈 - Speaker Deck』

2025/4/4 7:36:00

https://speakerdeck.com/eumesy/analysis_and_interpretation_of_language_models

あれ

LLM 言語モデル

言語モデルの物理学

2025/3/24 20:05:00

『言語モデルの物理学 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ』

言語モデル DLM dLLM

拡散言語モデル

2024/10/30 21:33:00

『Xユーザーのgotoさん: 「拡散言語モデル(DLM)の論文。ここ最近のAI界隈で最大のニュース...あれ

LLM 言語モデル論理的推論

『Xichuan: "逆に言えば LLM は単に言語モデルの一実装形態に過ぎないので、論理的推論とか...

2024/8/2 12:25:00

https://fedibird.com/@xichuan/112888189761077616

あれ

LLM 言語モデル

『Xichuan: "そもそもまず言語モデルという抽象的な概念があって、それをどのように実装するか、...

2024/8/2 12:24:00

https://fedibird.com/@xichuan/112888181488450193

あれ

言語モデル N-gram

n-gram言語モデル

2024/7/7 9:07:00

ベイズ階層n-gram言語モデルあれ

言語モデル LLM 大規模 LM

LLM

2024/3/24 20:21:00

Large Language Model
大規模言語モデル

言語モデル SLM 小規模

小規模言語モデル

2023/12/16 20:52:00

Phi-2

レコメンドアイデア二つ embedding 検索精度言語モデル検索

応向分離

2023/11/20 23:15:00

おそらく一般的には応類と向類は同じ言語モデルで生成して検索に用いるのだが、応類と向類で異なる言語モデルを用いることで以下の利点が得られる。

利用者の動向から向類を学習させ、漸次的に検索精度を向上させる
利用者の動向から向類を学習させ、漸次的に個々の利用者に対して検索結果を変化させる
上記をしつつ、更新費用が高くなる応類を不変あるいは低頻度での更新と出来る

レコメンドにおいても同様のことができ、同じような利点が得られる。

Two-Towerモデルと同一。

Two-Towerモデルあれ 2023年11月9日日記応類向類

Cartesian Genetic Programmingで文章の類似度を学習言語モデル tzmtwtr/tw-posts-ja GPGPU knownetにベクトル検索を実装再帰的な処理再帰的な構造 Attention Transformer

あれ

2023/6/22 21:05:00

遺伝的プログラミングで文章の類似度を学習させるの、CPUで一から学習させるには計算量が全然足りない。GPGPUで学習させたいが、再起的な構造と処理によって文章を処理しているために、GPGPUとは相性が悪い。構造から手をつけるべきか。

Transformerを参考にすると良さそうだが、あれを理解するのに手間取っている。さらに言えばAttentionも理解できていない。あり物のモデルを使ったり学習させるだけなら理解は不要だが、遺伝的プログラミングに組み込もうとすると十分に理解する必要がある。

普通の言語モデルも一から学習させると相応に時間がかかるだろうし、一晩で学習が進まないのを嘆くのは気が早すぎるかもしれない。私の投稿を学習データ化した物でさえ、一晩でやっと一巡できる程度だ。Wikipediaも学習データに含み出すととんでもない時間がかかる。

あれ

Google 言語モデル

T5

2023/6/15 21:41:00

あれ Flan-T5

LLM 言語モデル深層学習 Meta

あれ

2022/6/11 8:39:00

あれ