t_wの輪郭

Feedlyでフォローするボタン
大規模言語モデルの小規模化LLMGPT-4

あれ

2025/2/17 1:53:00

GPT-4もバリエーションがあり、2023年のGPT-4ならGemma2 9bが上回っている[1]。

Gemma2 9bの量子化されたモデルは5.4GB[2]であり、GTX 1070Tiで動かせる。

2024年2月に出たGemma-7B-itよりも、2024年7月に出たGemma-2-2b-itの方がChatbot Alenaで勝ってるので、激烈な速度で高効率なモデルが開発されてる。2026年にスマホで2023年のGPT-4相当のモデルが動いている可能性すらある。



2023年5月の時には2024年2月ごろにスマホでGPT-4相当のモデルが動いてるかなと思ってた(大規模言語モデルの小規模化)けど外した。さすがにサンプル数が少なすぎた。


[1] https://huggingface.co/spaces/lmarena-ai/chatbot-arena-leaderboard
[2] https://ollama.com/library/gemma2:9b

あれ