t_wの輪郭

Feedlyでフォローするボタン
MT-Bench言語処理学会第31回年次大会表彰論文llm-jp-judgeLLM-as-a-Judge
あれ

あれ

2025/7/31 0:04:00

現在 llm-jp-judge は,Hugging Face Hubに登録されたオープンなLLM〜〜中略〜〜による推論に対応している

助かる。ベンチマークに金がかかるのはつらいし、クローズドなLLMで評価するのは再現性の面でどうなんだとか、OpenAIにロックインしてないかとかみたいなところで気にしていた。