t_wの輪郭

llm-jp-judge

2025/7/31 0:00:00

2025/7/31 0:04:00

現在 llm-jp-judge は，Hugging Face Hubに登録されたオープンなLLM〜〜中略〜〜による推論に対応している

助かる。ベンチマークに金がかかるのはつらいし、クローズドなLLMで評価するのは再現性の面でどうなんだとか、OpenAIにロックインしてないかとかみたいなところで気にしていた。

2025/7/31 0:00:00