t_wの輪郭

Feedlyでフォローするボタン
dLLM

d1

2025/4/22 20:46:00
『d1: Scaling Reasoning in Diffusion Large Language Models via Reinforcement Learning』