t_wの輪郭

Feedlyでフォローするボタン
FFN
『Transformer LLMにおける層単位のFFN層の重要度検証』Transformer LLMではFFN層をネットワーク後部で有効化すると精度が高くなった