うまく微分の伝搬を表現できれば、もうちょっとシンプルな導出にできそうな気がする。 具体的な数式じゃなくて抽象的な数式をこねこねしたら行ける雰囲気。
『深層学習 Part 2』が「微分の連鎖律」を使って誤差逆伝播法の説明をしており、大変興味深い