概要
- バックプロパゲーション(BP) は、現代のニューラルネットワーク(NN)とディープラーニングの中心技術
- 1970年にSeppo Linnainmaa が現代的なBP(自動微分の逆モード)を初めて発表
- BPの前身は1960年にHenry J. Kelley が発表し、以降多くの研究者が発展に寄与
- ディープNNの効率的な訓練法としてBPが広く普及 したのは2010年代以降
- 歴史的経緯や誤解の訂正、主要な研究者や論文 についての要点整理
バックプロパゲーション(BP)の発明と発展
- BPの現代的手法 は1970年、フィンランドの大学院生Seppo Linnainmaaによる発表
- 自動微分の逆モードとしても知られる
- 当初はNNに直接関連付けられていなかった
- BPの前身 は1960年、Henry J. Kelleyによる最適飛行経路の勾配理論
- 1960年代から1970年代にかけてBryson、Pontryagin、Dreyfus、Amariらが関連研究を展開
- 勾配降下法 の歴史は19世紀に遡るが、NNへの応用は1960年代から
- 初期は変分法や動的計画法を基盤とした解析
- 効率的なBP は1970年のLinnainmaa論文・FORTRANコードで初めて明示
- 1971年Ostrovskiiらによる学術誌での初公開
- 2020年時点でTensorflow等全てのNNソフトウェアがLinnainmaa法を基礎に構築
ニューラルネットワークへの応用
- コスト関数最小化へのBP応用 は1973年Dreyfusが明示
- NN特化のBP は1982年Werbosによる初報告
- 1974年の彼の博士論文には未記載
- Amari(1967) は多層パーセプトロン(MLP)をSGDでエンドツーエンド訓練する手法を提案
- 5層MLPで内部表現の獲得を実証
- GMDHネットワーク(Ivakhnenko, 1965〜) は階層的な内部表現を学習する最初のディープNN
- 層ごとに回帰分析で訓練
BPの普及とその後
- 1985年頃 にはLeCunやParkerもBPの研究を発表
- 計算コストの低下とPC普及で実験が容易に
- Rumelhartら(1986) の実験でBPがNNの隠れ層内部表現を有効に学習することを実証
- 2010年以前 は「ディープNNはBPだけで訓練できない」との誤解が一般的
- 無教師事前学習(Schmidhuber, 1991)が必要とされていた
- 2010年、Schmidhuberらの研究 でディープFNNが単純なBPのみで有用な結果を出せると示され、BPの重要性が再認識
よくある誤解と正しい理解
- BP=単なる連鎖律 という誤解
- 実際は「大規模ネットワークへの効率的な連鎖律適用法」
- 非効率な方法も多く存在し、BPの効率性が鍵
- BPの発表は1970年
- それ以前の研究もあるが、「効率的なBP」の明示はLinnainmaaが初
参考文献・主要人物
- Seppo Linnainmaa (1970年):現代BPの発明
- Henry J. Kelley (1960年):BPの前駆研究
- Amari, Saito, Bryson, Dreyfus, Werbos, Ivakhnenko, LeCun, Parker, Rumelhart :関連分野の主要研究者
- Schmidhuber :ディープラーニング史の整理とBP普及の功績
ライセンス・連絡先
- 教育・非商用利用 を推奨(CC BY-NC-SA 4.0)
- 誤り指摘やフィードバック はjuergen@idsia.chまで
このまとめは、Jürgen Schmidhuberの2014年~2025年にわたるBP史の解説をもとに、要点を日本語で簡潔に整理したものです。