Mathmatical Principles of Reinforcement 強化の数学的原理を訳してみようと思うよ

最近なぜか部分強化スケジュールの勉強をしています。具体的には、スケジュールでのそれぞれのスケジュール固有の動物の挙動を表現する強化学習モデルの式を探しています。今回は、そんな式を理解するために記事にします。誰かのためというよりも、自分が理解をするために書いていきます。

一個の記事で終わるかなと思っていたけど、覚醒だけでかなりの文字数になったので３つの大きな要素をそれぞれ分けて記事にしました。

MPR: Mathmatical Principles of Reinforcement

日本語にするなら、強化の数学的原理（以下MPR）でしょうか。行動が増える強化という現象ですが、その現象を数式で表現したものになります。

元の論文はこの二つです(Killeen 1994; Killeen and Sitomer 2003)。オープンアクセスでもないです。また、内容もなかなかにややこしいのでまだ全文通して読んでの理解が僕もできていないです。なので、今回はWikipediaの英語版ページの和訳をしてきます。

さて、このMPRというのは、重要な要素が３つに分かれているそうです。arousal:覚醒、association:結合、constraint:抑制、です。それぞれの内容について３個の記事に分けて書きました。ここでは、簡単にそれぞれの内容に触れておきます。

覚醒とは、強化子が提示されることによって引き起こされる自発的な活動の増加を指します。ここでの活動というのは、レバーを押すというような実験的に強化したいオペラント行動というよりも、飼育小屋ん中を徘徊したりというような一般的な活動性の増加を指します。

この一般的な活動は、強化子の出現頻度が上がると線形に増加するそうです。

Killeen, Peter R. 1994. “Mathematical principles of reinforcement.” Behavioral and Brain Sciences 17 (1): 105–35. https://doi.org/DOI: 10.1017/S0140525X00033628.

Killeen, Peter R, and Matthew T Sitomer. 2003. “MPR.” Behavioural Processes 62 (1): 49–64. https://doi.org/https://doi.org/10.1016/S0376-6357(03)00017-2.