1.ポジティブな強化の力
私たちには常に選択肢があります。悪いことも良いことにも注意を払うことができます。 私たちのほとんどにとって自然な行動はこれです。何かがおかしくなったことがわかると、すぐに注意を払います。 子供を隅に置き、従業員から賞を奪い、口の中で犬をdogりました。 O.G. トルスノフはこれをハエの意識と呼んでいます。 一方、ハチの意識があります。それは、周りのすべてがどれほど良くて楽しいかを見るものです。 それが今日のことです。
積極的な強化は、アクションと一致するイベントであり、このアクションの2回目の発生の可能性の増加につながります。
強化には、ポジティブとネガティブの2種類があります。 肯定的なのは、被験者が望むもの、つまり、食べ物、愛情、賞賛です。 負の強化は、被験者が望まないものです:平手打ち、眉をひそめる、不快な音、不快な状況。
子供たちの両親への呼びかけの状況を取り上げてください。 親は、子供たちにできるだけ頻繁に電話をかけたいが、子供たちはそうではないことが多い。 補強には2つのオプションがあります。 肯定的なことは、子供たちが電話をかけたらすぐに、「あなたが電話したのは素晴らしい」と言われる必要があるということです。 発信者はこれを繰り返したいと思うでしょう。 マイナスの補強は次のようになります。「なぜそんなに長く電話しなかったのですか? 毎回電話する必要があるのはなぜですか?」 ここで、息子はそのような状況を避けるために再び電話したくありません。 実際、あなたは彼に電話しないように教えます。
HabréとMegamindでのポジティブな強化の例は、カルマ、評価、バッジの達成です。
私は良い記事を書きました-カルマにプラスを獲得しました。 私は悪い投稿を書きました-あなたは否定的な補強をしており、その結果、一般的にさらに書くことをためらいます。 したがって、最終的には、頑固なユーザーと頑固なユーザーはフィルターされます。
補強時間
援軍が時間通りに与えられると良い。 妻に「昨日は元気そう」と言ったら、すぐに言ったほど良くないでしょう。 犬にネットを頼んで座った場合、すぐに彼女の補強を与える必要があります。 彼女が起きるとき、それは間違いなく遅れます。
一方で、すぐに援軍を与えることは可能です、そして、これも原因を助けません。 強化を試みても、必ずしも結果が得られるとは限りません。 たとえば、単に試してみて新しい従業員を賞賛した場合、その従業員は一生懸命に試してみることに慣れるかもしれませんが、結果はオプションです。
強化値
補強はどうあるべきですか? 「少ないほど良い。」 補強は簡単に消化できるものでなければならず、非常に重要なものに変わるべきではありません。 動物を訓練する場合は、5秒後に食べるものを与えます。 人々は、仕事がより困難であるほど、より強く、より重要であると認めました。
また、 ジャックポットもあります。 これは通常の強化の100倍であり、常に予想外です。 理由もなく頭から持ち込まれた、オフィスでの突然のケーキの場合があります。 または、子供たちとサンクトペテルブルクのディボオストロフへの自発的な旅行かもしれません。 そのような補強(不適当な種類)も機能します。 しかし、それは突然で本当に大きくなければなりません。
条件付き強化
私たちは新年の音楽が好きです。というのは、新年がすぐに面白いものになることを意味するからです。 私たちは歯科医院の臭いが好きではありません。この臭いの後に歯車の穴あけ、時には痛み、そして多くのお金と時間が費やされるからです。 実際、これらは延期された増援です。まず増援の兆候があり、次に増援自体があります。 私たちが働くお金は条件付き強化です。 働いた→お金を受け取った→新しい車を購入した。
強化モード
永久に補強する必要はありません。 被験者が目的の行動を学習したら、ランダムで予測不可能な方法で強化を行うことができます。 一度自転車に乗るように子供に教えたら、あなたは彼の残りの人生のために彼をほめません。 少なくとも奇妙なことです。 しかし、行動をサポートできる刺激的な瞬間になるのは、まれで自発的な強化です。
個人的な練習からの例:デザイナーが一定の平均レベル(または平均よりわずかに低いレベル)で作業している場合、彼の側ではそのような補強としてバースト性の突発性が働きます。 そのような瞬間に、私は思う:「彼は、もちろん、悪党ですが、時々、彼は顧客が好む非常に良いものを配ります。 まだ彼を解雇する必要はありません。」
2.生産プロセス
対象がすでに必要なことを行っており、この動作を強化する必要がある場合-すべてが多かれ少なかれ明確です。 しかし、もし望む振る舞いがそこになく、あたかも何も無いように強化されたらどうなるでしょうか?
開発は、目的の動作に対するわずかな傾向を使用して、設定された目標に向かって段階的に移動することで構成されます。 最終目標を一連の小さな目標に分割します。 最初のステップとしてすでに行われているある種の動作を見つけます。 被験者が偶然に目的のタスク(またはその一部)を実行できることがよくあります。 この場合、この動作に注意し、強化する必要があります。
以下にリストされているのは、著者が詳細に解析する10の生産規則です。 この記事のフレームワークでは、詳細な説明は当てはまりませんが、表面的にはそれらに慣れることができます。
- 基準を少しずつ上げて、必要な条件を満たし、強化を受ける機会が常に得られるようにします。
- 特定の時間に1つのことを練習します。 複数の基準を同時に解決しようとしないでください。
- レベルアップに進む前に、現在の
- 新しい基準を導入すると、古い基準が一時的に緩和されます
- トレーニングプログラムを計画し、常にトレーニングの急激な進歩に備えることができます。
- 特定のスキルを開発する過程でトレーナーを変えないでください
- 1つの開発パスが失敗した場合、別のパスを見つけます。 たくさんあります
- 積極的に強化せずにトレーニングを終了しないでください。 これは罰に等しい。
- スキルが悪化した場合は、以前の学習プロセス全体をすばやく実行し、強化します
- 高音でワークアウトを終了します。 トレーニングの終了は、退屈ではなく、楽しいことです。
3.学習
Karen Priorも学習プロセスについて書いています。 つまり 不要な動作を削除したい場合。 彼女は学習の8つの原則を与えます。 それらの最初の4つは負で、2つ目は正です。 推測できるように、原則の後半はより良く機能し、永続的な結果をもたらします。
- 削除、削除、削除します。 単にソースを削除するか制限して、望ましくないアクションを物理的に実行できないようにします。
- 罰。 子供を隅に置き、犬を棒で打ち、プログラマーから賞を奪う
- 負の強化
- 絶滅。 望ましくない動作に注意を払ってはいけません。 何らかの形でそれを強化しないでください:否定的でも肯定的でもない。
- 互換性のない動作の開発。 望ましくないものと互換性のない新しい動作を開発する。
- この動作が信号で発生することを確認してから、この信号を徐々に削除します
- 不在の形成。 不要な動作を除き、すべてが強化されています。
- モチベーションの変化。 不要な動作が発生する理由と理由を特定し、動作目標をより適切な/正しいものに置き換えてみてください。
PS: Karen Priorは動物の訓練について多くのことを書いていますが、これらの同じ原則は私たちの日常生活にもうまく適用できます。 本を読んでいる間、私は個人的にポジティブな強化が私にどのように作用したかに気づきました。 本の表紙で発表されているように、本に記載されている科学を習得したので、コミュニケーションに実際に+1を得ることができます。