オペラント学習の概念 オペラント調整の理論

Bures Frederick Skinnerは彼の時間の最も有名な心理学者の一人でした。 今日の科学の起源に立っていたのは彼でした。 今日でも、彼の学習の理論は心理学、教育学、管理において重要な役割を果たしています。

科学者の実験

Skinnerの理論は、その基本的な作品の1つで詳細に説明されており、これは「生物の行動」と呼ばれています。 その中で、科学者はいわゆるオペラントコンディショニングの原理を設定します。 これらの原則を理解する最も簡単な方法で最も典型的な科学者実験の1つを考えています。 ラットの重量は通常の80~90%に減少しました。 それはスキンナー引き出しの名前を持つ特別な装置に配置されています。 それは、オブザーバー実験者が見ることができる行動のみをする機会を与えられます。

引き出しは、動物が食べ物を供給する穴を有する。 食べ物を得るために、ラットはレバーをクリックするべきです。 スキナーの理論におけるこのプレスは、操作反応と呼ばれます。 ラットがこのレバーをクリックすると、足、鼻、そして多分尾を通してクリックすることは重要ではありません。 実験における操作応答は、それが1つの結果のみを引き起こすので、その結果としても同じままである。ラットは食べ物を得ます。 動物の食料を一定の数の腕立て伏せのために奨励して、研究者は動物で対応するための持続可能な方法を形成します。

スキナーの行動

スキナー理論における術回答は任意で標的化された効果である。 しかし、スキナーはフィードバックの点でこの焦点を決定します。 言い換えれば、動物の特定の結果が影響を受けます。

Skinnerは、精神的発達の双方向の性質のために、ワトソンの科学者と竜巻カの景色と同意しました。 彼らは、2種類の要因が精神社会的および遺伝子の形成によって影響されたと考えていました。 操作者の学習を伴うと、特別な操作がサポートされており、これは主題によってコミットされます。 言い換えれば、遺伝データは社会的に決定された行動が構築されている基礎となる。 したがって、開発、スキナーは、外部環境の特定のインセンティブによる学習です。

スキナーはまた、他の被験者の行動を監視するだけでなく、それ自身の行動に関しても使用できると考えられていました。 自己制御は、目的の行動が強化される特別な条件を作成することによって達成することができます。

肯定的な補強

スキナーの強化理論における操作者学習は、特定の環境で行われた対象(「操作」)の能動的な行動に基づいています。 特定の必要性を補充するか目標を達成するためにいくつかの自発的な行動が有用になると、それは肯定的な結果によって支えられます。 例えば、ハトは包括的な行動を学ぶことができる - ピンポンゲーム。 しかし、このゲームが食べ物を得るための手段になる場合にのみ。 Skinnerの理論の奨励は、正確に最も望ましい行動であるため、強化の名前を受けました。

一貫した比例補強

しかし、実験者が差別的学習によってこの行動を形成しない場合、ピングエンはピンポンゲームを学ぶことができません。 これは、ピジョンの個体が一貫して、選択的に科学者によって支持されていることを意味します。 B.F.スキナー補強材の理論では、特定の時間間隔で発生し、ある時間間隔で発生するか、または特定の割合で発生することができます。 定期的なお金の賞金の形でランダムに分配された昇進は、人間のゲーム中毒の開発を誘発します。 特定の時間間隔で発生するプロモーション - 給料 - 人が特定のサービスに残っているという事実に貢献します。

スキナーの理論における比例励みは非常に強力な強化であり、彼の実験での動物は実質的に死によって死にかけていました。 強化行動とは異なり、罰は否定的な補強です。 罰の助けを借りて、新しい行動モデルを教えることは不可能です。 それは、被験者は常に罰金の後に罰を伴うことを常に避けます。

罰の使用は、原則として、副作用を有しています。 スキナーの学習の理論では、以下の罰の影響が示されています:高レベルの不安、病気、攻撃性、それ自体の世話。 時には罰は個人に特定の方法で行動を止めるのを抑制します。 しかし、その不利な点は、それが陽性の挙動の形成に寄与しないことです。

罰は、被験者が望ましくない行動のモデルを放棄しないようにしばしば罰せられていない隠された形にそれを変えるだけです(たとえば、それは仕事でのアルコール飲料の飲酒になる可能性があります)。 もちろん、罰が社会的に危険な行動を抑制する唯一の方法であるように思われることが多く、それは他の人々の人生や健康を脅かす。 しかし、普通の状況では、罰は無効な露出手段であり、それを回避する必要があります。

オペラント学習スキンナーの理論の長所と短所

スキンナーの概念の主な利点と短所を考慮してください。 彼女の利点は次のとおりです。

  • 仮説をチェックし、実験に影響を与える追加の要因の制御。
  • 状況要因の重要性、外部環境のパラメータの認識。
  • 行動を変換するための効果的な心理療法手順を作成することを許可されている実用的アプローチ。

Skinnerの理論:

  • 軽減 動物によって実証された行動は、ヒトの行動の分析に完全に減少します。
  • 実験室条件における実験による低妥当性。 実験結果は自然環境の条件に移すのが難しい。
  • 特定の種類の行動を形成する過程で認知プロセスに注意を払わない。
  • スキナーの理論は、実際には安定で持続可能な結果を\u200b\u200b与えない。

動機の概念

スキナーはまた動機の理論を作成しました。 その基本的な考え方は、これを繰り返すという願望やその行動は、過去のこの行動の影響によるものです。 特定のインセンティブの存在は特定の行動を引き起こします。 1つまたは別の行動の結果が陽性である場合は、将来的にこのような状況で題材を振る舞います。

彼の行動は繰り返されます。 しかし、特定の戦略の結果が否定的である場合、将来的には彼は特定のインセンティブに反応しないか、戦略を変更します。 スキンナーの動機の理論は、特定の結果の繰り返しの繰り返しが、被験体における特定の行動植物の形成をもたらすという事実に減少します。

人格と学習の概念

スキナーの観点からは、人物性は人生中に個人によって取得された経験です。 対照的に、例えば、Freudから、学習の概念の支持者は、人の心に隠されている精神的なプロセスについて考える必要があるとは対立していません。 スキナーの理論における人格は、外部要因によって形成されたほとんどの部分である製品です。 それは社会的環境であり、内部精神生活の現象ではなく、個人的な機能を特定します。 人間の精神スキンナーはブラックボックスを検討しました。 感情、モチーフ、そして本能を詳細に調査することは不可能です。 したがって、それらは実験者の観察から除外されなければなりません。

科学者が長年にわたって働いてきたオペラント学習スキナーの理論は、その豊富な研究を要約することになっていました:その人がしています。

主な目的

外部的に観察された、利用可能な観察と研究

人間の行動の尺度

研究方法観察、問題における実験的学習

行動の実験的分析

基本概念の行動、応答および運営者の学習、

決定の原則、補強、昇進

そして罰、強化モード、修飾

動作

主なアイデアは集中しています - 外部環境の影響。

オペラントの人生の素晴らしい価値

どの行動モデルで学習しています

それらは彼らの結果(強化文字)によって分けられます、

それら。 行動はインセンティブの観点から説明されています

そして補強の影響を強化する。 行動的な

反応は徐々にそして絶えず折り返します

開発要因社会的要因学習

貴重な - 学習理論の枠組みをより軽減する

オペラント動作の複雑なモデル

社会的状況への注目を集める

環境、行動強化の特性へ

個人

広い実用的なアプリケーション(修正

行動、訂正のための操作者技術者

プログラム学習)

批判の道順 - 人の発展における決定的な役割

世紀の環境への影響

内部を分析するための拒絶を原則

(心理学的)行動の要因、認知

似非


スキナーのアイデアは非常に広い実用的なアプリケーションを見つけました。 成功した一貫した近似の戦略と肯定的な強化の技術は、個人の行動の挙動を変更するための方法の基礎となりました。 彼らのアプリケーションの特定の分野の中には、さまざまな恐怖、驚異的、そして強迫的な州、破壊的な行動の再編、コミュニケーションスキルのための訓練、不安の治療、片頭痛、筋肉の緊張の治療における生物学的フィードバックの訓練高血圧症 オペラントの技術と就学前の年齢の子供たちが使用され、精神科診療所の患者、そして刑務所の囚人に。 「トークン報酬」、感作、脱感作、「OFF Time」、または「タイムアウト」を取得した方法。 コンピュータを使用したプログラムトレーニングは、主にスキナーによって開発された原則に基づいています。 多くの専門家たちが「行動の建設技術」の有効性を認識していますが、その方法のメカニズム、頭の権威主義的な傾向、そして開発の内部要因を無視し、過度に広く使用されていると警告しました。この方法の

セルフテストの質問:

1.新しい形態の行動の形成パターンは何ですか(古典的な行動の位置から)?

2.心理学における生体と行動のアイデアの比率は何ですか?

3.古典的な調整と運営者の学習の法律の下でのトレーニングを比較します。

4.子供や大人の規制挙動のさまざまな種類の補強の例を示します。

5.行動心理学における開発の年齢定期化の問題はどのように解決されますか?

6.行動の変更は何ですか?

7.子供の社会化の問題への行動的アプローチの特異性は何ですか?

演習1.

J. Watsonの記事「Breviorism」からの抜粋を読み、行動主義に特有の概念を強調し、このアプローチに特徴的な主な規定、それらの文言に注意を払っています。

「言い換えれば、バイオ活動主義は会社の研究室になると考えています。 行動の作業を妨げる状況は、最初に反応を呼び出すインセンティブがその後呼び出すことがあるということです。 それを決定するプロセスを(習慣の形成と呼ばれる前に)と呼びます。 この困難さは遺伝的方法に頼る行動を強制した。 生まれたばかりの赤ちゃんでは、彼は、いわゆる反射体の生理学的系を観察する、またはより良い、先天性反応を観察します。 無条件で影響を受けない反応の在庫全体に基づいて、彼はそれらを条件付きに変えようとします。 それは、出生時またはそれが比較的小さい直後に現れる複雑な不安定な反応の数がそれを検出することを検出します。 これは本能の理論を完全に拒絶する必要性をもたらします。 クロール、クライミング、緊張、戦い(あなたが長いリストを作ることができる)のような本能が本能と呼ばれる複雑な反応のほとんどは、現在規定または条件付きであると考えられています。 言い換えれば、動作主義者はより多くのデータを見つけられません。これは遺伝的な行動の存在、ならびに遺伝的に特殊能力の存在(ミュージカル、芸術など)の存在を確認するでしょう。 彼は、すべての子供たちでほぼ同じである先天性反応が比較的少ないと考えており、厳密に定義された道にあらゆる子供の形成を送ることが可能である「歴史上の読者」心理学の開放危機期間(10年の始まり - 30年代半ばXXセンチュリー)。

追加の文献:

1. Vygotsky A.S. 「心理学に基づくトレーニングの原則」//短所のロシア語の翻訳を序論に序文。 だから。:6 Tで。1. P. 177-195。

2.リンデって ソーシャルワークの心理療法。 1992年。

3.ルストフK.グループの心理療法。 1993年、1993年。

4. Hammatyainen Yu。子育て両親。 1993年、1993年。

第V8章社会化問題としての子供の精神的発達:社会科学理論

補強材は決定の原理の1つです。 スキナーによると、幼児年齢からすでに、強化刺激を用いて人々の行動を調整することができる。 2つの異なる種類の補強材があります。 食べ物や疼痛のようなものは、一次補強材と呼ばれます。 彼らは自然な強化力を持っています。 その他の強化インセンティブ(笑顔、大人の注意、承認、賞賛)は強化によって引き起こされます。 彼らは主な補強材との頻繁な組み合わせのようになります。

肯定的な強化に基づく機会的な条件、すなわち サポートまたは強化されている反応の結果として、例えば、食品、お金の報酬、賞賛。 それにもかかわらず、スキナーは否定的な補強材の重要性を強調し、それは反応の退色をもたらす。 そのような強化刺激は、体罰、道徳的影響、心理的圧力であり得る。 不快な刺激を罰するときは反応に従うとき、反応が再び現れる可能性を減らす。 スキナー残念ながら、罰は「これは現代の世界で使用される最も一般的な行動管理技術です。 。 この計画はみんなに知られています。男があなたが好きではないと思われるならば、子供がひどく振る舞うならば、それを叩くと、他の国の人々がひどく振る舞うならば、彼らの爆弾を失います」(サイト。クレーンW.パーソナリティ形成の秘密。SPB:Prime-Evhnova、2002. P. 241)。
強化に加えて、決定の原理はその即時性です。 実験の初期段階では、直ちに強化されている場合にのみ、反応を最高レベルにすることが可能であることがわかった。 そうでなければ、形成され始めた反応は、急速に消えます。

回答者だけでなく、操作者でも、その条件はインセンティブの一般化に観察されます。 一般化 - これは、本来開発された条件付きReflexが最初に開発されたものと同様のインセンティブとの応答の連想的な接続です。 一般化の例は、ある種の犬の攻撃、子供の肯定的な反応、子供の肯定的な反応(笑顔、「お父さん」、会議への移動など)の恐れがある。彼の父。



反応の形成はプロセスである。 反応は直ちに起こらず、突然、多くの補強材が作られるため、徐々に装飾されています。 一貫した強化は、形成されると予想される最終的な行動と徐々に似ている行動の強化を通じて、複雑な行動の開発です。 一般的な挙動は、挙動の個々の要素の補強の過程で形成されており、集計では複雑な行動に入ります。 それら。 最終形式での一連のもった学習された行動は、ホリスティックな行動として認識されています。

プロセス自体は、いわゆる強化モードによってサポートされています。 強化モードは反応の百分率と間隔補強です。 強化を研究するために、スキナーはスキナーボックス(スキナーボックス)を発明しました、彼は動物の行動を見ました。

概略的に、それはこのように見えます:
S1 - R - S2、
ここで、S1はレバーです。
r - レバーを押す。
S2 - 食品(補強)。

行動は環境(または補強)を変えることによって制御されます。 例えば、反応回数にかかわらず、一定期間後に(1)を与えることができる。 (2)一定数の反応(レバーを押す)などを通して。

強化体制

そのような補強材料の体制が割り当てられた:連続的な強化 - 対象が所望の反応を与えるたびに補強の提示。 断続的または部分的な強化。
強化モードのより厳密な分類のために、2つのパラメータが割り当てられた - 一時的な強化および比例補強。 第1の場合、第2の活動を実行する必要があった期間が期限切れになった場合にのみ支持され、第2回、作業の量(行動数)が生成されるべきである。

2つのパラメータに基づいて、4つの補強モードが記載されています。

1.一定の比率の補強モード。 補強は反応の確立された量(体積)に従って行われる。 そのような体制の例は、特定の一定の作業のための支払いかもしれません。 たとえば、翻訳された標識の数の翻訳者の支払い、または印刷物の量の代表主義者。

2.一定の間隔を持つ強化モード。 補強はしっかりと確立されたときにのみ行われ、固定時間間隔が期限切れになります。 たとえば、月曜日、月曜日、毎時支払、厳しく設定された身体的または精神的な仕事の時間の後に休んでください。

変数関係の補強モード。 このモードでは、本体は平均された平均された数の反応に基づいて支持されています。 したがって、宝くじのチケットの購入は、そのような補強モードの例であり得る。 この場合、チケットの購入は、賞金がある確率で侵入する可能性があることを意味します。 誰かが購入されていないが、いくつかのチケットが購入されている場合、確率は増加しています。 しかし、結果は原則として少し予測可能で矛盾しており、人はチケットの購入に投資された金銭を返すことはめったにありません。 それにもかかわらず、結果の不確実性、そして大きな賞金を待っていることは、反応の吹き込みと行動の騒音を遅くします。

4.可変間隔を持つ強化モード。 個人は、不定間隔が経過した後に補強を受けます。 この場合、補強モードのように、この場合、補強は時間によって異なります。 時間間隔は任意です。 短い間隔は、高い応答率を生成し、長い低い。 このモードは、実績レベルの推定値が不規則に行われるときに教育プロセスに適用されます。

スキナーは、異なる動物と同様に、さまざまな人々の中での特定のスキルの発展の変動について、強化の個性について話しました。 さらに、補強自体はユニークです この人や動物が強化として機能することができると言うことは自信を持って不可能です。

個人的な成長と発展

子供が発症するにつれて、その反応は吸収され、環境への影響を強化する管理下に残る。 サポート効果、食品、賞賛、感情的な支援などの形で、同じアイデアはスキンナーによって「口頭の行動」(1957)に記載されています。 彼は、スピーチマスターが操作されたコンテンツの一般的な法則に従って発生すると考えています。 子供は特定の音を発音するときに補強を受けます。 補強材は食べ物や水ではありませんが、大人の承認と支援。
批判的なコメントでは、有名なアメリカンリンギストN. Khomskyは1959年にスキナーの概念に話しました。 彼は習熟スピーチの間に強化の特別な役割を否定し、言語構造の人の意識に役割を果たす構文規則を無視するためのスキンナーを批判しました。 彼は、規則の訓練は特別な教育プロセスを必要としないが、「音声マスタリングメカニズム」と呼ばれる先天性、特定の音声メカニズムのために実行されると考えた。 したがって、マスタリングスピーチは学習の結果としてではなく、自然開発を通じて。

精神病病理

学習の心理学の観点から、隠された深い理由で病気の症状の説明を求める必要はありません。 行動主義によると、未消化態様、そして(1)未開発反応の結果、または(2)同化した非適応反応の結果である病理学。

(1)必要なスキルおよびスキルの形成における強化の欠如の結果として、不透明な反応または行動欠損が起こる。 鬱病はまた、形成のための強化の欠如、または必要な反応を維持することさえも考えられる。

(2)非適応的な反応は、行動の規範を満たさない社会に受け入れられない行動の同化の結果です。 そのような挙動は、望ましくない反応の強化の結果として、または反応および補強のランダムな一致の結果として生じる。

行動の変化は、行動および関連する補強材の修正システムに関する、運転コンテンツの原則にも構築されています。
A.挙動の変更は、自己制御の結果として発生する可能性があります。

セルフコントロールには、2つの相互依存応答が含まれています。

二次反応の可能性を変えることによって環境に影響を与える制御反応(「怒り」を発現しないように注意を払う。食べ過ぎから落ちるために食品の除去)。

2.所望の挙動をより可能性が高い(教育プロセスの実施のための表の存在)という状況において、インセンティブの存在を目的とした制御反応。

B.行動の変化が行動的なコンサルティングにより発生する可能性があります。 多くの点で、このタイプのコンサルティングは学習の原則に基づいています。
Wolpe(Wolpe)は、不適切な行動を変えるために実験プロセス中に処方された教育原則の使用を決定すると、治療の治療を決定します。 不適切な習慣は弱まり、排除されます。 反対に、適応習慣は導入され強化されています。

コンサルティングゴール:

1)不適切な行動の変化。

2)意思決定の回復

3)行動結果を予測することによる問題を防止する。

4)行動レパートリーの赤字の排除。

コンサルティングステップ:

1)行動評価、取得した行動の情報収集。

2)緩和手順(筋肉、口頭)。

3)体系的な脱感作 - 警報画像による緩和の関係。

4)トレーニング保証

5)強化手順

学習の理論の利点と短所

利点:

厳格な仮説、実験、追加変数の制御を厳重させたいという願望。

状況変数の役割、環境パラメータ、およびそれらの体系的研究の役割の認識。

3.治療への実用的なアプローチは、行動を変えるための重要な手順を作成することを可能にしました。

デメリット:

1.還元主義 - 人間の行動を分析するために動物で得られた行動の原則の理解。

2.実験室条件を実験することによって引き起こされる低い外部妥当性、その結果は自然条件に移行するのが困難です。

3. S-R接続を分析するときの認知プロセスを無視します。

4.理論と実践の間の大きなギャップ。

5.行動理論は安定した結果を与えません。

最終更新日:2018/12/12

運用学習には、特定の種類の行動を強化または終了させるために、報酬と罰のシステムが含まれています。

機会的な学習は、ある種の行動に対する報酬と罰によって発生する学習方法です。 オペラント学習の本質は、行動とこの行動の結果との間の連想的な関係を確立することです。

オペラントの学習の考えはバイエタリストに属しているので、この学習方法はスキンナー法と呼ばれます。 Skinnerは、内部思考と動機の行動を説明することは不可能だと考えました。 代わりに、彼は人間の行動に影響を与える外部の原因に注意を払うことを提案しました。

Skinnerは、外部要因の影響下で特定の結果に注がれる行動を説明するために「操作者」という用語を使用しました。 言い換えれば、スキナーの理論は、様々な日常習慣や行動をどのように習得するかを説明しています。

操作者学習の例

実際、私たちの周りの運営者学習の例は、両親から報酬を得るための宿題、または賃金や宣伝のためにプロジェクトに取り組む従業員を築く学校です。
これらの例は、賞の見通しがタスクに貢献するが、操作者の学習は、刑または望みの剥奪によって人を何もするためにも使用することができる。 たとえば、この機会に大きな変化を演じるために彼らを奪うならば、子供たちは教室で話すことを学ぶことができます。

オペラント学習の構成要素

補強材は、特定の行動モデルの開発に影響を与える任意の行動です。 補強材の2種類があります。
肯定的な補強は、望ましい行動を促進するために使用される報酬です。たとえば、賞賛や報酬。
否定的な補強材は、望ましい行動を促進するために停止または減少する不快な行動や結果です。
特定の行動モデルを奨励するために使用されています。

処罰は、不要な行動モデルを止めるために行われている不快な行動です。

処罰には2種類あります。

  1. 肯定的な罰は、その後の反応を弱めるための望ましくない行動の使用を意味します。
  2. 否定的な罰は、治療が必要な行動の徴候の場合の目的の対象の除去または剥離の停止を意味します。

両方のタイプの罰は、望ましくない行動モデルを弱めることを目的としています。

B. Skinner(1904-1990)は、破壊されていないことの代表です。

「事業者バイオビオリズム」の理論の主な規定:

1.研究の主題は、そのモーター構成要素内の体の挙動です。

1.行動は、体が作るもの、そしてそれが観察され、したがって意識とその現象 - 意志、創造性、知性、感情、人格は客観的に観察されないので、研究の主題ではありません。

彼自身が彼の混練を制御することは決してないので、その人は無料ではなく、外部環境によって決まります。

4.人格は一連の行動テンプレートとして理解されています」という状況は反応であり、後者は以前の経験や遺伝的歴史によって異なります。

5.行動は3つのタイプに分けられます。 無条件に反射し、条件付き反射、それはインセンティブに対する簡単な対応であり、そして運用者は自発的に起こり、条件付きとして定義されます。 このタイプの行動は、体の外部条件への適応において決定的な役割を果たします。

オペラント行動の主な特徴は、過去の経験、または強化と呼ばれる最後の刺激に対するその依存です。 補強材に応じて行動が向上または弱められている。

完全な動作のための正または負の補強のプロセスは条件付きと呼ばれます。

8.補強に基づいて、すべての材料が小さな部品に除去されたとき、そして各部の連続が成功した場合には、子供を学ぶシステム全体、いわゆるプログラムされた訓練を構築することが可能です。 、生徒は積極的な補強を受け、故障の場合には否定的な場合。

9.人を育成し管理するシステムは同じ基準で建設されています - 社会的行動は協会的な行動は会社によって否定的な強化を持つべきであるが、社会、価値観、行動規則の積極的な強化によって起こります。

強化モード

オペラント学習の本質は、強化された行動を繰り返すことを目指していることであり、行動は除去されていないか、罰が繰り返さないか、または抑制されない傾向があるということです。 その結果、強化の概念はスキナーの理論において重要な役割を果たしています。

オペラントの動作が購入され保存される速度は、補強のモードによって異なります。 強化モード- 補強が発生する可能性を確立する規則。 最も単純な規則は、対象が所望の反応を与えるたびに補強材を提示することである。 いわゆる 連続補強のモードそして通常、身体が正しい反応を生み出すことを学習しているときに、任意の操作者学習の初期段階で使用されます。 しかしながら、日常生活のほとんどの状況では、これは実用的な反応を維持するために実用的ではなかったか、または経済的には、行動の強化が常に同じで規則的ではないので。 ほとんどの場合、人の社会的行動は時々サポートされています。 母親の注意が達成される前に、子供は繰り返し泣いています。 科学者は難しい問題の正しい解決策になる前に何度も間違えられます。 これらの実施例の両方において、それらの一つが支持されるまで、殻のない反応が見出される。

Skinnerはモードのように慎重に研究しました 間欠, または 部分的な強化オペラントの行動に影響を与えます。 多くの異なる強化モードが可能であり、2つの主なパラメータに従ってすべて分類することができる.1)補強材は、前回の補強以降に期限切れまたはランダムな時間間隔が満了した後にのみ起こり得る(いわゆるモード。 一時的な補強); 2)補強材は、補強日から特定またはランダムが得られた後にのみ起こり得る。 反応数(モード 比例補強)。 2つのパラメータに従って、4つの主な補強材が分離されています。

1. 一定の比率の補強モード(PS)。 このモードでは、本体は、所定のまたは「定数」回数の対応する反応の存在によって支持されている。 このモードは日常生活の中で普遍的であり、それは行動を制御する上で重要な役割を所有しています。 多くの雇用分野では、従業員は部分的に、または販売されているユニットの数に従って一部を支払っています。 業界では、このシステムは製品単位の料金として知られています。 PSモードは通常、体が反応するのが多いほど、それが受け取るより大きな補強材をより頻繁にするので、通常非常に高い作業者レベルを設定する。

2. 恒久的な間隔の補強モード(PI)。 一定のインターバルの補強モードでは、身体はしっかりと設置された後に支持され、または「恒久的な」時間間隔が前回の強化の瞬間から実行されます。 人間レベルでは、PI Regimeは、1時間、週または月に行われた作業の給与の支払いを支払うときに有効です。 このように、毎週のポケット費用に対するお金の毎週の発行は補強の形によって形成されます。 大学は通常PIの一時モードに従って働きます。 検査は定期的に確立され、学術学業能力に関する報告が時間通りに発行されています。 補強が得られた直後にPIモードが低い応答率を与えることは興味があります - 呼ばれる現象 補強後の一時停止. これは学期の真ん中で訓練の困難を経験している学生の指標である(それは彼らが試験に合格したと想定されています)次の試験はもうすぐわからないでしょう。 彼らは文字通りトレーニングで休憩を取ります。

3. 変数関係の補強モード(太陽)。 このモードでは、本体は平均された平均された数の反応に基づいて支持されています。 おそらく、太陽の体制の管理下にある人の行動の最も劇的なイラストは刺激的なギャンブルです。 あなたが賞を下げるために硬貨や特別なハンドルを引き下げる必要がある人の行動を考えてみましょう。 これらの装置は、人がハンドルを制御するために支払う試み回数に従って補強(お金)が配布されるようにプログラムされている。 しかし、賞金は予測不可能ですが、矛盾しており、めったに投資したプレイヤーを乗り越えることができません。 これは、カジノの所有者が彼らの通常の顧客よりもかなり多くの強化を受けている理由を説明しています。 さらに、太陽の計画に従って取得された行動の騒音は、以下の補強があるときに体が正確に知らないので非常に遅い。 したがって、プレーヤーは、微妙な勝利(または失われた)にもかかわらず、次回彼の「甘いクッシュ」を完全に信頼しています。 そのような忍耐力は、Sun Regimenによって引き起こされる行動に典型的です。

4. 可変間隔を持つ強化モード(中と)。 このモードでは、圧力の時間間隔が経過した後に本体は補強を受けます。 PIモードと同様に、補強は時間によって異なります。 しかしながら、Vモードによる補強材間の時間はある種の平均を中心とし、正確に確立されていない。 原則として、Wモード時の応答率は、適用された間隔長の直接関数である:短い間隔は高速を生成し、長い間隔が低速生成される。 また、モードで強化されていると、生物は一定の応答率を確立し、反応の強化がない場合、それらはゆっくりと褪色します。 最終的には、次の補強があると、本体は正確に予測できません。

日常生活の中では、モードは頻繁に見つかりませんが、そのオプションのいくつかは観察されます。 たとえば、親は、子供がそれに応じて、そして盗難されていない時間間隔で行動し続けることを願って、子供の行動を非常に恣意的に称賛することができます。 このように、その周波数が1回の旅行によって3週間で3週間から1ずつずつ変化する「予期しない」テストをする教授は、平均2週間で、Wのモードを使用します。 これらの条件下では、次のテスト作業がどの瞬間になるのかわからないので、比較的高いレベルの隣接することを期待することが可能です。

原則として、Wのモードは、PIモードよりも高い応答率とフェージングに対する抵抗を大きくします。

条件付き補強

学習に従事する理論学は、2種類の補強材を認識しました - プライマリとセカンダリ。 一次補強は、強化特性を持っている自分で、あらゆるイベントやオブジェクトです。 したがって、それらは生物学的ニーズを満たすために他の補強材との予備的な関連付けを必要としない。 人々のための一次補強インセンティブは、食料、水、身体的な快適さと性別です。 体の値の値は学習に依存しません。 二次, または 条件付き一方、補強材は、身体の最後の経験のために、一次補強材との密接な関係によって補強を実行するための特性を獲得するあらゆる事象または物体である。 人間における一般的な二次強化インセンティブの例は、お金、注意、アタッチメント、そして良好な推定値です。

オペラント学習の標準的な手順の小さな変化は、中立的なインセンティブが行動の支援力を得ることができる方法を示しています。 ラットが「スキナー引き出し」のレバーを押すことを学んだとき、直ちにビープ音(反応直後)に入った後、食事ボールが続きます。 この場合、音はASに機能します 区別されたインセンティブ(すなわち、動物は、食料報酬に報告するので、音声信号の存在下でのみ対応することを学ぶ。 この特定の操作者反応が設定された後、空想が始まる:ラットがレバーに押されたとき、フィードもビープ音も現れない。 しばらくした後、ラットはレバーを押すのを止めます。 その後、動物がレバーを押すたびにビープ音が繰り返されますが、食事のボールは表示されません。 最初の強化刺激がないにもかかわらず、動物はレバーを押すとビープ音が生じるので、それは持続的に応答し続け、それによって絶滅を弱める。 言い換えれば、レバー上の取り付けられたプレス速度は、ビープ音が条件付き補強係数として機能するという事実を反映している。 正確な応答率は、状態補強刺激としての音声信号の音(つまり、ビープ音が一次補強刺激と関連している場合の数から学習過程で)としての音声に依存します。 スキナーは、実際には、以前に他のインセンティブと関連しているかどうかは、以前に特性を強化していた場合にはどのような中立のインセンティブが支持されている可能性があると主張しました。 したがって、条件付き補強材の現象は、特にそれが人の社会的行動に関するものであるならば、可能な作業者学習の範囲を大幅に増大させる。 言い換えれば、私たちが学んだことすべてが一次補強に比例しているでしょう、それから学習の可能性は非常に限られています、そして人間の活動はそれほど多様ではないでしょう。

条件付き補強の特徴は、複数の一次補強材を備えたユニットが一般化されていることです。 お金は特に指標の例です。 明らかに、お金は私たちの主な預金を満たすことができません。 文化交流システムのおかげで、お金はさまざまな楽しみを得るための強力で強い要因です。 たとえば、お金を使用すると、ファッショナブルな服、明るい車、医療、教育を提供することができます。 他の種類の一般化条件付き補強刺激は、お世辞、賞賛、添付ファイル、および他の人の劣後です。 これらのいわゆる 社会的強化のインセンティブ(他の人の行動を含む)はしばしば非常に困難で厳しく行動することがしばしば行動しますが、さまざまな状況での行動に不可欠です。 注意は簡単な場合です。 誰もが、子供が患者をふりやすいかひどく振る舞うときに注意を引くことができることを知っています。 多くの場合、子供たちは迷惑な、ばかげた質問に、大人の会話、描かれた、若い姉妹や兄弟たちに介入して、ベッドに遭遇します - そしてすべてが注目を集めることです。 重要な他の両親、先生の注意は、特に効果的な一般化された条件付きインセンティブであり、それは注目を集めることの顕著な行動を促進することができます。

さらに強力な一般化条件付きインセンティブは社会承認です。 例えば、承認された配偶者や恋人の外観を得ることを願って、多くの人々が鏡の前に熱心に多くの時間を過ごしています。 そして女性、そして男性のファッションは承認の主題であり、社会的承認があるまで存在します。 高校生は、両親、ピアツァーバー、隣人の承認を得るために、大学陸上競技チームの場所を競い、またはカリキュラムの外での出来事に参加しています(ドラマ、紛争、学校年鑑)。 大学の良いマーク - も - 肯定的な強化刺激, それが早く、両親の賞賛と承認を受けました。 強力な条件付き補強インセンティブであること、満足のいく評価も教えの推進に貢献し、高度な学術的成果を達成します。

Skinnerは、条件付き強化刺激が人間の行動を抑制するのに非常に重要であると考えました(Skinner、1971)。 彼はまた、各人が学習の独自の科学を渡し、すべての人々が同じ強化インセンティブによって管理されていることはほとんどありません。 例えば、誰かのために、非常に強力な強化刺激は起業家としての成功です。 他のものでは、優しさの表現は重要です。 そして他の人はスポーツ、学術的または音楽の授業で支持刺激を見つける。 条件付き補強刺激によって支持された行動の可能な変動は無限である。 その結果、人間における条件付き強化インセンティブを理解することは、なぜ食品を欠いているのかを理解することよりもはるかに複雑で、レバーを押し、ビープ音が強化されているだけです。

観察されたインセンティブによる行動の制御

スキナーの観点からは、主に人間の行動が管理されています aversmiss.(不快または痛み)のインセンティブ。 嫌悪コントロールの最も典型的な2つの方法は そして 負の鉄筋. これらの用語はしばしば概念的なプロパティと過度のコントロールの動作効果を説明するための同義語として使用されます。 Skinnerは次の定義を提案しました。 p.33)。

罰。 期間 それは、続く、またはいくつかの操作者反応の外観に依存するあらゆる激しい刺激または現象を指します。 それが伴う反応を強化する代わりに、刑は少なくとも一時的に減少し、反応が繰り返される可能性が低下する。 罰の推定目的は、人々がこのように振る舞わないように奨励することです。 Skinner(Skinner、1983)は、これが現代生活の中で行動を制御する最も一般的な方法であることに気づいた。

スキナー上で、罰は彼が電話をかける2つの方法で実行することができます 肯定的な罰そして 否定的な罰(表7-1)。 肯定的な処罰は、行動が活発な結果につながるたびに発生します。 ここにいくつかの例があります:子供がひどく振る舞うならば、彼らは吐き回ったり、熱心にしたりします。 学生が試験で幼児を楽しむならば、彼らは大学や学校から除外されています。 大人が盗みに巻き込まれたら、それらは罰金または投獄されています。 否定的な処罰は、行動が(可能)肯定的な補強インセンティブの排除に続くたびに起こります。 たとえば、子供たちは悪い行動のためにテレビを見ることを禁じられています。 否定的な罰への広く使われているアプローチはサスペンション技術です。 この技術によれば、特定の補強インセンティブが利用可能である状況から即座に削除されます。 たとえば、クラスを妨害する4年生のいたずらな学生は、キャビネットから追放することができます。

<Физическая изоляция - это один из способов наказания с целью предотвратить проявления нежелательного поведения.>

負の補強。 罰とは対照的に、 負の補強 -これは、体が嫌悪刺激を制限するか、またはそれを回避するプロセスです。 ケースの反転を防ぐ行動は、したがってより頻繁に繰り返され、否定的にサポートされています(表7-1を参照)。 ケアの行動は非常に問題です。 灼熱の太陽から隠れて部屋に入って隠れている人が、太陽が再び灼熱感になるとそこに戻る可能性が高いと言ってみましょう。 回避される圧倒的な刺激は、避けられているため、物理的に表現されていないので、嫌悪刺激の注意はそれの回避と同じではないことに留意されたい。 その結果、不快な条件に対処するための別の方法は、それらを避けること、すなわち外観を防ぐためのような方法で行動することを学ぶことです。 この戦略は回避を回避することとして知られています。 たとえば、教育プロセスが子供が宿題を避けることを可能にする場合、否定的な補強材は学習への関心を高めるために使用されます。 習慣は、習慣を維持するために熟練した計画を発展させているが、過剰停止の影響に訴訟を起こさない場合には、回避行動も行われます。

表7-1。 肯定的および否定的な強化と罰

増強と罰の両方を2つの方法で実行することができ、それは反応に続くものに依存します:心地よいまたは不快なインセンティブの提示または排除。 補強材は反応を強化することに留意されたい。 罰 - それを弱める。

Skinner(Skinner、1971,1983)は、過度のインセンティブに基づくすべての形態の行動管理を使用して苦労しました。 彼は行動を非効率的な手段として罰を強調した。 その理由は、その脅迫的な性質のために、望ましくない行動の戦術的処罰は否定的な感情的および社会的副作用を引き起こす可能性があるということです。 不安、恐怖、反社会的行動、自尊心と自信の喪失は、罰の使用に関連するいくつかの可能な副作用だけです。 嫌悪的なコントロールに触発された脅威はまた、彼らが最初に処罰されたものよりも、人々を行動モデルにプッシュすることができます。 例えば、仲別学研究のために子供を罰する親を考える。 後に、親がない場合、子供はさらに悪い授業ではなく、街路を徘徊し、学校の財産を台無しにすることができます。 結果にかかわらず、罰が子供の望ましい行動を開発することに成功しなかったことは明らかです。 罰は一時的に不要な行動を一時的に抑制することができるので、スキナーの主な異議は、それに続く罰がそれに続く、それに最も罰がかかる可能性が最も高いという行動は、罰することができる人がいないということでした。 セクシーなゲームのために数回数回、それは必ずしもその継続を放棄するわけではありません。 残酷な攻撃のために刑務所に入られた人は、必ずしも残虐行為が発生しやすいとは限りません。 処罰される可能性がある(Skinner、1971、P.62)の後に再び処罰される可能性があるのが現れます。 これにより、人生の例を簡単に見つけることができます。 彼が家の中に誓ったもののためにスパッチした子供は他の場所で自由にそれをするかもしれません。 スピード違反のために罰金を科された運転手は警官を支払うことができ、そしてレーダーが近くの巡回がないときにスピードを超え続けることができます。

行動のオーバーララの管理の代わりに、スキナー(Skinner、1978)をお勧めします 肯定的な補強, 不要な行動を排除するための最も効果的な方法として。 彼は、肯定的な強化インセンティブが過飽和刺激に関連して否定的な副作用を与えないので、それらはヒトの行動の形成に適していると主張した。 たとえば、有罪判決を受けた犯罪者は、多くの懲罰的な施設で耐え難い状況に含まれています(これまでの数年間の米国での数多くの刑務所暴動)。 明らかに、犯罪者を修復することをほとんどの試みに失敗した、これは高レベルの再発または法律の繰り返し違反を確認します。 Skinnerのアプローチを適用すると、法律遵守市民の行動に似た行動が積極的に支持されるように刑務所の環境の条件を解決することが可能であろう(たとえば、社会的適応のスキル、値、関係を学ぶ)。 そのような改革は、学習、性格、そして精神病病理の原則に関する知識を持っている行動に関する専門家の関与を必要とするでしょう。 スキナーの観点からは、このような改革は、既に入手可能な資源および理念主義者が訓練された心理学者を使用して首尾よく実施されている可能性がある。

スキナーは積極的な強化の可能性を示し、それは教育、ビジネス、そして産業において、子供の教育で使用される行動の戦略に影響を及ぼしました。 これら全ての分野において、所望の行動の促進が増加する傾向があり、望ましくないことの罰ではない。

インセンティブの一般化と区別

強化原理の論理的な拡大は、ある状況で強化された行動が、体がそれに似た他の状況に直面するときに繰り返される可能性が非常に高いということです。 それがそうでなければ、私たちの行動セットは午前中に目が覚めた可能性があるほど限られているので、新しい状況ごとに正しく反応する方法についての長い考えをしています。 スキナーの理論では、強化された行動の傾向は、呼ばれる多くのそのような規定に分布しています インセンティブの生成. この現象は日常生活で観察が簡単です。 例えば、家庭で洗練された良いマナーを称賛した子供はこの行動を適切な状況で一般化し、家の外で、そのような子供は、新しい状況で実際に行動する方法を学ぶ必要はありません。 インセンティブの一般化も不快な生活経験の結果であるかもしれません。 見知らぬ人を強姦した若い女性は、彼らが見知らぬ人によって与えられた身体的および感情的な傷害を彼女に思い出させるので、彼の恥と敵意を異性のすべての人にとって一般化することができます。 このように、特定の民族グループ(白、黒、ラテン、アジア)に属する人が引き起こされた恐怖や反転経験の唯一のケースは、個人がステレオタイプを作成し、したがって将来の社会的連絡先を回避するのに十分であり得る。このグループの代表者。

反応を要約する能力は、私たちの日常的な社会的相互作用の多くの重要な側面であるが、適応行動においては、さまざまな状況に違いを生む能力を持つ必要があることはまだ明らかです。 インセンティブの識別, 一般化の構成要素は、環境のさまざまな状況で適切に対応することを学ぶプロセスです。 多くの例があります。 トラフィックの赤と緑の色を区別するという事実のために、運転手はラッシュアワーに生き生きとしたままです。 子供は家の犬と邪悪な犬を区別することを学ぶ。 ティーンエイジャーは、仲間の承認、そして行動、迷惑、そして他の人を疎外させる行動を区別することを学ぶ。 糖尿病は、ただちに、たくさんの砂糖を含む食物を区別することを学ぶ。 実際、人のほとんどすべての合理的な行動は区別をする能力に依存します。

他のインセンティブの存在下で、いくつかのインセンティブの存在下での反応の強化を通して識別する能力が得られる。 識別されたインセンティブは、さまざまな社会的状況において特別なオペラント反応の表現に関連する可能性のある結果を予測する機会を与える機会を与える。 したがって、独特の能力の個々のバリエーションは、さまざまな補強材の独特の過去の経験に依存します。 スキナーは、一般化と遠くの能力との相互作用の結果として、正常な個人的な開発が起こり、肯定的な強化を最大限に活用し、罰を最小限に抑えるために私たちが私たちの行動を規制し、それを調整することを示唆した。

順次近似:山をマゴメにする方法。

オペラント学習の分野におけるスキナーの最初の実験は、通常、平均または高周波(例えば、屋根レバーを押すと、鍵の上のピジョンカラムなど)で拡張された反応に焦点を当てた。 しかしながら、ほぼゼロに等しい確率で自発的に遭遇する可能性がある多数の複雑なオペレータ反応には、標準的な操作学習の方法が不十分であることがすぐに明らかになった。 例えば、人間の行動の分野では、オペラント学習の一般的な戦略の助けを借りて、精神科部の患者に対応する対人的スキルを身に付けすることができます。 この課題を促進するために、スキナー(スキナー、1953)は心理学者が効果的かつ迅速に、その男が持っていたセット内のほとんどあらゆる行動を決定するのに必要な時間を迅速に減らすことができる技術を思い付きました。 このテクニックは_ 成功した近似の方法, または 挙動の形成, それは、所望の操作者の行動に最も近い行動を強化することからなる。 これはステップバイステップで近づくので、1つの反応が支持され、次いで他のものに置き換えられ、所望の結果に近い。

Skinnerは、行動を実施するプロセスが口頭の音声の発展を決定することを見出しました。 彼のために、その言語は、両親、兄弟姉妹との最初の口頭でのコミュニケーションによって提示された、子供の声明を強化した結果です。 したがって、幼児期の貧困のかなり簡単な形で始めて、子供の口頭の行動は成人の言語に似たようになるまで徐々に発展します。 「口頭による行動」では、スキナーは他の行動のような「言語の法則」についてのより詳細な説明を提供し、同じ操作者の原則(Skinner、1957)を使用して理解されています。 そして、可能性があったので、他の研究者はスキナーの承認に疑問を投げかけ、その言語は人生の最初の年の間に選択的に支持されている言語は言葉の声明の製品です。 Skinnerの最も厳しい批評家の1つであるNOEM Homsky(Chomsky、1972)は、オペラント学習の観点から、幼児期の言葉のスキルの同化の速度が高いと主張しています。 ホムスキーの観点から、脳が所有している特徴は、子供が言語を取得する理由です。 言い換えれば、会話通信の複雑な規則を吸収する先天性能力があります。

スキナーの学習とバイホイック方向の簡単な概要を終えました。 見たように、スキナーは、因果的行動因子として、人の骨力や動機づけ状態を考慮することが必要ではありませんでした。 むしろ、彼は特定の環境とオープン行動の関係に焦点を当てました。 さらに、彼は、人格が操作者学習によって取得された特定の形態の行動以下であるという意見に従っていた。 これらの議論は包括的な人格論に追加されているかどうか、しかしスキナーは人間の学習問題についての私たちの考えに深い影響を与えました。 スキンナーの景色を抱えている哲学的規定は、私たちがすでに満たしている人のほとんどの人物学者から明らかにそれを分離しました。

トピックを続ける:
タトゥーのためのアイデア

Ryabina Red(普通)は正しい形のピラミッド冠を持つ木です。 ナナカマの樽や枝は滑らかな灰色の樹皮で覆われています。 この植物の高さ...