Психологічна енциклопедія » rezhi-rive

Режими підкріплення (II) (schedules of punishment)

Режими підкріплення (II) (schedules of punishment)

Нек-рие стимули, напр. їжа для голодного тваринного або схвалення для осіб, що шукає розташування аудиторії, збільшують частоту реакцій, к-рие викликають появу цих стимулів (або передують їм). Щур, яка отримала їжу слідом за натисканням на важіль, надалі з більшою ймовірністю буде натискати на цей важіль, а осіб, чиї слова викликали гаряче схвалення аудиторії, з більшою ймовірністю буде продовжувати свою промову. Стимули, к-рие підсилюють передували їм реакції, називаються підкріплювальних стимулів, або просто підкріпленнями. Для того, щоб посилити бажану реакцію, її не обов'язково підкріплювати всякий раз після того, як вона виникла (напр. натискання щури на важіль може викликати появу їжі не всякий раз, а лише після п'яти таких натискань). Повний набір тих умов, при яких здійснюється підкріплення реакції, називається Р. п.. Дослідж. показують, що Р. п. багато в чому визначає вплив конкретного підкріплення на реакцію. Тут будуть розглянуті два аспекти вивчення Р. п.: поведінкові ефекти і теорет. трактування.

Поведінкові ефекти

Прийнято виділяти 3 поведінкових ефекту Р. п.: набуття, підтримання і збереження реагування. В цілому придбання (або научіння) сповільнюється в тому випадку, коли реакція підкріплюється лише після того, як вона виникла кілька разів. Щур, научающаяся натискати на важіль, буде швидше набувати цю реакцію, якщо їжа з'являється після кожного натискання, а не після неск. натискань. Р. п., при до-ром їжа пред'являється слідом за кожним виникненням реакції, називається безперервним, або постійним режимом; режим, при до-ром їжа пред'являється лише після неск. відтворень реакції, називається дискретним, або парціальним режимом.

Після того як реакція вже придбана, для підтримки реагування зазвичай виявляється досить переривчастих Р. п., особливо якщо підкріплювальний режим поступово змінюється від постійного до переривчастого. Переривчасті режими підтримують реагування і, що більш важливо, задають загальну частоту і тимчасові патерни реагування. Напр., одне і те ж кількість підкріплень може викликати як високу, так і низьку частоту реагування, в залежності від характеристик режиму. Традиційно Р. п. класифікують на основі 2 характеристик: кількості реакцій і часу реагування, необхідного для підкріплення. Режими, при яких для появи підкріплення потрібна певна кількість реакцій, називаються пропорційними (пайової) режимами; в них задається пропорційне відношення числа реакцій на одне підкріплення. Напр., якщо щур має чотири рази натиснути на важіль, перш ніж п'яте натискання призведе до появи їжі, пропорційний режим буде визначатися як 5:1. Режими, в яких крім самої реакції, необхідної для появи підкріплення, пред'являються вимоги до часу реагування, називаються інтервальними режимами. Напр., якщо має пройти 1 хвилина з моменту появи останнього їжі, перш ніж натиснути на важіль знову викличе її поява, такий інтервальний режим буде визначатися як хвилинний. В цілому пропорційні режими викликають більш високу частоту реагування порівняно з інтервальними режимами. Як у пропорційних, так і в інтервальних режимах може задаватися або фіксовану, або змінну кількість реакцій або часу відповідно. Так, якщо їжа з'являється після кожного п'ятого натискання на важіль, то цей режим буде режимом з фіксованою пропорцією; якщо їжа з'являється в середньому після п'яти реакцій (напр. після трьох, п'яти або семи реакцій), то такий режим буде режимом з мінливих пропорцією. В цілому режими із змінним підкріпленням підтримують стабільну частоту реагування, в той час як фіксовані режими викликають змінну частоту реагування. При фіксованих режимах частота реагування слідом за появою підкріплення спочатку знижується, коли реакція вже не може викликати цього підкріплення, а потім починає збільшуватися.

Третій поведінковий ефект Р. п. стосується збереження реагування (тобто меж, в яких дана реакція продовжує виникати вже після того, як вона більше не викликає появи підкріплення). В цілому, переривчасті Р. п. в значній мірі підвищують збереження реагування (тобто опірність угашению).

Оскільки частотні і тимчасові характеристики реагування у високій мірі залежать від конкретного Р. п., мн. сторони поведінки, традиційно розглядаються в мотиваційних термінах, можуть інтерпретуватися як ефекти Р. п. Напр., батьки, к-рие все-таки купують дитині солодощі після довгого опору його прохання, супроводжуваним ниттям і пхиканням, ненавмисно підкріплюють таку поведінку у відповідності з пропорційним режимом. Поведінковий аналіз відносить це поведінка до того Р. п., на основі якого воно купувалося і підтримувалося, на відміну від інших способів пояснення такої поведінки, відносять його до існування «потреби» в солодощах або до певного внутрішнього стану, напр. до розбещеності цієї дитини.

Теоретичні трактування режимів підкріплення

Теорет. трактування Р. п. взяла дві комплементарні форми: молярні і молекулярні підходи. В молярних підходах осн. зусилля концентруються на поясненні глобальних аспектів поведінки, що викликається тим чи іншим режимом (напр., граничної частоти реакцій або тривалості реагування в ході угашения реакції). В якості ілюстрації тут можна навести загальний висновок про те, що організм при зіткненні з двома одночасно доступними реакціями (так званий паралельний Р. п.) буде розподіляти свої реакції пропорційно кількості підкріплень, що викликаються цими реакціями. Так, якщо протягом певного періоду часу одна реакція буде викликати в три рази менше підкріплень, ніж ін., то реакцій першого типу буде виникати в три рази менше. Це молярне співвідношення між числом підкріплень і числом реакцій виражається загальним принципом відповідності: навчається погодить відносне число реакцій з відносним числом підкріплень.

З ін. боку, спостережувані в тому чи іншому Р. п. особливості поведінки можуть аналізуватися з т. зр. моментальних, або молекулярних відносин між конкретними стимулами, реакціями та підкріпленнями, що виникають у кожен момент часу. При даному підході вивчаються молярними підходами глобальні відносини розглядаються як кумулятивного вираження молекулярних процесів. Тобто, молярні відношення є лише наслідками молекулярних процесів і не являють собою фундаментальних принципів. Молекулярного підходу в інтерпретації Р. п. дотримувався Б. Ф. Скіннер. В протилежність цьому, при молярному підході глобальні відносини розглядаються в якості фундаментальних на підставі того, що такі відносини забезпечують опис поведінки на тому єдиному рівні, на до-ром можуть спостерігатися організовані функціональні відносини. Існуючі дослідж. вказують, що нек-рие молярні відношення дійсно можуть інтерпретуватися як сумарне вираження молекулярних процесів, тоді як ін. не можуть. Молярно-молекулярна проблема залишається предметом теорет. дискусій в даній області. Незалежно від того, який з цих рівнів в кінцевому підсумку виявиться найкориснішим у трактуванні ефектів Р. п., дослідж. останніх залишається як і раніше актуальним завданням внаслідок їх надзвичайно важливої ролі у придбанні, підтриманні і збереженні поведінки як в умовах лабораторних експериментів, так і в повсякденному житті.

См. також Експериментальні плани, Криві навчання, Теорії навчання, Оперантне обумовлення, Винагороди

Дж. У. Донахью


.