Психологічна енциклопедія » okku-orgo

Оперантне поводження (operant behavior)

Оперантне поводження (operant behavior)

Давно відомо, що на поведінку впливають його наслідки. Ми нагороджуємо або караємо людей, напр., щоб вони вели себе по-іншому.

При оперантном обумовлення на поведінку тж впливають його наслідки, але цей процес не є научением за методом проб і помилок. Його найкраще пояснити на прикладі. Голодну щура поміщають в частково ізольовану від звуків камеру. Протягом неск. днів за допомогою спеціальної автоматичної годівниці їй періодично подаються в лоток кульки їжі. Незабаром щур біжить до лотка, як тільки почує звук працюючої годівниці. Стіни камери виступає невеликий горизонтальний важіль, який при натисканні фіксується в крайньому нижньому положенні, але зараз він злегка піднятий для того, щоб при дотику до нього щури він міг рухатися вниз. При цьому замикається електричний ланцюг пристрою, що управляє подачею їжі. Відразу після того, як щур з'їдає отриману т. обр. їжу, вона починає швидко натискати на важіль. У цьому прикладі поведінка посилився, або підкріпилась, за допомогою лише одного наслідки. Щур не «намагається» щось робити в той момент, коли вона вперше стосується важеля, і не вчиться на к.-л. «помилки».

Для голодної щури природним підкріпленням служить їжа, але підкріпленням в наведеному прикладі є звук автоматичної годівниці, к-рий був обумовлений як підкріплення тим, що він постійно супроводжував подачу їжі ще до того, як щур натиснула на важіль. Насправді звук працюючої годівниці викликав би спостережуваний ефект навіть при відсутності подається їжі. Якщо подальше натискання важеля більше не буде супроводжуватися подачею їжі, щур перестане на неї натискати. Про такій поведінці кажуть, що воно було угашено.

Оперант може виникати під керуючим впливом к.-л. стимулу. Якщо натискання на важіль підкріплювати при включеному світлі і не підкріплювати при виключеному, реакції будуть здійснюватися при світлі і надзвичайно рідко, якщо взагалі будуть відбуватися в темряві. Щур сформувала розрізнення, або дискримінацію, світла і темряви. Коли вмикається світло, це викликає її реакцію, однак така реакція не є рефлекторною.

Важіль можна натискати з різним ступенем зусиль, і якщо підкріплювати тільки сильні реакції, щур стане натискати на нього все сильніше і сильніше. Якщо підкріплювати тільки слабкі реакції, це призведе в кінцевому підсумку до того, що вона стане реагувати лише дуже слабкими натисканнями. Такий процес називається диференціацією.

До того як реакція починає підкріплюватися і стає оперантом, вона може виникати в перший раз за ін. причин. Якщо необхідно виробити шляхом підкріплення к.-л. дуже складну реакцію, до-раю ніколи не виникне самостійно, її можна сформувати шляхом виділення її складових частин і підкріплення їх окремо, з тим щоб в кінцевому підсумку об'єднати їх у складний оперант. Підкріплення операнта не тільки формує топографію поведінки, воно зберігає це поведінка і після того, як був сформований оперант. У збереженні поведінки важливу роль відіграють режими підкріплення. Якщо реакція підкріплюється протягом певного часу, напр., через кожні 5 хвилин, щур не стане реагувати відразу після підкріплення, але буде все швидше і швидше реагувати по мірі наближення наступного підкріплення (режим підкріплення з фіксованим інтервалом). Якщо реакцію підкріплювати в середньому кожні 5 хвилин, але непередбачуваним чином, щур буде реагувати з певним ступенем сталості (підкріплення із змінним інтервалом). Якщо такий середній інтервал виявляється коротким, темп реагування буде високим; якщо він виявляється довгим, темп реагування буде низьким.

Якщо реакція підкріплюється після виникнення певного числа реакцій, щур буде все швидше і швидше реагувати по мірі наближення до необхідного числа реакцій (режим підкріплення з фіксованою пропорцією). Це число може досягати надзвичайно високих значень: щур буде продовжувати реагувати, навіть незважаючи на те, що її реакції підкріплюються вкрай рідко. Коли підкріплення здійснюється після нек-рого середнього числа реакцій, але непередбачуваним чином, такий режим підкріплення називається режимом із змінною пропорцією. Він знайомий нам з ігрових автоматів і систем, до-рие створені за принципом з'являються час від часу, але не передбачуваних винагород. Необхідне число реакцій можна легко збільшувати, і в індустрії азартних ігор усереднена пропорція встановлюється т. обр., що протилежна сторона - гравець - в кінцевому підсумку завжди програє.

Підкріплення можуть бути позитивними або негативними. Коли подається позитивне підкріплення, воно підсилює («підкріплює») реакцію; негативне підкріплення «підкріплює» реакцію, коли воно скасовується. Негативне підкріплення не є покаранням. Всі види підкріплення завжди підсилюють поведінка, що передається значенням самого слова «підкріплення». Покарання використовується для придушення небажаного поведінки. Воно полягає у скасуванні позитивного підкріплення або подачі негативного. Покарання осн. на процедурі обумовлення негативними підкріпленнями. Покараний чол. діє тими способами, к-рие знижують загрозу покарання, а тж тими, к-рие не пов'язані з карним поведінкою.

Відмітна особливість чол. як біолог. виду полягає в тому, що його голосові реакції можуть легко обумовлюватися як оперантов. У чол. існує безліч різновидів вербальних оперантов, оскільки його поведінка підкріплюється при посередництві інших людей, до-рие роблять безліч різних речей. Такі способи підкріплення, що практикуються у певній окремо взятій культурі, становлять разом те, що прийнято називати мовою. Люди, однак, говорять один одному те, що їм слід робити. Ми опановуємо більшою частиною нашої поведінки завдяки допомозі такого роду. Ми вдаємося до порад, прислухаємося до застережень, дотримуємося правил і підкоряємося законам, і нашу поведінку тим самим здійснюється під контролем наслідків, к-рий в інших випадках не був би настільки ефективним. Велика частина нашої поведінки виявляється занадто складною, щоб відбуватися з самого початку без такої вербальної допомоги. Звертаючись за порадою і дотримуючись правил, ми набуваємо набагато більш обширний репертуар, ніж це було б можливе лише за рахунок безпосереднього контакту з фіз. оточенням.

Реагування в рез-ті підкріплення наслідками вельми відрізняється від реагування в рез-ті отриманого ради, слідування правилам або підпорядкування законам. Ми не звертаємося за порадою з-за того, що вслід за цим наступить к.-л. конкретне наслідок: ми вдаємося до нього лише в тих випадках, коли виконання ін. ради, отриманого з подібних джерел, вже мало для нас підкріплюючі наслідки. В цілому, ми більш схильні робити те, що мало б негайні підкріплюючі наслідки, ніж те, що нам просто порадили робити.

Вроджене поведінка, досліджуване етологами, формується і зберігається в силу його значення для виживання індивіда і виду. О. п. формується і зберігається в силу його наслідків для індивіда. Щодо особливостей обох процесів залишається чимало спірних питань. Проте ні в одному з них, мабуть, не знаходиться місця для попереднього плану або цілі. В обох творчість замінюється відбором.

Може створюватися враження, що особиста свобода також знаходиться в загрозливому становищі. Проте існує лише відчуття свободи, до-рої, в свою чергу, тж залежить від підкріплень. Ті, хто реагує в силу того, що його поведінка мала позитивні підкріплюючі наслідки, зазвичай відчувають себе вільними. Їм здається, що вони роблять те, що їм хочеться робити. Ті, хто реагує в силу того, що підкріплення виявилося негативним, і хто, уникаючи або побоюючись покарання, робить те, що повинен робити, не відчувають такого почуття. Ці відмінності ніяк не пов'язані з самим фактом свободи.

Эксперим. аналіз О. п. привів до розроблення дизайн. технології, до-рую часто називають модифікацією поведінки. Вона полягає у зміні наслідків поведінки - видалення наслідків, - к-рие викликали проблеми, або вироблення нових наслідків для посилення бажаного поведінки. Історично чолов. поведінка регулювалася переважно на основі негативного підкріплення, тобто людей карали, коли вони не робили того, що мало підкріплюючі наслідки для тих, хто міг їх покарати. Позитивне підкріплення використовувалося набагато рідше, почасти тому, що його рез-ти виявляються неск. відстроченими в часі в порівнянні з покаранням, хоча воно може бути настільки ж ефективним, як і негативне підкріплення, і до того ж викликає набагато менше небажаних побічних ефектів.

См. також Модифікація поведінки, Класичне обумовлення, Закони навчання Торндайка

Б. Ф. Скіннер


.