Психологічна енциклопедія » kont-kriv

Кореляція і регресія (correlation and regression)

Кореляція і регресія (correlation and regression)

Розгляд К. і Р. будується навколо наступних осн. питань: а) чи існує між змінними X і Y такого роду зв'язок, що по відомим значенням X ми могли б, принаймні з розумної ступенем точності передбачити значення Y? б) Яка сила (або тіснота) зв'язку між змінними X і Y? в) За умови існування такого зв'язку між X і Y, яке оптимальне правило (або, висловлюючись математично, рівняння) для передбачення Y по X і наскільки добре воно обгрунтоване? Коли ми займаємося оцінкою ступеня тісноти або зв'язку (строго кажучи, ступеня лінійного зв'язку), ми маємо справу з К. Термін «Р.» відноситься до питань, пов'язаних з передбаченням значень однієї змінної за значенням ін.

Коефіцієнт кореляції

Коефіцієнт К. добутку моментів Пірсона (r), частіше званий просто коефіцієнтом К., - яв-ся показником сили лінійного зв'язку між двома змінними і змінюється в межах від +1 до -1. Нульове значення коефіцієнта К. Пірсона вказує на відсутність лінійного зв'язку між X і Y; позитивні значення цього коефіцієнта свідчать про існування тенденції збільшення Y по мірі збільшення X, тоді як його негативні значення свідчать про існування протилежної тенденції: зменшення Y по мірі збільшення X.

Прямолінійна К. між X і Y мала б місце в тому випадку, якщо б значення Y можна було безпомилково передбачити за значеннями X, використовуючи рівняння прогнозу виду Y = аХ + b, де а і b - відповідним чином підібрані константи. При а > 0 спостерігалася б повна позитивна К. (+1), а при а < 0="" -="" повна="" негативна="" кореляція="" (-1).="" рівняння="" виду="" y="аХ" +="" b="" називається="" лінійним="" рівнянням="" =""="" за="" побудові="" графіка="" функції="" y="" від="" x="" =""="" точки="" (x,="" y),="" що="" задовольняють="" даного="" рівнянню,="" лягають="" на="" пряму="" лінію.="">

Коефіцієнт К. Пірсона - це показник ступеня лінійної зв'язку, а не зв'язки взагалі. Напр., він може вказувати на повну відсутність К. (r = 0) між двома змінними, зв'язаними функціональної нелінійною залежністю. З-за цих обмежень коефіцієнт К. Пірсона має тенденцію недооцінювати ступінь зв'язку між змінними.

Незважаючи на те що існує неск. різних, хоча і еквівалентних формул для обчислення коефіцієнта К. Пірсона, найбільш відомою розрахунковою формулою яв-ся наступна:

де N - число парних оцінок по X і Y.

При інтерпретації коефіцієнта К. слід проявляти обережність. Одного тільки факту К. між змінними X і Y ще недостатньо для автоматичного виводу про існування між ними причинного зв'язку. X може корелювати з Y, тому що: а) зміни X викликають зміни Y; б) зміни Y викликають зміни Х; в) зміни ін. змінних служать причиною змін як X, так і Y. Напр., у уч-ся початкової школи обсяг словникового запасу позитивно корелює з їх зростанням, тому що обидві ці змінні пов'язані з віком. До того ж коефіцієнт К. Пірсона може знижуватися внаслідок «обмеження широти вибірки».

Зіставлення кореляційних і експериментальних досліджень

Эксперим. дослідж. передбачає маніпулювання однієї або декількома незалежними змінними і часто має рез-том формулювання причинно-наслідкових тверджень щодо впливу незалежних змінних на залежну змінну. Коректність таких тверджень, як правило, забезпечується дотриманням трьох наступних умов: а) на початковому етапі дослідж. експерим. групи не повинні систематично розрізнятися по всім контрольованим змінним; б) ці групи зазнають однакового впливу всіх контрольованих факторів, за винятком впливу незалежної змінної; в) після експерим. впливу, викликаного маніпулюванням незалежної змінної, групи надійно різняться між собою за рівнем залежної змінної.

Кореляційне дослідж. не припускає маніпулювання незалежними змінними і у своїй найпростішої формі зводиться до вимірювання ряду змінних і визначення сили зв'язків між ними. Хоча такі дослідж. забезпечують нас інформ. про ступінь зв'язку і навіть дозволяють пророкувати значення одних змінних за даними, якими ми володіємо щодо ін. змінних, вони, як правило, не дозволяють робити висновки про причинно-наслідкові зв'язки між змінними. Однак у наш час дослідникам доступні методи статистичного аналізу, що дають можливість перевірити, наскільки конкретна кореляційна плеяда узгоджується з певною моделлю причинно-наслідкових відносин.

Приватний коефіцієнт К. rXY.W є показником сили лінійного зв'язку між змінними X і Y при виключеному вплив змінної W. Він також дозволяє «очистити» парну К. від примешивающегося впливу більш ніж однією змінною.

Множинна кореляція

Припустимо, що ми хочемо домогтися найкращого передбачення змінної Y (критеріальної, або залежною змінною) на основі ряду ін. змінних X1, Х2, Х3, ..., Хр (прогнозуючих, або незалежних змінних). Напр., нам захотілося передбачити ступінь успішності навчання в аспірантурі на основі студентських відміток і кількісних оцінок письмових іспитів для аспірантів (GRE). Користуючись методами побудови множинної регресії, ми можемо отримати вираз виду:

b0 + b1Х1 + ... + bpXp,

де b0, b1,..., bp - відповідним чином підібрані константи, яке оптимально пророкує Y. Коефіцієнт множинної К., r, являє собою коефіцієнт К. добутку моментів Пірсона між найкращим прогнозом і фактичними значеннями прогнозованої змінної, і, як такий, що служить мірою правильності передбачення на основі множинної регресії.

См. також Кореляційні методи, Статистика в психології

А. Д. Велл


.