ПІДГОТОВКА ДАНИХ ДО МАТЕМАТИЧНОЇ ОБРОБКИ



МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

 

ЧЕРКАСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ

ІМЕНІ БОГДАНА ХМЕЛЬНИЦЬКОГО

 

 

Кафедра прикладної психології

 

Нечипоренко О. В.

 

МАТЕМАТИЧНІ МЕТОДИ В ПСИХОЛОГІЇ

Конспект лекцій навчальної дисципліни

для студентів психологічного факультету

Черкаси – 2015


УДК

ББК

 

Математичні методи в психології:Конспект лекцій навчальної дисципліни для студентів психологічного факультету / Розробники: старший викладач кафедри прикладної психології Нечипоренко О. В.; Черкаський національний університет імені Богдана Хмельницького. – Черкаси: Вид. від. Черкаського національного університету імені Богдана Хмельницького, 2015. – 88 с.

ISBN

 

Розробники:

О. В. Нечипоренко,старшийвикладач кафедри прикладної психології.

 

Рецензенти:

Д. М. Харченко, доктор психологічних наук, доцент кафедри психології.

Л. І. Мохнар,кандидат педагогічних наук, викладач кафедри психології та педагогіки Черкаського інституту пожежної безпеки імені Героїв Чорнобиля НУЗС України.

 

Затверджено на засіданні кафедри прикладної психології Черкаського національного університету імені Богдана Хмельницького

(протокол № 18від 26.03.2015 р.)


ЗМІСТ

 

Лекція 1. ПРОБЛЕМА ВИМІРЮВАННЯ В ПСИХОЛОГІЇ…………………. 4
Лекція 2. ОСНОВНІ СТАТИСТИЧНІ ПОНЯТТЯ…………………………….. 9
Лекція 3. ПІДГОТОВКА ДАНИХ ДО МАТЕМАТИЧНОЇ ОБРОБКИ……… 16
Лекція 4. МІРИ ЦЕНТРАЛЬНОЇ ТЕНДЕНЦІЇ……………………………….. 22
Лекція 5-6. РОЗПОДІЛ ЗМІННИХ ВЕЛИЧИН………………………………. 28
Лекція 7-8. ДОСЛІДЖЕННЯ ВЗАЄМОЗВ’ЯЗКУ ОЗНАК…………………… 44
Лекція 9-10. ОЦІНКА ДОСТОВІРНОСТІ ВІДМІННОСТЕЙ………………... 60
Лекція 11-13. МІРИ ВПЛИВУ………………………………………………….. 76

Лекція 1

ПРОБЛЕМА ВИМІРЮВАННЯ В ПСИХОЛОГІЇ

Сучасного психолога неможливо уявити без знання математичних методів, які використовуються для опису та аналізу експериментальних даних. Ці знання дозволяють повніше і в більш загальному вигляді описувати закономірності психологічних явищ, розуміти їх суть та підвищуючи доказовість думок та висновків, оскільки сучасна культура експериментального дослідження вимагає переконливих статистичних підтверджень.

Математичні методи дозволяють обґрунтовано прогнозувати майбутні події. Загалом, користь від застосування математики велика, але й праці на її освоєння потрібно багато. Однак вона окупається сповна.

Математики давнини вважали, що математичні форми мають божественне походження. Так, Платон розглядав геометричні фігури як ідеальні ейдоси, тобто образи, створені вищими богами для копіювання людьми, звичайно, вже не в тій досконалій формі. А знаменитий Піфагор бачив в числах і певних числових поєднаннях встановлену гармонію небесних сфер. Релігійний світогляд людей століттями пов'язувало божественне творіння світу з математичними засобами, за допомогою яких виражаються закони природи. Глибоко релігійний сер Ісаак Ньютон вірив, що «книга природи написана мовою математики», і широко використовував математичні методи у своїй натуральній філософії. Психологія у своєму науковому становленні неминуче повинна була пройти і пройшла шлях математизації. Для психології в якості умовної дати початку цього шляху можна прийняти 18 квітня 1822. Саме тоді в Королівському німецькому науковому товаристві Йоганн Фрідріх Гербарт прочитав доповідь «Про можливість і необхідність застосовувати в психології математику». Основна ідея доповіді зводилася до згаданої вище думки: якщо психологія хоче бути наукою, подібно фізиці, в ній потрібно та можна застосовувати математику. Психофізики, зокрема Теодор Фехнер, і знаменитий Вільгельм Вундт, що працювали в Лейпцигу, не могли пройти повз основоположні публікаціїІ. Ф. Гербарта та Моріц-Вільгельм Дробиш «Першооснови математичної психології». Адже саме вони математично реалізували в психології ідеї Гербарта про психологічні величини, пороги свідомості, час реакцій свідомості людини, причому реалізували з використанням сучасної їм математики.

Нині при обробці експериментальних даних використовуються комп’ютери, однак це не вивільняє дослідника від необхідності розуміти, які завдання та в якому вигляді можна поставити перед комп’ютером, які власне результати він видає, як вони можуть бути проінтерпретовані.

Як відомо, основним методом психологічних досліджень (якщо не брати до уваги чисто експериментальні області психології) традиційно є метод спостереження. Незважаючи на деякі позитивні аспекти цього методу спостереження завжди є дуже суб'єктивним. Інтерпретація отриманих даних зазвичай носить відображення особистості психолога, його досвід, інтуїцію та інше. В той же час, у багатьох випадках, виникає проблема стандартизації результатів дослідження та їх більш-менш однозначного трактування. У цьому сенсі математика є універсальною, дуже формальною мовою, яка однозначно описує різні властивості, характеристики, зміни, тощо у тому числі й результати психологічного дослідження.

Виміри та шкали

Любе емпіричне наукове дослідження починається з того, що дослідник фіксує вираження властивості, яка цікавить у об’єктів дослідження, як правило за допомогою чисел. Таким чином слід розрізняти об’єкти дослідження (в психології частіше люди, досліджувані), їх властивості (те, що цікавить дослідника, складає предмет дослідження) та ознаки, які відображаються в числовій шкалі вираження властивості.

На початковому етапі математичної обробки результатів будь-якого (включаючи психологічні) дослідження є вимірювання. Іншими словами, ознака яка вивчається (властивість, риса, характеристика) повинна бути виміряна, тобто виражена у будь якій кількісній (чисельній) формі. Чисельне вираження ознаки може бути різноманітним – від представлення її в бінарній системі (1 – наявність ознаки, 0 – відсутність ознаки) для дуже точних кількісних значень (наприклад, максимальна амплітуди альфа-ритму електроенцефалограми для даного досліджуваного складає 95 мікровольт).

Одним з досить складних в психології є завдання математичної формалізації вираження досліджуваної ознаки, тобто переведення її в кількісне вираження.

Таким чином, тест, як інструмент вимірювання, накладає свої обмеження на отримуваний результат. Таке обмеження називається шкалою вимірювання.

Шкала вимірюванняобмеження типу відносин між значеннями змінних, що накладається на результати вимірювань. Найчастіше, шкала вимірювання залежить від інструменту вимірювання.

Приклад, якщо змінною є колір очей, то ми не можемо сказати, що одна людина більша або менша іншої за цією змінною, ми так само не можемо знайти середнє арифметичне кольору. Якщо змінною є порядок (саме порядок) народження дітей в сім’ї, то ми можемо сказати, що перша дитина однозначно старша іншої, але не можемо сказати на скільки вона старша (відносини «більше/менше»). Маючи результати тесту інтелекту, ми можемо однозначно сказати на скільки одна людина інтелектуальніша від іншої.

В залежності від того, яка операція лежить в основі виміру ознаки, виділяють шкали вимірювання. Вони називаються шкалами С. Стівенса (Стенлі Сміт Стівенс 1906-1973, американський психолог), який їх запропонував. Шкали поділяють на метричні (якщо є або може бути установлена одиниця виміру) та неметричні (якщо одиниці виміру не можуть бути установлені).

Номінативна шкала (неметрична), або шкала найменувань (номінальне вимірювання)(потеп(лат.) – ім’я, назва). Користуючись відповідним правилом, об’єкти групуються за різними класами так, щоб в середині класу вони були ідентичними за виміряною ознакою. Кожному класу дається назва та пояснення, за звичай числове. Потім кожному об’єкту присвоюється відповідне позначення. Відображає ті відносини, за допомогою яких об’єкти групуються в окремі непересічні класи. Номер (буква, назва) класу не відображає його кількісного змісту.

Прикладом шкали такого роду може служити класифікація досліджуваних на чоловіків і жінок, нумерація гравців спортивних команд, номери телефонів, паспортів, штрих-коди товарів. Всі ці змінні не відображають відносин більше/менше, а значить є шкалою найменувань.

Особливим підвидом шкали найменувань є дихотомічна шкала, яка кодується двома взаємовиключними значеннями (1/0). Стать людини є типовою дихотомічною змінною,має братів і сестер – єдина дитина в сім'ї; іноземець – співвітчизник; проголосував «за» – проголосував «проти» і т.п.

У шкалі найменувань не можна сказати, що один об’єкт більше або менше іншого, на скільки одиниць вони розрізняються і в скільки разів. Можлива лише операція класифікації – відрізняється/не відрізняється.

Приклад: приклади номінативних ознак: «стать» (1 – чоловіча, 0 – жіноча), «національність» (1 – українець, 2 – білорус, 3 – росіянин), «любима тваринка» (1- собака, 2 – кішка, 3 – морська свинка, 0 – ніяка). Якщо одному досліджуваному присвоєна 1, а іншому 2, це значить що у них різні вподобання: у першого – собаки, у другого коти. З того що 1˂2, не можна робити висновок, що у другого вподобання більше, ніж у першого.

У психології іноді неможливо уникнути шкали найменувань, особливо при аналізі малюнків. Наприклад, малюючи будинок, діти часто малюють сонце у верхній частині листа. Можна припустити, що розташування сонця зліва, посередині, справа або відсутність сонця взагалі може говорити про деякі психологічні якості дитини. Перераховані варіанти розташування сонця є значеннями змінної шкали найменувань. Причому, ми можемо позначити варіанти того, що має в своєму розпорядженні номери, буквами або залишити їх у вигляді слів, але як би ми їх не називали, ми не можемо сказати, що одна дитина «більша» іншої, якщо намалювала сонце не посередині, а зліва. Але ми можемо точно сказати, що дитина, що намалювала сонце справа однозначно не є тою, хто намалювала сонце зліва (або не входить до групи).

Таким чином, шкала найменувань відображає відносини типу: схожий/не схожий, той/не той, відноситься до групи/не відноситься до групи. Номінативна шкала дозволяє нам підраховувати частоту зустрічі різних «найменувань», або значень ознаки, і потім працювати з цими частотами за допомогою математичних методів. Одиниця виміру, якою ми при цьому оперуємо – кількість спостережень (досліджуваних, реакцій, виборів і т. п.), або частота. Точніше, одиниця виміру – це одне спостереження. Такі дані можуть бути оброблені за допомогою методу χ2, біноміального критерію m і кутового перетворення Фішера φ*.

Рангова,абопорядкова шкала(неметрична)(як результат ранжування). Вимірювання за цією шкалою визначає приписування об’єктам чисел в залежності від ступеню вираження виміряної властивості, відображення відносин порядку. Єдино можливі відносини між об’єктами вимірювання в даній шкалі – це більше/менше, краще/гірше.

Найтиповішою змінною цієї шкали є місце, зайняте спортсменом на змаганнях. Відомо, що переможці змагань отримують перше, друге і третє місце і ми точно знаємо, що спортсмен з першим місцем має кращі результати, ніж спортсмен з другим місцем. Окрім місця, маємо можливість дізнатися і конкретні результати спортсмена.

Приклад, коли людину просять проранжувати кольори за перевагою, від найприємнішого, до найнеприємнішого. В цьому випадку, ми точно можемо сказати, що один колір приємніший за інший, але про одиниці вимірювання ми не можемо навіть припустити, оскільки людина ранжувала кольори не на основі яких-небудь одиниць вимірювання, а ґрунтуючись на власних відчуттях. Те ж саме відбувається в тесті Рокіча, за результатами якого ми так само не знаємо на скільки одиниць одна цінність вища (більша) за іншу. Тобто, на відміну від змагань, ми навіть не маємо можливості дізнатися точні бали відмінностей.

Ми можемо проранжувати всіх досліджуваних за властивістю, яка нас цікавить на основі експертної оцінки або за результатами виконання певного завдання та приписати кожному досліджуваному його ранг. Або запропонувати досліджуваним самим визначити вираженість властивості, яка досліджується, користуючись запропонованою шкалою (5-, 7- або 10-ти бальною).

Суспільний статус, тип ВНД, раса, релігія, сімейний стан.

Одиниця виміру в шкалі порядку – відстань в 1 клас або в 1 ранг, при цьому відстань між класами і рангами може бути різною (вона нам не відома).

Провівши вимірювання в порядковій шкалі не можна дізнатися на скільки одиниць відрізняються об’єкти, тим більше в скільки разів вони відрізняються.

Правила ранжування:

1. встановити та запам’ятати порядок ранжування. Можна ранжувати досліджуваних за їх «місцем в групі»: ранг 1 присвоюється тому в кого найменша вираженість ознаки, наступне збільшення рангу за мірою збільшення ознаки. Або можна ранг 1 присвоїти тому у кого 1-е місце за вираженням ознаки («самий швидкий).

2. Дотримуйтесь правила ранжування зв’язаних рангів, коли двоє або більше досліджуваних мають однакове вираження ознаки дослідження. В цьому випадку таким досліджуваним присвоюється один і той же середній бал (4+5)/2=4,5 або (2+3+4)/3=3. У відповідності з правилом узгодження дотримання однакової суми рангів для зв’язаних та незв’язаних рангів, сума всіх присвоєних рангів для групи чисельністю N повинна рівнятися N(N+1)/2.

Інтервальна шкала (інтервальневимірювання) (метрична)– це вимірювання, при якому числа відображають не тільки відмінності між об’єктами в рівні вираження властивості (характеристика порядкової шкали), але й те наскільки одна змінна відрізняється (більше або менше) від іншої. Виміри в цій шкалі визначає можливість використання одиниць виміру (метр, градус за Цельсієм, бал досягнень, секунда, грам та ін.). Важливою особливістю інтервальних вимірювань є те, що властивість об’єкта не зникає, якщо в результаті вимірювання змінна набуває нульового значення. Для інтервальної шкали розташування нульової точки довільне. Використовуючи цю шкалу ми можемо судити наскільки більше чи менше виражена властивість при порівнянні об’єктів, але не можемо судити про те у скільки разів більше чи менше виражена властивість. Змірявши явище в інтервальній шкалі, ми можемо сказати, що один об’єкт на певну кількість одиниць більше або менше іншого.

Більшість психологічних тестів містять норми, які і є зразком інтервальної шкали. Коефіцієнт інтелекту, результати тесту FPI(фрайбургський особистісний опитувальник), шкала градусів Цельсія – все це інтервальні шкали. Нуль в них умовний: для IQ і FPI нуль – це мінімально можливий бал тесту (очевидно, що навіть проставлені навмання відповіді в тесті інтелекту, дозволять отримати який-небудь бал відмінний від нуля). Якби ми не створювали умовний нуль в шкалі, а використовували реальний нуль як початок відліку, то отримали б шкалу відносин, але ми знаємо, що інтелект не може бути нульовим.

Не психологічний приклад шкали інтервалів – шкала градусів Цельсія. Нуль тут умовний – температура замерзання води але не відсутність температури і існує одиниця вимірювання – градус Цельсія. Хоча ми знаємо, що існує абсолютний температурний нуль – це мінімальна межа температури, яку може мати фізичне тіло, який в шкалі Цельсія рівний – 273,15 градуса.

Таким чином, умовний нуль і наявність рівних інтервалів між одиницями вимірювання є головними ознаками шкали інтервалів.

Шкала відношеньабоабсолютнашкала (метрична). На відміну від шкали інтервалів може відображати те, в скільки один показник більше іншого. Шкала відношень має нульову крапку, яка характеризує повну відсутність вимірюваної якості.

Для відносних змінних завжди можна не тільки визначити міру того, наскільки змінні відрізняються між собою, а встановити у скільки разів. Зі значеннями змінних, виміряних за шкалою відношень, можна проводити всі відомі математичні операції.

Дана шкала допускає перетворення подібності (множення на константу). Визначення нульової крапки – складне завдання для психологічних досліджень, що накладає обмеження на використання даної шкали. За допомогою таких шкал можуть бути зміряні маса, довжина, сила, вартість (ціна), тобто все, що має гіпотетичний абсолютний нуль.

Для інтервальної та шкали відношень: вік, зріст, вага, кількість дітей, доход, швидкість реакції, бали досягнень.

Приклад: на відміну від температури за Цельсієм, температура по Кельвіну – це вимір в абсолютній шкалі. Виміри росту, ваги, часу виконання завдання – визначають застосування одиниць виміру і те, що нульовій точці відповідає повна відсутність даної ознаки.


Лекція 2

ОСНОВНІ СТАТИСТИЧНІ ПОНЯТТЯ

 

При використанні математичної статистики у психологічних дослідженнях можна виділити дві основні групи методів: методи описової статистики і методи статистичних висновків.

Методи описової статистики використовуються для узагальнення показників однієї змінної (статистика випадкової вибірки) та виявлення взаємозв’язків між двома і більше змінними (кореляційний аналіз).

Описова статистика дає змогу отримати нову інформацію, швидше зрозуміти і всебічно оцінити її, тобто виконує функцію опису об’єктів дослідження. За її методом здійснюють перетворення сукупності окремих емпіричних даних на систему наочних для сприйняття форм і чисел (розподіли частот, показники тенденцій, варіативності, зв’язку) і розраховують статистики випадкової вибірки, які уможливлюють здійснення статистичних висновків.

Методи статистичних висновків надають можливість оцінити похибки, які виникають у процесі статистичних досліджень (статистичне оцінювання); узагальнити параметри генеральної сукупності, отримані на підставі вибіркових статистик (перевірка статистичних гіпотез).

Основна мета досліджень – отримання нового знання про великі класи явищ, осіб або подій, тобто про генеральну сукупність.

Генеральна сукупність – це вся множинність об’єктів, по відношенню до якої формулюється дослідницька гіпотеза(повна сукупність об’єктів дослідження).

Дослідження починається з певних припущень, які вимагають перевірки з залученням фактів. Це припущення – гіпотеза – формулюється по відношенню зв’язку явищ або властивостей в певній сукупності об’єктів.

Приклад: дослідник передбачає, що жінки в середньому більш тривожні, ніж чоловіки (тривожність пов’язана з статтю). Або перегляд телепередач, які містять сцени насилля, підвищує агресивність у підлітків. В першому випадку дослідника цікавлять такі явища, як тривожність і стать, в другому – агресивність та перегляд телепередач. Об’єктами-носіями властивостей в першому випадку будуть всі чоловіки та всі жінки, а в другому – всі підлітки.

Для перевірки подібних припущень на фактах необхідно виміряти відповідні властивості у їх носіїв. Але не можливо виміряти тривожність у всіх жінок та чоловіків, як не можливо виміряти агресивність у всіх підлітків. Тому при проведенні досліджень обмежуються лише відносно невеликою групою представників відповідної сукупності людей.

В першому прикладі такими генеральними сукупностями є всі чоловіки та жінки. У другому – всі підлітки, які дивляться передачі, що містять сцени насилля. Генеральні сукупності по відношенню до яких дослідник збирається робити висновки за результатами дослідження, можуть бути за чисельністю і більш скромними.

Приклад: при вивченні професійного самовизначення студентів-випусників певного факультету в конкретному вузі генеральна сукупність, начебто невелика та допускає суцільне дослідження. Але дослідник за звичай надіється, що висновки дослідження будуть справедливі не тільки по відношенні випускників цього, але й наступних років.

Таким чином, генеральна сукупність – це хоч і не нескінчене за чисельністю, але недоступна для суцільного дослідження множинність потенціальних досліджуваних.

Вибіркаце обмежена за чисельністю група об’єктів (в психології – досліджуваних, респондентів), спеціально відібрана з генеральної сукупності для вивчення її властивостей. Відповідно, вивчення на вибірці властивостей генеральної сукупності називається вибірковим дослідженням. Практично всі психологічні дослідження є вибірковими, а їх висновки поширюються на генеральні сукупності. Вибірка повинна бути такою, щоб була обґрунтована генералізація висновків вибіркового дослідження – узагальнення, поширення їх на генеральну сукупність. Основні критерії обґрунтування висновків дослідження – це репрезентативність вибірки та статистична достовірність (емпіричних) результатів.

Репрезентативність вибірки – або її показовість – це здатність вибірки представляти явища, що вивчаються достатньо повно – з точки зору їх мінливості в генеральній сукупності.Репрезентативність відповідність характеристик вибірки характеристикам популяції або генеральної сукупності в цілому. Репрезентативність визначає, наскільки можливо узагальнювати результати дослідження із залученням певної вибірки на всю генеральну сукупність, з якої вона була зібрана.

Помилки репрезентативності можуть виникати:

1. Якщо вибірка, яка характеризує генеральну сукупність, мала. Якщо ми провели дослідження на групі, яка складається з 10-ти школярів 11-го класу якоїсь школи міста, то навряд ми маємо право екстраполювати отримані нами дані на всю генеральну сукупність.

2. Властивості (параметри) вибірки не співпадають з параметрами генеральної сукупності. Це може спостерігається в тих випадках, коли порушується принцип випадковості при відборі досліджуваних.

Залежні та незалежні вибірки. Звичайна ситуація дослідження, коли властивість, яка цікавить дослідника, вивчається на двох або більше вибірках з метою їх подальшого порівняння. Ці вибірки можуть знаходитись в різних співвідношеннях – в залежності від процедури їх організації. Незалежні вибірки характеризуються тим, що вірогідність відбору любого досліджуваного однієї вибірки не залежить від відбору любого з досліджуваних іншої вибірки. У випадку, якщо такий взаємозв'язок між вибірками відсутній, то ці вибірки вважаються незалежними.

Приклад: чоловіки та жінки; психологи та математики.

Напроти, залежні вибірки характеризуються тим, що кожному досліджуваному однієї вибірки поставлений в відповідності до певного критерію досліджуваний з іншої вибірки.

Приклад: найбільш типовий приклад залежних вибірок – повторне вимірювання властивості на одній і тій же вибірці після впливу (ситуація «до – після»). Чоловіки – одна вибірка, їх жінки – інша вибірка (при дослідженні їх уподобань). Або діти 5 – 7 років одна вибірка, а їх брати або сестри-близнюки – інша вибірка.

Змінна величина (або змінна) – це кількісно виміряна властивість або ознака, яка набуває різні значення. В якості змінних можуть виступати різні психічні ознаки – час вирішення задачі, кількість отриманих помилок, рівень тривожності або нейротизму, коефіцієнт інтелекту та ін.. значення змінних можуть змінюватися або неперервно, або дискретно (роздільно). В більшості психофізіологічних дослідженнях виміряні величини неперервні і точність їх вимірювання залежать від точності вимірювального пристрою (приладу). Дискретні значення змінних зустрічаються в більшості психодіагностичних процедур, де параметр виміру набуває цілечисельного значення – кількість позитивних та негативних відповідей, число правильно вирішених завдань (виконаних задач) та ін..

Прийнято вважати, що психологічні змінні є випадковими величинами, так як відчувають на собі вплив багатьох та різноманітних факторів та неможливо передбачити, яке значення вони набудуть. На мові математики величина будь-якої варіюючої ознаки є змінною випадкової величини. На відміну від постійних величин, які позначаються початковими буквами латинського алфавіту, змінні величини прийнято позначати останніми в латинському алфавіті великими (друкованими) буквами X, Y, Z, а їх числові значення, тобто варіанти – відповідними маленькими (прописними) буквами того ж алфавіту: x1, x2, x3, …, xnабо y1, y2, y3,…, ynта інше. Загальне позначення любої варіанти відмічається символом xi, yi, де індекс iсимволізує загальний характер варіанти.

Причини варіювання результатів спостережень. Ознаки варіюються під впливом самих різних, в тому числі і випадкових, причин. Поряд з природнім варіюванням на величину ознак впливають помилки, які виникають при вимірах досліджуваних об’єктів. Як би точно не проводились виміри вони завжди супроводжуються відхиленнями від дійсного значення величини виміру, тобто не можуть бути проведені абсолютно точно. Різниця між результатами вимірів та дійсно існуючими значеннями виміряної величини називається похибкою або помилкою. Помилки виникають через несправність або неточність вимірювальних приладів та інструментів, особистісних якостей дослідника, його навичок та майстерності в роботі та інш.

Математична обробка – це оперування зі значеннями ознак (змінної), отриманими у досліджуваних в процесі психологічного дослідження.

Статистична гіпотеза– це припущення, яке носить вірогідний характер, та має невизначеність по відношенню до своєї істинності. Формалізація гіпотез з математичної точки зору приводить до опису гіпотез двох видів: Н0нульова гіпотеза, Н1альтернативна гіпотеза.

Нульова гіпотеза є припущенням, про відсутність відмінностей у значеннях ознак, які зіставляють (відсутність відмінностей у вибірках, в умовах експериментів, про рівність мір зв’язку нулю, про схожість двох розподілів).Відмінності не достатньо значимі, і тому розподіли відносяться до одної і тої популяції, а незалежна змінна не містить ніякого впливу.

Альтернативна гіпотезаце припущення про існування відмінностей (міри зв’язку відрізняються від нуля, відмінність двох розподілів). Відмінності між двома розподілами достатньо значимі та обумовлені впливом незалежної змінної.

Нульова гіпотеза – це гіпотеза про відсутність відмінностей. Вона позначається як H0 і називається нульовою тому, що містить число 0: X1–Х2 = 0, де X1, Х2 – зіставляються значення ознак. Нульова гіпотеза – це те, що ми хочемо спростувати, якщо перед нами стоїть завдання довести значимість відмінностей. Альтернативна гіпотеза – це гіпотеза про значимість відмінностей. Вона позначається як H1. Альтернативна гіпотеза – це те, що ми хочемо довести, тому іноді її називають експериментальною гіпотезою.

 

Спрямовані гіпотези Н0: X1 не перевищує Х2 Н1: X1 перевищує Х2 Не спрямовані гіпотези Н0: X1 не відрізняється від Х2 H1: Х1 відрізняється від Х2

 

У гуманітарних науках прийнято вважати, що нульову гіпотезу можна відхилити на користь альтернативної гіпотези, якщо за результатами статистичного тесту ймовірність випадкового виникнення знайденої відмінності не перевищує 5 з 100. Якщо ж цей рівень достовірності не досягається, вважають, що різниця цілком може бути випадковою і тому не можна відхилити нульову гіпотезу.

Гіпотези перевіряються за допомогою статистичних критеріїв. Статистичний критерій – це правило, яке дозволяє приймати істинні та відхиляти хибну гіпотезу з високою вірогідністю. Математично критерій є формулою, за якою отримується певне число. Критерій є випадковою величиною, розподіл якої залежить від числа ступені свободи. Ступені свободи – це кількість можливих напрямків мінливості деякої змінної. Загальноприйнятим позначенням числа ступенів свободи є df (від англ.. – degreesoffreedom – ступінь, рівень та свобода).

Співвідношення емпіричного і критичного значень критерію є підставою для підтвердження чи спростування гіпотези. Статистичні критерії поділяються на параметричні й непараметричні. До формули розрахунку параметричних критеріїв належать показники розподілу, наприклад середні, дисперсії. Це класичні критерії, як z – критерій, t – критерій Стьюдента, F – критерій Фішера.

Непараметричні критеріїоперують – частотами, рангами та вірогідностями.

В статистиці за основний приймається варіант розглядати істинність нульової гіпотези та хибність альтернативної. Оскільки дослідження завжди проводиться на вибірці, а висновки робляться по відношенню до генеральної сукупності, то остаточне рішення про істинність чи хибність нульової та альтернативної гіпотези не можливе, можна тільки вказувати вірогідність помилки такого припущення.

Параметричні критерії Критерії, які містять у формулі розрахунку параметри розподілу, тобто середні і дисперсії (t-критерій Стьюдента, критерій F та ін) Непараметричні критерії Критерії, не містять у формулі розрахунку параметрів розподілу і засновані на оперуванні частотами або рангами (критерій Q Розенбаума, критерій Т Вілкоксона та ін)

 

Рівень значимості(поріг достовірності –β) є показником вірогідності безпомилкових висновків та прогнозів. Частіше всього в статистиці використовуються чотири стандартних рівня значимості – нульовий (β0=0,90), перший (β1=0,95), другий (β2=0,99) та третій (β3=0,999). Іншими словами, якщо дослідник задає нульовий рівень значимості, то його висновки та прогнози справедливі в 90% випадків (вірогідність рівна 0,90); якщо перший рівень – в 95% випадків і т.д.

Необхідно мати на увазі, що робота на кожному рівні значимості визначає мінімальний об’єм вибіркової сукупності, на якій проводиться дослідження. Так якщо об’єм вибірки (n) – від 20 до 30 досліджуваних, ми маємо право використовувати тільки нульовий рівень значимості, при n ≥ 30 – нульовий та перший рівень, при n ≥ 100 – β0 , β1та β2 і нарешті при n ≥ 200 – всі чотири рівня. При малочисельних вибірках (n ˂ 20) надають перевагу методам непараметричної статистики, оскільки визначити характер розподілу досліджуваної ознаки на такій вибірці не є можливим.

Деякі дослідники в якості рівня значимості використовують величину α(або ρ), рівну 1 – β. В цьому випадку рівні значимості набувають наступного виду: α0≤ 0,10; α1≤ 0,05; α2≤ 0,01; α3≤ 0,001. Логічний сенс цих величин в тому, що вони характеризують вірогідність випадковості (вірогідність помилкових прогнозів). Іншими словами, це та вірогідність, яка припадає на долю випадкових (як правило, непередбачуваних) факторів.

Який власне критерій (α чи β) використовувати при статистичній обробці – справа самого дослідника, оскільки принципового значення не має.

 

Рівень статистичної значимості Рівень значущості – це ймовірність того, що ми визнали відмінності істотними, а вони насправді випадкові. Коли ми вказуємо, що відмінності достовірні на 5%-му рівні значущості, або при р<0,05, то ми маємо на увазі, що ймовірність того, що вони все-таки недостовірні, становить 0,05. Коли ми вказуємо, що відмінності достовірні на 1%-му рівні значущості, або при р<0,01, то ми маємо на увазі, що ймовірність того, що вони все-таки недостовірні, становить 0,01. Якщо перевести все це на більш формалізовану мову, то рівень значущості – це ймовірність відхилення нульової гіпотези, в той час як вона вірна. Помилка, яка полягає в тому, що ми відхилили нульову гіпотезу, в той час як вона вірна, називається помилкою 1 роду. Ймовірність такої помилки зазвичай позначається як α. По суті, ми повинні були б вказувати в дужках не р<0,05 або р<0,01, а α<0,05 або α<0,01. У деяких посібниках так і робиться (Руніон Р., 1982; Захаров В.П., 1985 та ін.) Якщо ймовірність помилки – це α, то ймовірність правильного рішення: 1–α. Чим менше α, тим більше вірогідність правильного рішення. Історично склалося так, що в психології прийнято вважати нижчим рівнем статистичної значущості 5%-ий рівень (р<0,05): достатнім – 1%-ий рівень (р<0,01) і вищим 0,1%-ий рівень (р<0,001), тому в таблицях критичних значень зазвичай приводяться значення критеріїв, що відповідають рівням статистичної значимості р<0,05 і р<0,01, іноді – р<0,001. Для деяких критеріїв у таблицях вказано точний рівень значимості їх різних емпіричних значень. Наприклад, для φ*=1,56 р=0,06.

Достовірність результатів дослідження.Про статистичну достовірність (статистичної значимості) результатів психологічного дослідження можна говорити в тих випадках, коли статистичний критерій (міра відмінностей, зв’язку, залежностей, впливу і т.д.) перевищує стандартне (критичне) табличне значення для даного рівня значимості. При рівності показників (tексп.=tкр.) достовірність відмінностей піддається сумніву (іноді говорять, що відмінності лежать на межі достовірності). Виключення складають деякі непараметричні критерії, наприклад, критерій Манна-Уітні, критерій Вілкоксона та критерій знаків G, де ступінь відмінностей або впливу вважається статистично значимою, коли емпірично отримані значення критерію менше критичного (табличного).

 

Правило відхилення Н0 та прийняття H1 Якщо емпіричне значення критерію дорівнює критичному значенню, відповідному р<0,05 або перевищує його, то Н0 відхиляється, але ми ще не можемо виразно прийняти H1. Якщо емпіричне значення критерію дорівнює критичному значенню, відповідному р<0,01 або перевищує його, то Н0 відхиляється і приймається H1. Винятки: критерій знаків G, критерій Т Вілкоксона і критерії U Манна-Уїтні. Для них встановлюються зворотні співвідношення.
Потужність критеріїв Потужність критерію – це його здатність виявляти відмінності, якщо вони є. Іншими словами, це його здатність відхилити нульову гіпотезу про відсутність відмінностей, якщо вона неправильна. Помилка, яка полягає в тому, що ми прийняли нульову гіпотезу, в той час як вона неправильна, називається помилкою II роду. Ймовірність такої помилки позначається як β. Потужність критерію – це його здатність не допустити помилку II роду, тому. Потужність=1-β Потужність критерію визначається емпіричним шляхом. Одні й ті ж завдання можуть бути вирішені за допомогою різних критеріїв, при цьому виявляється, що деякі критерії дозволяють виявити відмінності там, де інші виявляються нездатними це зробити, або виявляють більш високий рівень значущості відмінностей. Виникає питання: а навіщо ж тоді використовувати менш потужні критерії? Справа в тому, що підставою для вибору критерію може бути не тільки потужність, але й інші його характеристики, а саме: а) простота; б) більш широкий діапазон використання (наприклад, по відношенню до даних, визначеним за номінативною шкалою, або по відношенню до великих n); в) застосовність по відношенню до нерівних за обсягом вибірках; г) велика інформативність результатів.

Лекція 3

ПІДГОТОВКА ДАНИХ ДО МАТЕМАТИЧНОЇ ОБРОБКИ

 

Перш ніж приступати до математичні обробки результатів психологічних досліджень, експериментальний матеріалу необхідно належним чином підготувати. Психолог повинен дотримуватися двох необхідних умов. По-перше, дані мають бути представлені в найбільш компактній, зручній для обробки формі. По-друге, при упорядкуванні даних повен зберігатися максимум інформації, що міститься в них.

Підготовка даних до математичної обробки включає в себе кілька послідовних етапів: протоколювання, табулювання даних, створення таблиць згрупованих частот, побудова діаграм або полігона, розподіл частот і т. д.

Дані протоколювання

Якщо психолог має під рукою персонального комп'ютера, завдання протоколювання значно спрощується. Будь-який програміст може зробити відповідні бази даних і всю необхідну інформацію про кожного досліджуваного ви можете занести до комп’ютера. Безсумнівно зручність комп'ютерного варіанту в тому, що в будь-який час ви можете отримати інформацію про контингент досліджуваних, які нас цікавлять – стать, вік, соціальний клас тощо. Якщо це неможливо, на кожного досліджуваного складається окремий протокол.

У протоколі необхідно відмітити прізвищетаініціали досліджуваного, статьтавік (за винятком випадків анонімного опитування, коли вказуються тільки ініціали, стать та вік). Недотримання цих вимог робить неможливим подальший аналіз результатів (у випадках, коли нас цікавить зв'язок вимірюваної змінної з віком та статтю досліджуваних).

Бажано вказати в протоколідатудослідження. Це особливо важливо в тих випадках, коли дослідження одної й тої ж вибірки проводиться повторно (період часу між повторними дослідженнями, наприклад, два тижні або півроку) має важливе значення, особливо коли мова йде про дітей.

В деяких випадках необхідно вказувати час доби, коли було проведено дослідження. Деякі психологічні та психофізіологічні змінні (час сенсомоторної реакції, концентрація та переключення уваги, об’єм оперативної пам'яті та інші) значною мірою залежать від рівня активності суб'єкта, ступеню його втоми, які не одинакові в різний час доби.

При необхідності в протоколі слід відмічати умови досліду (проводилось дослідження окремо чи в групі, наявність зовнішніх перешкод і т. д.). Всі інші дані по кожному або окремих досліджуваних дослідник відмічає на свій розсуд, тобто фіксується те, що психолог вважає найбільш важливим.


Дата добавления: 2018-05-09; просмотров: 572; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!