Автор-розробник: к.психол.н, доц. каф. прикладної психології О.Л. Луценко
Лекція з психодіагностики №1 |
---|
У результаті засвоєння курсу психодиагностики студенти повинні вміти вирішувати наступні психодиагностические проблеми.
1) Навчитися користуватися стандартними тестами, що передбачає, уміння організувати тестування з дотриманням стандартної процедури, не втручатися в процес виконання тесту досліджуваним (не створювати установок і т.п.), стежити за правильним розумінням і виконанням тесту, вміти коректно обробляти та інтерпретувати результати тестування.
2) Навчитися відрізняти якісні тести від неякісних серед великої кількості розповсюджуваних у друкованому й електронному виді тестів (з'ясовувати валидность, надійність, норми й інші необхідні параметри тестів).
3) Уміти конструювати власні тести й методики, проводити стандартизацію й адаптацію тестів і методик, готувати їх до видання.
Серед певної кількості визначень предмету психодіагностики, що накопичились за більш ніж столітню історію її розвитку, є два дуже точних і ємних, які до того ж не виключають, а, навпаки, доповнюють одне одного.
За першим з них, більш узагальненим, психодіагностика вважається наукою і практикою постановки психологічного діагнозу (О.О.Бодальов, В.В.Столін, 2004).
За другим, більш диференційованим, психодіагностика визначається як область психологічної науки, яка розробляє теорію, принципи і інструменти оцінки та вимірювання індивідуально-психологічних якостей особистості (Л.Ф. Бурлачук, 2006).
Головним завданням психодіагностики є створення, обґрунтування, вдосконалення психодіагностичних методик, розвиток теоретичних аспектів психологічного оцінювання. Крім того є ще специфічні завдання психодіагностики, які виникають через певні ситуації, в яких здійснюється психодіагностична робота.
Виділяють наступні психодіагностичні ситуації і пов’язані з ними завдання:
1. Діагностика для психолога або клієнта. Коли людина приходить до психолога за власним бажанням, намагається бути якомога щирішою, співпрацювати з консультантом, тоді методичний інструментарій може бути більш «прозорим» та відкритим, менш захищеним від фальсифікації. Психолог-психодіагност використовує отриману інформацію для планування подальшої консультативної і корекційної роботи з клієнтом, або надає клієнту проінтерпретовані результати психодіагностичного обстеження, для того, щоб клієнт самостійно вивчав їх з метою рефлексії, особистісного зросту, прийняття рішення з вибору професії тощо.
2. Діагностика для суміжника. В даному випадку психолог діагностує психологічні особливості людини на замовлення інших спеціалістів – педагога, лікаря, тренера, пенітенціарного службовця, соціального працівника, або іншого психолога, за умов, наприклад, коли в організації існує розподіл праці між психологами (один займається психодіагностикою, а інший веде консультування і корекційну роботу). Така психодіагностична ситуація позбавляє психодіагноста необхідності прийняття рішень стосовно досліджуваного, розробки планів подальшої роботи, рекомендацій. Він може обмежитися чітким викладенням отриманої під час діагностики інформації стосовно індивідуально-психологічних особливостей досліджуваного, які цікавлять суміжника.
3. Діагностика-експертиза. Коли діагностика носить характер експертизи на замовлення різних інституцій (органів внутрішніх справ, конкурсної установи, суду, медичної установи), психодіагностична процедура і програма має організовуватися за максимально жорсткими критеріями достовірності і захисту від перекручення інформації про себе зацікавленої в певному результаті експертизи людини. Тут також, як і в попередньому випадку, від психодіагноста не вимагається плану подальшої психологічної роботи з обстеженою людиною на основі отриманих даних, але ступінь відповідальності при постановці психологічного діагнозу, який повинен дати точні відповіді на питання, що з’ясовуються через проведення експертизи, найвища.
Психодіагностику розділяють на загальну і прикладну.
В межах загальної психодіагностики вивчаються закономірності винесення валідних і надійних діагностичних суджень, обґрунтовуються головні конструкти або концепти, що вважаються утворюючими структуру особистості, розробляються правила конструювання та вдосконалення тестів, конструюються психодіагностичні процедури для найбільш фундаментальних напрямків психології – загальної, диференційної, вікової, соціальної. Універсальні і надійні тести використовуються для фундаментальних наукових міждисциплінарних досліджень – в психосоматичній медицині, психогенетиці, психофізіології, економіці, антропології тощо.
Диференційна психометрія (психометріка) – техніко-методична частина загальної психодіагностики, яка засобами математичної статистики, математичного моделювання намагається зробити тести якомога більш точними та надійними інструментами виявлення і вимірювання індивідуально-психологічних якостей людини.
На відміну від універсальних методів загальної психодіагностики, у прикладний психодіагностиці на перший план виходить не логіка психологічної теорії (концепція властивостей, які діагностуються) і не технологічна логіка побудови самого психодіагностичного методу певного типу, а логіка практичної сфери діяльності психолога, де ці методи будуть найбільше використовуватися.
Однією з проблем, що підштовхнули психологів до розробки психологічних тестів, було виявлення розумово відсталих. І до сьогоднішнього дня визначення інтелектуальної неповноцінності залишається важливою областю застосування певних видів психологічних тестів. Клінічне використання таких тестів включає обстеження правопорушників, осіб з емоційними й іншими типами відхилень у поведінці.
Засоби психодіагностики - ефективний інструмент при вирішенні проблем у навчанні. Сфера освіти - одна з основних серед споживачів тестів. Виявлення обдарованих учнів і студентів, відбір для розподілення на різни типи навчання, робота зі складними і відстаючими учнями, вивчення психологічного мікроклімату, відношень у навчальних і педагогічних колективах, перевірка якості засвоєння навчального матеріалу учнями – це ті завдання, які потребують психодіагностичного інструментарію.
Також прикладними сферами застосування психодіагностичних методик і тестів є: відбір і розподіл персоналу на всіх типах підприємств і організацій; формування команд, вивчення психологічних станів у спорті; відбір військовослужбовців і службовців інших спеціальних служб.
Психологічне консультування й психокорекція.
Вивчення впливу реалізації соціальних програм.
Зростає використання тестів як засобу самопізнання й розвитку особистості, допоміжного засобу, що полегшує ухвалення життєво важливих рішень.
Важливість психодіагностичних знань.
За стандартами провідних країн світу психолог-практик для того, щоб мати право користуватися психологічними тестами, повинен довести якість своїх знань з психодіагностики (яка там зараз частіше за все називається «психологічним оцінюванням» - psychologicalassessment). Відсутність відповідних знань і навичок призводить до некоректного використання тестів, неправильного розуміння всього, що пов’язано з діагностикою індивідуально-психологічних якостей людини, погіршення іміджу психології і психологічного тестування в суспільстві, погіршення соціальних відносин, психологічного стану, та соціального статусу досліджених осіб. Тому ми будемо ретельно вивчати основні поняття, процедури, правила психодіагностики, типології тестів.
Так склалося, що за сучасних умов психодіагностика має низку проблем, які доводиться вирішувати і в рамках теоретичної, і в рамках прикладної психології. Це основні небезпеки для сучасного психолога, а з іншого боку – це завдання, якими він має зайнятися.
1) Занадто великий емпіризм, який властивий психодіагностиці ще з перших часів її існування. Багато тестів розробляються суто технічно, без належного теоретичного обґрунтування вимірюваних змінних, без подальшої роботи по узагальненню накопичених даних. Відомими способами розробки тестів, які призводять до виникнення такого становища є факторно-аналітичний і критеріально - ключовий типи конструювання тестів.
2) Необхідність врахування ситуаційних факторів, що роблять не менш значний вплив на варіативність поведінки людини, ніж індивідуально-психологічні розходження, ставить завдання розробки нових інструментів дослідження, більше надійних і валідних, ніж наявні сьогодні.
3) Відсутність повної адаптації закордонних тестів.
4) Відсутність норм (стандартизації) для багатьох тестів.
5) Відсутність систематичної роботи з рестандартизації тестів, через що застарівають норми і зміст тестових завдань.
6) Відсутність контролю за виданням і розповсюдженням тестів, що призводить до накопичення великої кількості помилок в тестах, розповсюдження тестів без збереження авторства тесту та авторства адаптацій зарубіжних тестів, без повних психометричних характеристик, з невідомою стандартизацією, порушенням валідності тестів через їх загальну доступність.
Рекомендована та використана література:
Анастази А., Урбина С. Психологическое тестирование. - СПб.: Питер, 2003.
Бурлачук Л.Ф. Психодиагностика: Учебник для вузов. - СПб.: Питер, 2006.
Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. - СПб.: Питер, 1999.
КлайнП. Справочное руководство по конструированию тестов. – Киев: ПАН Лтд., 1994.
Кулагин Б.В. Основы профессиональной психодиагностики. - Л.: Медицина, 1984.
Общая психодиагностика / Под ред. А.А. Бодалева, В.В. Столина. СПб.: Изд-во «Речь», 2004.
Психологическая диагностика: Учебник для вузов / Под ред. М.К. Акимовой, К.М.Гуревича. – СПб.: Питер, 2008.
к.психол.н. О.Л. Луценко ©
Лекція з психодіагностики №2 |
---|
Історія світової психодиагностики
Різні конкурси і екзамени робилися для відбору відповідних осіб у Древньому Вавілоні, Егіпті, Греції, Китаї, Індії, Персії, В’єтнамі. Зокрема всього за два роки з 1370 до 1372 у В’єтнамі вдалося провести переатестацію всіх військових і цивільних чиновників, що дозволило організувати перевірку державного апарату по всій країні. В результаті цього В’єтнам знову став сильною і життєздатною феодальною державою; особливу увагу було приділено створенню боєздатного офіцерського корпусу.
Наприкінці XIX ст. у психологію проникає й швидко завойовує популярність ідея виміру - можливість кількісного вираження індивідуальних розбіжностей. Це сприяє зародженню психодиагностики, оформлення якої як самостійної області досліджень завершується в 20-х рр. ХХ сторіччя. Значний внесок у становлення психодиагностики внесли праці Ф. Гальтона, Дж.Кэттелла, Г. Еббінгауза, Е. Крепеліна, А. Біне.
Перш за все почалося тестування інтелекту.
Френсіс Гальтон наприкінці ХІХ століття поклав початок тестуванню. Розробив значну кількість простих тестів сенсорного розрізняння, і думав, що вони можуть служити засобом оцінки інтелекту людини. Першим застосував оцінювальні шкали, анкетування й техніку вільних асоціацій. Почав розробляти методи математичної статистики. Зокрема Ф. Гальтон створив серію з 17 тестів і пропонував відвідувачам своєї лабораторії, що була розташована на виставці, за невелику плату протестуватися за фізіологічними і психічними властивостями. За повною програмою він протестував 9337 людей віком від 5 до 80 років. Для обробки такого масиву даних знадобилося розробити матиматико-статистичні процедури, чим він теж успішно займався.
Джеймс Кеттел в 1890 році ввів термін “розумовий тест”, але його тести також вимірювали сенсорні, моторні й прості перцептивные процеси. Перевірка їхніх результатів показала слабку погодженість результатів тестів між собою, а також їхню невідповідність зовнішнім критеріям - оцінкам вчителів й академічній успішності учнів.
Е. Крепелін (1895 р.) створив велику серію тестів для вимірювання практичних ефектів пам'яті, стомлюваності, відволікаємості за допомогою елементарних арифметичних операцій.
Г. Еббінгауз (1897 р.) пред'являв школярам тести арифметичного лічення, обсягу пам'яті й завершення речень. Тест на завершення речень був єдиним, що відповідав навчальним досягненням дітей.
А. Біне (1905 р.) створив першу реальну шкалу інтелекту з 30 завдань зростаючої труднощі. Хоча сенсорні й перцептивні тести теж були включені, більшу частину тесту займав вербальний матеріал, а саме, задачі здатності до судження, розуміння й міркування. В 1908 році тест був удосконалений. Він розрахований на дітей від 3 до 13 років. Показник дитини по тесту виражав розумовий рівень, що відповідає віку нормальних дітей, чиє виконання було таким же. В 1911 році був створений третій варіант – тест “Біне-Симона”. У Станфордському університеті в 1916 р. (США) був розроблений найбільш удалий варіант переробки цього тесту за назвою шкали Станфорд-Біне. У ньому вперше був використаний коефіцієнт інтелекту IQ, як відношення між розумовим і фактичним віком.
Тест інтелекту А. Біне допускає лише індивідуальне дослідження. Поява тестів для групового тестування була викликана потребами американської армії під час першої світової війни. Для цього А.Отіс запропонував закриті завдання – завдання з готовими варіантами відповідей. Так були розроблені тести групового обстеження «армійський альфа» і «армійський бета», де вперше були використані різні об'єктивні завдання із множинним вибором відповідей.
В 20-х роках стало зрозумілим, що більшість створених тестів інтелекту, є тестами здатності до навчання. Так з'явилося поняття тестів здатностей. Тести спеціальних (професіональних) здатностей розроблялися для використання в профорієнтації.
Розвиток психодиагностики із самого початку найтіснішим образом пов'язаний з розробкою й удосконалюванням математико-статистичного апарата, і, насамперед, кореляційного й факторного аналізу.
Появі факторного аналізу зобов'язана розробка комплексних батарей здатностей (після 1945 р.).
Удосконалення шкільних іспитів привело до появи тестів досягнень - Е.Л. Торндайк - 1904 р. З 1923 р. з’явилися батареї здібностей і досягнень – перша Стенфордська батарея здібностей SAT(SholasticAssesmentTest– Келлі, Рач, Тёрмен) – за її результатами і зараз приймають студентів до Принстону, Гарварду, Йелю, та батарея досягнень ACT, за нею приймають до менш престижних учбових закладів. К 30-му року в провідних країнах світу було визнано, що описові іспити у порівнянні з тестами не лише віднімають більше часу на аналіз, але й надають менш надійні результати.
В 50-х роках з’явилися перші тести креативності – тести для вимірювання творчих здібностей особистості. До їх розробки спонукало відкриття невідповідності між успішністю виконання традиційних тестів інтелекту і творчими здібностями. Підходи до вимірювання здатності продукувати нові ідеї, знаходити нестандартні способи розв’язання проблемних завдань були запропоновані Л.Терстоуном, Дж. Гілфордом (1954) і Е. Торрансом (1962). Пізніше нові тести креативності були запропоновані Джонсоном і Ф. Вільямсом (1980). Розвиток виявлення і вимірювання креативності поступово становиться одним з основних напрямків закордонної психодіагностики. Його особливості полягають в тому, що креативність включає не лише когнітивні, але й особистісні характеристики психіки людини.
Розвиток особистісного (не інтелектуального) тестування йшов наступним шляхом.
Одним з перших тестів особистості був крепеліновський варіант тесту вільних асоціацій, застосований їм для обстеження хворих із психічними відхиленнями (1892). Варто згадати також розробку Ф. Гальтоном, К. Пірсоном і Дж. Кеттеллом стандартизованих анкет і шкал ранжирування, які надалі сталі використатися для створення особистісних тестів. Як вихідний варіант особистісного опитувальника можна назвати листок особистісних даних Р. С. Вудвортса, розроблений їм у роки першої світової війни для виявлення осіб, що страждають неврозами й непридатні до військової служби.
Інший підхід до виміру особистісних характеристик представлений у об’єктивних тестах особистості - тестах дії, і їх різновиді - ситуаційних тестах (кінець 20-х – початок 30-х років ХХ століття).
Третій підхід у вивченні особистості представляють проективні методики. Тести вільних асоціацій і завершення речень - одні з найбільш ранніх проективних методик.
В 40-50 р. у світовий психодіагностиці сформувалися основні діагностичні підходи, була в тім або іншому ступені завершена розробка всіх найбільш відомих тестів (Шкали виміру інтелекту Векслера, Тест Роршаха, Тематичної Апперцепції Тест, Опросник «Шістнадцять факторів особистості», MMPI). У створюваних в наступні роки за рубежем тестах немає принципово нових ідей і рішень. Період тимчасового «затишку» у психодіагностиці припиняється в 60-і рр. повертанням дослідників до аналізу ситуацій, у яких здійснюється поведінка (В. Мішель, 1968 і ін.).
Історія ПД у колишньому СРСР і Україні
У розвитку психодіагностики в СРСР можна виділити два періоди. Перший варто віднести до початку 20-х - середини 30-х рр. Це роки масового застосування тестів у народній освіті, профвідборі й профорієнтації. Для тодішнього рівня розвитку психодіагностики в СРСР характерним є широке запозичення закордонних тестів. Створювалися й власні методики.
У ці роки в області психодіагностики плідно працювали М.С. Бершнтейн, М.Я. Басов, П.П. Блонскій, С.Г. Геллерштейн, Н.Д. Левітов, Г.І. Россолімо, Ф.Е. Рибаков, А.М. Мандирка, М.Ю. Сиркін, І.П. Шпільрейн, А.М. Шуберт й ін.
Книга Григорія Івановича Россолімо «Психологічні профілі» (видана ще в дореволюційній Росії у 1908 р.) містила новаторський для того часу підхід, а саме, в ній був запропонований тест, що складався з 11 субтестів для діагностики структури особистості й загальних здатностей. Була розроблена графічна форма відбиття результатів. «Профілі» одержали високу оцінку наукової громадськості, були переведені на кілька мов.
Не менш видатний психіатр і психолог Ф.Е. Рибаков розробив тест для визначення рівня розвитку просторової уяви. «Фігури Рибакова» стали швидко відомі у світі, за їхньою подобою створювалися численні тести, що використовуються й у цей час, наприклад, тест інтелекту Р.Мейлі.
На Україні публікують свої новаторські дослідження А.М. Мандирка й М.Ю. Сиркін. Основна увага в їхніх роботах приділяється теоретичним аспектам прикладної статистики в психологічному тестуванні (Мандирка, 1931), а також критеріям точності тестових випробувань і сполученості одержуваних даних із соціальними факторами (Сиркін, 1929).
Слід зазначити внесок Л.С. Виготського, а саме його роботу «Діагностика розвитку й педагогічна клініка важкого дитинства» (1936).У ній було розроблене вчення про психологічний діагноз, його особливостях і етапах.
Постановою ЦК ВКП(б) в оригіналі: «О педологических извращениях в системе наркомпроссов» (1936), була накладена повна заборона на застосування безглуздих (як там відзначалося) тестів. Як пише з цього приводу Л.Ф.Бурлачук (цитування, с. 87-88):
«Як видно, один з найбільш тяжких докорів на адресу тестів був в тому, що за їхньою допомогою все більшу і більшу кількість дітей відносили до розумово відсталих. Як же реально було діло з інтелектуальним розвитком підростаючого покоління на той час? В діагностичних обстеженнях, проведених у 1920-ті роки булі отримані дані щодо існування національних і соціальних відмінностей в рівні інтелектуального розвитку дітей. Широко відомими стали дослідження інтелекту дітей в Узбекистані. Було з’ясовано, що рівень інтелекту узбецьких дітей, у порівнянні з руськими та українськими учнями, значно нижчий. Причини інтелектуального відставання цих дітей вбачались в тяжких соціально-побутових умовах, особливостях фізіологічного розвитку. Не лише середньоазійські діти, але й діти слов’янського пролетаріату і селян виявилися такими, що мають низький інтелект. Відповідні обстеження кінця 1920-х років показали, що IQрадянських учнів в середньому на 7% нижче, ніж американських школярів. При цьому IQдітей службовців був більш високим, ніж у дітей робочих, а найбільш низький – у дітей селян. Соціальні розбіжності в інтелекті між дітьми робочих і службовців носили стійкий характер. Якщо к цьому додати дослідження дорослих, де у вихідців з робоче-селянського середовища також відмічався невисокий IQ, і дані про те, що обдарована інтелігенція виявлялася родом із дворянства, духовенства і купецтва, тоді нескладно уявите собі ідеологічну реакцію класу-переможця на такі дослідження».
«Виступаючи на І Загальносоюзному педологічному з’їзді (1927), К.Н.Корнілов говорив: «Дозвольте вас запитати, для чого використовують тести? Якщо все це проводиться на Заході, то інша справа все ж радянська школа, тому що в нашому житті ми зовсім не цінуємо чинника інтелекту так високо, як на Заході. Інтелектуально обдарована людина у нас не означає: придатна до життя».
«Психологічні тести стають непотрібними, більше того, шкідливими тоді, коли суспільством (або від його імені) знайдені якісь відмінні від наукових критерії, що визначають, наприклад, здатність його членів до тієї або іншої діяльності. В якості таких критеріїв може виступати приналежність до певного класу, партії, особистісна відданість лідеру, конфронтація з владою (або її відсутність) в минулому тощо» (кінець цитування).
В 30-і роки багато психологів, що займалися психодіагностикою, безвісти зникли, багато хто були знищені: трагічним прикладом може слугувати доля І.Н.Шпильрейна, розстріляного в 1937 році. Його дослідження були присвячені вивченню професій, наукової організації праці, розробці методик відбору для Червоної армії. У ті часи тести не інакше як з епітетом «буржуазні» не називалися. Знадобилося близько 40 років, щоб психодіагностичні дослідження були відновлені у своїх правах.
Якісний, клінічний, індивідуальний підхід до аналізу індивідуальних відмінностей людей або обов'язкова наявність психофізіологічних корелятів для доказу цих відмінностей, призводили до того, що психологія відривалася від практики, де в умовах ліміту часу, без спеціальних лабораторних умов, цей складний аналіз був нездійсненний.
У період, що передував «дозволу на тести» слід особливо зазначити внесок Ленінградської психологічної школи. Завдяки ініціативі лідера ленінградських психологів Б.Г.Ананьєва тести починають відігравати активну роль у психологічних дослідженнях. Під керівництвом Ананьєва був початий і здійснений грандіозний проект комплексного вивчення людини, що потребував залучення тестів інтелекту, особистісних опитувальників і багатьох інших маловідомих тодішнім психологам психодіагностичних інструментів. Слід зазначити також внесок Бехтеревського Ленінградського психоневрологічного інституту, де також були адаптовані найвідоміші закордонні методики й проведені за їхньою допомогою серйозні дослідження.
Наприкінці 60-х рр. (час хрущовської відлиги) відбувається нова «легітимізація» тестів. Починається другий період розвитку вітчизняної психодіагностики, відзначений бурхливими дискусіями про місце її в системі психологічного знання, принципах і методах, про відношення до закордонного досвіду. На цьому етапі були видані вітчизняні монографії і підручники з психодіагностики: К.М. Гуревич (1969, 1970, 1980), В.М. Блейхер і Л.Ф. Бурлачук (1978), Л.Ф.Бурлачук (1979), О.Т. Соколова (1980), М.М. Кабанов, А.Є. Лічко й В.М. Смірнов (1983), Б.В.Кулагін (1984), В.М. Мельніков і Л.Т. Ямпольский (1985), О.О. Бодалев й В.В. Столін (1987) та інші.
В 80-90-х роках психодіагностика продовжує розвиватися - переводяться перші книги по конструюванню тестів (А. Анатази, П. Клайн), з'являються нові підручники: О. Г. Шмельов, Л.Ф.Бурлачук, К.М.Гуревич, розробляються оригінальні методики: А.Є. Лічко, В.М.Мельников, Л.Т.Ямпольский, М.К.Акімова, В.В. Столін, О. Кроник та ін. У Санкт-Петербурзі відкрита організація ИМАТОН, що займається професійний видавництвом тестів (замість кустарного), проведенням курсів і конференцій з психодіагностики, аналогічні організації відкриваються в Києві, Ярославлі, Москві та інших містах СНД.
І останнє.Справедливості раді варто відмітити, що гоніння на адресу психологічної діагностики й тестів виникали не тільки в колишньому СРСР (де них підтримували своєю критикою такі відомі психологи як К.Н. Корнілов, М.Г. Ярошевський, А.В. Петровський, О.М.Леонтьєв, О.Р. Лурія, Б.М. Теплов, В.Д. Небиліцин, В.М. Русалов, Л.С.Виготський, С.Л.Рубінштейн), але й за рубежем.
Проте замість того, щоб заборонити тести (як це було зроблено в СРСР – перефразую висловлювання «класика» - «немає тестів – немає проблеми»), в західній психології були проаналізовані причини критики на адресу психологічного тестування. Зокрема С. Брім навіть провів факторний аналіз особистісних рис критиків психодіагностичного метода! В результаті його роботи та досліджень інших вчених були названі декілька джерел критики на адресу тестів, які ми пропонуємо для ознайомлення.
Перше джерелоС. Брім бачить в особистісному портреті критиків, в числі яких частіше інших опиняються ті, хто не схильний до самопізнання та інтроспекції, авторитарний у міжособистісних відносинах, нетерплячий до думки інших і виступає против будь-яких соціальних змін. Такі люди як правило в США належать до правих політичних груп, що вимагають заборони тестів.
Друге джерелоС. Брім бачить в системі соціальних цінностей, яка має своє коріння у відношенні до питань рівності людей. Якщо в суспільстві схвалюється принцип відкритої рівності його членів, тоді в кожному поколінні на передові позиції повинні висуватися найбільш талановиті люди. В такому суспільстві кожен повинен мати можливість внести свій внесок у відповідності до власних здібностей. Останні мають бути оцінені, і тому орієнтація на цей принцип створює сприятливе відношення до тестів.
Третє джерело, на думку Р. Кеттелла, є наслідком емоційного і сентиментального відношення людей естетичного і нарцисічного типу, які чинять спротив будь-яким спробам представити «унікальну, художню особистість» у вигляді формул та кількісних коефіціентів.
Четверте джерелокритики є науковим, його, до речі, часто здійснюють самі психологі-психодіагности, і воно стосується тих недоліків тестового методу, які реально існують. Їх мивже назвали на початку цієї лекції в питанні «сучасні проблеми психодіагностики».
Історія світової психодіагностики (і української, як її частини) продовжується і потребує залучення нових кваліфікованих і творчих фахівців, нових ідей та інструментів.
Нові психодіагностичні методики і дослідження публікуються в журналах: «Психологическая диагностика», «Практична психологія та соціальна робота», «Psychometrica», «Intelligence», «JournalofPersonalityAssessment» і т.п.
Рекомендована та використана література:
Анастази А., Урбина С. Психологическое тестирование. - СПб.: Питер, 2003.
Бурлачук Л.Ф. Психодиагностика: Учебник для вузов. - СПб.: Питер, 2006.
Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. - СПб.: Питер, 1999.
Общая психодиагностика / Под ред. А.А. Бодалева, В.В. Столина. СПб.: Изд-во «Речь», 2004.
к.психол.н. О.Л. Луценко ©
Лекція з психодіагностики №3 |
---|
Психологічний тест- стандартизоване, часто обмежене в часі випробування, призначене для встановлення кількісних (і якісних) індивідуально-психологічних особливостей через вербальні або невербальні зразки відповідей або інші види поведінки.
Тест складається із завдань– окремих пунктів методики, які призначені в сукупності для моделювання діяльності, в рамках якої, згідно теоретичним міркуванням або емпіричним спостереженням психолога, проявляється та або інша психологічна особливість індивідуума: його риси, темпераментальні властивості, настанови, мотиви, соціально-психологічні якості.
Психологічний тест може бути охарактеризований як ефективний, якщо він відповідає наступним вимогам: будові на шкалі інтервалів; обґрунтованості конструкту тесту; репрезентативності; дискримінативності, надійності, валідності окремих тестових завдань та тесту загалом; стандартизованості пред'явлення й обробки результатів; незалежності результатів від впливу експериментальної ситуації й особистості психодіагноста; наявності нормативних даних, а у випадку індивідуально-орієнтованих тестів - наявності критеріїв, установлених експертами; адаптованості тестів.
Дані психометричні вимоги до тестів або методичні принципи психодіагностики є «професійною мовою» психодіагноста, яку потрібно знати і розуміти бездоганно. Розглянемо їх по черзі.
Шкалювання. Види вимірювальних шкал
Шкала - форма фіксації сукупності ознак досліджуваного об'єкта з упорядкуванням їх у певну числову систему. Просто кажучи, шкала – це мірка, без якої вимірювання неможливе.
Наприклад, Цельсій для шкалювання температури взяв дві точки відліку - точку замерзання води й точку кипіння води. Розділив цей інтервал на 100 рівних відрізків і, таким чином, увів температурну шкалу, якою ми користуємося, говорячи, що на вулиці -5 градусів морозу або 25 градусів тепла. Фаренгейт використав інші точки відліку, тим самим створив іншу шкалу. Тому градус за шкалою Фаренгейта не дорівнює градусу за шкалою Цельсія.
С.Стівенс запропонував класифікацію з 4-х типів шкал вимірювання, ієрархічно впорядкованих за точністю. Тип шкали, що закладається до тесту, буде визначати всі подальші процедури з конструювання і перевірки тесту, а також методи обробки і аналізу даних, які будуть отримані за допомогою цього тесту. Ці шкали носять назви: номінативних, порядкових, інтервальних і шкал відношень.
1. Номінативні шкали (шкали найменувань)– класифікація, що встановлює відповідність ознаки тому або іншому класу. Найпростіший випадок номінативної шкали - дихотомічна шкала, що складається всього лише із двох пунктів: «має братів і сестер - єдина дитина в родині»; «іноземець - співвітчизник»; «проголосував «за» - проголосував «проти»» і т.п. Ознака, що виміряється за дихотомічною шкалою найменувань, може приймати всього два значення. Тоді можна говорити про те, що та або інша ознака «виявилась» або «не виявилась». Наприклад «Ознака наявності досвіду праці виявилась у 8 досліджуваних з 20. У 12 досліджуваних не виявилося досвіду праці».
Складніший варіант номінативної шкали - класифікація із трьох і більше пунктів: «екстрапунитивні - інтрапунитивні - імпунитивні реакції»; «вибір кандидатури А - кандидатури Б - кандидатури В - кандидатури Г» і т.п. Допустимо, що кандидатуру А вибрали 7 досліджуваних, кандидатуру Б - 11, кандидатуру В - 28, а кандидатуру Г - усього 1.Тепер можна оперувати цими числами, що представляють собою частоти зустрічальності різних найменувань, тобто частоти прийняття знаком «вибір» кожного з 4 можливих значень.
Для обробки даних, що вимірюються за номінативними шкалами, вживають методи χ2, кутового перетворення Фішера φ*, кореляції якісних ознак – тетрахорічний і поліхорічний коефіцієнти зв’язку, дисперсійний аналіз Фішера.
Порядкові (рангові, ординальні) шкали– тут елементи шкали впорядковані (ранжирувані) за принципом «більше - менше», але в цій шкалі не враховуються відстані між ними. У шкалі найменувань не має значення, в якому порядку розташовані класифікаційні категорії, а в шкалі порядків вони утворюють послідовність від пункту «найменше значення» до пункту «найбільше значення» (або навпаки). У порядковій шкалі повинно бути не менше трьох рангів, наприклад в методиці Ч.Осгуда «Семантичний диференціал» 7 рангів: -3, -2, -1, 0, 1, 2, 3. Є багато опитувальників з варіантами відповідей, які утворюють порядкову шкалу, наприклад: «Буває, що я ніяк не можу прийняти якесь остаточне рішення»...а) Повністю згоден. б) Можу погодитися. в) Не впевнений. г) Скоріше не згоден. д) Зовсім не згодний.
Для обробки даних, які вимірюються ранговими шкалами, використовується непараметрична статистика – критерії Манна-Уітні, Уілкоксона, Колмогорова-Смірнова, Крускала-Уоллеса, ранговий кореляційний аналіз Спірмена та інші.
Шкали інтервалів (рівних інтервалів, кількісні).Вони класифікують за принципом «більше на певну кількість одиниць – менше на певну кількість одиниць». В них різниці між значеннями у всіх точках даної шкали рівні. Рівноінтервальними можна вважати лише шкали в одиницях стандартного відхилення шкали, і те лише за умови, що розподіл значень у вибірці стандартизації був нормальним. Принцип конструювання більшості інтервальних шкал використовує так зване правило «трьох сигм»: це емпірична закономірність, яка полягає в тому, що приблизно 97,7-99,7% всіх значень ознаки при нормальному його розподілі укладаються в діапазоні М±3s, де М – середнє арифметичне, s- середнє квадратичне відхилення. Можна побудувати шкалу в одиницях часток стандартного відхилення (наприклад, інтервал може складати ½ s, як це було зроблено Р.Кеттеллом для стандартизації тесту «16 Особистісних факторів»), яка буде охоплювати весь можливий діапазон змін ознаки, якщо крайній ліворуч і крайній праворуч інтервали залишити відкритими. Еквівалентні інтервальні шкали можуть бути лінійно перетворений друг у друга, що дозволяє приводити результати тестування до загальних шкал і в такий спосіб здійснювати порівняння показників.
Коли показники виміряні за шкалою інтервалів для їх обробки підходять більшість процедур параметричної статистики – коефіцієнт лінійної кореляції Пірсона, t- критерій Ст’юдента тощо. До розряду шкал інтервалів відносяться шкали IQ-показника стандартного, Т-балів, стенів, стенайнів, с-шкала, Z-показники.
Шкала процентілей Р (окремий вид стандартних тестових показників, що відображають, скільки відсотків вибірки стандартизації мали тестові показники, які були нижче балів даного досліджуваного) ще відноситься до порядкових шкал і не потрапляє до рівноінтервальних.
Шкали відносин (рівних відносин, пропорційні).Шкали відносин крім усього, чим характеризуються інтервальні шкали, мають значиму нульову точку. Тобто на відміну від інтервальної шкали, де нульова точка довільна (умовна), в шкалі відносин вона справжня, і вказує на повну відсутність вимірюваної властивості. Наявність такого справжнього «нуля» - проблема для більшості психологічних змінних. Можливості людської психіки настільки великі, що важко уявити абсолютний нуль у будь-якої психологічної змінній (абсолютна дурість або абсолютна чесність - поняття скоріше життєвої психології). Хоча існують методи конструювання тестів, які дозволяють використати цю можливість. Вважається, що прикладами шкал рівних відносин у психології є шкали порогів абсолютної чутливості аналізаторів. До шкал відносин наближуються тести, сконструйовані також за моделлю Раша (теорією завдання-відповідь або item-responsetheory- IRT).
До шкал відношень можуть застосовуватися всі найбільш точні й потужні статистичні методи обробки даних.
В ідеалі розроблювач тестів повинен прагнути використовувати шкали відносин. Якщо це неможливо, бажано будувати шкали інтервалів. Проте, як можна бачити, дуже багато поширених у СНД тестів і методик будуються на ранговій шкалі.
Окрім поняття шкали, для коректного здійснення процедури вимірювання необхідно ознайомитися ще з деякими психометричними термінами – поняттями істинного показника і репрезентативності.
Репрезентативність завдань тесту. Істинний показник. Похибка вимірювання
Репрезентативність - властивість вибіркової сукупності представляти характеристики генеральної сукупності. Генеральна сукупність – це всі існуючи об’єкти (ситуації) даного типу. Вибіркова сукупність – частина генеральної сукупності, з якою працює дослідник, тому що зазвичай генеральна сукупність недоступна для вивчення і навіть не є необхідною за умов репрезентативності і достатньої кількості об’єктів у вибірковій сукупності. Тобто дослідження генеральної сукупності є надлишковим і зайвим.
З певною погрішністю (похибкою вимірювання) можна вважати, що представлений у вибірковій сукупності розподіл досліджуваних ознак психологічної змінної відповідає їхньому реальному розподілу.
Для будь-якої риси (наприклад, домінанантності, доброзичливості, креативності) індивідуум має істинний, справжній показник. Його можна було б обчислити, якби було можливо пред'явити досліджуваному всі можливі завдання, в яких діагностується ця риса. Будь-який тестовий показник для будь-якого індивідуума в кожному окремому випадку відрізняється від його істинного показника на величину випадкової погрішності, що з'являється в результаті виконання досліджуваним не всіх можливих завдань, а тільки вибіркових.
Тест буде працювати помилково, коли вибірка його завдань не відбиває задовільно генеральну сукупність завдань (більшість життєвих ситуацій, в яких проявляється вимірювана психологічна риса), тому що тоді похибка вимірювання буде надмірно великою, такою, яку не можна ігнорувати, адже вона буде серйозно відхиляти отриманий розподіл ознаки від його реального стану. В цьому полягає важливість утворення репрезентативної сукупності завдань тесту.
Для створення репрезентативності завдань тесту роблять так звану специфікацію тесту – розраховують, скільки завдань різних типів необхідно включити до тесту.
Похибка вимірювання виникає ще через випадкові коливання вимірюваної психологічної якості під впливом настрою, стану, обставин. Навіть, якщо той самий досліджуваний декілька днів поспіль буде виконувати той самий тест, його результати кожного разу будуть дещо відрізнятися. Усереднення цих відхилень дозволить обчислити похибку вимірювання тесту.
Репрезентативність вибірки досліджуваних осіб
Як і вибірка завдань, вибірка досліджуваних осіб повинна адекватно відбивати генеральну сукупність людей, до якої буде застосовуватися даний тест, тобто на кого його результати можна буде екстраполювати. Якщо тест буде застосовуватися для школярів, то у вибірці повинні бути у відповідній пропорції представлені школярі приватних і державних шкіл, шкіл математичного й гуманітарного профілів, сільських і міських шкіл і т.п.
Дотримання репрезентативності вибірки досліджуваних у психодіагностиці важливо під час визначення норм тесту, формування вибірок критеріальних і контрольних груп при конструюванні тесту за критеріально-ключевим принципом, під час апробації тесту, перевірки надійності й валідності тесту й інших психометричних процедурах.
Етапи створення тесту
Для конструювання ефективного тесту необхідно виконати наступні кроки:
1) розглянути й установити строгі обмеження на зміст завдань у відповідності з теоретичною концепцією досліджуваної психологічної властивості;
2) сформулювати так багато різноманітних завдань, релевантних цьому змісту, наскільки це можливо;
3) випробувати ці завдання на такій великій вибірці досліджуваних, наскільки можливо;
4) виконати аналіз завдань тесту, відбираючи ефективні. (Аналіз завдань - процедура для оцінки ефективності завдань у тесті; вона може включати визначення кореляції завдань з загальним тестовим показником, перевірку складності/дискримінативності та інші способи.);
5) крос-валідизувати завдання на новій вибірці. Треба перевірити, щоб завдання адекватно охоплювали відповідний контекст;
6) обчислити показники дискримінативності та надійності тесту;
7) валідизувати тест;
8) виконати факторний аналіз завдань і порівняти його із процедурою аналізу й відбору завдань;
9) визначити норми для цього тесту;
10) якщо тест виявляється ефективним і корисним, представити результати в посібнику з тесту.
Рекомендована та використана література:
Анастази А., Урбина С. Психологическое тестирование. - СПб.: Питер, 2003.
Бурлачук Л.Ф. Психодиагностика: Учебник для вузов. - Спб.: Питер, 2006.
Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. - СПб.: Питер, 1999.
Клайн П. Справочное руководство по конструированию тестов. – Киев: ПАН Лтд., 1994.
Общая психодиагностика / Под ред. А.А. Бодалева, В.В. Столина. СПб.: Изд-во «Речь», 2004.
Практикум по общей, экспериментальной и прикладной психологии / В.Д.Балин, В.К. Гайда, В.К. Гербаческий и др. Под общей ред. А.А. Крылова, С.А. Маничева. – СПб.: Питер, 2006.
Психологическая диагностика: Учебник для вузов / Под ред. М.К. Акимовой, К.М.Гуревича. – СПб.: Питер, 2008.
Сидоренко Е.В. Методы математической обработки в психологии. - Спб., 1996.
к.психол.н. О.Л. Луценко ©
Лекція з психодіагностики №4 |
---|
Класифікація тестів
Для впорядкування, структурування та виявлення певних закономірностей серед великої кількості розроблених за всю історію психодіагностики тестів дослідники намагаються запропонувати різні способи класифікації тестів.
За процедурою проведення тести розділяють на індивідуальні й групові.
За конструкцією вони розпадаються на гомогенні й гетерогенні (багатофакторні).
За обладнанням, яке використовуються для тестування, їх розподіляють на бланкові (олівець - папір), предметні (картки, кубики, фігурки), апаратні (для діагностики уваги, темпераменту, психічної працездатності, сенсо-моторної координації, психічних станів використовують прилади контактної координаціометрії, критичної частоти злиття світлових мерехтінь, реакції вибору, стеження за рухомим об’єктом тощо), комп’ютерні.
За ступенем впливу експериментатора серед них виділяють дуже залежні від цього впливу – діалогічні/клінічні методи (спостереження, бесіда, інтерв’ю), проективні методики, ситуативні тести, і слабко залежні – стандартизовані особистісні опитувальники, тести інтелекту і здібностей, об’єктивні тести особистості, психофізіологічні методики.
За психодіагностичним методом всі тести поділяють на: 1) об'єктивні (діагностика здійснюється на основі успішності/результативності й способу/особливостей виконання діяльності); 2) суб'єктивні (діагностика здійснюється на основі самоопису досліджуваним особливостей власного характеру, відчуттів, реакцій, поведінки в тих або інших ситуаціях) і 3) проективні (діагностика здійснюється на основі взаємодії досліджуваного з зовні нейтральним стимульним матеріалом, що стає в силу його невизначеності об'єктом проекції).
За принципом оцінки виділяють номотетичні, ідеографічні, крітеріально-орієнтовані психодіагностичні методики.
За досліджуваними змінними тести розділяють на дві великі групи - інтелекту й особистості. В свою чергу, інтелектуальні тести утворюють гілки тестів інтелекту в цілому, тести загальних і спеціальних здібностей, тести креативності і тести досягнень. Особистісні тести теж утворюють підгрупи особистісних опитувальників, проективних тестів, тестів мотивів, інтересів, цінностей, шкал установок, психосемантичних методик і об’єктивних тестів. Далі певні підгрупи теж можуть утворювати власні ієрархії, наприклад, об’єктивні тести особистості діляться на об’єктивні тести дії і ситуативні тести, а проективні тести утворюють групи структурування, доповнення, конструювання, інтерпретації, катарсису, вивчення експресії і продуктів творчості.
Будь-яка класифікація є не абсолютною, а умовною формою організації інформації, тому що завжди є певні «змішані» категорії, наприклад, серед психодіагностичних методик тести креативності є такою змішаною категорією, тому що по суті відносяться і до інтелектуальних і до особистісних тестів, так як містять особистісні (ризикованість, уяву, допитливість, складність) і когнітивні фактори (бігкість, гнучкість, оригінальність, розробленість), або певні медико-психологічні проби, наприклад, метод піктограм або доповнення речень, які нагадують проективні тести особистості, але спрямовані на діагностику когнітивних порушень і т.п.
Конструкт тесту (концептуальна змінна)– змінна, існування і природа якої випливає з теорій, наукових уявлень, а не з прямих спостережень. Більшість психологічних рис і якостей, які психологи зазвичай згадують, коли описують психологію людини, є недоступними для безпосереднього спостереження, наприклад, інтелект, агресивність, тривожність або екстраверсія. Ми спостерігаємо не інтелект, а те, що одна людина вчиться, вирішує завдання, знаходить вихід із складних ситуацій краще ніж інша; ми спостерігаємо не агресивність, а те, що певна людина ображає, б’є інших людей, розповсюджує плітки про них і т.п. Тести вимірюють ці концептуальні гіпотетичні конструкти через завдання, в яких йдеться про об’єктивні спостережувані ознаки поведінки. Теоретично припускається (концептуалізується), що група корелюючих ознак поведінки, не випадково ведуть себе узгоджено – має бути прихована (латентна) неспостереджувана причина, над-змінна, яка об’єднує всі ці більш дрібні ознаки, «примушує» їх діяти узгоджено.
Розробка будь-якого тесту починається з обґрунтування теоретичного конструкту - психологічної змінної, котру треба вивчити. Таке обґрунтування повинне включати різнобічний опис змінної: опис її передбачуваних взаємозв'язків з іншими властивостями особистості й гіпотезу про те, у яких завданнях (вербальних або невербальних) ця змінна може виявити себе. У якості джерел для обґрунтування теоретичного конструкта використовують літературу з досліджуваної проблеми, словники, думки експертів. Ретельна ідентифікація конструкту важлива ще й через співіснування в психологічній науці різних шкіл та напрямків, в рамках яких по різному трактуються основні рушійні сили психіки, структура особистості і т.д.
Методи конструювання тестів
Перший метод або спосіб конструювання тесту полягає в розробці тестових завдань відповідно до обраної моделі тесту на основі сформульованої теоретичної гіпотези (теоретичного конструкту). Тобто це такий прямий безпосередній спосіб – він включає обґрунтування конструкту, розробку завдань, перевірку психометричних властивостей.
Спочатку обирається форма завдань тесту, серед яких є:
- завдання із запропонованими відповідями (закриті);
- завдання з вільними відповідями (відкриті).
Завдання із запропонованими відповідями у свою чергу діляться на: завдання з альтернативними відповідями; завдання із множинним вибором; завдання з вираженням відповіді у вигляді відновлення частин речень, фігур і т.д.; завдання з переструктуруванням даних, що вимагають перегрупування елементів.
Завдання з вільними відповідями включають: завдання доповнення символу, малюнка, висловлення і т.п.; завдання вільного конструювання відповіді, які у свою чергу діляться на завдання з малоструктурованим стимулом (проективні) і завдання конструювання за чітко заданою схемою.
Далі розробляється низка завдань, яка спочатку має бути як мінімум у два рази більшою, ніж потрібна кількість. Дотримання певних правил розробки тесту дозволить заздалегідь підвищити надійність і валідність майбутнього тесту. Ці правила стосуються створення легких для розуміння завдань (запобігання вкладання більш ніж однієї думки або ситуації в одне завдання, використання простої загальноприйнятої мови, чітких, однозначних, лаконічних, оптимальних за довжиною формулювань), відносно нових за способом рішення і змістом завдань (без банальностей, повторень одних і тих же формулювань з широковідомих тестів, сформульованих так, щоб не слугувати підказкою до інших завдань), завдань економічних з точки зору виконання та обробки, таких, що допускають можливість формалізації остаточних результатів, чіткої стандартизації процедури й інтерпретації, завдань адекватних (реальних, сучасних, не надто екстравагантних та таких, що ставлять досліджуваного в незручне, дурне становище, породжують відчуття безглуздості всієї процедури тестування, роздратування).
Відібрані завдання розміщуються за ступенем труднощі (тести інтелекту, здатностей, досягнень), у випадковому порядку (особистісні і інтелектуальні тести) або в певному, запланованому згідно із замислом тесту порядку. Вони також можуть поєднуватися в блоки для виміру певного фактора (в багатофакторних тестах).
Завданням передує назва тесту, яка має бути загально-нейтрального характеру для того щоб, з одного боку не розкрити істинну валідність тесту, а з іншого – створити необхідну очевидну валідність. Ми рекомендуємо розробляти дві назви – справжню, для фахівців, та маскувальну – для досліджуваних, вона має розміщуватися на бланку тесту, або повідомлятися усно, якщо тест не бланковий, а предметний. Після назви розміщується інструкція, яка пояснює спосіб виконання тесту, часові обмеження і приклади розв’язання типових завдань, якщо це тести інтелекту, здібностей, досягнень.
Другий спосіб конструювання тестів –критеріально-ключовий принцип – це коли емпірично підшукуються психологічні ознаки, які дозволяють диференціювати релевантні критеріальні групи (де концентруються носії психологічних якостей, які вимірюються) від контрольних (що складаються з носіїв інших ознак або недиференційовані - звичайні, нормальні люди). Класичними прикладами методик, створених за цим принципом, є Мінесотський багатоаспектний особистісний опитувальник (MMPI) та “Бланк інтересів” Стронга: перший – у клінічній психології, другий – в області профорієнтації. Так, при розробці MMPI з первісного банку тверджень в основні клінічні шкали включалися тільки ті твердження, які добре диференціювали досліджуваних з тим або іншим клінічним діагнозом від контрольної групи здорових людей. В якості критерію, тут використовувався психіатричний діагноз досліджуваних, встановлений традиційним способом. До шкали “Бланка інтересів” Стронга ввійшли ті твердження з первісного набору, які реально розрізняли осіб, що були носіями окремих професійних інтересів. До речі завдання розробляються і в даному методі, і в обох наступних, так, як вказувалося вище – відповідно до обраної форми завдань тесту, враховуючи правила розробки завдань тесту. Далі тест перевіряється за всіма психометричними вимогами – дискримінативністю, надійністю, валідністю і стандартизується.
Третій спосіб – факторно-аналітичний принцип – це конструювання тестів за допомогою факторизації великої кількості завдань, які попередньо сформульовані як релевантні конструкту або конструктам (цей спосіб дозволяє відразу сконструювати багатофакторні тести або декілька однофакторних тестів). Розрізняють так званий розвідковий (експлораторний) факторний аналіз, за яким Р. Кеттелл побудував тест “Шістнадцять особистісних факторів”, і перевірочний (конфірматорний) факторний аналіз, за яким Г. Айзенк побудував тест EPI(Інтроверсія-нейротизм).
Крім того факторному аналізу можуть піддаватися тести, створені іншими способами, завдяки чому перевіряється факторна структура тесту – однорідність, наявність субшкал, виявляються неякісні завдання. Далі тест валідизується і стандартизується.
Існує спосіб розробки тестів за так званою моделлю Раша. Модель Раша (Rasch, 1966) є математично набагато складнішою, ніж класична модель похибки вимірювання, за якою будуються тести вже обговореними способами. Для її обчислення необхідна відповідна комп’ютерна програма. Вважається, що модель Раша є особливим випадком моделі латентних рис Бірнбаума (Birnbaum, 1968), відповідно до якої імовірність правильної відповіді – це функція від складності завдання, здібності тестувальника і параметра угадування.
Для шкалювання за Рашем необхідно розуміти також так звану теорію «завдання-відповідь», за якою вважається, що для дихотомічних завдань існують криві їхньої здібності виявити латентну рису особистості. Наприклад, завдання «а» може бути вирішено досліджуваними з низькими інтелектуальними здібностями з імовірністю 0,015, а завдання «в» з більшою імовірністю 0,15. Теж саме завдання «а» може бути вирішено досліджуваними з середніми здібностями з імовірністю 0,8, а завдання «в» з меншою імовірністю 0,6. І нарешті, завдання «а» може бути вирішено досліджуваними з високими інтелектуальними здібностями з імовірністю 0,95, а завдання «в» з більшою імовірністю 1,00. Якщо нанести на графік ці дані, то криві завдань «а» і «в» будуть різними – одна більш пологою, інша – більш крутою, а в цілому вони нагадують криві нормального розподілу.
Таким чином, імовірність правильної відповіді залежить від сполучення ступеню виразності даної риси у досліджуваного і здібності завдання виявити дану рису. Тобто є завдання, які краще або гірше виявляють певну рису і це їхня незалежна характеристика, яка не так прямо прив’язана до відсотку людей, які впоралися з завданням в нормативній вибірці, як це робиться для визначення трудності завдань в класичній моделі.
Для створення шкали Раша спочатку завдання апробуються (калібруються, градуюються) на репрезентативній вибірці не менш ніж 1000 досліджуваних. За її допомогою та із використанням відповідної комп’ютерної програми виявляють ці незалежні властивості завдань щодо вимірювання певної психологічної риси, тобто будуються криві «завдання-відповідь». Подальше застосування програми призводить до того, що завдання та групи завдань мають точно визначену трудність і дискріминативність і можуть застосовуватися для утворення якісних (однорідних і дискримінативних) тестів, де вони будуть розташовані зі зростаючою трудністю, а також будуть відрізнятися одне від одного на строго однакову величину психологічної ознаки, тим самим утворюючи пропорційну шкалу.
Ще за допомогою завдань, прошкальованих за Рашем, можна вирішувати проблему створення дійсно еквівалентних (паралельних) форм тестів для перевірки надійності або повторного тестування.
Шкалювання за Рашем надає можливість створення коротких, проте надійних тестів, що в традиційній моделі досягається за рахунок збільшення кількості завдань.
Прошкальовані за Рашем завдання ефективно використовувати для адаптивного тестування. Адаптивне тестування – комп’ютерне тестування за допомогою певного алгоритму, коли, якщо людина не може впоратися з певним завданням, їй далі пред’являються не всі завдання, в тому числі більш складні, а ті, які будуть легше. І навпаки, якщо людина може впоратися с певним завданням, їй пропонуються більш складні завдання допоки вона зможе їх вирішувати. Таким чином, швидко визначається рівень здібностей досліджуваного, тестування стає більш коротким і менш фруструючим для досліджуваного.
Передбачалось також, що шкали Раша будуть придатні для створення крос-культурних тестів, але ця можливість піддається критиці, принаймні для дуже «далеких» за типом культури популяцій, наприклад, ескімосів і китайців.
Рекомендована та використана література:
Анастази А., Урбина С. Психологическое тестирование. - СПб.: Питер, 2003.
Бурлачук Л.Ф. Психодиагностика: Учебник для вузов. - Спб.: Питер, 2006.
Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. - СПб.: Питер, 1999.
Клайн П. Справочное руководство по конструированию тестов. – Киев: ПАН Лтд., 1994.
Общая психодиагностика / Под ред. А.А. Бодалева, В.В. Столина. СПб.: Изд-во «Речь», 2004.
Практикум по общей, экспериментальной и прикладной психологии / В.Д.Балин, В.К. Гайда, В.К. Гербаческий и др. Под общей ред. А.А. Крылова, С.А. Маничева. – СПб.: Питер, 2006.
Психологическая диагностика: Учебник для вузов / Под ред. М.К. Акимовой, К.М.Гуревича. – СПб.: Питер, 2008.
к.психол.н. О.Л. Луценко ©
Лекція з психодіагностики №5 |
---|
Аналіз завдань тесту (аналіз пунктів, відбір та відсіювання завдань)
В питанні аналізу завдань фактично відпрацьовуються головні психометричні процедури, які вживають до цілого тесту (складність / дискримінативність, надійність, валідність), але спочатку стосовно окремих завдань тесту.
У завданнях може аналізуватися якісна сторона, тобто їхній зміст і форма, і кількісна, тобто їхні статистичні властивості. Про те, як домогтися якісного змісту завдань говорилося в лекції №4 в пункті «Методи конструювання тестів». Кількісний аналіз означає головним чином вимірювання складності (дискримінативності) завдань, а також процедуру кореляції окремих пунктів з підсумковим показником тесту (за аналогією з аналізом надійності і валідності). Ефективність тесту, в кінцевому рахунку, залежить від властивостей завдань, і попередній їх аналіз дозволяє підвищити якість тесту загалом. Усуваючи, додаючи, замінюючи або переглядаючи окремі завдання, можна вдосконалити тест в цілому. Аналіз завдань дозволяє скоротити тест, підвищуючи в той же час його валідність, надійність і дискримінативність.
Складність (дискримінативність) завдань.Складність завдань визначається відсотком досліджуваних, які надали правильну відповідь. Він має бути в межах 20%-80%.
Більшість стандартизованих тестів здібностей призначені для якомога більш точної оцінки індивідуального рівня розвитку здібності, і якщо в такому тесті ніхто не може впоратися з певним завданням, воно виявляється просто зайвим вантажем. Теж можна сказати і про завдання, з якими справляються усі.
Рівень складності завдань залежить від призначення тесту, наприклад, для відбору найбільш обдарованих людей потрібні завдання підвищеної складності, з якими зможуть впоратися лише 20-10% звичайної вибірки. Проте в більшості випадків, максимум інформації про індивідуальний рівень виконання тесту забезпечують завдання середньої складності. Теж саме стосується тестів особистості. Тільки стосовно них використовують термін «дискріминативність» завдань, тобто їх розпізнавальна здібність. Вона визначається відсотком людей, які надали ключові відповіді на питання. Тут теж повинно працювати правило інтервалу 20-80%.
Кореляція показників окремих пунктів із загальним тестовим показником.
Кореляцію результатів за окремими завданнями з загальним тестовим результатом використовують, виходячи із двох теоретичних міркувань. По-перше, за аналогією з перевіркою надійності за внутрішньою погодженістю – тобто для того, щоб створити однорідний тест. Однорідний тест вимірює тільки одну змінну, тому всі його завдання теж мають вимірювати лише цю змінну. Якщо це не так і вони виявляють дещо інше – вони в тесті не потрібні, тому що шкодять точності вимірювання через створення похибки.
Для такої кореляції використовують коефіцієнт лінійної кореляції Пірсона (коефіцієнт добутку моментів) для завдань з рейтинговими шкалами із 5-ті і більше пунктів. Наприклад:
Багато людей вважають мене люб’язним та турботливим. |
Зовсім не згоден (1) |
Скоріше, не згоден (2) |
Дещо не згоден (3) |
Дещо згоден (4) |
Скоріше, згоден (5) |
Повністю згоден (6) |
Для завдань з 3-4 - бальними варіантами відповідей можна використовувати коефіцієнт рангової кореляції Спірмена. Для дихотомічних завдань (коли відповідь має лише два значення – так/ні і т.п.) використовують точечно-бісеріальну кореляцію.
По-друге, кореляцію окремих завдань і тесту загалом можна розглядати як перевірку валідності за критерієм. Гарна розділяючи здібність завдань буде присутня тоді, коли за результатами виконання завдань люди потрапляють до різних крітеріальних груп, тобто реально різних груп, які в своїй практичній діяльності і життєдіяльності розрізняються на психічно хворих і здорових, просоціальних і асоціальних, успішних та неуспішних в навчанні або виконанні певних професійних обов’язків. Через те, що отримати справжні критеріальні дані не завжди легко, вважають, що результат за цілим тестом моделює (апроксимує, наближує) критерій. Таким чином, мета такої процедури корелювання – з’ясувати співвідношення між виконанням завдання й контрольним критерієм. Повинна бути значима кореляція, але не висока за значенням – достатньо r≥0,2.
Для оцінки дискримінативності використовують також метод екстремальних (контрастних) груп [9, с. 91].
Є чинники, які часто впливають на дискріминативність завдань – це стать, вік і соціально-економічний статус досліджуваних. Може статися, що в чоловічій вибірці відсоток розв’язання завдань (або ключових відповідей) буде іншім, ніж у жіночий. Так само стосовно молодої, середньої або літньої груп або груп з вищою/середньої світою. Тому треба перевіряти дискріминативність завдань тесту в вибірках, сформованих за цими універсальними критеріями і відсіювати або переформульовувати завдання, які сильно відрізняються за ефективністю в цих групах. В той же час є психологічні змінні, які дійсно, за своєю суттю, виявляються відмінними в різних вікових, культурних та статевих групах. Тоді, якщо вони після численних переформулювань мають різну дискріминативність і це не є артефактом тесту, треба під час стандартизації розробляти різні норми для жіночої та чоловічої вибірок і для груп за іншими ознаками. Зокрема для тестів інтелекту і здібностей прийнято розробляти тести для відносно вузьких вікових груп, тому що різниця у виконанні тестів інтелекту різними віковими групами обов’язково виявиться.
Наприкінці аналізу завдань однофакторний тест має містити 20-30 ефективних завдань. Не рекомендується створювати тест з меншою кількістю завдань через падіння надійності тесту за виключенням випадку, коли за допомогою факторного аналізу конструюється багатофакторний тест з корелюючими факторами (коли певні завдання входять до декількох факторів – шкал тесту).
Далі профільтрована через аналіз низка завдань піддається перевірці на дискріминативність, надійність і валідність вже як цілісний тест. Коротко розглянемо ці поняття.
Дискріминативність тесту в цілому.
Дискріминативність - здатність тесту диференціювати обстежуваних відносно «максимального» і «мінімального» результату тесту.
Відсутня інформативність психологічного тесту, за яким всі випробувані показали однакові результати.
Основний показник коефіцієнта дискріминативності δ Фергюсона простий в обчисленні. Коефіцієнт δФергюсона – це відношення між показником дискріминативності, отриманим для деякого тесту, і максимальним значенням дискріминативності, що може забезпечити такий тест [15].
Де N – кількість досліджуваних, n – кількість завдань, fі – частота зустрічальності кожного показника.
δ=0, коли всі досліджувані одержали однакові показники (тобто коли немає дискріминативності), і дорівнює 1 при рівномірному розподілі показників у вибірці.
Надійність тесту.
Надійність - характеристика методики, що відбиває точність психодіагностичних вимірювань, а також стійкість результатів тесту до дії сторонніх випадкових факторів; погодженість тесту внутрішня і через певний час. У самому широкому сенсі надійність тесту показує, наскільки індивідуальні розходження в тестових результатах є «справжніми», а наскільки можуть бути приписані випадковим чинникам.
Вимоги до вибірки досліджуваних для перевірки надійності: репрезентативність вибірки, обсяг - не менше 200 чоловік.
Існує кілька способів дослідження надійності методики. Основний статистичний метод перевірки надійності – кореляційний аналіз, вибір методу якого залежить від шкали вимірювання, на якій побудовано тест.
У практиці психологічної діагностики вважається, що тест надійний, якщо коефіцієнт надійності rt ≥ 0,6.
Надійність за внутрішньою погодженістю.
У психометрії прагнуть розробляти тести здебільшого внутрішньо погодженими, з тієї причини, що якщо деяка змінна виміряється частиною тесту, то тоді в інших частинах, якщо вони не погоджені з першої, ця ж змінна вимірюватися не може. Внутрішня погодженість тесту виміряється різними способами. Перший – це за ступенем виразності інтеркореляційних зв'язків між завданнями тесту.
Надійність, яка обчислюється за інтеркореляцією завдань тесту, статистично дорівнює стандартній похибці середньої взаємної кореляції завдань або тестів (формула Дж. Наннеллі, 1978) [15]:
Де σt – стандартна помилка виміру, σr– стандартне відхилення кореляції завдань усередині тесту й k – кількість завдань у тесті, rt – коефіцієнт надійності тесту. Чим більше завдань у тесті, тим вище його надійність.
Надійність еквівалентних (паралельних форм).
Надійність паралельних форм - це характеристика надійності психодіагностичної методики за допомогою взаємозамінних форм тесту. При цьому тих самих досліджуваних у вибірці визначення надійності обстежують спочатку з використанням основного набору завдань, а потім - із застосуванням аналогічних додаткових наборів.
Основним показником надійності паралельних форм є коефіцієнт кореляції між результатами первинного й повторного обстежень за допомогою першої й другої форм тесту.
Надійність частин тесту (розподіл навпіл, розщеплення) та окремих завдань.
Надійність частин тесту - характеристика надійності психодіагностичної методики, одержувана шляхом аналізу стійкості результатів окремих сукупностей тестових завдань. Найбільш простим і розповсюдженим способом визначення надійностей частин тесту є метод розщеплення на парні/непарні завдання (розподілу навпіл). Достатньо одного виконання тесту в одній вибірці досліджуваних. Потім, під час обробки результатів, підраховують не загальну суму балів за тестом у кожного досліджуваного, а окремі суми за двома рівноцінними половинами тесту. Коефіцієнт кореляції між половинами тесту покаже надійність тесту.
Для розрахунку надійності при розщепленні тесту навпіл існує формула Спирмена-Брауна:
де r12 – кореляція між двома половинами тесту.
Найпоширенішим методом оцінки надійності окремих завдань є обчислення по формулі Кьюдера-Ричардсона:
Де, k - кількість завдань у тесті, P - частка досліджуваних, що дали правильні (ключові) відповіді на завдання від загальної кількості досліджуваних, Q = 1 – P, σ2y - дисперсія для тесту.
, де N1 – кількість досліджуваних, що дали правильні (ключові) відповіді, N - загальна кількість досліджуваних.
Вищенаведена формула придатна для випадків, коли завдання оцінюються в дихотомічній шкалі, тобто за принципом «виконане - не виконане», «так - ні», «правильно – не правильно». Для випадків з більше диференційованою оцінкою («так – утрудняюся – ні», «повністю згодний - згодний - скоріше згодний…»і т.п.) застосовується формула коефіцієнта альфа Кронбаха:
Де k - кількість завдань у тесті, ∑σ2i - сума дисперсій для завдань, і σ2y - дисперсія для даного тесту.
Ретестова надійність.
Ретестова надійність - це характеристика надійності психодіагностичної методики, одержувана шляхом повторного обстеження досліджуваних за допомогою того самого тесту. Вона обчислюється по відповідності результатів першого й другого обстежень або по збереженню рангових місць досліджуваних у вибірці при ретесті. Коефіцієнт надійності відповідає коефіцієнту кореляції між результатами таких обстежень. Рекомендується інтервал між обстеженнями від декількох місяців до половини року.
Якщо тест не може дати той же самий результат для деякого досліджуваного (за умови, що цей досліджуваний не змінився) в різних умовах - значить його надійність незадовільна, або його прогноз дуже швидкоплинний, тобто вимірювана змінна більш відноситься до станів, настроїв і т.п. Низька ретестова надійність властива проективним методикам через те, що вони вимірюють дуже широкий спектр властивостей особистості. Одна і таж сама методика першого разу може стимулювати проявлення мотивації досліджуваного, а іншого разу – особливості його міжособистісної взаємодії. Проективні методики також дуже чутливі до рапорту між експериментатором і досліджуваним.
Коефіцієнт надійності вказує, наскільки вона задовільна або ні, але щоб її підвищити в разі необхідності треба розуміти через які причини виникають її порушення. Крім головної причини – різниці між характеристиками вибіркової і генеральної сукупності, є ще декілька специфічних, які ми наводимо нижче.
Джерела незадовільної надійності.
1.Угадування відповідей в тестах інтелекту, здібностей і досягнень.
2. Установки на відповідь в особистісних тестах – стереотипи відповідей на завдання тесту, що ведуть до порушення валідності: установка на соціально схвалювані відповіді; установка на згоду; відхилення; установка на крайні відповіді; установка на невизначені або середні відповіді.
3.Усвідомлена фальсифікація, як симуляція або погіршення (агравація) відповідей досліджуваними.
4. Суб'єктивнеоцінювання експериментатора в проективних тестах.
5. Невиконання принципів конструювання ефективного тесту: занадто великий тест, під час виконання якого виникає стомлення і зниження мотивації досліджуваного, незрозумілі багатозначні завдання, незрозуміла або некоректна інструкція до тесту.
к.психол.н. О.Л. Луценко ©
Лекція з психодіагностики №6 Валідність тесту |
---|
Валідність тесту.
Валідність - комплексна характеристика тесту, що включає відомості про область досліджуваних явищ і репрезентативність використовуваної стосовно неї діагностичної процедури [Бурлачук-Морозов]. Інакше кажучи, тест називається валідним, якщо він вимірює те, для вимірювання чого він призначений [Клайн]. А. Анастазі пише, що валідність тесту це поняття, яке вказує нам, що тест вимірює й наскільки гарно він це робить.
У поняття валідності входить велика кількість інформації про тест. Різні категорії такої інформації і способи її одержання утворюють типи валідності.
Очевидна (зовнішня, лицьова) валідність– відомості про тест, сферу його застосування, результативність й прогностичну цінність, що виникає у досліджуваного або іншої особи, яка не володіє спеціальними знаннями про справжню валідність. Очевидна валідність зазвичай демонструється через назву й інструкцію до тесту, і допомагає налагодити співробітництво з досліджуваними.
Основними видами справжньої валідності є: змістовна, конструктна й критеріальна валідності.
Змістовна валідність.
Змістовна валідність (внутрішня, логічна) −комплекс відомостей про репрезентативність змісту завдань тесту відносно вимірюваних психологічних властивостей і особливостей. Найбільше значення цей вид валідності має для тестів досягнень (тестів успішності, екзаменаційних тестів). Для конструювання завдань тесту залучаються експерти з досліджуваної якості, література, словники.
Завдання – це вибірка поведінки, за якою стоїть психологічна якість. Важливо, щоб завдання відбивали всі боки психологічної якості. Тому робиться так звана специфікація тесту – це скільки завдань має бути з кожної складової якості. Таким чином можна зробити відсотковий розрахунок складових конструкту, а котім перевести його в кількість завдань залежно від того, скільки завдань планується мати в ньому.
Після генерування необхідної кількості завдань, вони піддаються експертній оцінці. (Існують два способи експертної оцінки – колективна і середньозважена. Остання може організовуватися через усереднення рейтингів, шкалювань або парних порівнянь). Таким чином змістовна валідність формується однією з перших видів валідності і перевіряти її також можна відразу.
Конструктна валідність (ідентифікація конструкту).
Конструктна валідність (теоретична) −відбиває ступінь репрезентації досліджуваного психологічного конструкта в результатах тесту; чим більше результати тесту відповідають теоретичній гіпотезі про природу вимірюваної змінної, тим вище конструктна валідність тесту.
При розробці тесту формулюється низка гіпотез про те, як буде пов'язаний досліджуваний тест із іншими тестами, що вимірюють подібні, протилежно спрямовані або незалежні психологічні явища. Ці гіпотези висуваються на підставі теоретичних уявлень про вимірювані властивості як про психологічні конструкти. Підтвердження гіпотез свідчить про теоретичну обґрунтованість методики, тобто про ступінь її конструктної валідності. Цей тип валідності є найбільш складним і комплексним.
Коли ми ідентифікуємо конструкт ми працюємо нібито хіміки, які для того, щоб дослідити якусь невідому речовину, поміщують її у контакт з відомими – кислотою, лугом й іншими. Потім вони спостерігають, як вона реагує з ними і роблять висновок, що ж це за речовина.
Так само з конструктом тесту – його піддають кореляції з іншими вже валідизованими тестами, які вимірюють подібні ж явища і мають корелювати з цим новим тестом (конвергентна валідність); його піддають кореляції з іншими вже валідизованими тестами, які вимірюють незв’язані, зовсім інші явища і не повинні корелювати з цим новим конструктом (дивергентна валідність). Також висуваються і перевіряються гіпотези про наявність або відсутність статевих розбіжностей у групах чоловіків і жінок за даним тестом; висуваються і перевіряються гіпотези про наявність або відсутність за цим тестом вікових розбіжностей в групах молодих, середніх і старших за віком людей; пропонуються способи психофізіологічної та експериментальної перевірки валідності тесту.
Якщо конструкт тесту в процесі ідентифікації демонструє передбачувані теорією результати, він вважається валідним. Конструктна валідність має особливе значення для валідизації тестів особистості, але тести інтелекту і здібностей теж валідизують за конструктом. Для цього використовують методи декомпозиції завдання (варіювання пред’явлення завдань частково і повністю, з різними інструкціями і підказками), а також аналіз протоколів −голосний синхронний переказ того, що людина думає під час розв’язання завдань.
Критеріальна валідність.
Критеріальна валідність −комплекс характеристик методики, що відбиває відповідність діагнозу і прогнозу певному колу критеріїв вимірюваного явища. Критеріальна валідність включає як комплекс зв'язків з поточним станом досліджуваного явища (поточна критеріальна валідність), так і ймовірність і обґрунтованість прогнозу про його стан у даної людини в майбутньому (прогностична критеріальна валідність). Найбільше значення цей вид валідності має для валідизації тестів професійних інтересів, мотивів, граничних нервово-психічних розладів, специфічних типів поведінки (асоціальних), здібностей тощо.
Перевіряється критеріальна валідність шляхом статистичного корелювання балів за тестом й показників за зовнішнім параметром, вибраним у якості критерію валідизації.
Валідизація за будь-яким критерієм ефективно здійснюється методом контрастних груп (розумово відсталих і з нормальним інтелектом, що страждають і не страждаючими психічними захворюваннями, асоціальних-просоціальних і т.п.).
Критерій валідизаціїє незалежним від тесту показником, що має безпосередню цінність для певних областей практичної діяльності. Наприклад, у педагогічній психології - це «успішність», у психології праці - «продуктивність», у медичній психології - «стан здоров'я» і т.д.
У якості об'єктивних критеріїв валідизації часто використовують:
- об'єктивні соціально-демографічні й біографічні дані (стаж, освіта, професія, прийоми або звільнення з роботи, кількість браків та розлучень тощо);
- показники успішності навчання, які найчастіше є критеріальною мірою тестів здібностей, досягнень в окремих дисциплінах, тестів інтелекту;
- виробничі показники ефективності виконання певних видів професійної діяльності, що мають найбільше значення під час валідизації методик, використовуваних у профвідборі й профорієнтації;
- результати реальної діяльності (малювання, моделювання, музика, складання розповіді й т.д.) при випробуванні тестів загальних і спеціальних здібностей, креативності, тестів особистості;
- лікарський діагноз або інші висновки фахівця;
- контрольні випробування знань і вмінь;
- дані інших методик і тестів, валідність яких вважається встановленою.
Суб'єктивними критеріями є оцінки, судження, висновки про досліджуваного, зроблені експертом – людиною, яка знає досліджуваного з боку оцінюваної якості і може надати їй адекватну оцінку (фахівцем, педагогом, керівником, психологом, сусідом, родичем). Об'єктивізація суб'єктивного критерію валідизації досягається збільшенням числа експертів. Крім цього критерій валідизації повинен бути багатокомпонентним, наприклад, експертне опитування плюс біографічні дані, плюс результати тестування контрастних груп.
Перехресна валідизація (крос-валідизація).
Важливо, щоб валідність тесту перевірялася на вибірці досліджуваних, відмінної від тієї, за допомогою якої здійснювався аналіз і відбір завдань. Будь-який коефіцієнт валідності, знайдений на вибірці, що застосовувалася для відбору завдань, виявиться завищеним, тому що випадкові особливості цієї вибірки будуть враховуватися як справжні властивості популяції.
Наприклад, для валідизації тесту для відбору майбутніх студентів медичного факультету використовувалася крітеріальна валідизація за допомогою контрастних груп. З кожного курсу відраховується та частина студентів, яка не може оволодіти програмою навчання. За логікою критериальної валідизації вважається, що можна взяти контрастні групи найкращих і найгірших студентів (успішність навчання буде критерієм) і виявити всі якості, що статистично достовірно розрізняють групи кращих та гірших студентів. За ті якості, що характеризують верхню групу присвоювати позитивні бали до ключа, за ті – що характеризують нижню – негативні. Таким чином за допомогою створеного тесту можна буде одбирати здатну до успішного навчання молодь ще на етапі вступу до вузу. Припустимо, що вибіркою були 100 студентів-медиків і серед них 30 кращих і 30 гірших за успішністю навчання були порівняні за різними характеристиками. Будуть виявлені певні розбіжності, наприклад, в групі кращих було більше дівчат на ім’я Таня і хлопців на ім’я Сергій. А в групі відстаючих було більше Марин та Андріїв. Ми можемо надавати за те, що дівчину звуть Таня більше балів, ніж якщо її звуть Марина. Але якщо ми візьмемо інший курс – скоріше за все ця закономірність не підтвердиться, або виявиться ще якась нова. Так само і з психологічними ознаками – вони теж можуть бути випадковим феноменом певної вибірки і треба, щоб вони підтвердилися на іншій групі, щоб довести, що вони справді пов’язані з критерієм.
Чим меншими будуть вибірки досліджуваних під час аналізу завдань, менша кількість завдань залишена після аналізу, а також завдання відбираються суто емпірично, без теоретичного обґрунтування, тим більше вірогідність того, що вони будуть мати після крос-валідизації незадовільну валідність.
Факторній аналіз (факторизація тесту)
Факторизація тесту є іншим способом проаналізувати і відібрати ефективні завдання тесту, а також остаточною перевіркою гомогенності тесту. Математичний алгоритм факторного аналізу дозволяє виявити, наскільки завдання тесту корелюють між собою, з чого робиться припущення, що вони всі так «поводяться» через кореляцію з гіпотетичним фактором, який і є конструктом тесту – певною латентною психологічною змінною, про яку можну судити через спостережувані ознаки поведінки людини. Факторний аналіз тесту покаже, які завдання не увійшли до головного фактора, або увійшли до нього з надто низькими кореляціями. Їх потрібно виключити або переформулювати таким чином, щоб вони більше відповідали психологічній змінній, на діагностику якої спрямовано тест, і потім повторити процедуру факторизації. В результаті буде водночас перевірена і надійність тесту за внутрішньою погодженістю, яка ще має назву факторно-дисперсійної надійності. Про процедури факторного аналізу і оцінку факторно-дисперсійної надійності можна прочитати у спеціальній літературі [1, 2, 7, 9, 15, 20, 41, 48].
Факторний аналіз використовується також для з’ясування певних внутрішніх характеристик самого конструкту тесту. Наприклад, за його допомогою (а також за допомогою кластерного аналізу) здійснювалося визначення, чи є новий конструкт «перфекціонізм», тобто прагнення до досконалості в будь-якої діяльності, категоріальним або континуальним. Певні дослідники вважають його протяжним, з негативними виходами на екстремальних значеннях у вигляді обсесивно-компульсивних розладів, порушень харчової поведінки тощо. Інші вважають, що перфекціонізм має дві різні форми – адаптивну і неадаптивну. Проведення цих математичних процедур дозволило одній групі дослідників довести континуальність даної риси [45].
к.психол.н. О.Л. Луценко ©
Лекція з психодіагностики №7 Стандартизація та адаптація тесту |
---|
Стандартизація тесту.
Стандартизація тесту - уніфікація, регламентація, приведення до єдиних норм процедури й оцінок тесту.
В психодіагностиці потрібно розрізняти дві форми стандартизації.
У першому випадку під стандартизацією розуміються обробка й регламентація процедури проведення, уніфікація інструкції, бланків обстеження, способів реєстрації результатів, умов тестування, характеристика контингентів досліджуваних.
В-другому - процедура одержання показників за тестом (норм) для репрезентативних груп досліджуваних, чим досягається порівнянність одержуваних результатів у різних досліджуваних.
Норми – це група показників із чітко визначених вибірок, а процедури одержання цих показників становлять процес стандартизації тесту.
Стандартизація тесту здійснюється на дуже великих групах досліджуваних. Для одержання норм за тестом для загальної популяції, наприклад, дітей шкільного віку, необхідна вибірка близько 10000 досліджуваних, де будуть представлені школярі державних і приватних шкіл, загальноосвітніх шкіл, гімназій і ліцеїв, міських і сільських шкіл, шкіл першого, другого і третього ступеню, шкіл з різних регіонів держави. Однак вибірка з обмеженої популяції (льотчиків-космонавтів або академіків національної академії наук), звичайно, не повинна бути настільки великою. Репрезентативність вибірки важливіше, ніж її розмір. Невелика, але репрезентативна вибірка дозволить отримати більш точні норми, ніж велика, але нерівномірно представлена (зміщена).
Завдяки стандартизації ми можемо зіставити результати окремого досліджуваного з результатами «більшості подібних людей», тобто релевантної групи (релевантна група −це група, що відповідає даному індивідуумові за впливовими для більшості психологічних якостей показникам −віком, статтю, національністю, соціальним статусом, освіті й т п.), і проінтерпретувати його результати в термінах більшої або меншої виразності в нього тих або інших індивідуально-психологічних особливостей у порівнянні з іншими людьми.
Показники індивідуума порівнюються з показниками релевантної нормативної групи за допомогою певного перетворення, що виявляє статус цього індивідуума в даній групи. Порівняння показника індивідуума й нормативної групи в «сирих» балах підходить для дослідницьких цілей, але незручно в прикладній психології. Наприклад, у ситуації психологічного консультування, говорити, що клієнт має показник 95, а середнє по вибірці – 38,6 балів за даним тестом, або в такий же спосіб обговорювати результати кандидатів на вакансію при профвідборі, досить трудомістка процедура. Перетворення «сирих» балів до більш зручних кількісних еквівалентів спрощує їхній аналіз і інтерпретацію. До найбільш поширених стандартних показників відносяться процентилі, Z-показники, Т-бали, стени, стенайни, s-показники, стандартні IQ-показники. Часто використовують спеціальну нормалізацію показників, тобто залишають в тесті лише ті завдання, які утворюють нормальний розподіл для цієї змінної.
Зміст основних видів стандартних балів викладений нижче.
Процентилі. Ранг показника в процентилях визначається відсотковим відношенням у групі стандартизації (нормативній групі) тих досліджуваних, які одержали більш низький показник. Значення у 20 процентилей (Р20) у досліджуваного за певним тестом означає, що 20% популяції мають показники нижче за його і 80% - вище. Недоліками процентилей є те, що вони є значеннями порядкової шкали і відображають не справжній розподіл ознаки, а ранг людини у вибірці стандартизації. Тобто, Р0 не означає, що людина має найнижчий нульовий бал (не розв’язала жодного завдання або не дала жодної ключової відповіді), Р50 – що впоралася з половиною завдань (обрала половину ключових відповідей), а Р100, не означає, що вона повністю впоралася з тестом (відмітила всі ключові відповіді).
Z-показники. Перехід до відбиття рівня ознаки в стандартних балах тесту відбувається починаючи з Z-показників.Вони утворюють рівноінтервальну шкалу. СтандартизованийZ-показник – це відхилення кожного неопрацьованого («сирого») показника від середньоарифметичного значення тесту у вибірці, розділене на стандартне відхилення розподілу:
Де Z – стандартизований показник, x – «сирий» показник, `х – середнє, σ – середнє квадратическое (стандартне) відхилення. Якщо розподіл сирих показників нормальний, то Z – показники будуть змінюватися від –3 до +3. Наприклад, середнє арифметичне в вибірці для певного тесту дорівнювало 50, а стандартне відхилення - 10. Тоді:
«Сирі» показники |
Обчислення |
Z |
60 |
(60 – 50) / 10 = |
1,0 |
65 |
(65 – 50) / 10 = |
1,5 |
50 |
(50 – 50) / 10 = |
0 |
40 |
(40 – 50) / 10 = |
-1,0 |
54 |
(54 – 50) / 10 = |
0,4 |
Недоліками Z −показників є те, що їхнє середнє значення = 0, а найвище можливе значення = 3; серед них зустрічаються від’ємні і дробові значення, а також надто мало цілих позицій шкали. Це привело до того, що розроблювачі тестів почали застосовувати подальші перетворення Z −показників.
Стандартизований перетворений Z – показник −Zt. Стандартизоване перетворення Z – показників виконується за формулою: Zt = А+ВZ, де Zt – перетворений Z – показник, А – середнє значення перетвореного розподілу, В – стандартне відхилення перетвореного розподілу і Z – Z – показник. Таким чином можна задати зручне середнє і довжину шкали. Наприклад, ми хочемо, щоб нове середнє шкали дорівнювало 100, а стандартне відхилення залишилося 10. Тоді:
«Сирі» показники |
Обчислення |
Z |
Обчислення |
Zt |
60 |
(60 – 50) / 10 = |
1.0 |
Zt = 100 + 1 *10 = |
110 |
65 |
(65 – 50) / 10 = |
1.5 |
Zt = 100 + 1,5 *10 = |
115 |
50 |
(50 – 50) / 10 = |
0 |
Zt = 100 + 0 *10 = |
100 |
40 |
(40 – 50) / 10 = |
-1.0 |
Zt = 100 - 1*10 = |
90 |
54 |
(54 – 50) / 10 = |
0.4 |
Zt = 100 + 0,4 *10 = |
104 |
При конструюванні тестів часто виробляється перетворення Z – показників до розподілу із середнім значенням `х=50 і стандартним відхиленням σ=10. У цьому випадку якщо розподіл наближається до нормального, показники будуть змінюватися від 80 до 20. Їх називають Т-показниками (використовуються в MMPI та інших тестах). Ще одним популярним масштабом шкали є: `х=100, σ=16 (15) - це шкала IQ-показника стандартного, використовуваного в тестах інтелекту.
Наступні перетворення, широко застосовувані в прикладній психології, є показники в стенайнах (дев’ятибальна шкала), стенах (десятибальна шкала), s– показниках (одинадцятибальна шкала).
Норми в будь-яких одиницях являються зовнішньою, не обов’язковою характеристикою тесту, проте вони надають можливість суттєво збагатити інтерпретацію отриманих результатів, підвищують можливості математичної обробки даних і є дуже зручними в практичній роботі психолога. Зокрема, за більшістю стандартних показників завжди відомі інтервали, показники з яких є середніми, високими та низькими. Наприклад, у шкалі в Т-балах середній інтервал 50±10 (±1σ), відповідно вище 60-ті – це високі показники, а вище 70-ті (±2σ) – це дуже високі, клінічно значущі показники. Або в шкалі стенів середнє завжди 5,5, а стандартне відхилення – 2,5, відповідно середній нормативний інтервал буде дорівнювати від трьох до семи, вище та нижче нього будуть високі і низькі показники.
Крім тестів, де інтерпретація результатів і кінцевий висновок робляться на основі норм, існує ще спосіб оцінки на основі певних критеріїв, які закладені в зміст тесту, тобто включені до змісту окремих завдань або частин тесту. Маються на увазі так звані крітеріально-орієнтовані тести. Вони частіше за все конструюються для оцінки досягнень – якості засвоювання дорослими або дітьми певного навчального курсу. Експерти розробляють цілі, які мають бути досягнуті за допомогою цього навчального курсу і потім, на основі даних цілей-критеріїв оцінюється – яку частину тесту або які окремі завдання досліджуваний виконав правильно. Подібні критерії можуть закладатися при конструюванні індивідуально-орієнтованих тестів, діагностика за якими інакше називається «адаптивним тестуванням». На відміну від звичайного тестування, при адаптивному тестуванні досліджуваному пред’являються не всі завдання тесту, а лише ті (за допомогою спеціального комп’ютерного алгоритму), які він імовірно зможе виконати. В результаті час тестування скорочується і обстежувана людина не відчуває фрустрації через спроби розв’язати багато надто складних для неї завдань.
Адаптація тестів.
Адаптація тесту - комплекс заходів, що забезпечують адекватність тесту в нових умовах його застосування [9]. У вітчизняної психодіагностиці особливу актуальність здобуває адаптація закордонних тестів. Проте, можна адаптувати тести для іншої вікової групи, для групи з іншим рівнем освіти, для груп з обмеженими можливостями тощо.
Виокремлюють наступні обов’язкові етапи адаптації тесту:
- аналіз вихідних теоретичних положень автора тесту;
- переклад тесту й інструкцій до нього на мову (мовний стиль) користувача, що завершується експертною оцінкою відповідності оригіналу;
- аналіз завдань, перевірка валідності, надійності, дискріминативності тесту, здійснювана відповідно до психометричних вимог;
- стандартизація тесту на відповідних вибірках.
Проблеми виникають як у зв'язку з адаптацією різних видів опросників, так і тестів інтелекту. Це пов'язане з мовними й соціокультурними розходженнями між національними, соціальними або віковими групами.
Наприклад, для адаптації російськими психологами опитувальника «Шкала психологічного благополуччя» переклад методики з англійської мови на російську виконувався психологом, який володіє мовою оригіналу і професійним перекладачем (двома особами). Під час перекладу основна увага приділялась не лише максимальному збереженню психологічного смислу, але і збереженню граматичної форми кожного твердження, тому, що як вже доведено, навіть незначні на перший погляд зміни у змісті та формі суджень часто значним чином впливають на характер відповідей досліджуваних. Далі, з метою перевірки адекватності перекладу, був виконаний зворотній переклад методики з російської мови на англійську. Переклад виконувався перекладачем, який раніше не був знайомий з текстом англійського оригіналу. Для емпіричної перевірки еквівалентності кінцевого російськомовного варіанту дві його форми (російськомовна та оригінальна) в різному порядку надавалися для виконання студентам, які навчаються за спеціальністю «Іноземна мова. Практична психологія». Порівнювалися середні та стандартні відхилення, отримані в групах студентів за обома методиками. Вони були дуже близькі за значеннями і не мали значущих розбіжностей. Також були отримані значущі кореляції (р≤0,01) між результатами за обома варіантами методики в цілому і по окремих шкалах, що довело їхню еквівалентність і адекватність перекладу. І це стосується тільки другого етапу адаптації. Звісно так само ретельно виконуються й інші етапи адаптації.
Із вищесказаного зрозуміло, що якісна адаптація тесту за трудомісткістю і матеріальними витратами часто дорівнює тим, які потребуються при створенні повністю нового тесту.
к.психол.н. О.Л. Луценко ©
Лекція з психодіагностики №8 |
---|
В психологічній науці, як і в багатьох інших, існує проблема взаємовідношення загального і індивідуального. По іншому, це питання формулюється так: що є предметом вивчення психологічної науки – людина в загальних рисах або людина в її особливих індивідуальних якостях? Обидва ці полюси знаходяться у сфері компетенції психологічної науки.
Вивчення продуктів творчості окремої особи, біографічне інтерв'ю, деякі проективні техніки відноситься до ідеографічних методів, оскільки вони намагаються розкрити психологічні особливості окремої особи, конкретної індивідуальності. Такі методи мають мінімум обмежень, привнесених експериментатором і будуються на основі особливостей особистості, що вивчається.
Методи, націлені на вивчення «людини загалом» називаються номотетичними, оскільки вони проводять узагальнення специфічних особливостей окремих осіб, визначають середнє арифметичне і потім порівнюють кожну нову особистість, що вивчається, з цим «середнім». До них відносяться всі стандартизовані тести, тобто тести, що оснащені нормами.
Кожний з двох підходів завоював своїх прихильників.
Можна сказати, що це суперечка між прихильниками пояснення (номотетичний, він же статистичний підхід) і розуміння (ідеографічний, він же идеоморфічний, морфогенетичний, клінічний підхід).
Наука, як номотетична, так і ідеографічна, повинна бути у великій мірі обгрунтованою. Пропоновані ідеографічні інтерпретації повинні піддаватися перевірці, передачі і мати високу прогностичну силу.
Г. Олпорт приводить наступні ідеографічні методи. (Оллпорт Гордон В. Общее и уникальное в психологии / Личность в психологии. – М.: «КСП+», СПб.: «Ювента», 1998. – С. 72-87.)
1. Метод розроблений Болдуіном на основі аналізу листів однієї жінки на ім'я Джені (Baldwin, 1942). Предметом вивчення була індивідуальна структура її мислення, а саме, комплекси асоціацій. Який емоційний тон її листа, коли вона говорить про жінок, про гроші, про природу? Якщо вона розказує про свого сина, про що ще згадується в цьому контексті? За допомогою цього методу, названого Болдуіном «Аналіз структури особистості», можна виявити низку цікавих особистисніх феноменів, і він не вимагає залучення якихось середньогруповихпоказників.
2. Метод був розроблений Шапіро (Shapiro, 1961). На основі п'ятигодинної глибинної розмови психіатра з пацієнтом конструюється опитувальник, який надалі використовується для роботи з цим і лише з цим пацієнтом. Повторні його заповнення з інтервалом в декілька місяців або років допомагають прослідити процес взаємодії лікаря з пацієнтом, а також моменти поліпшення або погіршення здоров'я.
3. Метод для визначення сфери інтересів особистості і їх кількості. Теоретична посилка така, що можна якоюсь мірою повно зрозуміти життя людини, якщо прослідити його основні інтереси або мотиви. Наприклад, видатний письменник-фантаст Г.Уеллс сам писав, що в його житті було тільки дві основні теми – світовий уряд і секс. Говорять, що у Л.М.Толстого після його відлучення від церкви була лише одна тема – прагнення до простоти життя. У Уїльяма Джеймса за свідченням його біографа було вісім домінуючих тенденцій. Модель методу полягає в тому, щоб виділити апріорно у особистості список цих домінуючих тенденцій (на основі опитування добре обізнаних про цю людину людей) і потім підрахувати, яка кількість повсякденних дій може бути віднесена до тієї або іншої з цих тенденцій. Проблема полягає тільки в об'єктивності даного експертного спосотереження.
4. Для вивчення індивідуальної системи цінностей можна застосувати прямі питання типу: «Що б вам хотілося мати більше всього на світі?», «Які події викликають у вас відчуття повноти життя?», «Які події викликають у вас відчуття власної унікальності?»
5. Олпорт стверджує необхідність довір'я до випробовуваного, коли він розказує про принципові аспекти свого життя. Він пише, що проективні тести не можуть застосовуватися у відриві від направлених методів, оскільки ми не можемо проінтерпретувати одержані за їх допомогою результати, якщо нам невідомо, чи злагоджені вони з його уявленням про себе або суперечать йому.
6. Метод «Шкала самовизначення» Килпатріка і Кантріла (Kilpatrick, Cantril, 1960). Перед досліджуваним кладуть бланк, на якому намальовані сходи з десятьма ступенями. Досліджуваному пропонують розказати, в чому, на його думку полягає «найкращий або ідеальний спосіб життя». На малюнку цьому способу життя відповідає сама верхня, десята сходинка. Потім його просять описати «якнайгірший спосіб життя», як він його собі уявляє. Це, говорять йому, нижня сходинка сходів. Після цього випробовуваний повинен вказати, на якій з сходинок сходів, на його думку, знаходиться зараз він сам. Також нерідко задаються питання типу: «в якому місці цих сходів Ви знаходилися два роки тому? Як Ви думаєте, де Ви виявитеся через п'ять років?».
Олпорт пише, що така методика досить продуктивна в діагностиці і консультуванні. Автори використовували її також в дослідженні, присвяченому динаміку моральних установок, зокрема при порівняльному аналізі установок в стабільних країнах і тих, які недавно пережили революцію.
При цьому від ідеографічних методів можна перейти до номотетичного аналізу, якщо узагальнити результати цих методів по багатьом досліджуваним. Звичайно відбувається і протилежна картина – конкретну особистість намагаються вставити в номотетичну рамку.
Вищеперелічені методи є повністю ідеографічними. Нижче ми вкажемо ті методи, які можуть виявитися дуже корисними при вивченні індивідуальності, хоча по своїй природі вони близькі до кількісних методів.
1. Ранжирування по тих параметрах із запропонованого списку, які сам досліджуваний, або опитуваний експерт, вважає характерними для оцінюваного об'єкту, будь то він сам або інша людина. Такий спосіб дозволяє людині ігнорувати нерелевантні змінні. А цього не вистачає практично всім кількісним методам.
2. Методика «репертуарних грат» Келлі (1955). Досліджуваного просять сказати, що загального між двома пропонованими поняттями і чим вони обидва відрізняються від третього (наприклад, порівняти членів своєї родини - мати, сестру, дружину). Так виявляються особистісні конструкти (способи оцінки, інтерпретації), властиві тільки даному досліджуваному. Проте, список елементів (значущих інших людей) задається експериментатором і в цьому обмеження ідеографичності даного методу.
3. Метод Олпорта-Вернона «Вивчення цінностей» за теорією Шпрангера: в якої мірі людина віддає перевагу теоретичним, економічним, естетичним, релігійним, політичним і соціальним цінностям. Ідеографічность даного методу полягає в його іпсативній, а не нормативній оцінці вираженості даних цінностей. Отриманий в результаті профіль не показує, більше або менше в порівнянні з групою інших людей дана людина віддає перевагу таким цінностям. Його призначення – продемонструвати співвідношення значущості цих цінностей для даної особистості: які для нього більш значимі, які менш.
4. Q-сортировка Стефенсона, що використовується для вивчення змін в Я-концепції. Ідеографічность даного методу також полягає у використовуванні іпсативної оцінки. Обмеженість – вимоги нормального розподілу і запропоновані для класифікації риси особистості.
5. Психобіографічне лонгітюднеінтерв'ю Ханса Томе. Х.Томе різко негативно відноситься до всіх стандартизованих опитувальників і проективних тестів і називає їх «пострілами із засідки». На його думку дослідник і респондент – рівноправні партнери психологічної взаємодії і мистецтво психолога полягає в тому, щоб в чесній бесіді разом з партнером шукати причини його психологічних проблем або вивчати людську природу.
Ми рекомендуємо застосовувати ідеографічні методи разом з номотетичними, щоб скористатися перевагами обох підходів, хоча, можливо, навчитися працювати з ідеографічними методами буде дещо складніше, ніж із стандартизованими тестами.
Зміна наукових пріоритетів, а саме поворот до ідеографічних методів, разом із збільшенням уваги до ролі ситуації у формуванні внутрішнього світу і поведінки людини – дві основні сучасні тенденції світової психологічної науки.
к.психол.н. О.Л. Луценко ©
Лекція з психодіагностики №9 |
---|
Методи формулювання психодіагностичного висновку (звіту, діагнозу)
Результатом психодіагностичного обстеження клієнта (або групи) виступає складення психодіагностичного звіту (висновку), де йдеться про головні аспекти самого процесу обстеження та формулюється психологічний діагноз.
В праці «Психологічний діагноз» О.Ф.Ануфрієв формулює визначення психологічного діагнозу наступним чином: «Психологічний діагноз як результат діяльності психолога-практика є (1) відповідаючим запиту (2) логічним висновком (3) про стан психологічних змінних, які обумовлюють певні параметри діяльності або психічний стан обстежуваного (4) в поняттях сучасної психологічної науки, (5) що дозволяє передбачити майбутній стан клієнта в певних умовах і сформулювати рекомендації з надання йому психологічної допомоги.
Таке визначення стосується здебільшого індивідуальної роботи з досліджуваним в ситуації консультування, звернення за допомогою, але в ситуації експертизи або діагностики для суміжника останній аспект діагнозу, в якому йдеться про рекомендації, не є обов’язковим. Важливіше буває відповісти на питання, в якому стані був досліджуваний під час здійснення певних вчинків (контрольованому або в стані афекту, паніки, іншому зміненому стані свідомості); чи цей стан був викликаний зовнішніми обставинами, які склалися незалежно від бажання і поведінки досліджуваного, або знаходження в подібному стані є властивим його психіці як перманентна схильність; які особливості когнітивних та емоційно-вольових процесів, здібностей, мотивів може виявити психолог для пояснення певної поведінки або проблем людини. Діагностика може бути спрямована не тільки на індивідуума, але й на групу в цілому, наприклад, коли керівника або педагога цікавить психологічний мікроклімат в групі, структура відносин у колективі, особливості групової взаємодії, прийняття групових рішень тощо. В такому випадку можна говорити про соціально-психологічний діагноз.
Американський експерт з психологічного оцінювання А.Анастазі вказує, що не існує єдиної форми або правила написання висновків за результатами тестування. Як зміст, так і стиль висновку можуть і мають змінюватися залежно від мети вивчення випадку, ситуації, в якій воно проводиться, адресата висновку, теоретичних установок і спеціалізації психолога. Особливо важливо, щоб висновок відповідав потребам і рівню підготовки тих, хто його одержить.
У звіті має наводитися коротка анотація змістовного характеру (100-150 слів), а слідом за цим даватися більше докладний спеціальний опис конкретних даних: через яку проблему організоване психодіагностичне обстеження, які саме і з якою метою були обрані та використані ті або інші методики. Центральний момент у психодіагностичному звіті - це аналіз результатів, висновки, рекомендації (якщо вони передбачаються ситуацією тестування); тестові протоколи й інші дані анамнезу краще помістити у додатку [1, 48].
З усіх зібраних психодіагностом даних він повинен відібрати лише ті, які стосуються відповіді на поставлені ще на початку обстеження питання.
У висновку в першу чергу повинні бути відбиті відмітні властивості індивіда, тобто риси, результати обстеження за якими були або помітно низькими, або помітно високими, а не ті риси, за якими індивід мав показники, близькі до середнього. Висновок ефективний, якщо він може бути застосований лише до даного індивіда, а не просто до людей, демографічні характеристики яких подібні характеристикам цього обстежуваного. На таких універсальних і розмитих інтерпретаціях базуються всілякі сумнівні види діагностики – гороскопи, гадання тощо.
Якщо результати тестування містять протиріччя, обов'язок діагноста звернути увагу на їхню суперечливість і по можливості пояснити її.
Необхідно вказати, чи ґрунтуються судження про індивіда на критеріально-орієнтованій або ж нормативній оцінці і якщо вірно останнє, то з якими нормами зіставляються результати індивіда.
Бажано уникати спеціальної термінології, за винятком випадків, коли вона полегшує викладення суті справи.
Як і будь-який експертний висновок, звіт про результати психодіагностичного обстеження має інформувати, роз’яснювати, тобто робити вклад у розв’язання проблеми дослідження, а не спантеличувати. Написання такого звіту вимагає продуманого плану, редагування, наявності досвіду.
В.М. Мельников і Л.Т. Ямпольський [20] вказують, що інтерпретація результатів тестування є описом психологічних механізмів, які управляють поведінкою окремого досліджуваного, і тому може бути використана для прогнозу і корекції індивідуальної поведінки. Вони нагадують, що працюючи над інтерпретацією, психолог має врахувати, по-перше, не лише результати тестування, але й всі інші відомості про досліджуваного, які йому доступні, й, по-друге, всі психологічні знання про фактори особистості і способи їхньої взаємодії під час формування реальної поведінки.
Етичні аспекти психологічної діагностики як методології і практики постановки психологічного діагнозу та проведення психологічних досліджень
В світовій психодіагностиці до кваліфікованого створення та використання тестів відносяться дуже серйозно. В. Алексєєв в передмові до підручника А.Анастазі та С. Урбіної пише, що на Заході купити психологічний тест складніше ніж пістолет.
В 1966 році в Конгресі в США йшо обговорення заборони тестів. Проголосувала меньшість, але на підставі цього були прийняті етичні вимоги і чітки обмеження щодо використання тестів. Такові головні етичні принципи психологічної діагностики:
- Згода й усвідомленість рішення досліджуваного про проходження тестування;
- Інформування досліджуваного про можливе використання результатів тестування;
- Анонімність групових обстежень і збереження в таємниці результатів індивідуального тестування*;
* Зобов'язання зберігати професійну таємницю втрачає силу, якщо положення закону зобов'язує психолога повідомити про отриману інформацію;
- Розуміння обмеженості норм і можливості екстраполяції даних;
- Обмеження доступу сторонніх осіб до тестових даних;
- Збір анамнезу. Під час повідомлення результатів тестування необхідно враховувати особливості тієї людини, для якої вони призначаються;
- Індивідові не повинні повідомлятися результати його обстеження без їхньої інтерпретації фахівцем.
Приклади для обговорення порушення етичних аспектів психологічної діагностики:
-«Чи можу я отримати бланки тесту Станфорд-Біне? Мій небог наступного тижня поступає до школи №…, і мені хотілось би трохи піднатаскати його, щоб він міг поступити?».
- «Щоб вдосконалити програму читання в нашій школі, нам потрібен культурно-вільний тест інтелекту, який дозволить виміряти природжений потенціал дитини».
- «Вчора ввечері я відповів на питання інтелектуального тесту, опублікованого в журналі, і отримав IQ, рівний 80. Я думаю що психологічні тести просто дурні».
- «Моя сусідка по кімнаті вивчає психологію. Вона дала мені особистісний тест, за яким я виявилась невротичною. Я так засмутилася, що навіть перестала ходити на заняття».
- «В минулому році ви давали нашим службовцям з дослідницькими цілями новий особистісний тест. Нам би зараз хотілось мати їхні тестові показники для картотеки кадрів».
Особлива увага повинна приділятися запобіганню дискримінації через тестування певних соціальних груп, серед яких представники національних меншин, інваліди, малозабезпечені, жінки тощо. Наприклад, розповіді або картинки, які зображують типові для людей середнього класу сімейні сцени можуть викликати відчуженість дитини, яка живе в незабезпеченій родині. Теж саме стосується статевих стереотипів, зокрема, переважне зображення лікарів чоловіками, а медсестер – жінками і т.п. В американській психодіагностиці видавці тестів тепер докладають спеціальних зусиль, щоб очистити тести від образливого для певних соціальних груп змісту.
Дотримання наведених правил, причому не лише цих, але й інших, які тактовний та відповідальний дослідник відчуває інтуїтивно, залежно від тієї унікальної ситуації, яка виникає під час організації кожного окремого дослідження, убезпечує досліджуваних індивідуумів і групи від нанесення моральної шкоди, а також є запорукою позитивного іміджу психодіагностики і психології в суспільстві.
Рекомендована та використана література:
Анастази А., Урбина С. Психологическое тестирование. - СПб.: Питер, 2003.
Ануфриев А.Ф. Психологический диагноз. – М.: Ось-89, 2006.
Бурлачук Л.Ф. Психодиагностика: Учебник для вузов. - СПб.: Питер, 2006.
Общая психодиагностика / Под ред. А.А. Бодалева, В.В. Столина. СПб.: Изд-во «Речь», 2004.
к.психол.н. О.Л. Луценко ©