1.6. Надійність і валідність психологічних тестів.
Надійність психологічних тестів
Надійність - це характеристика психодіагностичної методики, що відображає ступінь точності вимірів, здійснюваних з допомогою даного тесту, а також усталеність результатів тесту стосовно впливу сторонніх випадкових факторів, які не є об'єктами дослідження.
На результат психологічного дослідження зазвичай впливає величезна кількість неврахованих чинників, як-от: стан емоційної сфери, ступінь утомленості досліджуваного, мотиваційна спрямованість на дослідження з боку його суб'єкта, а ще - такі випадкові фактори, як освітлення у приміщенні, температура й вологість, рівень шуму, година доби, магнітні бурі та безліч інших.
Розмаїття характеристик і показників надійності тесту таке ж значне, як і розмаїття умов, що можуть впливати на результат тесту. Однак найширше практичне застосування набули кілька методів характеристики надійності, а саме:
• ретестова надійність;
• надійність паралельних форм тесту;
• надійність частин тесту.
Ретестова надійність. Найприродніший спосіб визначити надійність результатів тесту - це використати той самий тест удруге. У цьому випадку коефіцієнт надійності просто дорівнює кореляції між результатами, отриманими на тих самих досліджуваних в кожному з двох випадків проведення тесту.
Користуючись разом із тестом його ретестовою надійністю, завжди необхідно вказувати, в якому часовому інтервалі вона виміряна. А якими ж міркуваннями слід керуватися за вибору цього інтервалу?
Можна навести чимало прикладів того, як надійність тесту залишається високою протягом кількох днів або тижнів, але після 10-15 років його результати майже не корелюють із початковими. Так, багато тестів інтелекту для дошкільнят достатньо стабільні в дошкільний період, але зовсім непридатні для прогнозування, яким буде інтелект дитини у старшому шкільному віці або коли вона стане дорослою.
Тому, визначаючи тип тестової надійності, прагнуть дотримуватися невеликих часових інтервалів. Під час тестування малих дітей цей період має бути коротшим, ніж у досліджуваних старшого віку, оскільки в ранньому дитинстві вікові зміни відбуваються протягом місяця і навіть скоріше.
У загальному випадку для будь-якого типу досліджуваних інтервал між двома послідовними застосуваннями тесту не повинен перевищувати 6 місяців.
Надійність паралельних форм. Спроба компенсувати частину недоліків ретестової надійності привела до розроблення засобу надійності паралельних форм. При цьому використовується така процедура: ті самі піддослідні з вибірки визначення надійності досліджуються за основним варіантом тесту, а потім - з якимось завданим Інтервалом ретесту - з використанням допоміжного набору, яким може стати паралельна чи спільна форма тесту.
Незважаючи на те, що паралельна форма тесту добирається в такий спосіб, щоб обидва варіанти тесту були максимально суміснимиза головними діагностичними характеристиками, обрані варіанти тесту не завжди мають однакові середні показники і стандартне відхилення. У цьому разі обов'язковою умовою до паралельної форми тесту є забезпечення можливості приведення показників обох форм один до одного з допомогою спеціальних коефіцієнтів, або таблиць еквівалентності.
Надійність частин тесту. Найпростішим і найпоширенішим видом аналізу надійності частин тесту є метод розщеплення, змістом якого є виконання досліджуваним завдань двох рівноцінних частин тесту.
Безпосередньо процедура отримання емпіричних оцінок надійності виглядає простішою, ніж у попередніх випадках визначення коефіцієнтів ретестової надійності та надійності паралельних форм. Піддослідні з вибірки визначення надійності проходять обстеження єдиний раз за повним набором завдань тесту. Після цього окремо оцінюються відповіді в еквівалентних частинах тесту. Ці результати корелюють між собою. Отриманий коефіцієнт кореляції є показником, що відображає міру усталеності результату протягом виконання різних частин тесту.
Валідність психологічних тестів
Валідність тесту (від лат. Міцний, здоровий) - поняття, яке вказує нам, що тест вимірює І наскільки добре він це робить. Необхідно мати на увазі, що назва тесту не обов'язково вказує на те, що він вимірює. Вона тільки дозволяє розпізнати його (А. Анастазі).
Методи визначення валідності розподіляються за трьома основними критеріями:
• валідність за змістом;
• валідність за критерієм;
• конструктна валідність.
Валідність за змістом означає систематичну перевірку змісту тесту для того, щоб встановити, чи відповідає він репрезентативній виборці сфери вимірюваної поведінки.
Така процедура валідності зазвичай застосовується для оцінювання тестів досягнень, які дозволяють виміряти, наскільки індивід оволодів конкретними навичками або навчальним предметом.
Може скластися враження, що для встановлення валідності такого тесту досить лише перевірити його зміст. Наприклад, тест на множення, правопис чи бухгалтерські навички уже, вочевидь, міг би бути валідним, якби складався відповідно із завдань на множення, правопис і ведення бухгалтерських операцій.
Але проблема не є такою простою, як може здатися. Відразу ж виникає питання адекватності вибірки всієї множини завдань. Тому тестовану сферу поведінки необхідно систематично перевіряти, аби існувала впевненість, що завдання тесту охоплюють усі головні аспекти і в правильній пропорції.
Очевидна валідність. Валідність за змістом не слід плутати з очевидною валідністю. Остання, власне, і не є валідністю як такою. Вона стосується не того, що тест насправді вимірює, а того, що він за першого розгляду нібито вимірює.
Очевидна валідність - це те, наскільки тест здається цінним досліджуваному, офіційним особам, які ухвалюють рішення про його використання, або іншим неспеціалістам. Власне, очевидна валідність відображає ставлення останніх до тесту.
Очевидна валідність як така - бажана властивість тесту. Наприклад, коли тести, розраховані на дітей і на умови школи, почали застосовувати для дорослих, останні часто ставилися до таких тестів вороже і критично саме через відсутність очевидної валідності. Справді, якщо зміст тесту здасться дивним, недоречним або дитячим, то результатом буде погіршення обставин тестування, попри дійсну валідність тесту.
Очевидна валідність є особливо бажаною в тестуванні дорослих, її можна підвищити простим переформулюванням завдань так, щоб тестованому контингентові вони здавалися природними.
Валідність за критерієм показує, наскільки за результатами тесту можна судити про цікавий для нас аспект поведінки індивіда тепер або в майбутньому.
Щоб визначити ЇЇ, виконання тесту зіставляють із критерієм, тобто з безпосередньою І незалежною мірою того, що повинен передбачити тест. Наприклад, для тесту технічних здібностей критерієм може бути подальша робота на виробництві; для тесту готовності до навчання - оцінки, отримані в коледжі; для тесту на невротизм - відгуки колег досліджуваного або інші доступні дані про його поведінку за різних життєвих обставин.
Конструктна валідність показує, наскільки результати тесту можуть розглядатися як міра певного теоретичного конструкта, або властивості. Прикладами таких конструктів є інтелект, розуміння просторових співвідношень, плавність мовлення, швидкість ходи, невротизм і тривожність.
Будучи націлена на обширні, тривкі та більш абстрактні описи типів поведінки, ніж попередньо розглянуті типи валідності, конструктна валідність передбачає поступове накопичення інформації з різних джерел. Тут підходять будь-які дані, що кидають промінь на природу досліджуваного явища, на умови, від яких залежать його розвиток і прояв.
У дослідженні конструктної валідності тесту використовуються такі критерії й чинники, як вікова диференціація, кореляція з іншими аналогічними тестами, факторний аналіз (статистичний метод визначення психологічних властивостей), внутрішня узгодженість тесту та ін.
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 Наверх ↑