Материально-техническое обеспечение и технико-методические средства обеспечения освоения студентами дисциплин «Психодиагностика» и «Практикум по психодиагностике. Надежность и валидность теста

Необходимыми материальными и техническими средствами обеспечения эффективного усвоения студентами дисциплин являются :

А) типовое учебное помещение (комната, кабинет, аудитория), укомплектованное стандартной учебной мебелью (партами и стульями), имеющее типовое, функционально необходимое электрическое освещение, имеющее стандартную меловую или типовую «маркеровую» учебную доску и обычное мультимедийное проекционное оборудование;

Б) библиографические источники из списка основной литературы по дисциплинам, в стандартно-типовом количестве и качестве наименований на одного студента (как минимум – три наименования разноплановых библиографических источников, с минимальным расчётом – один экземпляр одного наименования на трёх студентов);

В) копировальная и множительная техника (принтер, сканер, ксерокс) с целью сканирования и тиражирования в бумажном (печатном) виде бланков, заданий и стимульных материалов к используемым тестовым психодиагностическим методикам.

Специальное (особое) материально-техническое обеспечение для успешного освоения студентами данных учебных дисциплин не требуется.

ПРИЛОЖЕНИЯ К НАСТОЯЩЕМУ ПОСОБИЮ

ПРИЛОЖЕНИЕ № 1.

«ТЕСТОВЫЕ ПРОВЕРОЧНЫЕ КОНТРОЛЬНЫЕ ВОПРОСЫ

ПО ДИСЦИПЛИНАМ ″ПСИХОДИАГНОСТИКА″ И ″ПРАКТИКУМ ПО ПСИХОДИАГНОСТИКЕ″»

1. Наука, разрабатывающая методы выявления и измерения индивидуально-психологических особенностей человека, наука и практика постановки психологического диагноза (выбор единственно правильного ответа): а) социология;б) медицина;в) педагогика;г) психодиагностика.

2. Психодиагностика – это (выбор двух правильных ответов):а) наука, изучающая индивидуально-психологические особенности человека;б) наука о принципах и способах организации научного познания человека;в) комплексная дисциплина, изучающая человека в конкретных условиях его деятельности;г) наука о закономерностях психического развития человека;д) наука, разрабатывающая методы измерения индивидуально-психологических особенностей человека.

3. Когда завершилось формирование психологической диагностики в самостоятельную область исследований(выбор единственно правильного ответа):а) 20-е гг. ХХ века;б) 40-е гг. ХХ века;в) 60-е гг. ХХ века;г) 80-е гг. ХХ века.

4. Сколько этапов выделяют в развитии отечественной психодиагностики (выбор единственно правильного ответа): а) два;б) один;в) три;г) четыре.

5. Что явилось первым диагностическим тестовым методом по форме проведения теста (выбор единственно правильного ответа):а) тесты-опросники;б) тесты-задания;в) проективные техники;г) психофизиологические методики.

6. Кто впервые использовал психодиагностические тесты-опросники (выбор единственно правильного ответа):а) Ф. Гальтон;б) Т. Рибо;в) Р. Вудвортс;г) Д. Юм.

7. Какие тесты, по содержанию, по направленности теста, первыми стали применяться в психодиагностике(выбор единственно правильного ответа):а) тесты интеллекта;б) тесты достижений;в) тесты креативности;г) личностные тесты.

8. В какого рода методиках от испытуемого требуется получить верный ответ (выбор единственно правильного ответа):а) тесты;б) анкеты;в) психофизиологические методики;г) проективные методики.

9. Единообразие проведения и обработки теста, независимость результатов теста от внутренних и внешних раздражителей, называется (выбор двух правильных ответов):а) надёжность теста;б) валидность теста;в) адаптация теста;г) стандартизация теста.

10. К проективным методикам относятся (выбор двух правильных ответов): а) тест «Прогрессивные матрицы Дж. Равенна»;б) Тематический апперцептивный тест (ТАТ) Г. Меррея и К. Моргана;в) Тест «Моторная проба К. Шварцландера»;г) Рисуночные тесты.

11. Как можно установить надёжность частей теста (выбор единственно правильного ответа):а) предложить испытуемому выполнить две равноценные части теста и сравнить результаты;б) повторно обследовать испытуемых с помощью одного и того же теста и сравнить результаты;в) предложить разным группам испытуемых разные части теста и сравнить результаты;г) предложить испытуемым выполнить основной набор заданий, а затем дополнительный набор заданий и сравнить полученные результаты.

12. Что такое статистический критерий (выбор единственно правильного ответа):а) правило принятия истинной гипотезы;б) метод расчета количества испытуемых;в) показатель наличия причинно-следственной связи между переменными;г) показатель влияния переменных на изменчивость изучаемого признака.

13. Какая измерительная шкала имеет фиксированное начало отсчета(выбор единственно правильного ответа):а) шкала отношений;б) шкала интервалов;в) шкала порядка;г) шкала наименований.

14. Какая из контрольных шкал направлена на анализ тенденции к ухудшению результатов обследования (выбор единственно правильного ответа):а) шкала валидности;б) шкала коррекции;в) шкала лжи;г) шкала вопросов.

15. Что такое выборка стандартизации (выбор единственно правильного ответа):а) группа людей, которые реально (непосредственно) подвергаются тестированию;б) группа, состоящая из людей, обладающих стандартным набором качеств;в) группа людей, к которой применяются формализованные методики;г) большая совокупность людей, относительно которой психологи-тестологи собираются делать выводы.

16. Что означает понятие «репрезентативность выборки» (выбор единственно правильного ответа):а) вероятностные свойства (конкретные параметры) данной выборки очень близки к свойствам генеральной совокупности респондентов;б) выборка ориентирована на широкую популяцию;в) выборка состоит из людей, пожелавших принять участие в исследовании;г) использование одной и той же выборки для двух разных исследований.

17. В чём, прежде всего, заключается надёжность психодиагностической тестовой методики (выбор единственно правильного ответа):а) в точности и достоверности имеющихся психологических измерений;б) в теоретической обоснованности методики;в) в единообразии проведения и оценки результатов методики;г) во внутренней однородности методики.

18. Кто автор теста интеллекта "Прогрессивные матрицы …", направленного на изучение невербального (геометрического, пространственного, графического) интеллекта (выбор единственно правильного ответа):а) Дж. Равенн;б) Дж. Гилфорд;в) Ж. Пиаже;г) К. Левин.

19. Каких субтестов нет в тесте Р. Амтхауэра, направленном на диагностику разнообразных видов интеллекта (выбор единственно правильного ответа):а) моторных (двигательных) субтестов;б) пространственных субтестов;в) числовых субтестов;г) вербальных субтестов.

20. На что направлен тест «кубиков Коса» (выбор единственно правильного ответа):а) на оценку способности к синтезу целого из частей;б) на оценку способности к формированию понятий;в) на исследование оперативной памяти;г) на оценку способности выделять существенные детали

21. Для чего применяется диагностический обучающий эксперимент (выбор единственно правильного ответа):а) для оценки интеллектуального развития;б) для оценки развития памяти;в) для оценки развития внимания;г) для оценки развития творческих способностей.

22. Кто создал первые тесты креативности (выбор единственно правильного ответа):а) Дж. Гилфорд;б) Е.П. Торранс;в) Р. Кеттелл;г) Д. Векслер.

23. Для каких сфер наиболее актуальна диагностика моторных (двигательных) способностей (выбор двух правильных ответов):а) спорт;б) профотбор;в) возрастная психология;г) медицинская психология.

24. Где, в основном, применяются тесты сенсорных способностей (выбор двух правильных ответов):а) в промышленности;б) в военном деле;в) в спорте;г) в образовании.

25. Что из названного является сущностной характеристикой эпилептоидного типа личности (выбор единственно правильного ответа):а) склонность к периодическому возникновению т.н. злобно-тоскливого настроения;б) устойчивая ориентация на нормы и ценности ближайшего окружения;в) повышенная тревожность, мнительность, склонность к сомнениям;г) повышенная впечатлительность и чувство неполноценности

26. Сколько цветов используется в тесте цветовых предпочтений (выбор единственно правильного ответа):а) восемь;б) пять;в) десять;г) двенадцать.

27. Какие личностные черты называются генерализованными, генирализированными (выбор единственно правильного ответа):а) те черты, которые характеризуются безусловным постоянством их проявлений;б) те черты, которые характеризуются эпизодичностью проявления;в) те черты, которые являются социально значимыми;г) те черты, проявление которых находится под сознательным контролем человека.

30. С какого возраста применяется тест цветовых предпочтений (выбор единственно правильного ответа):а) с 3-4 лет;б) с 1-2 лет;в) с 6-7 лет;г) с 11-12 лет.

31. Какой из способов косвенной оценки межличностных отношений не касается "личностного пространства" (выбор единственно правильного ответа):а) паралингвистические средства;б) методики наблюдения реальной ситуации;в) методики символического моделирования реальной ситуации;г) проективные средства (методики).

32. В чём состоят аутосоциометрические методики (выбор единственно правильного ответа):а) испытуемые сами "измеряют" взаимные отношения людей друг к другу и к себе;б) испытуемые сравнивают реальное и желаемое отношение людей к себе;в) испытуемые "измеряют" взаимоотношения людей с точки зрения другого человека;г) испытуемые "измеряют" свои отношения с другими людьми с точки зрения другого человека.

33. Какая сфера общения рассматривается в методике «социометрия» (выбор единственно правильного ответа):а) все сферы;б) труд;в) досуг;г) учёба.

34. Каково минимальное количество членов малой группы (выбор единственно правильного ответа):а) 2-3 человека;б) 5-6 человек;в) 8 человек;г) 10 человек.

36. В чём состоят рефрактивные (рефрактерные) техники (выбор единственно правильного ответа):а) люди оценивают свои атрибуты, не осознавая, что оценивают свою личность;б) люди оценивают свои атрибуты с точки зрения малознакомого человека;в) люди оценивают свои атрибуты с точки зрения друга;г) люди оценивают свои атрибуты с точки зрения человека, с которым он находится в неприязненных отношениях.

37. О чём говорит выбор человеком, в основном (как правило), каких-либо средних значений в разнообразных тестах-опросниках самоотношений, самооценки личностных качеств (выбор единственно правильного ответа):а) о значительном включении психозащитных процессов;б) об оптимальном уровне самопринятия;в) о низком уровне самопознания;г) о действии психологического механизма социальной желательности.

38. Какое минимальное количество альтернатив предлагается при выборе ответа в тестах-опросниках самоотношения (выбор единственно правильного ответа): а) одна;б) две;в) три;г) четыре.

39. Что такое страх, чем страх отличается от тревоги (выбор единственно правильного ответа):а) страх – это, в большинстве случаев, реакция на конкретную угрозу;б) страх - это реакция на угрозу представления о себе;в) страх - это реакция на угрозу базовым ценностям;г) страх - это ожидание неудач в социальном взаимодействии.

40. Что не относится к т.н. кратким функциональным пробам (выбор единственно правильного ответа):а) тесты-опросники;б) корректурная проба;в) таблицы Шульте;г) метод парных ассоциаций.

41. Каких психодиагностических тестов нет среди средств диагностики психических состояний личности, имеющих место «здесь и сейчас» (выбор единственно правильного ответа):а) личностные тесты;б) психофизиологические тесты;в) поведенческие тесты;г) т.н. субъективные тесты.

42. Что характерно для людей со слабой нервной системой (выбор единственно правильного ответа):а) обстоятельное выполнение заданий в строгой очередности, без перескакивания с одной операции на другую;б) умение собраться, сконцентрироваться в ответственных ситуациях;в) в шумной обстановке эффективность умственной работы не снижается;г) неудачи в деятельности мало отражаются на дальнейшей работе.

43. Что относится к формально-динамическим особенностям психического склада человека (выбор единственно правильного ответа):а) чувствительность органов чувств;б) убеждения;в) знания;г) интересы.

44. Что относится к физиологическим показателям сдвигов в функциональном состоянии человека (выбор единственно правильного ответа):а) частота сердечных сокращений;б) количество выполняемых операций за единицу времени;в) качество работы;г) скорость работы.

45. Для чего предназначена доска форм Сегена (выбор единственно правильного ответа):а) для исследования уровня умственного развития детей;б) для исследования памяти у детей;в) для исследования внимания у детей;г) для исследования пространственного восприятия у детей.

46. Что позволяет определить методика Д.Б. Эльконина "Графический диктант" (выбор единственно правильного ответа):а) умение ребенка выполнять задания взрослого, предлагаемые в устной форме;б) уровень ориентировки ребенка на заданную систему требований;в) уровень саморегуляции ребенка в интеллектуальной деятельности;г) готовность ребенка к коллективной учебной деятельности.

47. В чём состоит методика Н.И. Гуткиной по определению доминирования познавательной или игровой мотивации у ребенка (выбор единственно правильного ответа):а) ребёнка ставят в реальную ситуацию выбора - поиграть с игрушками или дослушать незнакомую сказку;б) ребёнку предлагают рассказать о его предпочтениях - игрушки или сказки;в) сравнивают время, которое ребенок по собственной инициативе играл с игрушками и слушал новую сказку;г) сравнивают, как часто ребенок обращается к игрушкам и к новым сказкам.

48. Когда проводится диагностика психологической готовности детей к школе (выбор единственно правильного ответа):а) за 3-4 месяца до поступления в школу;б) за 1 год до поступления в школу;в) за 1 месяц до поступления в школу;г) в первый месяц обучения в школе.

49. Как диагностируется степень тревожности у детей в возрасте 3,5 - 7 лет (выбор единственно правильного ответа):а) выбор ребёнком веселого или печального детского лица среди рисунков типичных для ребенка ситуаций;б) придумывание продолжения сказок с различным сюжетом;в) систематическое наблюдение за поведением ребенка в различных обстановках;г) рассказ ребенка о его обычных состояниях.

50. На какой возраст рассчитаны таблицы развития Гезелла (выбор единственно правильного ответа):а) от 4 недель до 6 лет;б) от 6 месяцев до 3 лет;в) от 5 до 10 лет;г) от 0 до 1 года.

51. По какому типу построено большинство тестов для раннего возраста, – 1 год – 3 года (выбор единственно правильного ответа):а) по типу шкал;б) по типу игровых методик;в) по типу проективных методик;г) по типу формирующего эксперимента.

52. В чём состоит отличие отечественных методик диагностики детей раннего возраста от западных (выбор единственно правильного ответа):а) в комплексном подходе к диагностике психического развития;б) в подробной диагностике отдельных сфер психики;в) в акценте на познавательной сфере ребенка;г) в акценте на двигательной активности ребёнка.

53. На какой возраст рассчитана проективная методика "Дом-дерево-человек" (выбор единственно правильного ответа):а) на все возраста;б) на детей;в) на подростков;г) на взрослых.

54. Что не является причиной различия в развитии познавательных процессов у представителей разных культур (выбор единственно правильного ответа):а) специфика самих познавательных процессов у разных народов;б) характер деятельности представителей разных сообществ;в) характер обучения у разных сообществ;г) участие в социальном взаимодействии с представителями более высокого уровня развития.

55. С чем связан запрет на свободное распространение психодиагностических методик (выбор двух правильных ответов):а) гласность в отношении содержания методики делает недейственным ее применение в будущем;б) предупреждение неправильного применения методики;в) защита авторских прав создателя методики;г) регулирование финансовых отношений в области психологической диагностики.

56. В каких источниках содержится описание методик, обеспечивающее их адекватное использование (выбор двух правильных ответов):а) инструктивные документы;б) научные сообщения (доклады, тезисы);в) справочно-методические издания;г) популярные издания.

57. Как можно устранить влияние фактора культуры на тестовые результаты (выбор единственно правильного ответа):а) полностью устранить влияние фактора культуры нельзя;б) тест должен проводить представитель той же культуры, что и испытуемые;в) проверить надежность методики в новых социокультурных условиях;г) проверить валидность методики в новых социокультурных условиях.

58. Чего нельзя сделать посредством традиционных интеллектуальных тестов (выбор единственно правильного ответа):а) произвести коррекцию интеллектуальной сферы;б) определить успешность ученика;в) классифицировать группу учащихся по уровню умственного развития;г) отобрать учеников в школы с усложненными программами.

59. Какие погрешности процедуры тестирования нельзя устранить с помощью компьютера (выбор единственно правильного ответа):а) отсутствие оптимальной мотивации испытуемых;б) несоблюдение временных стандартов выполнения тестовых заданий;в) нарушения правил инструктирования испытуемых;г) установки на определенные ответы испытуемых.

60. В какой области психологического тестирования применение компьютера не целесообразно (выбор единственно правильного ответа):а) сообщение результатов обследования;б) предъявление заданий испытуемым;в) обработка результатов;г) интерпретация результатов.

ПРИЛОЖЕНИЕ № 2.

«ПРИМЕРНЫЙ ПЕРЕЧЕНЬ КОНТРОЛЬНЫХ ВОПРОСОВ К ЗАЧЁТУ И К ДИФФЕРЕНЦИРОВАННОМУ ЗАЧЁТУ ПО ДИСЦИПЛИНАМ ″ПСИХОДИАГНОСТИКА″ И ″ПРАКТИКУМ ПО ПСИХОДИАГНОСТИКЕ″»

1. Определение, цели, задачи и предмет психодиагностики. Области практического использования результатов психодиагностической работы.

2. История развития психодиагностики на Западе.

3. Развитие психодиагностики в России. Критика тестов в отечественной психологии.

4. Классификация методов психодиагностики.

5. Требования к диагностическим методикам.

6. Методологические принципы в работе психолога-диагноста.

7. Понятие теста в психодиагностике. Объективные тесты и тесты-опросники.

8. Диагностика умственного развития. Тесты интеллекта. Примеры тестов.

9. Тесты интеллекта. Правила проведения тестирования и обработки результатов.

10. Тесты интеллекта. Тест структуры интеллекта Р. Амтхауэра.

11. Тесты интеллекта. Тест «Прогрессивные матрицы» Дж. Равенна.

12. Тесты интеллекта. Тест Д. Векслера.

13. Диагностика личности. Личностные опросники.

14. Конструирование личностных опросников как инструмента психодиагностики.

15. Требования, предъявляемые к личностным опросникам.

16. Личностные опросники Г. Айзенка, теоретические позиции автора.

17. Факторные технологии создания личностных опросников. Опросник 16-PF Кеттелла Р.

18. Тестовые методики на изучение эмоциональной сферы личности.

19. Тестовые методики изучения психологических защит личности.

20. Проективные методики, их классификация. Достоинства и недостатки проективной техники.

21.

22. Проективные методики. Цветовой тест предпочтений М. Люшера.

23. Проективные методики. Тематический апперцептивный тест (ТАТ) Г. Меррея и К. Моргана.

24. Проективные методики. Рисованный апперцептивный тест Л.Н. Собчик (РАТ).

25. Проективные методики. Тест фрустрации С. Розенцвейга.

26. Проективные методики. «Тест руки» («Hand test»). Тест «Пятна Г. Роршаха».

27. Проективные методики. Тест «Пятна Г. Роршаха».

28. Назначение и взаимосвязь основных методов исследования личности: наблюдения, беседы, тестирования.

29. Надёжность тестов. Основные методы оценки надёжности тестов.

30. Понятие валидности. Необходимость валидизации психодиагностических методик.

31. Понятие валидности. Виды валидности. Содержательная валидность.

32. Конструктивная валидность. Понятие конструкта. Технологии оценки конструктивной валидности.

33. Понятие валидности. Виды валидности. Критериальная валидность. Понятие внешнего критерия. Технологии оценки критериальной валидности.

34. Методы оценки критериальной валидности. Метод контрастных групп.

35. Психометрические процедуры стандартизации на этапе обработки диагностических данных.

36. Стандартизация психодиагностических методик. Статистическая норма. Первичные и вторичные показатели (стены, IQ, Т-баллы и др.)

37. Стандартизованные и нестандартизованные личностные опросники. Сравнительная оценка и примеры.

38. Тесты достижений. Диагностика учебных и профессиональных достижений. Школьный тест умственного развития (ШТУР), Групповой интеллектуальный тест (ГИТ).

39. Диагностика креативности. Тесты Е.П. Торранса.

40. Тестовые методики на мотивацию достижений и избегания неудач.

41. История развития психодиагностики в России: этапы и периоды.

42. Диагностика особенностей личности. «Тест руки – Hand test».

43. Предмет и задачи психодиагностики. Области практического использования результатов диагностики.

44. Классификация психодиагностических методов (Б.Г. Ананьев, А.А. Бодалёв, К.М. Гуревич, В.В. Столин и др.).

45. Тесты интеллекта (зарубежные и отечественные). Диагностика умственного развития.

46. Диагностика особенностей личности. Детский апперцептивный тест Л. Беллак. Рисуночный апперцептивный тест (РАТ) Л.Н. Собчик.

47. Проблема нормы в психодиагностике.

48. Тест как предмет исследования. Виды тестов. Правила проведения, обработки и интерпретации результатов тестирования.

49. Диагностика интеллектуального развития. Тест структуры интеллекта Р. Амтхауэера.

50. История возникновения и становления психодиагностики. Дифференциальная психология.

51. Возникновение и развитие тестирования. Тестовый бум в 20-е – 30-е годы XX-го века (В. Вундт, Т. Эббингауз, Р. Кеттелл, А. Бине и др.). Критика тестов.

52. Диагностика особенностей личности детей и взрослых. Тест фрустрации С. Розенцвейга.

53. Диагностика креативности. «Познавательное» и «личностное» направления в изучении креативности. Методика Е.П. Торранса и др.

54. Проективные техники как средство диагностики личности.

55. Тесты интеллекта, тесты достижений, тесты способностей. Сравнительный анализ.

56. Процедура получения вторичных показателей.

57. Рисуночные тесты как метод психодиагностического исследования.

58. Диагностика интеллекта. Прогрессивные матрицы Дж. Равенна.

59. Профессионально-этические принципы в психодиагностике. Этические стандарты психологов (1963, 1965, 1972).

60. Диагностика учебных и профессиональных достижений. Стенфордский тест достижений. Критериально-ориентированные и ориентированные на норму тесты достижений.

61. Требования к построению и проверке методик. Качественная и количественная интерпретация результатов обследования. Связь интерпретации с позициями исследования.

62. ГИТ (групповой интеллектуальный тест), ШТУР (школьный тест умственного развития).

63. Проективные методики. Их классификация (Л.К. Франк, Д. Линдсей). Достоинства и недостатки проективной техники, проектные оценки.

64. Психометрическое сопровождение создания тестов. Валидизация, стандартизация, проверка надёжности.

65. Диагностика интеллекта. Тест интеллекта Д. Векслера.

66. Тест как предмет исследования. Проблема адаптации и стандартизации тестов. Критика тестов.

67. Тесты способностей. Диагностика общих и специальных способностей (сенсорные, моторные, технические, профессионализированные).

68. Малоформализованные методы в психодиагностике: наблюдение, беседа, интервью и анализ продуктов деятельности, экспертные оценки.

69. Диагностика потребностно-мотивационной сферы личности.

70. Диагностика интеллекта. Тест структуры интеллекта Р. Амтхауэра, тест интеллекта Д. Векслера. Сравнительный анализ.

71. Метод тестов как предмет исследований. Виды тестов: по цели проведения и по форме проведения.

72. Диагностика особенностей личности. Цветовой тест отношений М. Люшера. Тест чернильных пятен Г. Роршаха.

73. Рисуночные методики как средство исследования личности.

74. Современное состояние психодиагностики. Критика теста как метода диагностики в отечественной и иностранной психологии.

75. История становления психодиагностики. Возникновение и развитие тестирования.

76. Диагностика особенностей личности. Проективные методики: «Несуществующее животное», «Дом-дерево-человек», «Завершение предложений», «Автопортрет».

77. Диагностика личности. Опросники и их виды. Факторные опросники. Теория черт личности Р. Кеттелла. Опросник 16 PF Кеттелла Р.

78. Особенности проведения психодиагностики с целью профориентации и профотбора.

79. Требования к психодиагностическим методикам. Валидность, виды валидности. Проверка теста на критериальную валидность методом контрастных групп.

80. Диагностика особенностей личности. Тематический апперцептивный тест (ТАТ) Г. Меррея и К. Моргана. РАТ (рисуночный апперцептивный тест).

ПРИЛОЖЕНИЕ № 3.

«МАЛОФОРМАЛИЗОВАННЫЙ ПСИХОДИАГНОСТИЧЕСКИЙ МЕТОД ″НАБЛЮДЕНИЕ″»

Методическое указание . Наблюдение осуществляется в процессе организованной специально, или имеющей место быть по факту трудовой профессиональной деятельности испытуемых, активности испытуемых в поведении, деятельности, общении, решении совместных деятельностных задач.

По форме проведения исследования, мы осуществляем прямое исследовательское наблюдение, применяем его в качестве практического психологического метода накопления данных.

Цель наблюдения: изучение поведения и деятельности испытуемого в естественных условиях (как правило – в естественных условиях), выявление эмоциональных реакций субъекта, выяснение его чувственных отношений к действительности и т.д.

Вид (параметры) наблюдения: внешнее; стандартизированное; включённое; систематическое.

Инструкция. Наблюдение профессионально желательно осуществлять несколько раз (2–4 раза) подряд. Наблюдение осуществляется с фиксированными перерывами (промежутками) в течение полного дня жизнедеятельности субъекта или в течение нескольких часов (2–3 часа), находясь с ним в постоянном взаимодействии в процессе выполнения разнообразной деятельности. Наблюдателем должен являться только сам психолог, от лица которого и составляется протокол стандартизированного наблюдения. Протокол наблюдения, разработанный нами на основе многолетнего опыта, мы приводим в нижеследующей таблице.

«Протокол ведения стандартизированного систематического наблюдения за психологическими и ″деятельностными″ реакциями субъекта (субъектов)» (Автор-составитель Д.А. Донцов).

*Надежность и валидность теста - это характеристики соответствия исследования формальным критериям, определяющим качество и пригодность к применению на практике.

Что такое надежность

В ходе проверки надежности теста проводится оценка постоянства полученных результатов при повторном проведении испытания. Расхождения данных должны отсутствовать или же быть незначительными. В противном случае невозможно относиться к результатам теста с доверием.

Надежность теста - это критерий, который свидетельствует о Существенными считаются следующие свойства тестов:

воспроизводимость результатов, полученных по итогам исследования;
степень точности или соответствующих приборов;
устойчивость результатов на протяжении определенного периода времени.

В трактовке надежности можно выделить следующие основные составляющие:

надежность измерительного инструмента (а именно грамотности и объективности тестового задания), которая может быть оценена путем расчета соответствующего коэффициента;
стабильность изучаемого признака на протяжении длительного периода времени, а также предсказуемость и плавность его колебаний;
объективность результата (то есть его независимость от личных предпочтений исследователя).

Факторы надежности

На степень надежности может повлиять целый ряд негативных факторов, наиболее существенными из которых являются следующие:

несовершенство методики (неверная или неточная инструкция, нечеткая формулировка заданий);
временная нестабильность или постоянные колебания значений показателя, который подвергается исследованию;
несоответствие обстановки, в которой проводятся первоначальные и повторные исследования;
меняющееся поведение исследователя, а также нестабильность состояния испытуемого;
субъективный подход при оценке результатов теста.

Способы оценки надежности теста

При определении надежности теста могут быть использованы следующие методики.

Метод повторного тестирования является одним из самых распространенных. Он позволяет установить степень корреляции между результатами исследований, а также временем, в которое они были проведены. Данная методика отличается простотой и эффективностью. Тем не менее у испытуемых, как правило, повторные исследования вызывают раздражение и негативные реакции.

конструктивная валидность теста - это критерий, применяемый при оценке теста, имеющего иерархическую структуру (используется в процессе исследования сложных психологических явлений);
валидность по критерию подразумевает сопоставление результатов тестирования с уровнем развития у испытуемого той или иной психологической характеристики;
валидность по содержанию определяет соответствие методики изучаемому явлению, а также круг параметров, которые она охватывает;
прогностическая валидность - это который позволяет оценить перспективное развитие параметра.

Типы критериев валидности

Валидность теста - это один из показателей, который позволяет оценить адекватность и пригодность методики для изучения того или иного явления. Можно выделить четыре основных критерия, которые могут повлиять на нее:

критерий исполнителя (речь идет о квалификации и опыте исследователя);
субъективные критерии (отношение испытуемого к тому или иному явлению, что отражается на конечном результате теста);
физиологические критерии (состояние здоровья, усталость и прочие характеристики, которые могут оказать существенное влияние на конечный результат тестирования);
критерий случайностей (имеет место в определении вероятности наступления того или иного события).

Критерий валидности представляет собой независимый источник данных о том или ином явлении (психологическом свойстве), исследование которого проводится посредством тестирования. До тех пор, пока не будет проведена проверка полученных результатов на соответствие критерию, о валидности судить нельзя.

Основные требования к критериям

Внешние критерии, которые влияют на показатель валидности теста, должны отвечать следующим основным требованиям:

соответствие именно той сфере, в которой проводится исследование, релевантность, а также смысловая связь с диагностической моделью;
отсутствие каких-либо помех или резких разрывов в выборке (суть состоит в том, что все участники эксперимента должны соответствовать заранее установленным параметрам и находиться в схожих условиях);
исследуемый параметр должен быть надежным, постоянным и не подвергаться резким перепадам.

Способы установления валидности

Проверка валидности тестов может осуществляться несколькими способами.

Оценка очевидной валидности подразумевает проверку соответствия теста его предназначению.

Оценка конструктивной валидности проводится в том случае, когда для изучения определенного сложного показателя проводится ряд экспериментов. Она включает в себя:

конвергентную валидизацию - проверку взаимосвязи оценок, полученных с использованием различных комплексных методик;
дивергентную валидизацию, которая состоит в том, чтобы методика не подразумевала оценки посторонних показателей, не касающихся основного исследования.

Оценка прогностической валидности подразумевает установление возможности предвидения перспективного колебания изучаемого показателя.

Выводы

Валидность и надежность тестов - это взаимодополняемые показатели, которые дают наиболее полную оценку справедливости и значимости результатов исследований. Зачастую они определяются одновременно.

Надежность показывает, насколько результатам теста можно доверять. Имеется в виду их постоянство при каждом повторном проведении аналогичного испытания с одними и теми же участниками. Низкая степень надежности может говорить о намеренном искажении или безответственном подходе.

Понятие валидности теста связано с качественной стороной эксперимента. Речь идет о том, соответствует ли выбранный инструмент оценке того или иного психологического явления. Здесь могут быть применены как качественные показатели (теоретическая оценка), так и количественные (расчет соответствующих коэффициентов).

В любом эмпирическом исследовании по психологии используются психологические тесты . Часто от студентов требуют указывать данные об их надежности и валидности.

Надежность психологических тестов

В обычной жизни надежность человека или какого-либо предмета означает уверенность в том, что на него можно положиться. Как же проверяют, что на психологический тест можно положиться?

Первый способ проверки надежности психологического теста - анализ устойчивости результатов теста. Действительно, если результаты использования теста на одной и той же выборке существенно не меняются при нескольких тестированиях, то это может служить критерием его надежности.

Повторное тестирование называется ретест. Его проводят с интервалом от недели до года. Затем анализируют корреляции нескольких замеров. Если корреляции между результатами ретестов не ниже 0,76, то такой тест считается надежным.

Недостатки ретестовой проверки надежности психологического теста.

1. Некоторые психологические показатели неустойчивы и изменчивы. Например, измеряя настроение, самочувствие в разное время дня или в разные дни, можно получить разные результаты, и это не будет следствием ненадежности теста.

2. При неоднократном заполнении одного и того же теста испытуемые к нему «привыкают». Они могут помнить свои ответы и отвечать так же. Могут, наоборот, менять ответы в сторону социальной желательности. Таким образом, ретестовая надежность не будет в полной мере отражать надежность теста.

Второй способ проверки надежности психологического теста - анализ согласованности различных частей теста. Например, в тесте один показатель, который диагностируется 10-ю вопросами. Согласованность данного теста определяется высокой корреляцией ответов на каждый вопрос с общим результатом по шкале.

Часто для определения согласованности психологического теста его расщепляют на две части. Можно это сделать, отбирая вопросы через один. Можно разделить первую и вторую половину теста. Далее анализируют корреляции ответов двух расщепленных частей теста. Чем выше корреляция, тем выше согласованность теста и его надежность.

Итак, надежность психологического теста - это характеристика его формальной пригодности для диагностики психологических показателей. Например, если тест диагностики тревожности надежен, то это значит, что при его использовании на разных выборках, в разное время вы будете получать схожие результаты. Но будут ли эти результаты характеризовать именно тревожность испытуемых? Надежность психологического теста этого не гарантирует. За это отвечает другой показатель - валидность психологического теста.

Валидность психологических тестов

Валидность психологических тестов отражает соответствие их результатов сущности измеряемых психологических феноменов. Например, насколько результат теста агрессивности отражает реальный уровень агрессивности респондента.

Можно выделить два основных способа определения валидности психологических тестов.

Первый способ выявления валидности психологического теста предполагает соотнесение результатов теста с аналогичными показателями других тестов. Например, для проверки валидности теста на самооценку можно сделать следующее:

провести тестирование испытуемых по новому тесту;
выявить самооценку испытуемых по другому тесту (предполагается, что он валиден);
рассчитать корреляцию показателей самооценки по двум психодиагностическим методикам;
статистически значимая корреляция даст основания говорить о валидности нового теста.

Такой способ позволяет выявить так называемую конструктную валидность. Она отражает соответствие выявляемого психологического показателя психологическому конструкту.

Второй способ выявления валидности психологического теста предполагает соотнесение результатов теста с внешними критериями. Такая валидность называется критериальная валидность психологического теста.

Например, показателем критериальной валидности теста склонности к отклоняющемуся поведению может быть реальное число правонарушений подростка. Применительно к тесту мотивации достижений показателем критериальной валидности может быть успешность выполнения той или иной деятельности.

Соотношение надежности и валидности психологических тестов

Надежность теста отражает его качество как метода диагностики, с точки зрения формальных показателей. Без учета содержательного анализа результатов.

Валидность оценивает именно содержательные результаты теста. Насколько они соответствуют реальным психологическим феноменам.

Надежный тест может не быть валидным. Например, тест инициативности может показывать высокую ретестовую надежность и согласованность частей. Однако, с содержательной точки зрения, результаты теста отражают не столько инициативность, сколько силу воли. То есть, надежность данного теста высокая, а валидность низкая.

В практике психологического тестирования надежность тестов с помощью ретеста. Валидность психологических тестов, как правило, проверяется с помощью анализа взаимосвязей с показателями других тестов, измеряющих аналогичные или схожие психологические показатели.

Примеры заключений о надежности и валидности психологически тестов

Тест смысложизненных ориентаций (СЖО)

Надежность СЖО

Надежность теста СЖО проверялась с помощью ретестирования с интервалом в 2 недели (испытуемые — 76 студентов МГУ). Результаты по тесту оказались устойчивы на уровне значимости 5% (р<0,05).

Валидность СЖО

Автором теста СЖО, Д.А. Леотьевым, была проведена проверка конструктной валидности СЖО. Для этого была сформирована выборка, включавшая студентов московских ВУЗов общей численностью 24 человека (мужчин и женщин).

Было проведено тестирование испытуемых по тестам: СЖО, УСК (уровень субъективного контроля) и САТ (тест на уровень самоакутализации). Далее был проведен корреляционный анализ показателей СЖО с показателями тестов УСК и САТ.

Все шесть показателей теста СЖО значимо положительно коррелируют с общей интернальностью и с интернальностью в области достижений, а также (кроме третьей субшкалы) — с интернальностью в области семейных отношений. Отмечены также значимые корреляции пятой субшкалы СЖО с интернальностью в производственной сфере и по отношению к здоровью-болезни.

Показатели теста СЖО положительно значимо коррелируют со следующими шкалами теста САТ: шкалой опоры и познавательных потребностей — все шесть показателей; шкалами компетентности во времени, самоуважения и представления о природе человека — все, кроме первой субшкалы; шкалой ценностных ориентации — все, кроме общего показателя, и шкалой спонтанности — третья, четвертая и пятая субшкалы. С остальными шкалами CAT значимых корреляций обнаружено не было.

Достаточно высокий уровень взаимосвязи показателей теста смысложизненных ориентаций (СЖО) с показателями интернальности (тест УСК) и показателями самоакутализации (тест САТ) позволяет говорить о конструктной валидности теста СЖО.

Леонтьев Д.А. Тест смысложизненных ориентаций (СЖО). 2-е изд. М.: Смысл, 2000, 18 с.

Методика Ш. Шварца для изучения ценностей личности была адаптирована в России В.Н. Карандашевым.

Тем фактом, что в основе данной психодиагностической методики лежит четкая и теоретически обоснованная концепция ее автора, содержащая операционализированные характеристики ценностей;

Тем, что что при разработке оригинальной версии опросника использовались данные исследований по 54 странам.

Карандашев В.Н. Методика Шварца для изучения ценностей личности: концепция и методическое руководство. - СПб.: Речь, 2004-70 с.

Методика «Уровень соотношения Ценности и Доступности в различных жизненных сферах» (УСЦД) (Е.Б.Фанталова)

В методике Е.Б. Фанталовой «Уровень соотношения Ценности и Доступности в различных жизненных сферах» используется список из 12 ценностей, взятых из списка терминальных ценностей методики М. Рокича .

Таким образом, надежность и валидность методики Е.Б. Фанталовой определяется надежностью и валидностью списка ценностей М. Рокича.

Надежность теста ценностных ориентаций М.Рокича проверялась автором через устойчивость ценностной структуры к ретестированию через временные интервалы от 3 недель до 14-16 месяцев на выборках студентов колледжей. Для отдельных ценностей при ретестировании с интервалом 3-7 недель показатель устойчивости варьируется от 0,51 до 0,88 (терминальные ценности) и от 0,45 до 0,70 (инструментальные ценности). Для русскоязычного варианта методики при ретестировании с интервалом в 2 недели были получены средние показатели надежности 0,82 (для терминальных ценностей) и 0,79 (для инструментальных).

О валидности методики ценностных ориентаций М. Рокича (а, следовательно, и методики Е.Б. Фанталовой) косвенно свидетельствуют результаты, полученные при обследовании различных социальных групп. Различия в оценках одних и тех же ценностей мужчинами и женщинами достигают статистически значимых пределов для 12 из 18 терминальных ценностей и для 8 инструментальных.

Леонтьев, Д.А. Методика изучения ценностных ориентации. - М.: Смысл, 1992. - 17 с.

Фанталова Е.Б. Об одном методическом подходе к исследованию мотивации и внутренних конфликтов // Психологический журнал, т. 13, 1992, N 1. С. 107-117.

Методика «Свободный выбор ценностей» Фанталовой Е.Б.

Методика «Свободный выбор ценностей» является составной частью ценностно-ориентированной системы автора «Диагностика внутреннего конфликта» (ДВК).

В данной методике Е.Б. Фанталова расширила список ценностей от 12 до 72. При этом надежность данной ценностной структуры и ее валидность автором не проверялась.

Фанталова Е.Б. Диагностика и психотерапия внутреннего конфликта. Самара, 2001.

Надеюсь, эта статья поможет вам написать работу по психологии самостоятельно. Если понадобится помощь, обращайтесь (все виды работ по психологии; статистические расчеты).

Для начала определим круг разработанности данной проблемы и кратко перечислим ученых.

Ученые, которые занимались проблемой надежности и валидности методик в психодиагностике: А. Анастази и др.

Определение

Надежность методики представляет собой стабильность результатов при многократном обследовании.

Валидность методики – это достоверность измерения определенного психического свойство, которое подвержено измерению.

Надежность теста

Рассмотрим несколько видов надежности психодиагностических тестов.

Надежность по внутренней согласованности. Измененная часть теста измеряет такую переменную, которую не измеряют неизмененные части теста.
Ретестовая надежность. Повторное тестирование испытуемых с последующей корреляцией результатов начального и окончательного обследования.
Надежность параллельны форм теста. Создание эквивалента опросника и его предъявлений тем же испытуемым для последующей корреляции результатов.
Надежность частей теста можно определить, разделив опросник на части; затем провести корреляцию полученных результатов.

Рисунок 1. «Показатели надежности теста»

При выявлении надежности теста следует проводить методику через значительные временные интервалы. Также рекомендуется проводить тест на выборки не менее 200 испытуемых.

Валидность теста

Рассмотрим некоторые виды валидности тестов в психодиагностике.

Очевидная валидность. Представления испытуемого о тесте.
Конкурентная валидность. Корреляция с подобными тестами.
Прогностическая валидность. Корреляция начальных и более поздних результатов теста.
Инкрементная валидность.
Дифференциальная валидность.
Содержательная валидность. Отражение заданий тестов аспектов определенной изучаемой области.
Эмпирическая валидность. Корреляция результатов данной методики с результатами подобных методик у одних и тех же испытуемых.
Критериальная валидность. Связь полученных результатов и внешних критериев.
Конструктная валидность.

Одним из важных отличий психометрических тестов является то, что они стандартизированы , а это позволяет сравнить показатели, полученные одним испытуемым, с таковыми в генеральной совокупности или соответствующих группах. Стандартизация теста наиболее важна в тех случаях, когда осуществляется сравнение показателей обследуемых.

При этом вводится понятие нормы , или нормативных показателей . Для получения стандартных норм нужно тщательно отобрать большее количество испытуемых в соответствии с ясно обозначенным критерием. При формировании выборки стандартизации следует учитывать ее объём и репрезентативность.

В некоторых случаях приходится формировать несколько групп стандартизации или стратифицировать группу стандартизации относительно таких параметров, как возраст, пол, социальный статус. Устанавливать нормы не всегда обязательно. При использовании психологических тестов в научном исследовании нормы не столь важны и достаточно сырых показателей теста. Нормы для каждой группы должны быть представлены в средних величинах и показателе стандартного отклонения.

Рисунок 2. «Структура валидности»

План лекции

1. Надежность и ее виды.

2. Процедуры определения ретестововй надежности.

3. Определение одномоментной надежности теста

Тема 13. Надежность теста. Ее виды.

Процедуры определения надежности теста

(семинарско-практическое - 8 часов)

Вопросы для обсуждения:

1. Понятие надежности. Виды надежности.

2. Ретестовая надежность тестовой методики. Процедуры ее определения: преимущества и недостатки.

3. Одномоментная надежность теста. Варианты определения одномоментной надежности: метод параллельных форм, метод расщепления, метод анализа согласованности ответов по всем пунктам методики (метод Кьюдера-Ричардсона). Преимущества и недостатки каждого из них.

3. Надежность отдельных пунктов теста. Характеристика требований, обеспечивающих надежность отдельных пунктов теста: объективность, валид-ность, устойчивость, сила/трудность, дискриминативность. Процедуры определения надежности отдельных пунктов теста

Практические задания:

1) расчет ретестовой надежности на материале результатов теста Дж. Равена и опросника Ч.Д. Спилбергера;

2) расчет одномоментной надежности на материале результатов теста Дж. Равена и опросника Ч.Д. Спилбергера.

1. Надежность и ее виды.

В традиционной тестологии термин «надежность» означает относ тельное постоянство, устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых. Повторное применение надежных методик дает сходные оценки. При этом в определенной мере могут совпадать как сами результаты, так и порядковое место, занимаемое испытуемым в группе.

Степень надежности методик зависит от многих причин. Поэтому важной проблемой практической диагностики является выяснение негативных факторов, влияющих на точность измерений. Многие авторы пытались составить классификацию таких факторов. Среди них наиболее часто называются следующие:

1) нестабильность диагностируемого свойства;

2) несовершенство диагностических методик (небрежно составлена инструкция, задания по своему характеру разнородны, нечетко сформулированы указания по предъявлению методики испытуемым и т.д.)

меняющаяся ситуация обследования (разное время дня, когда проводятся эксперименты, разная освещенность помещения, наличие или отсутствие посторонних шумов и т.д.);

3) различия в манере поведения экспериментатора (от опыта к опыту по-разному предъявляет инструкции, по-разному стимулирует выполнение заданий и т.д.);

4) колебания в функциональном состоянии испытуемого (в одном эксперименте отмечается хорошее самочувствие, в другом - утомление и т.д.);

5) элементы субъективности в способах оценки и интерпретации результатов (когда ведется протоколирование ответов испытуемых, оцениваются ответы по степени полноты, оригинальности и т.п.).

Если все эти факторы иметь в виду и постараться в каждом из них устранить условия, снижающие точность измерений, то можно добиться приемлемого уровня надежности теста. Одним из важнейших средств повышения надежности психодиагностической методики является единообразие процедуры обследования, его строгая регламентация: одинаковые для обследуемой выборки испытуемых обстановка и условия работы, однотипный характер инструкций, одинаковые для всех временные ограничения, способы и особенности контакта с испытуемыми, порядок предъявления заданий и т.д. При такой стандартизации процедуры исследования можно существенно уменьшить влияние посторонних случайных факторов на результаты теста и таким образом повысить их надежность.

В самом широком смысле надежность теста – это характеристика того, в какой степени выявленные у испытуемых различия по тестовым результатам являются отражением действительных различий в измеряемых свойствах ив какой мере они могут быть приписаны случайным ошибкам. В узком методическом смысле под надежностью понимают степень согласованности результатов теста при повторном его использовании.

На характеристику надежности методик большое влияние оказывает исследуемая выборка. Она может как снижать, так и завышать этот показатель, например, надежность может быть искусственно завышена, если в выборке небольшой разброс результатов, т.е. если результаты по своим значениям близки друг к другу. В этом случае при повторном обследовании новые результаты также расположатся тесной группой.

В настоящее время надежность все чаще определяется на наиболее однородных выборках, т.е. на выборках, схожих по полу, возрасту, уровню образования, профессиональной подготовке и т.п. Для каждой такой выборки приводятся свои коэффициенты надежности. Приводимый показатель надежности применим только к группам, подобным тем, на которых он определялся. Если методика применяется к выборке, отличающейся от той, на которой проверялась ее надежность, то эта процедура должна быть проведена заново.

Так как все виды надежности отражают степень согласованное двух независимо полученных рядов показателей, то математике статистический прием, с помощью которого устанавливается надежность методики, - это корреляции (по Пирсону или Спирмену). Надежность тем выше, чем больше полученный коэффициент корреляции приближается к единице, и наоборот. Важнейшим средством повышения надежности ПД методик является стандартизация процедуры обследования. При строгой регламентации процедуры обследования (обстановка и условия работы, характер инструкции, временные ограничения, способы и особенности контакта с испытуемым и пр.) существенно повышается надежность теста.

Надежность тесно связана с валидностью. Надежность – это устойчивость процедуры относительно объектов исследования. Валидность – устойчивость относительно измеряемых свойств объекта (предмета измерения). Устойчивость теста относительно объектов исследования является необходимым, но не достаточным условием его устойчивости относительно измеряемых свойств объектов. То есть, надежность является необходимым, но не достаточным условием валидности. Валидность может качественно и количественно превышать надежность.

В данном пособии при описании видов надежности основной упор делается на работы К.М. Гуревича (1969, 1975, 1977, 1979), который, проведя тщательный анализ зарубежной литературы по это£ проблеме, предложил толковать надежность как:

1) надежность самого измерительного инструмента;

2) стабильность изучаемого признака;

3) константность, т.е. относительную независимость результатов от личности экспериментатора.

Показатель, характеризующий измерительный инструмент, предлагается называть коэффициентом надежности; показатель, характеризующий стабильность измеряемого свойства, - коэффициентом стабильности; а показатель оценки влияния личности экспериментатора - коэффициентом константности.

Именно в таком порядке рекомендуется осуществлять проверку методики: целесообразно сначала проверить инструмент измерения. Если полученные данные удовлетворительны, то можно переходить к установлению меры стабильности измеряемого свойства, а уже после этого при необходимости заняться критерием константности.

1. Определение надежности измерительного инструмента. От того, как составлена методика, насколько правильно подобраны задания с точки зрения их взаимосогласованности, насколько она однородна, зависит точность, объективность любого психологического измерения. Внутренняя однородность методики показывает, что ее задания актуализируют одно и то же свойство, признак.

Для проверки надежности измерительного инструмента, говорящего о его однородности (или гомогенности), используется так называемый метод «расщепления». Обычно задания делятся на четные и нечетные, отдельно обрабатываются, а затем результаты двух полученных рядов коррелируются между собой. Для применения этого способа нужно поставить испытуемых в такие условия, чтобы они смогли успеть решить (или попытаться решить) все задания. Если методика однородна, то большой разницы в успешности решения по таким половинкам не будет, и, следовательно, коэффициент корреляции будет достаточно высоким.

Можно делить задания и другим путем, например сопоставить первую половину теста со второй, первую и третью четверть - со второй и четвертой и т.п. Однако «расщепление» на четные и нечетные задания представляется наиболее целесообразным, поскольку именно этот способ наиболее независим от влияния таких факторов, как врабатываемость, тренировка, утомление и пр.

Методика признается надежной, когда полученный коэффициент не ниже 0,75-0,85. Лучшие по надежности тесты дают коэффициенты порядка 0,90 и более.

Но на начальном этапе разработки диагностической методики можно получить невысокие коэффициенты надежности, например, порядка 0,46-0,50. Это означает, что в разрабатываемой методике присутствует некоторое число заданий, которые в силу своей специфичности ведут к снижению коэффициента корреляции. Такие задания необходимо специально проанализировать и либо переделать их, либо вообще изъять.

Чтобы легче было установить, за счет каких заданий снижаются коэффициенты корреляции, необходимо проанализировать таблицы с выписанными данными, подготовленными для корреляций. Следует отметить, что любые изменения в содержании методики - изъятие заданий, их перестановка, переформулировка вопросов или ответов требует заново высчитывать коэффициенты надежности.

При ознакомлении с коэффициентами надежности не следует забывать, что они зависят не только от правильного подбора заданий с точки зрения их взаимосогласованности, но и от социально-психологической однородности той выборки, на которой проверялась надежность измерительного инструмента.

2. Определение стабильности изучаемого признака. Определить надежность самой методики - это не значит решить все вопросы, связанные с ее применением. Нужно еще установить, насколько устойчив, стабилен признак, который исследователь намерен измерять. Колебания признака не должны иметь непредсказуемого характера. Если не ясны причины резких колебаний, то такой признак не может быть использован в диагностических целях.

Для проверки стабильности диагностируемого признака, свойств используется прием, известный как тест - ретест. Он заключаете в повторном обследовании испытуемых с помощью той же методики. О стабильности признака судят по коэффициенту корреляции между результатами первого и повторного обследования. Он будет свидетельствовать о сохранении или несохранении каждым испытуемым своего порядкового номера в выборке.

На степень устойчивости, стабильности диагностируемого свойства влияют разнообразные факторы. Число их достаточно велико Поэтому необходимо соблюдать требования единообразия процедуры проведения эксперимента.

При определении стабильности признака большое значение имеет промежуток времени между первым и повторным обследованием. Чем короче срок от первого до второго испытания, тем (при прочих равных условиях) больше шансов, что диагностируемый признак сохранит уровень первого испытания. С увеличением временного интервала стабильность признака имеет тенденцию снижаться, так как возрастает число посторонних факторов, влияющих на нее. Следовательно, напрашивается вывод, что целесообразно проводить повторное тестирование через короткий срок после первого, но не слишком, так как возможно, что испытуемые помнят свои ответы. В тестологической литературе наиболее часто называются временные интервалы в несколько месяцев (но не более полугода). При обследовании детей младшего возраста, когда возрастные изменения и развитие происходят очень быстро, эти интервалы могут быть порядка нескольких недель.

Если тест исследует свойство, которое в период тестирования находится в процессе интенсивного развития (например, умение проводить обобщения), то коэффициент стабильности может оказаться невысоким, но это не следует истолковывать как недостаток теста. Такой коэффициент стабильности должен интерпретироваться как показатель определенных изменений, развития исследуемого свойства. Совсем другое требование предъявляется к коэффициенту стабильности, если автор методики считает, что измеряемое свойство уже сформировано и должно быть достаточно устойчивым. Коэффициент стабильности в этом случае должен быть достаточно высоким (не ниже 0,80).

Таким образом, вопрос о стабильности измеряемого свойства решается не всегда однозначно. Решение зависит от сущности самого диагностируемого свойства.

3. Определение константности, т.е. относительной независимости результатов от личности экспериментатора. Поскольку методика, разработанная для диагностических целей, не предназначена для того, чтобы вечно оставаться в руках своих создателей, крайне важно знать, в какой мере ее результаты поддаются влиянию личности экспериментатора. Хотя диагностическая методика всегда снабжается подробными инструкциями по ее применению, правилами и примерами, указывающими, как проводить эксперимент, регламентировать манеру поведения экспериментатора, скорость его речи, тон голоса, паузы, выражение лица очень трудно. Испытуемый в своем отношении к опыту всегда отразит то, как сам экспериментатор к этому опыту относится. . Если под воздействием нового экспериментатора все испытуемые в одинаковой степени стали работать немного лучше или немного хуже, то сам по себе этот факт (хотя и заслуживает внимания) на надежность методики не окажет влияния. Надежность изменится лишь тогда, когда воздействие экспериментатора на испытуемых различно: одни стали работать лучше, другие хуже, а третьи так же, как и при первом экспериментаторе. Другими словами, если испытуемые при новом экспериментаторе изменили свои порядковые места в выборке.

Коэффициент константности определяется путем корреляции результатов двух опытов, проведенных в относительно одинаковых условиях на одной и той же выборке испытуемых, но разными экспериментаторами. Коэффициент корреляции не должен быть ниже 0,80.

2. Определение ретестовой надежности.

НАДЕЖНОСТЬ РЕТЕСТОВАЯ - характеристика надежности психодиагностической методики, получаемая путем повторного обследования испытуемых с помощью одного и того же теста. Надежность в этом случае вычисляется по соответствию результатов первого и второго обследований или по сохранению ранговых мест испытуемых в выборке при ретесте. Коэффициент надежности (г () соответствует коэффициенту корреляции между результатами таких обследований. При использовании интервальных шкалприменяется коэффициент корреляции произведения моментов Пирсона. Для шкал порядка в качестве меры устойчивости к перетестированию может быть использован коэффициент ранговой корреляции Спирмена или Кэндалла.

При характеристике ретестовой надежности особое значение имеет временной интервал между первым и вторым обследованиями. С его увеличением показатели корреляции имеют тенденцию к снижению, существенно повышается вероятность воздействия посторонних факторов - могут наступить закономерные возрастные изменения измеряемых тестом свойств, произойти различные события, влияющие на состояние и особенности развития исследуемых качеств. По этой причине при определении ретестовой надежности стараются выбирать непродолжительные временные интервалы (до нескольких месяцев), а при обследовании детей младшего возраста эти интервалы должны быть еще меньше, поскольку возрастные изменения и развитие в этом случае происходят еще быстрее.

Несмотря на указанную тенденцию, при получении характеристик теста проводятся повторные испытания и с длительным временном промежутком. Определение ретестовой надежности ограничивается анализом краткосрочных случайных изменений, характеризующих тест как измерительную процедуру, а не его отношение к исследуемой области поведения.

Наряду с очевидной простотой ретестовая надежность как метод определения надежности обладает существенными недостатками. Так, при повторном применении одних и тех же заданий, особенно при относительно непродолжительном временном интервале между обследованиями, у испытуемых может сформироваться навык работы с данной психодиагностической методикой, что приводит к улучшению индивидуальных результатов, хотя и не одинаково выраженному у разных лиц. Это неизбежно ведет к заметной перестановке ранговых мест отдельных испытуемых в данной выборке и, соответственно, ухудшению коэффициента надежности. Еще более заметное воздействие на результаты анализа надежности оказывает запоминание испытуемыми отдельных решений, воспроизведение в повторном обследовании предыдущей картины правильных и неправильных решений. В этом случае результаты двух предъявлений теста не будут независимыми и корреляция между ними окажется завышенной.

Один из путей устранения влияния тренировки на результаты оценки ретестовой надежности - формирование устойчивого навыка в работе с соответствующей методикой перед проведением тест-ретеста. Однако количество повторений теста при этом неизбежно возрастает, что приводит к увеличению числа запомнившихся решений. Такой прием может быть рекомендован для методик типа тестов скорости, содержащих большое количество элементов тестового материала.

Для других методик, очевидно, единственным приемлемым путем снижения влияния тренировки остается увеличение интервала ретеста, что, однако, как уже говорилось выше, вступает в противоречие с определением надежности как характеристики теста.

Для большинства тестов общих способностей характерно улучшение показателей Н. р. с возрастом испытуемых за счет лучшего контроля условий их выполнения. Другим фактором увеличения расчетных показателей Н. р. является относительное замедление с возрастом темпа психического развития в области тех характеристик, которые могут стать объектом измерения или влиять на результат теста. Благодаря этому, спустя время, составляющее интервал ретеста, случайные искусственно завышает показатели Н. р. Эта закономерность требует отдельных измерений Н. р. в разных возрастных контингентах испытуемых, что особенно существенно для методик, предназначенных для обследования в широком возрастном диапазоне.Указанные особенности и недостатки метода определения надежности путем ретеста делают его пригодным лишь для ограниченного числа методик, допускающих многократное повторное обследование. К их числу относятся сенсомоторные пробы, тесты скорости и ряд других методик, отличающихся большим количеством пунктов.

3. Определение одномоментной надежности.

Одномоментная надежность теста. Понятие сопоставимых форм методики. Варианты определения одномоментной надежности:

Метод параллельных форм.

Одни и те же испытуемые в выборке определения надежности обследуются вначале с использованием основного набора заданий, а затем - с применением аналогичных дополнительных наборов. Коэффициент надежности по типу параллельных форм может быть определен и другим способом, а именно: испытуемые делятся примерно на равные группы, затем одной из них предлагается форма А теста, а другой - форма Б. Через определенное время (обычно не более недели) проводится повторное тестирование, но в обратном порядке.

Такая процедура обследования лишена значительной части недостатков способа определения надежности ретестовой. Так как в параллельной форме используется другой по содержанию материал, возможность тренировки и запоминания отдельных решений уменьшается. Важнейшим преимуществом данного метода является сокращение временного интервала перед повторным обследованием. Основным показателем надежности параллельных форм является коэффициент корреляции между результатами первичного и повторного обследований, который позволяет оценить как временную стабильность теста (собственно надежность), так и степень соответствия результатов обеих форм теста. Если формы применяются непосредственно одна за другой, то корреляция отражает их взаимозаменяемость.

Отношение между параллельными формами теста имеет сложный характер. Оба набора заданий должны не только отвечать одним и тем же требованиям, измеряя идентичные показатели и давая сходные результаты, но вместе с тем быть относительно независимыми друг от друга. На практике эта задача осуществима далеко не для всех тестовых. Другим недостатком характеристики надежности по типу Н. п. ф. является возможность усвоения испытуемым принципа решения, общего для основной и параллельной форм. Таким образом, в случае оценки Н. п. ф. влияние тренировки и навыка, приобретаемого при повторном обследовании, если и снижается по сравнению с характеристикой надежности ретестовой, однако не устраняется полностью.

Метод расщепления.

Наиболее простым и распространенным способом определения Н. ч. т. является метод расщепления, суть которого заключается в выполнении испытуемым заданий двух равноценных частей теста. Обоснованием метода является вывод о том, что при нормальном или близком к нормальному распределении оценок по полному тесту выполнение любого случайногонабора из частей теста даст аналогичное распределение (при условии, что части однородны по характеру заданий по отношению к тесту в целом).

Для оценки надежности методом расщепления выбирают две эквивалентные по характеру и степени трудности группы задач (см. Внутренняя согласованность, Трудность заданий теста). Разделение объема заданий теста на сопоставимые части достигается:

Распределением заданий на четные и нечетные (в том случае, если задания в тесте строго ранжированы по степени субъективной трудности);

Распределением пунктов по принципу близости или равенства значений индексов трудности и дискриминативности.

При расщеплении тестов скорости применяется особая процедура группировки заданий. Определяется минимальное время (t^J решения целого теста, затем отсчитываются половина и четвертая часть этого времени. Все испытуемые работают половину минимального времени, после чего ставят отметку против задания, выполняемого в момент подачи сигнала, и продолжают работать еще четверть минимального времени. Коэффициент надежности в этом случае будет соответствовать степени корреляции между числом задач, решенных до первого сигнала (0,5t m ] n) и решенных за время между первым и вторым сигналами (0,25f mln).

Разделение заданий теста на равноценные половины является лишь частным случаем Н. ч. т. Вполне возможно расщепление на три, четыре и более частей. В предельном случае число частей равно числу пунктов. При этом для определения надежности применяют анализ внутренней согласованности.

При разделении всего набора заданий теста на любое количество групп для правильного определения Н. ч. т., как уже указывалось выше, должно соблюдаться требование равноценности таких групп. Поэтому при вычислении коэффициента надежности методом анализа внутренней согласованности отобранные задания теста должны быть в высокой степени однородны по содержанию и трудности (гомогенны). При гетерогенных задачах значения r t ниже истинных.

2а

Наиболее распространенным методом оценки надежности отдельных заданий является вычисление коэффициента Кьюдера-Ричардсона

где σ х - дисперсия первичных оценок теста, р - индекс трудности, выраженный в виде доли индекса трудности U деленного на 100, q = 1 - р, r pb - коэффициент дискриминации

При отсутствии коэффициента дискриминации применим вариант формулы Кьюдера-Ричардсона:

Где ∑σ² ‑ сумма дисперсий результатов отдельных заданий. В практике психологической диагностики считается, что тест надежен, если r>0,6.

Характеристика надежности по типу частей теста имеет серьезные преимущества по сравнению с надежностью ретестовой и надежностью параллельных форм, главным образом благодаря отсутствию необходимости в повторном обследовании. Таким образом, снимается влияние многих посторонних факторов, в частности тренировки, запоминания решений и т. д. Это обстоятельство определяет широкое распространение метода Кьюдера-Ричардсона по сравнению с другими типами надежности. К недостаткам метода относится невозможность проверить устойчивость результатов теста спустя определенное время. Это требует комбинирования метода Кьюдера-Ричардсона с другими типами характеристики надежности психологической методики

4. Надежность отдельных пунктов теста.

Надежность отдельных пунктов теста. Характеристика требований, обеспечивающих надежность отдельных пунктов теста: объективность, валидность, устойчивость, сила/трудность, дискриминативность. Процедуры определения надежности отдельных пунктов теста.