7. Многомерный статистический анализ в профотборе (Владислав Логинов) / Проза.ру

         Задача профессионального отбора одна из самых трудных среди задач распознавания образов в виду комплексности требований, которые необходимо учесть при принятии «окончательного» для испытуемого и, к сожалению, почти всегда недостаточно объективного решения. Многомерность задачи профотбора возникает непременно, при использовании более одного психологического теста, или теста имеющего в своем составе более одной шкалы. Распознать, среди множества данных, описание нужных нам претендентов невозможно без применения методов многомерной статистики.
   При трех и более тестах, используемых в процедуре профессионального отбора, n-мерность возникающих образов затрудняет их непосредственное восприятие, а, значит, и точность оценки их близости к «эталону». Попытка анализировать данные такой размерности без привлечения соответствующих многомерных статистик, попахивает уже не субъективностью, а произволом при принятии решений, чрезвычайно важных для судеб многих людей.
   Использование методов многомерной статистики предполагает обращение к системному анализу рассматриваемого явления, основных его составляющих и их связей, принятие решения о характере установленных закономерностей. Кроме того, программно-алгоритмическое обеспечение такого анализа имеет отношение к методам искусственного интеллекта (обобщение данных с помощью факторного и кластерного анализа, распознавание с помощью дискриминантного анализа).
         Кластерный анализ – это способ группировки многомерных объектов, основанный на представлении результатов отдельных наблюдений точками подходящего геометрического пространства с последующим выделением групп как «сгустков» этих точек. Не без оснований считается, что терминология кластерного анализа заменит все ранее использовавшиеся для этой цели конструкции (распознавание образов без учителя, стратификация, таксономия, автоматическая классификация и т.п.). Очевидны потенциальные возможности кластерного анализа и это вполне понятно. Ведь речь идет фактически о моделировании операции группирования, одной из важнейших не только в статистике, но и вообще – и в познании, и в принятии решений. Кластерный анализ может быть эффективно использован для принятия решения об отнесении испытуемого к одной из трех групп соответствия (близкие, средние, далекие), разработанному экспертами «эталона» эффективного профессионала.
         Необходимость использования достаточно сложных, для проведения и последующей интерпретации результатов, методов статистической обработки, вызывает у многих специалистов понятное и нам сомнение. В предисловии к очень популярной в настоящий момент среди психологов книге, Е.В.Сидоренко высказывает мнение, что «…факторный и таксономический анализ уже слишком сложны и запутанны, чтобы каждый исследователь мог точно понимать, какие преобразования стоят за ними. Он лишь вводит свои данные в «черный ящик», а затем получает машинную выдачу с факторными весами признаков, группировками испытуемых и т.д. Далее начинается интерпретация полученных факторов или классификаций, и, как любая интерпретация, она неизбежно субъективна. Но ведь субъективно судить о психических феноменах мы можем и безо всяких измерений и вычислений.» Интерпретация результатов сложных обсчетов, по мнению автора, «…несут в себе лишь видимость научной объективности, поскольку мы по прежнему субъективно интерпретируем, но уже не реальные результаты наблюдений, а результаты их математической обработки.» По этой причине факторный, дискриминантный, кластерный, таксономический виды анализа не рассматриваются автором в ее прекрасно написанной и очень, по нашему мнению, полезной для психологов-экспериментаторов книге.
            С этим мнением трудно, с одной стороны, не согласиться, а, с другой стороны, следовать ему достаточно бесперспективно. Ведь методы обработки экспериментальных данных, которые приведены в этой книге, отличаются от не приведенных в ней методов только легкостью понимания, простотой вычислений, а поэтому и частотой использования в лабораторной практике. Но с удешевлением а, значит, более широким распространением компьютеров, и знакомством пользователей со статистическими пакетами обработки данных («STATISTIKA» и др.), психологи вынужденно перейдут на более высокий уровень математических абстракций, стоящих за этими, с первого взгляда, столь сложными методами, а значит, получат более высокий уровень возможностей интерпретации экспериментальных данных. Для того чтобы эти методы стали столь же привычными как расчет средних и дисперсии, нужно, в учебном процессе, больше времени уделить математико-статистической подготовке студентов-психологов. Да и работу со статистическими пакетами программ следует начинать как можно раньше, еще на первых курсах в лабораторных практикумах по общей психологии.