Е. Ю. Артемьева. О некоторых проблемах использования математических методов в психологии
В последнее время применение математических методов и математических идей к решению психологических задач стало столь частым явлением, что возникло естественное стремление рассматривать эти применения как некоторое единство, имеющее свою собственную структуру. Видимо, поэтому все множество таких методов и идей с неясными пока отношениями между ними и объединяют сейчас под именем математической психологии. Понятны и актуальны различные попытки сформулировать задачи психологии, которые обслуживались бы математической психологией. Однако, если уж говорить о математической психологии, не менее актуально разобраться в ее собственном устройстве: в логике выбора и типологии применений математических методов, в перспективах ее внутреннего развития.
В настоящих заметках нам и хотелось бы обсудить некоторые из этих вопросов, выяснив взаимоотношения психологической задачи и математического метода, а также возможность различения "хороших" и "плохих" методов. Для одной из задач (задачи выяснения структуры экспериментальной ситуации) - проследить закономерности эволюции выбора математического метода от самого жесткого - числового - до формализмов естественного языка. Высказать некоторые соображения о тактике исследования нечисловых систем, поделиться опытом построения формальных, но близких к естественным, языков описания экспериментальных результатов. Обсудить тенденции развития математической психологии, необходимость создания "новой" математики для нужд формализации психологии.
Приложения математики в психологии разделяются, по крайней мере, на три крупных класса, различных и по своей математической природе и по особенностям применения. Это, во-первых, статистические методы описания числовых результатов экспериментов. Во-вторых, разнообразные математические схемы, используемые как готовые или впоследствии уточняемые модели психологических феноменов. В-третьих, собственно методы формализации, методы построения систем.
Из этого перечисления легко видеть, что все используемые в психологии методы, безусловно, так или иначе связаны с содержательной стороной решаемых с их помощью задач (разные методы по-разному), но никак не определены собственно психологической спецификой, т. е. это те же методы, которые используются в любых приложениях. Следовательно, и законы их применения те же, что и в любых других приложениях, и не нуждаются в специальном обсуждении.
Тем не менее хочется еще раз остановиться на одном общем, но, к сожалению, часто забываемом свойстве применения математических методов. Дело в том, что любой метод, хотим мы этого или не хотим, имеет свой аксиоматический остов. Принимая метод, мы с необходимостью принимаем и ту модель, которая соответствует этому остову. Если это делается неосознанно, риск положить в основу описания неадекватную модель очень велик. А нахождение оптимального способа решения поставленной задачи возможно только тогда, когда соответствующая модель построена правильно, своя для каждой задачи. Поэтому не всегда "работают" стандартные методы, построенные для других ситуаций, поэтому для некоторых задач психологии приходится искать специализированные решения.
Рассмотрим очень простой пример, по-видимому, встречавшийся в разных модификациях каждому из тех, кому приходилось давать консультации по статистике. При сравнении достоинств двух типов шрифтов для каждого испытуемого регистрируется время t1 и t2, затраченное на чтение текста заданной длины, напечатанного шрифтами 1 и 2. Если к полученным выборкам применить широко рекомендованный критерий Стъюдента для сравнения средних значений, то он даже по очень большой группе испытуемых вряд ли выявит различия между t1 и t2 в той ситуации, когда совершенно ясно, что один шрифт читается намного лучше другого.
В чем же дело? Рассмотрим несколько упрощенную модель ситуации: tij=ai+bj+ξij (i - индекс шрифта, j - индекс испытуемого, tij - время, затраченное j испытуемым на чтение i шрифта, величина аi зависит только от шрифта, bj задается индивидуальными особенностями испытуемого, ξij - некоторая случайная ошибка). Теперь ясно, что надо было рассматривать не t1-t2 (суммирование не относящихся к делу индивидуальных особенностей bj приводит к огромной дисперсии оценок, затрудняющей различение t1 и t2), а t1-t2 - среднее попарных разностей времен чтения 1 и 2 шрифтов по всем испытуемым. Достаточно перейти к исследованию t1-t2, чтобы эффективно различить достоинства шрифтов с помощью критерия t для сравнения среднего с нулем.
Другой пример: известные марковские модели обучения Эстеса и др. иногда рассматривают как описание поведения испытуемого, адаптирующегося к случайной среде, надеясь получить из модели сведения о тактике испытуемого. Поскольку эти модели оперируют с вероятностями, понятиями принципиально асимптотическими, они не позволяют строить никаких выводов об алгоритме испытуемого, но эти же модели могут оказаться весьма полезными для предсказания асимптотических результатов в длительных экспериментах.
Зачастую априорные предпосылки не просматриваются явно, теряются из виду на долгом пути от теоретического обоснования метода до конкретных применений. Так обстоит дело с широко применяемым корреляционным анализом: для выяснения наличия связи между двумя переменными подсчитывают коэффициент корреляции выборочных значений этих переменных. Если коэффициент окажется близким к нулю, считают, что переменные независимы. Между тем известно, что только для узкого класса данных (для данных, имеющих так называемое нормальное распределение) из равенства нулю коэффициента корреляции следует независимость переменных. Хуже того, вопреки нашим привычным представлениям о том, что из малых нарушений предпосылок следуют малые разрушения выводов, в корреляционном анализе для распределений внешне очень похожих на нормальные (таких же симметричных и гладких) коэффициент корреляции бывает равным нулю для теснейше (функционально!) связанных переменных. Понятно, какие анекдотические артефакты можно получать в корреляционном анализе.
Итак, метод будет адекватен задаче, если априорный остов метода совпадает с внутренней структурой ситуации. Конечно, такое соответствие не бывает абсолютным, а установление его часто куда более трудное дело, чем самоё применение.
Поскольку выбор оптимального метода довольно жестко диктуется задачей, возникает впечатление, что нельзя говорить, хорош ли обсуждаемый метод для применений, до того, как поставлена конкретная задача. Видимо, это не так: возможен и обратный ход рассуждений. Исходя из предположений метода, можно указать ограничения на класс адекватных ему ситуаций. Если такие ограничения окажутся слишком обременительными, лучше поискать другой метод.
Математическая схема, применяемая к реальной ситуации, может быть ошибочной в двух смыслах: не обладать чертами, важными для ситуации или обладать чертами, не присущими ситуации. Второй случай (иногда его называют "математическим шумом") имеет место почти всегда: ведь не следует же ожидать идеального совпадения структур метода и ситуации. Видимо, по мере накопления сведений о самой ситуации или в силу внутренней логики развития приложений должен наблюдаться такой ход замены одного метода решения данной задачи другим, который снижал бы "математический шум". Ниже будет прослежена тенденция таких замен для одной из психологических задач.
В самом общем виде рассмотрим задачу выяснения структуры (устройства, организации, механизма) наблюдаемых психологических феноменов. Внешне такие задачи могут весьма отличаться друг от друга. Достаточно, например, сравнить две задачи: "У 10 испытуемых в определенном функциональном состоянии регистрируется 100 параметров ЭЭГ. Сократить число параметров регистрации и выделить те параметры или функции от них, которые являются истинными коррелятами состояния" и "Описать структуру субъективных геометрических представлений испытуемого, решающего учебную задачу". Общим для таких задач является только необходимость нахождения факторов (и, конечно, отношений между ними), ответственных за наблюдаемые в эксперименте результаты.
Обычно для решения таких задач рекомендуется факторный анализ, хорошо проявивший себя в различных приложениях. Однако факторный анализ является жестким численным методом, предъявляющим к экспериментальным данным весьма обременительные требования. Одно из пих состоит в предположении, что каждый наблюдаемый в эксперименте параметр является линейной функцией искомых факторов. Где же в реальной жизни встретишь процессы, линейно разложимые по составляющим? Если же применять факторный анализ формально, не заботясь о выполнении его предположений, легко можно быть обманутым иллюзией достоверности результатов.
Понимание подобных трудностей не могло не привести к попыткам освободиться от требований линейности и искать менее жесткие структуры базисных переменных, определяющих экспериментальные результаты. Один из возможных выходов, как известно, был предложен Д. Шеппардом и Дж. Кероллом. В частности, Керолл разработал алгоритм для ЭВМ, позволяющий находить те нелинейные функции от наблюдаемых в эксперименте параметров, которые могут быть объяснены базисными переменными, через которые можно выразить все параметры. Основой метода является рассмотрение наблюдений как точек в пространстве с некоторой метрикой и использование топологических отношений между точками.
Однако и метод Керолла существенно опирается на числовое представление результатов и вряд ли может быть приспособлен для тех случаев, где требуется описать факторы, управляющие психологическими феноменами. Здесь нужен, видимо, другой подход, скорее более близкий к моделированию, чем к статистике.
Рассмотрим одну из проблем, занимающую в некотором смысле промежуточное положение между численно-факторными и модельно-факторпыми задачами. Речь идет о синдромном анализе в нейропсихологической клинике. Один из возможных подходов к синдромному анализу состоит в том, что выбирается система нейропсихологических тестов, отмечается, выполнен или не выполнен каждый тест обследуемым больным, проводится статистический анализ результатов. Группа тестов, результаты нарушений выполнения которых статистически связаны, объявляется соответствующей некоторому фактору. Иногда базисные факторы выделяются факторным анализом. Такой подход, несмотря на существенные трудности его реализации, может давать неплохие результаты, если поражение специфично для выбранной системы тестов, т. е. поражение проявляется в нарушениях нри выполнении одних тестов и в отсутствии нарушений при выполнении других. Однако есть ряд поражений, для которых нельзя (или очень трудно) подобрать тестовую систему: они проявляются не в распаде отдельных действий, а в особенностях деятельности вообще. Тогда может случиться, что никакие модификации факторного анализа не обнаружат базисных факторов поражения. Это легко просмотреть на искусственном числовом примере.
Пусть x1 и x2 - независимые факторы поражения, численные оценки которых имеют нормальное распределение; k1 и k2 - регистрируемая в обследовании степень разрушенности выполнения двух независимых (соответствующих х1 и х2) тестов, t - влияние общего для всех тестов фактора. Механизм же выполнения тестов таков, что k1=x1+t; k2=x2-t. Предположим, что было обследовано пять больных, для которых истинные значения х1 и х2 были равны соответственно x1=(-2; -1; 0; 1; 2) и х2=(1; 1,5; 3; 6,5; -3), a t= (3; 2; - 1; 0; -1). Следовательно, в опыте были зарегистрированы значения k1=(1; 1; -1; 1; 1) и k2=(3; 3; -3; 0; 3). Легко видеть, что х1 и х2, х2 и t практически не коррелированы, а rk1k2=0,9. Из независимых выборок х1 и х2 образовались выборки k1 и &2 с коэффициентом корреляции, близким к единице. Понятно, что факторным анализом независимые факторы хг и хг, а также и сам фактор t обнаружены не будут.
К таким же выводам можно прийти и при содержательном анализе ситуации: влияние общего фактора может скрыть проявление специфических факторов поражений, а специфические факторы, несомненно, маскируют проявление фактора.
При работе с реальным экспериментальным материалом (поисковое исследование, проводимое на кафедре нейропсихологии МГУ совместно с М. Ш. Баймишевой) у пас сложилось мнение, что тактика изучения таких не поддающихся стандартному факторному анализу синдромов должна быть весьма своеобразной: исследование не может идти статистическим путем, оно требует схемы типа "грубая гипотеза о факторах - проверка и уточнение - уточненная гипотеза - и т. д.". При этом на каждом этапе исследования нарушения в выполнении тестов должны получать единую интерпретацию в рамках той системы
гипотез о факторах, которая на данном этапе проверяется. Видимо, такой процесс проверки и уточнения содержательных гипотез может сходиться и в случае, когда мы начинаем с "плохой" гипотезы. Но это предположение нуждается в специальном обсуждении, и, конечно же, выдвижение начальной гипотезы остается важным звеном такого подхода.
Начальная гипотеза по существу содержит грубую модель деятельности какого-то специального типа. И от того, на каком языке модель сформулирована, в какой формальной системе задана, зависит, сколь быстрым будет процесс ее уточнения. С одной стороны, желательна достаточно жесткая формализация, поскольку она позволяет быстро и надежно просматривать следствия из модели и проверять ее. С другой стороны, желательно, чтобы модель не уходила из поля зрения исследователя, чтобы ему все время был бы доступен ее содержательный просмотр, симультанное удержание, т. е. формализмы модели должны быть компактны и иметь "близкие" аналоги в самой моделируемой ситуации. Эти пожелания можно примирить, если строить модели-языки, задавая алфавиты, грамматики, синтаксис и заботясь каждый раз о создании такого языка, который был бы близок к естественному описанию феномена.
Мы не будем обсуждать здесь общие проблемы "лингвистического" моделирования. Позволим себе лишь указать на один из возможных путей построения моделей-языков, даже, точнее, моделей-словарей.
В последних работах, посвященных методологии моделирования, справедливо подчеркивается, что модель - всегда лишь перевод концепции в концепцию и формальной системы в формальную систему. Известно и то, что психология пока не располагает системами понятий, удобными для описания ее процессов и феноменов. И если для процессов, входящих в сегодняшнюю психологическую номенклатуру (восприятия, мышления и т. п.), есть какие-то конвенциальные системы понятий и представлений, могущие стать основаниями для формулировки первичных моделей, то для "комплексных" процессов, скажем, для зрительной классификации, их просто нет. Так что приходится одновременно уточнять структуру процесса с помощью модели и развивать сам внутрипсихологический понятийный аппарат, связанный с такими процессами.
Любая психическая деятельность является единством своих операционной и содержательной сторон. Иногда проявление обеих компонент этого единства или одной из них, можно непосредственно наблюдать в эксперименте. И, если удается проследить, скажем, набор операций, характерных для данной деятельности, и их отношения, то можно строить единицы этой деятельности, высказывать предположения о ее структуре. В результате выстраивается формальная "лингвистическая" система, алфавитом которой являются сами наблюдаемые операции, грамматикой - наблюдаемые отношения. Довести такую модель до ранга психологической теории много проще, чем модель, выращиваемую из жесткой математической схемы.
Конкретное применение такого подхода "естественного" моделирования к описанию процессов зрительной классификации и решения геометрических задач было осуществлено на факультете психологии МГУ в дипломных работах И. Карлинской, В. Петухова и Б. Сегаля. При изучении процесса зрительной классификации были получены в явном виде упорядоченные (по доступности использования для испытуемых) "операторы" (признаки) классификации. Анализ этих списков позволил высказать гипотезу о существовании упроченных базисных признаков, о механизме порождения новых признаков из базисных. Было выяснено, что использование некоторых признаков, а следовательно, и соответствующих им операций недоступно большинству взрослых здоровых испытуемых. Эти же операции легко применяются больными шизофренией, т. е. утеря операций, образно говоря, есть плата за сформированность систем базисных признаков. Устойчивость списка признаков, однородность по группе испытуемых заставляет верить, что результатом перцептивного опыта субъекта является не только изменение структуры и динамики процесса восприятия, увеличение емкости образных систем, но и их "прорастание" друг в друга. Модели могут позволить изучить эти закономерности прорастания координат систем классификации друг в друга. Во всяком случае, теперь мы можем в явном виде выписать грубую модель такого процесса и заняться ее уточнением.
Рассмотренный подход, как нам кажется, может быть полезен в тех случаях, когда изучается структура субъективных представлений о среде, о задаче деятельности и т. п.
Итак, просматривая смену подходов по мере уточнения самой психологической задачи, мы видим, что они движутся от применения жестких схем к построению систем в естественном языке явления. Все теснее становится связь метода и психологического содержания изучаемого объекта: формализмы "лингвистических" моделей уже прямо зависят от объекта. Такое тесное срастание, по-видимому, может привести к появлению специфических для психологии законов построения моделей, к возникновению новой аксиоматической теории, объектами которой были бы формализмы, а правилами вывода - те самые специфические законы. Именно такая теория, если она возникнет, будет иметь право на звание математической психологии.
Что же касается прогнозов о необходимости создания нового математического аппарата, новых математических идей, заметим только: пока не известно пи одной задачи, для решения которой (в адекватной постановке, разумеется) не хватило бы существующего запаса методов. Острейшие трудности, по-прежнему, заключены в стыковке явления и модели, за дачи и метода. Окончательному взаимопрорастанию наук, математики и психологии, должен предшествовать неокончившийся еще процесс взаимопривыкания людей, психологов и математиков, и взаимопроникновения методологий, психологической и математической. А преодоление методологических трудностей - все еще пока первейшая задача.