Math Ajax

среда, 9 января 2019 г.

"Язык как инстинкт" Пинкера, часть 2: аргумент от бедности стимула

К выводу о реконструкции языка можно прийти и из более теоретических соображений. 

Главным аргументом самого Хомского является «бедность стимула» (Poverty of Stimulus): объём данных, получаемый ребёнком в процессе обучения, совершенно недостаточен для того чтобы восстановить правила языка с нуля. Мне кажется, что Стивен Пинкер недооценивает убедительность этого аргумента, поэтому я хочу остановиться на нём поподробнее.

Построение вопросов в английском языке – классический пример этого аргумента. Кратко рассмотрим его.

Как известно, для того, чтобы получить общий вопрос, требуется перенести вспомогательный (либо модальный) глагол на место перед подлежащим. Маленькие дети успешно вычленяют эту закономерность в известных им предложениях (на основе корректно сформулированных вопросов, услышанных от взрослых). Тем не менее, известные ребёнку к этому моменту примеры не позволяют сузить класс гипотез до единственной правильной.

Вспомним о предложениях, имеющих более одного вспомогательного глагола: например, «John is saying that Mary could sing» или «The doll that was in a store is pretty». В этом случае возникает неоднозначность в том, какой именно глагол переносится в начало. Данную задачу можно решить бесконечным числом способов.

Возьмём какую-нибудь пару из предложения и соответствующего ему вопроса (например, “John is outside” и “Is John outside?“). Эта пара согласуется с “истинным” правилом построения вопроса. Однако, если предложение имеет лишь один глагол, то эта пара согласуются ещё и с правилом «перенеси в начало тот глагол, который ближе к началу предложения», или даже с правилом «перенеси в начало тот глагол, в котором меньше всего букв».

Представим себе какого-нибудь марсианина, не имеющего никаких представлений о структуре человеческого языка и изучающего правила с абсолютного нуля. В такой ситуации он не сможет угадать настоящее правило «перенеси в начало главный глагол» с первого раза.

Какие правила он рассмотрит в первую очередь? Если он будет основываться на бритве Оккама, то он не станет без нужды вводить нетривиальное понятие “главный глагол”, а ограничиться более простой сущностью “первый глагол”. Даже в этом случае наивно было бы считать что он с первого раза определит сложные правила о том, какой именно глагол является главным.

Поскольку в этом и подобных случаях человеческие дети способны безошибочно выбирать правильные гипотезы, то они должны иметь какие-то врождённые представления о структуре языка.

Ещё больше этот аргумент усиливается, если ввести разделение на положителньые примеры (positive evidence) и отрицательные примеры (negative evidence). Положительные примеры --- это примеры предложений, про которые ребёнку известно, что они грамматически корректны (к таким предложениям относятся все предложения, услышанные от взрослых). Отрицательные примеры --- это предложения, про которые известно, что они не являются правильными.

Единственный доступный ребёнку источник отрицательных примеров --- это обратная связь от взрослых. Услышав неправильное предложение (например, “I is ready” вместо “I am ready”), взрослый может поправить ребёнка, каким-то образом выразить своё неодобрение, или просто неправильно истолковать произнесенную фразу.

Эмпирические исследования показывают, что подобные ситуации встречаются достаточно редко. Как правило, вероятность одобрения или неодобрения не зависит от грамматичности произнесённой фразы.

Кроме того, существуют основания считать, что дети в принципе не воспринимают негативные примеры. Например, авторы статьи “Does Negative Feedback Have an Effect on Language Acquisition?” (ссылка: http://eoa.umontreal.ca/wp-content/uploads/sites/32/publicationsRoyleP_Kulinich_BUCLD39.pdf ) изучали русскоязычных детей, овладевающих морфологией.



В русском языке форма первого лица у глагола образуется по-разному. Основа некоторых глаголов сохраняется целиком (например “читать --- читаю”). Но у некоторых глаголов из основы исчезает суффикс (например, правильная форма глагола “рисовать” --- “рисую”, а не “рисоваю”). Маленькие дети часто совершают ошибки, употребляя некорректные формы, такие как “доставаю” или “танцеваю”.

В рамках исследования трёхлетних детей, разделённых на несколько групп, просили описывать изображённое на картинке. Если ребёнок отвечал неправильной фразой (“Что делает эта девочка?” --- “Она плакает”), то ему давали или не давали обратной связи (это зависело от того, в какой группе он находится). На протяжении нескольких таких сессий исследователи записывали процент верных и неверных ответов.

В результате между группами не обнаружилось статистически значимой разницы. Это говорит в пользу гипотезы о том, что обратная связь не слишком важна для приобретения языка.

Если посмотреть на эту ситуацию через призму машинного обучения, то способность детей обучиться языку, используя лишь положительные примеры, является чем-то поразительным.

Теория машинного обучения занимается задачами обучения по прецедентам. Решение таких задач в общем виде требует либо большого количества положительных и отрицательных примеров, либо дополнительной информации об искомой закономерности.

На мой взгляд, одни только эти соображения уже позволяют сделать обоснованный вывод о том, что какая-то часть лингвистических правил является врождённой.

Язык мышления и структура языка

Как могут выглядеть эти врождённые правила? В следующей серии будет рассказ о них, а также ответ на загадку "главного глагола".




Комментариев нет:

Отправить комментарий