Math Ajax

четверг, 10 января 2019 г.

"Язык как инстинкт" Пинкера, часть 3: универсальная структура языка


Язык мышления


Насколько человеческая мысль зависит от слов? На этот вопрос возможны по крайней мере две точки зрения.

Первая точка зрения утверждает, что люди буквально мыслят «по-русски», «по-английски» или, к примеру, «на китайском». Процесс мышления напрямую состоит из строк русского текста (а понятия, для которых нет слов, в самом прямом смысле являются “немыслимыми”). Этот взгляд находит своё выражение в известной гипотезе Сапира-Уорфа:

Мы рассекаем природу по линиям, проложенным нашим родным языком. Категории и типы, которые мы отделяем от мира явлений, мы не находим в этом мире, потому что они очевидны для каждого; напротив, мир представлен в виде калейдоскопа впечатлений, который должен быть организован нашим сознанием — и это означает лингвистической системой нашего сознания. Мы разрезаем природу, оформляем ее как концепт и приписываем ей значения, потому что мы связаны договором, предписывающим организовывать ее именно так — договором, который объединяет наше языковое сообщество и заложен в модели нашего языка. Разумеется, этот договор негласный и неофициальный, но его условия абсолютно обязательны; мы вообще не можем говорить иначе, как присоединяясь к классификации и организации данных, которую он предписывает.

(Бенджамин Ли Уорф)

Вторая точка зрения утверждает, что мысль состоит из объектов другой природы. Что объекты когнитивных операций не являются словами, или, по крайней мере, облачены в какие-то другие структуры, специфичные для разума, но отсутствующие в языке. Иными словами, существует особый язык мышления (который можно назвать “ментализ” (mentalese)), неэквивалентный языку естественному.

Реальное положение дел, по всей видимости, намного ближе к гипотезе языка мышления, чем к гипотезе Сапира-Уорфа (хотя нет сомнения в том, что естественный язык каким-то образом влияет на язык мышления).
В пользу этого говорит, например, неоднозначность предложений естественного языка.

Например, рассмотрим предложение “раскапывайте погребенных в земле слепых исполинов”. Это фраза имеет около двух десятков разных интерпретаций, которые удобно выделить, сгруппировав связанные слова при помощи скобок: например, “раскапывайте [погребенных в земле] [слепых исполинов]” (слепых исполинов нужно выкапывать из земли), “раскапывайте [погребенных [в земле [слепых исполинов]]” (у слепых исполинов есть местность, в которой кто-то закопан), или даже “раскапывайте [погребенных [в земле слепых] исполинов]” (исполины закопаны в земле, принадлежащей слепым; их следует раскопать).

Сам факт того, что эта фраза имеет разные “смыслы”, означает то, что смысл и фраза неравнозначны. Следовательно, в языке мышления есть что-то дополнительное, позволяющее различить эти два смысла. В своём разуме человек оперирует не просто с цепочками слов, а с некими другими, более сложными объектами



Структура языка и его понимание

Вернёмся к нашему примеру про трансформацию предложения «John is saying that Mary could sing» в вопрос «Is John saying that Mary could sing?». 

По какому правилу случилось это преобразование? Мы перенесли в начало первый глагол? Мы перенесли в начало самый короткий глагол? Если мы перенесли в начало «главный» глагол, то что такое «главный» и почему это правило кажется людям более естественным, чем остальные?

Согласно Хомскому, причина этого в том, что универсальная грамматика относится к математическому классу порождающих грамматик. Грамматически корректными являются те и только те предложения, которые получаются в результате применения определённых правил вывода. 

Процесс “создания” предложения можно представить в виде дерева вывода. Самый первый уровень понимания текста --- это понимание того, какому дереву вывода он соответствует. Переход от “плоского” предложения к дереву его разбора называется парсингом.

(на самом деле, универсальная грамматика Хомского включает себя не только деревья разбора, но и правила их трансформации. Например, правило «поставь в начало главный глагол»)

Таким образом, предложение не является просто цепочкой слов. Предложение - это иерархия, найти в которой “главный глагол” не составляет труда. Это объясняет, почему предложения так естественно анализировать, группируя слова внутри вложенных скобок (это уже затрагивалось в разделе про неоднозначность синтаксического разбора предложений). Как известно программистам, любую правильную скобочную последовательность можно представить в виде дерева и наоборот.

Парадокс построения вопросов в английском языке оказывается очень легко разрешимым, если принять тезис о том, что деревья разбора — это форма-образец, по которой отливаются предложения языка. «Главный глагол» предложения --- это просто глагол, входящий в самую первую скобку (или находящийся на самом верхнем уровне дерева). Если оперировать не с цепочкой слов, а с деревом разбора, то правило “выбери глагол с самого первого уровня” действительно является естественным первым кандидатом.

Ещё одна важная особенность универсальной грамматики заключается в том, что она в некотором смысле очень проста. Если дано дерево разбора предложения, то на многие вопросы можно ответить, даже не имея ни малейшего представления о смысле этого предложения. К таким вопросам относятся, например, «является ли это предложение корректным?», «как превратить это утверждение в вопрос?» и «какие объекты участвуют в этом предложении? Каковы логические отношения между ними?».

На вопросы, связанные со структурой предложения, можно отвечать, просто преобразуя дерево разбора механическим образом по определённым правилам. Аналогичным образом возможно и построить само дерево разбора.

Именно это и делают, например, компиляторы для языков программирования. Алгоритм их работы основан на идеях Хомского касательно парсинга контекстно-свободных грамматик.

Это основополагающий принцип вычислительной когнитивистики: процесс мышления сравнивается с работой компьютера, который преобразует некие символьные структуры согласно некоторому алгоритму. В частности, в человеке существует специализированный ментальный модуль парсинга, работающий по универсальным формальным правилам.

Продираясь сквозь синтаксический бурелом

В скобках отметим ещё один интересный аргумент за теорию Хомского. Человеку трудно читать те предложения, для которых парсеру контекстно-свободной грамматики требуется дополнительная память.

(Этот абзац можно перефразировать по-другому, сохранив его смысл, но сделав его очень трудным для понимания. Сравните:

Аргумент за теорию Хомского, состоящий в том, что человеку трудно читать предложения, требующие для парсера, предназначенного для обработки контекстно-свободной грамматики, описанной Хомским, дополнительной памяти, является довольно интересным.)

В качестве примера рассмотрим два предложения, аналогичных по глубине вложенности, но иначе структурированных.

Предложение [Удивительна [скорость [движения [крыла [колибри]]]]] читается с некоторым трудом, но в целом понятно. При этом единственный способ понять предложение [Скорость, [которую имеет движение, [которым обладает крыло [этой птицы] ] ] ] удивительна] --- это перечитать его несколько раз, осознанно разворачивая слои изнутри наружу.

Пирахан

На мой взгляд, сейчас необходимо остановится на одном распространённом заблуждении. Это отступление прояснит, чем является и чем не является теория Хомского.

Один из самых известных контраргументов к теории Хомского – это язык Пирахан, на котором говорит бразильский народ охотников-собирателей.

Пирахан не поддерживает рекурсии (хотя это утверждение является спорным). Например, на Пирахане невозможно сказать "дом брата Джона", вместо этого нужно сказать "у Джона есть брат. У этого брата есть дом".

Этот факт означает, что рекурсия не является универсальным свойством естественных языков. При этом рекурсия является самым главным свойством универсальной грамматики. Опровергает ли Пирахан теории Хомского?

На самом деле нет.

Хомский утверждает, что в мозге человека есть общечеловеческий “языковой орган”, умеющий оперировать с рекурсивными структурами, подобными деревьям разбора. До тех пор, пока все люди способны обучиться языку с рекурсией, существование языка без рекурсии не противоречит этой картине. И никто не ставит под сомнение тот факт, что дети племени Пирахан могут свободно говорить по-португальски.

Сам Хомский приводит следующую аналогию. Пусть исследователи обнаружили племя, люди которого закрывают один глаз чёрной повязкой. Это племя будет интересно антропологам, но оно не будет иметь никакого отношения к теориям бинокулярного зрения

Что было бы таким контраргументом? Например, существование языка, правила которого сформулированы не в терминах деревьев (“перенеси в начало главный глагол”), а в терминах линейного порядка (“перенеси в начало самый первый глагол”), нанесло бы теориям Хомского серьёзный удар. Пирахан таким серьёзным контраргументом не является.

Заключение

Тезис Хомского о врождённости языка имеет множество убедительных свидетельств в свою пользу. Язык представляет собой сложную структуру, изучить которую «с нуля» очень сложно. Дети не столько учатся языку, сколько реконструируют его. За восприятие языка отвечают определённые зоны мозга.

Сейчас теория Хомского об универсальной грамматике продолжает развиваться и оказывает сильное влияние на лингвистику, психологию, информатику и на современный мир в целом.