Лингвистика для школьников

Что в символе тебе моём

27.06.2014

Что в символе тебе моём

Почти год назад увидела свет книга Вяч. Вс. Иванова «От буквы и слога к иероглифу: Системы письма в пространстве и времени», — надеемся, некоторые из вас с тех пор успели ее прочесть (остальным настоятельно советуем). Сегодня, в продолжение этой темы, речь пойдет о том, чем письменность отличается от не-письменности.

В июньском издании журнала Language вышла статья американского лингвиста Ричарда Спроута (Sproat), научного сотрудника корпорации Google, под названием «Сопоставительный статистический анализ письменной формы языка и нелингвистических знаковых систем». Кириллический или латинский алфавит, китайские иероглифы, арабская вязь — все это способы записи текстов на естественном языке, языке человеческого общения. Однако в мире есть масса вещей, которые мы фиксируем, не связывая с ними ни буквы, ни слоги, ни слова нашего языка: например, математические символы, для которых в разных языках есть масса разных названий. Как же отличить одно от другого? Казалось бы, никакой проблемы и нет, ведь любой школьник знает, что математические значки — это одно, а буквы русского языка — другое. Ну а если перед вами символы, которых вы никогда раньше не видели?

На первый взгляд, сделать это совершенно невозможно. Лингвисты, тем не менее, и раньше предлагали решения этого вопроса, однако Спроут отвергает старые предложения и показывает продуктивность метода, основанного на вычислении двух величин: относительной частоты повторения символов и меры неопределенности появления биграмм (сочетаний из двух букв). Если символы в тексте повторяются слишком часто (как в двоичном коде) или не повторяются вовсе, это показывает неязыковое поведение системы; кроме того, в неязыковых системах количество реально встречающихся биграмм не так значительно отличается от теоретически возможного максимального количества, как в текстах на естественном языке.

Как считает Спроут, такое поведение систем письма поддается довольно простому объяснению: тексты на естественном языке в среднем гораздо длиннее, чем какие бы то ни было наборы нелингвистических символов, и обе предложенные величины коррелируют с этим параметром. Так, в длинной последовательности будет встречаться гораздо больше повторов одного и того же символа, а разрыв между общим числом биграмм и количеством их типов будет, предположительно, только возрастать с увеличением длины текста. Поэтому ученый предостерегает от поспешных выводов и обращает внимание на то, что его методика может сделать только предположение о принадлежности данной системы к тому или иному типу, а окончательным решением вопроса может служить только признанная дешифровка письма. Кстати, согласно его результатам, пиктские пиктограммы не принадлежат к способам записи естественного языка. Что ж, это досадно, но кажется, что отчаянных романтиков, которые ищут славы дешифровщиков неизвестных письменностей, это вряд ли остановит.

Антон Кухто


Назад

####

Заочный конкурс
по решению
лингвистических задач

подробнее





подробнее
<img src="/bitrix/images/fileman/htmledit2/php.gif" __bxsrc="/bitrix/images/fileman/htmledit2/php.gif" border="0" __bxtagname="php" __bxcontainer="{'code': '<?$APPLICATION->ShowTitle()?>'}" />
Лингвистика для школьников
© Совет сайта "Лингвистика для школьников", 2009-2020