
Как лингвисты расшифровывают язык вымерших цивилизаций с помощью нейросетей
Летние археологические экспедиции — не только про пыль, солнце и древние черепки. Сегодня, в разгар сезона полевых раскопок, внимание учёных всё чаще переключается с предметов — на звуки. Точнее, на языки, давно исчезнувшие и оставившие после себя только надписи на глине, камне или коже.
До недавнего времени чтение этих письмен было сродни угадыванию. Шумерский, этрусский, протоэламитский — для большинства таких языков не сохранилось ни "живых" носителей, ни двуязычных надписей. Но в 2024 году у лингвистов появился неожиданный союзник: нейросети нового поколения, способные не просто обрабатывать данные, но и предсказывать смысл давно забытых слов.
Что делает нейросеть? Она обучается на известных языках, выявляя закономерности в структуре и синтаксисе. Затем применяет это знание к неизвестным текстам. Слово за словом, фраза за фразой — и вот на месте непонятных символов начинает появляться связное повествование.
Например, одна из моделей — Decipher, разработанная в Массачусетсе, — смогла интерпретировать целые фразы на угаритском языке, используя сравнение с семитскими языками. Нейросеть "угадывает", что означает тот или иной символ, исходя из его окружения. Это как сложная кроссвордная игра, только на несколько тысяч лет глубже.
Интересно, что алгоритмы не просто распознают, а интуитивно догадываются о смысле. Так, при анализе текста на линейном письме A (микенская цивилизация) модель указала на повторяющиеся шаблоны, которые, по её "мнению", относятся к счёту и торговле. Для историков это — ценный след.
Тем не менее, точность — пока не стопроцентная. Машина может указать направление, но ключевое решение остаётся за человеком. Нейросеть — это лупа, не ответ.
Особенно эффектно работают эти методы летом, когда появляется новый материал с раскопок. Вместо многолетнего ожидания, его теперь можно "скормить" алгоритму — и получить первичную интерпретацию за сутки.
Но тут возникает другой вопрос: насколько можно доверять переводу, который сделала машина, не знающая ни культуры, ни контекста? Некоторые исследователи уже высказывают тревогу: не станем ли мы видеть в древнем мире то, чего там не было?
И всё же потенциал огромен. Учитывая, что человечество потеряло тысячи языков, новые технологии становятся шансом услышать "голоса мёртвых". Причём — буквально. В перспективе, эти тексты можно будет озвучить и "восстановить" звучание языка, исчезнувшего до нашей эры.
Так что этим летом археология стала ближе к киберпанку, чем к "Индиане Джонсу". И, возможно, где-то на дне раскопа нейросеть уже прочла первую строку романа, написанного 5000 лет назад.
Подписывайтесь на Экосевер