Искусственный интеллект
Искусственный интеллект
Юрий Манаков Опубликована 14.10.2025 в 7:34

Искусственный интеллект заговорил языком предков: в Новгороде создали уникальную систему

В Новгородском университете разработали ИИ-систему для распознавания древнерусских текстов

Молодой исследователь из Великого Новгорода предложил решение, которое может навсегда изменить работу с древними рукописями. Магистрант Новгородского государственного университета (НовГУ) Иван Филиппов разработал нейросеть, способную автоматически расшифровывать берестяные грамоты с точностью до 98%. Проект получил грант в 1 миллион рублей по программе "Студенческий стартап".

Почему расшифровка древнерусских текстов так сложна

Берестяные грамоты — уникальные источники сведений о языке и быте средневековой Руси. Только в Новгороде археологи нашли более 1200 таких документов, однако их ручная расшифровка занимает месяцы, а иногда и годы.

Трудности создают особенности древнерусского письма: множество вариантов начертания букв, исчезнувшие символы, редкие диакритические знаки. Стандартные алгоритмы компьютерного зрения с ними не справляются. Поэтому Филиппов решил создать специализированную нейросеть, адаптированную именно под палеографические особенности древних текстов.

Как работает система

Разработка состоит из двух основных модулей — детектора и распознавателя.

  1. Детектор анализирует изображение грамоты и находит отдельные буквы. Он заключает каждую из них в прямоугольную область — "бокс", чтобы отделить символы друг от друга.

  2. После этого система сегментирует изображение, объединяет соседние боксы, выстраивает их в строки и отправляет на обработку в нейросеть ResNet-18 - свёрточную модель, обученную на изображениях древних букв.

Для обучения использовались пять эталонных грамот с ручной разметкой, выбранных по качеству сохранности и разнообразию начертаний. Чтобы увеличить количество данных, разработчик дополнил набор автоматически вырезанными символами, полученными с помощью детектора.

Результаты распознавания сохраняются в формате PNG и могут быть экспортированы для последующей аналитики.

"Модель обрабатывает изображение за 1-2 секунды с точностью 98%. Это в десятки раз быстрее ручного анализа", — рассказал автор проекта Иван Филиппов.

Интерфейс и возможности приложения

Готовое приложение имеет интуитивно понятный интерфейс. Система позволяет загружать фотографии берестяных грамот, масштабировать изображение, перемещать его в пределах рабочего поля и редактировать результат вручную.

Распознанные символы можно экспортировать в виде текстовых файлов, что облегчает дальнейшее сравнение, анализ и архивацию. Инструмент уже готов к интеграции в научные проекты и может использоваться в археологии, палеографии и исторической лингвистике.

Преимущества нейросети

  1. Высокая точность. Ошибка распознавания не превышает 2%, что делает систему пригодной для научной работы.

  2. Скорость. Полная обработка одного изображения занимает не более двух секунд.

  3. Универсальность. Нейросеть можно адаптировать для анализа других старинных рукописей, включая церковные книги или летописи.

  4. Открытая архитектура. Система реализована на Python с использованием стандартных библиотек, поэтому легко интегрируется в сторонние приложения.

Ошибка → Последствие → Альтернатива

  1. Ошибка: использовать универсальные модели OCR без адаптации под древние символы.
    Последствие: неверное распознавание, потеря смысловых связей.
    Альтернатива: обучать специализированные нейросети на основе оцифрованных грамот с ручной разметкой.

  2. Ошибка: проводить расшифровку вручную без автоматизации.
    Последствие: длительный анализ и высокая вероятность человеческих ошибок.
    Альтернатива: использовать гибридный подход, где ИИ делает черновую расшифровку, а учёный её уточняет.

  3. Ошибка: не учитывать контекст и соседние символы при обработке.
    Последствие: искажение орфографии и смыслов древнерусского текста.
    Альтернатива: внедрять постобработку на основе языковых моделей, учитывающих грамматику эпохи.

А что если применить нейросеть шире?

Созданная система может найти применение не только в археологии. Аналогичные подходы можно использовать для:

  • расшифровки старинных карт и документов,

  • восстановления повреждённых архивных записей,

  • автоматической датировки рукописей по стилю письма,

  • создания интерактивных музеев, где посетители смогут "читать" древние тексты с помощью ИИ.

Плюсы и минусы технологии

Критерий Преимущества Ограничения
Скорость обработки 1-2 секунды на документ Требуется качественное изображение
Точность распознавания До 98% Возможны ошибки при повреждениях грамот
Гибкость модели Легко адаптируется под другие алфавиты Нужен большой набор обучающих данных
Простота интеграции Реализована на Python Требуется мощный графический процессор

Мифы и правда

Миф 1. Искусственный интеллект не может работать с древними текстами.
Правда: современные нейросети способны адаптироваться к нестандартным шрифтам и символам при правильной разметке данных.

Миф 2. Машина не способна заменить палеографа.
Правда: нейросеть не заменяет специалиста, но ускоряет его работу, исключая рутинные операции.

Миф 3. Для обучения ИИ нужны тысячи документов.
Правда: при правильной архитектуре и разметке достаточно нескольких десятков хорошо сохранённых образцов.

Три интересных факта

  1. Берестяные грамоты впервые были найдены в Новгороде в 1951 году и стали одним из крупнейших археологических открытий XX века.

  2. На сегодняшний день расшифровано более 1100 грамот, но многие всё ещё ждут интерпретации.

  3. Применение ИИ в палеографии уже используется в проектах Оксфордского и Кембриджского университетов, однако российская модель — одна из первых, созданных специально для древнерусского письма.

Исторический контекст

  1. В XII-XIV веках берестяные грамоты служили основным средством письменной коммуникации между горожанами.

  2. Большинство текстов были написаны обыкновенными жителями — купцами, ремесленниками и даже детьми.

  3. Современные технологии позволяют не только читать эти письма, но и восстанавливать повреждённые фрагменты, сохраняя их в цифровых архивах.

Автор Юрий Манаков
Юрий Манаков — журналист, корреспондент Экосевер

Подписывайтесь на Экосевер

Читайте также

Раскрыто, почему штормы запускают длительную тьму под водой сегодня в 3:03
Темнота приходит с водой внезапно и надолго: явление меняет океан

Шокирующие подробности о "морских темных волнах" — временных и интенсивных периодах темноты в океане, которые могут разрушительно повлиять на подводные экосистемы.

Читать полностью »
Бани Помпей оказались одними из самых грязных в античном мире вчера в 22:34
Мерзкий запах истории: вот как бани Помпей скрывали антисанитарию

Учёные раскрыли шокирующие подробности о гигиене в древних Помпеях. Общественные бани города шокировали антисанитарией — почему так происходило?

Читать полностью »
Археологическая находка в кампусе ТГУ перевернула карту Сибири вчера в 16:50
Земля помнит больше: под кампусом ТГУ ищут курган раннего средневековья

На территории Томского государственного университета могут скрываться археологические тайны. Что может рассказать это открытие о средневековой Сибири?

Читать полностью »
Спешка может быть признаком мошенничества — психолог Полянова вчера в 15:20
Он не оставляет вам времени: явный признак обманщика, о котором надо знать каждому

Психолог Людмила Полянова объяснила, как распознать недобросовестных людей и почему важно прислушиваться к внутренним сигналам, даже если все кажется безопасным.

Читать полностью »
Юпитер содержит больше кислорода, чем Солнце — The Planetary Science Journal 19.01.2026 в 19:30
На Юпитере атмосферно: учёные удивлены — как Юпитер накопил кислород, обогнав Солнце

В атмосфере Юпитера может содержаться в полтора раза больше кислорода, чем в Солнце. Новые исследования объясняют это удивительное открытие.

Читать полностью »
НАСА допускает археологические методы поиска внеземного разума 19.01.2026 в 12:15
Теперь внеземной разум будут искать археологи? НАСА удивила научный мир интересом к древним символам

НАСА исследует, как археология и антропология могут помочь в расшифровке сигналов от инопланетных цивилизаций, предлагая уникальные подходы к межзвездной коммуникации.

Читать полностью »
Вода могла быть поглощена мантией Земли с самого начала — Science 19.01.2026 в 3:55
Океаны, которых мы не видим: как глубинные минералы скрывают миллиарды литров воды

Новые данные открывают, как большая часть воды Земли могла остаться скрытой в недрах планеты, влияя на формирование океанов и поддержание водного баланса.

Читать полностью »
Обнаружена связь голодания с функциями мозга — Acta Physiologica 18.01.2026 в 21:29
Не только похудеете, но и развеселитесь: как прерывистое голодание помогает снизить тревогу

Как прерывистое голодание влияет на обмен веществ и здоровье мозга при ожирении? Узнайте о молекуле, которая может повысить ваше настроение.

Читать полностью »