Искусственный интеллект
Искусственный интеллект
Юрий Манаков Опубликована 14.10.2025 в 7:34

Искусственный интеллект заговорил языком предков: в Новгороде создали уникальную систему

В Новгородском университете разработали ИИ-систему для распознавания древнерусских текстов

Молодой исследователь из Великого Новгорода предложил решение, которое может навсегда изменить работу с древними рукописями. Магистрант Новгородского государственного университета (НовГУ) Иван Филиппов разработал нейросеть, способную автоматически расшифровывать берестяные грамоты с точностью до 98%. Проект получил грант в 1 миллион рублей по программе "Студенческий стартап".

Почему расшифровка древнерусских текстов так сложна

Берестяные грамоты — уникальные источники сведений о языке и быте средневековой Руси. Только в Новгороде археологи нашли более 1200 таких документов, однако их ручная расшифровка занимает месяцы, а иногда и годы.

Трудности создают особенности древнерусского письма: множество вариантов начертания букв, исчезнувшие символы, редкие диакритические знаки. Стандартные алгоритмы компьютерного зрения с ними не справляются. Поэтому Филиппов решил создать специализированную нейросеть, адаптированную именно под палеографические особенности древних текстов.

Как работает система

Разработка состоит из двух основных модулей — детектора и распознавателя.

  1. Детектор анализирует изображение грамоты и находит отдельные буквы. Он заключает каждую из них в прямоугольную область — "бокс", чтобы отделить символы друг от друга.

  2. После этого система сегментирует изображение, объединяет соседние боксы, выстраивает их в строки и отправляет на обработку в нейросеть ResNet-18 - свёрточную модель, обученную на изображениях древних букв.

Для обучения использовались пять эталонных грамот с ручной разметкой, выбранных по качеству сохранности и разнообразию начертаний. Чтобы увеличить количество данных, разработчик дополнил набор автоматически вырезанными символами, полученными с помощью детектора.

Результаты распознавания сохраняются в формате PNG и могут быть экспортированы для последующей аналитики.

"Модель обрабатывает изображение за 1-2 секунды с точностью 98%. Это в десятки раз быстрее ручного анализа", — рассказал автор проекта Иван Филиппов.

Интерфейс и возможности приложения

Готовое приложение имеет интуитивно понятный интерфейс. Система позволяет загружать фотографии берестяных грамот, масштабировать изображение, перемещать его в пределах рабочего поля и редактировать результат вручную.

Распознанные символы можно экспортировать в виде текстовых файлов, что облегчает дальнейшее сравнение, анализ и архивацию. Инструмент уже готов к интеграции в научные проекты и может использоваться в археологии, палеографии и исторической лингвистике.

Преимущества нейросети

  1. Высокая точность. Ошибка распознавания не превышает 2%, что делает систему пригодной для научной работы.

  2. Скорость. Полная обработка одного изображения занимает не более двух секунд.

  3. Универсальность. Нейросеть можно адаптировать для анализа других старинных рукописей, включая церковные книги или летописи.

  4. Открытая архитектура. Система реализована на Python с использованием стандартных библиотек, поэтому легко интегрируется в сторонние приложения.

Ошибка → Последствие → Альтернатива

  1. Ошибка: использовать универсальные модели OCR без адаптации под древние символы.
    Последствие: неверное распознавание, потеря смысловых связей.
    Альтернатива: обучать специализированные нейросети на основе оцифрованных грамот с ручной разметкой.

  2. Ошибка: проводить расшифровку вручную без автоматизации.
    Последствие: длительный анализ и высокая вероятность человеческих ошибок.
    Альтернатива: использовать гибридный подход, где ИИ делает черновую расшифровку, а учёный её уточняет.

  3. Ошибка: не учитывать контекст и соседние символы при обработке.
    Последствие: искажение орфографии и смыслов древнерусского текста.
    Альтернатива: внедрять постобработку на основе языковых моделей, учитывающих грамматику эпохи.

А что если применить нейросеть шире?

Созданная система может найти применение не только в археологии. Аналогичные подходы можно использовать для:

  • расшифровки старинных карт и документов,

  • восстановления повреждённых архивных записей,

  • автоматической датировки рукописей по стилю письма,

  • создания интерактивных музеев, где посетители смогут "читать" древние тексты с помощью ИИ.

Плюсы и минусы технологии

Критерий Преимущества Ограничения
Скорость обработки 1-2 секунды на документ Требуется качественное изображение
Точность распознавания До 98% Возможны ошибки при повреждениях грамот
Гибкость модели Легко адаптируется под другие алфавиты Нужен большой набор обучающих данных
Простота интеграции Реализована на Python Требуется мощный графический процессор

Мифы и правда

Миф 1. Искусственный интеллект не может работать с древними текстами.
Правда: современные нейросети способны адаптироваться к нестандартным шрифтам и символам при правильной разметке данных.

Миф 2. Машина не способна заменить палеографа.
Правда: нейросеть не заменяет специалиста, но ускоряет его работу, исключая рутинные операции.

Миф 3. Для обучения ИИ нужны тысячи документов.
Правда: при правильной архитектуре и разметке достаточно нескольких десятков хорошо сохранённых образцов.

Три интересных факта

  1. Берестяные грамоты впервые были найдены в Новгороде в 1951 году и стали одним из крупнейших археологических открытий XX века.

  2. На сегодняшний день расшифровано более 1100 грамот, но многие всё ещё ждут интерпретации.

  3. Применение ИИ в палеографии уже используется в проектах Оксфордского и Кембриджского университетов, однако российская модель — одна из первых, созданных специально для древнерусского письма.

Исторический контекст

  1. В XII-XIV веках берестяные грамоты служили основным средством письменной коммуникации между горожанами.

  2. Большинство текстов были написаны обыкновенными жителями — купцами, ремесленниками и даже детьми.

  3. Современные технологии позволяют не только читать эти письма, но и восстанавливать повреждённые фрагменты, сохраняя их в цифровых архивах.

Автор Юрий Манаков
Юрий Манаков — журналист, корреспондент Экосевер

Подписывайтесь на Экосевер

Читайте также

Влечение непреодолимой силы: почему сверкающие грани кристаллов лишают покоя даже шимпанзе 10.03.2026 в 10:26

На стоянках древних предков находят странные коллекции прозрачных камней, которые не использовались в быту. Зачем же их хранили?

Читать полностью »
Лошадь по спецзаказу: в России родился первый жеребёнок из пробирки 10.03.2026 в 9:58

В России произошло событие, перевернувшее представления о разведении племенных лошадей. Жеребенок Эконика родился по методу ЭКО.

Читать полностью »
Космический бильярд: человечество учится двигать астероиды — планетам приготовиться 10.03.2026 в 7:14

Человечество в 2022 году впервые заставило небесное тело свернуть с привычного пути. Последствия прямого удара в глубоком космосе превзошли самые смелые ожидания физиков.

Читать полностью »
В полёт только с Таней: загадочное имя много лет охраняет российские ракеты от катастроф 10.03.2026 в 1:09

История имени Таня на корпусе ракет: странный обычай, который возник из-за влюблённого офицера и закрепился после череды опасных происшествий.

Читать полностью »
24 часа в сутках мешают жить: биологический маятник человека настроен на иные ритмы 09.03.2026 в 12:45

Ученые обнаружили пугающее несоответствие между земными сутками и внутренним таймером человека, который активируется в условиях полной изоляции от солнечного света.

Читать полностью »
Куда ведёт кроличья нора? Новые данные меняют предсталвение о Большом взрыве и Вселенной 09.03.2026 в 9:28

Старые расчеты великих физиков получили новое прочтение, которое меняет взгляд на природу пространства и возможность существования иных измерений в космосе.

Читать полностью »
Над Антарктидой пасмурное небо:  чем полярные облака удивили исследователей 09.03.2026 в 7:18

Исследователи на самолете Polar 6 проникли вглубь Антарктиды, чтобы разгадать механизм возникновения полярных облаков.

Читать полностью »
Утро вечера мудренее: стало ясно, как сон становится источником гениальных решений 09.03.2026 в 5:59
Ночная лаборатория смыслов:

Ученые нашли способ направлять работу подсознания во время отдыха, превращая обычные сны в эффективный механизм для поиска ответов на сложные рабочие задачи.

Читать полностью »