Искусственный интеллект
Искусственный интеллект
Юрий Манаков Опубликована сегодня в 7:34

Искусственный интеллект заговорил языком предков: в Новгороде создали уникальную систему

В Новгородском университете разработали ИИ-систему для распознавания древнерусских текстов

Молодой исследователь из Великого Новгорода предложил решение, которое может навсегда изменить работу с древними рукописями. Магистрант Новгородского государственного университета (НовГУ) Иван Филиппов разработал нейросеть, способную автоматически расшифровывать берестяные грамоты с точностью до 98%. Проект получил грант в 1 миллион рублей по программе "Студенческий стартап".

Почему расшифровка древнерусских текстов так сложна

Берестяные грамоты — уникальные источники сведений о языке и быте средневековой Руси. Только в Новгороде археологи нашли более 1200 таких документов, однако их ручная расшифровка занимает месяцы, а иногда и годы.

Трудности создают особенности древнерусского письма: множество вариантов начертания букв, исчезнувшие символы, редкие диакритические знаки. Стандартные алгоритмы компьютерного зрения с ними не справляются. Поэтому Филиппов решил создать специализированную нейросеть, адаптированную именно под палеографические особенности древних текстов.

Как работает система

Разработка состоит из двух основных модулей — детектора и распознавателя.

  1. Детектор анализирует изображение грамоты и находит отдельные буквы. Он заключает каждую из них в прямоугольную область — "бокс", чтобы отделить символы друг от друга.

  2. После этого система сегментирует изображение, объединяет соседние боксы, выстраивает их в строки и отправляет на обработку в нейросеть ResNet-18 - свёрточную модель, обученную на изображениях древних букв.

Для обучения использовались пять эталонных грамот с ручной разметкой, выбранных по качеству сохранности и разнообразию начертаний. Чтобы увеличить количество данных, разработчик дополнил набор автоматически вырезанными символами, полученными с помощью детектора.

Результаты распознавания сохраняются в формате PNG и могут быть экспортированы для последующей аналитики.

"Модель обрабатывает изображение за 1-2 секунды с точностью 98%. Это в десятки раз быстрее ручного анализа", — рассказал автор проекта Иван Филиппов.

Интерфейс и возможности приложения

Готовое приложение имеет интуитивно понятный интерфейс. Система позволяет загружать фотографии берестяных грамот, масштабировать изображение, перемещать его в пределах рабочего поля и редактировать результат вручную.

Распознанные символы можно экспортировать в виде текстовых файлов, что облегчает дальнейшее сравнение, анализ и архивацию. Инструмент уже готов к интеграции в научные проекты и может использоваться в археологии, палеографии и исторической лингвистике.

Преимущества нейросети

  1. Высокая точность. Ошибка распознавания не превышает 2%, что делает систему пригодной для научной работы.

  2. Скорость. Полная обработка одного изображения занимает не более двух секунд.

  3. Универсальность. Нейросеть можно адаптировать для анализа других старинных рукописей, включая церковные книги или летописи.

  4. Открытая архитектура. Система реализована на Python с использованием стандартных библиотек, поэтому легко интегрируется в сторонние приложения.

Ошибка → Последствие → Альтернатива

  1. Ошибка: использовать универсальные модели OCR без адаптации под древние символы.
    Последствие: неверное распознавание, потеря смысловых связей.
    Альтернатива: обучать специализированные нейросети на основе оцифрованных грамот с ручной разметкой.

  2. Ошибка: проводить расшифровку вручную без автоматизации.
    Последствие: длительный анализ и высокая вероятность человеческих ошибок.
    Альтернатива: использовать гибридный подход, где ИИ делает черновую расшифровку, а учёный её уточняет.

  3. Ошибка: не учитывать контекст и соседние символы при обработке.
    Последствие: искажение орфографии и смыслов древнерусского текста.
    Альтернатива: внедрять постобработку на основе языковых моделей, учитывающих грамматику эпохи.

А что если применить нейросеть шире?

Созданная система может найти применение не только в археологии. Аналогичные подходы можно использовать для:

  • расшифровки старинных карт и документов,

  • восстановления повреждённых архивных записей,

  • автоматической датировки рукописей по стилю письма,

  • создания интерактивных музеев, где посетители смогут "читать" древние тексты с помощью ИИ.

Плюсы и минусы технологии

Критерий Преимущества Ограничения
Скорость обработки 1-2 секунды на документ Требуется качественное изображение
Точность распознавания До 98% Возможны ошибки при повреждениях грамот
Гибкость модели Легко адаптируется под другие алфавиты Нужен большой набор обучающих данных
Простота интеграции Реализована на Python Требуется мощный графический процессор

Мифы и правда

Миф 1. Искусственный интеллект не может работать с древними текстами.
Правда: современные нейросети способны адаптироваться к нестандартным шрифтам и символам при правильной разметке данных.

Миф 2. Машина не способна заменить палеографа.
Правда: нейросеть не заменяет специалиста, но ускоряет его работу, исключая рутинные операции.

Миф 3. Для обучения ИИ нужны тысячи документов.
Правда: при правильной архитектуре и разметке достаточно нескольких десятков хорошо сохранённых образцов.

Три интересных факта

  1. Берестяные грамоты впервые были найдены в Новгороде в 1951 году и стали одним из крупнейших археологических открытий XX века.

  2. На сегодняшний день расшифровано более 1100 грамот, но многие всё ещё ждут интерпретации.

  3. Применение ИИ в палеографии уже используется в проектах Оксфордского и Кембриджского университетов, однако российская модель — одна из первых, созданных специально для древнерусского письма.

Исторический контекст

  1. В XII-XIV веках берестяные грамоты служили основным средством письменной коммуникации между горожанами.

  2. Большинство текстов были написаны обыкновенными жителями — купцами, ремесленниками и даже детьми.

  3. Современные технологии позволяют не только читать эти письма, но и восстанавливать повреждённые фрагменты, сохраняя их в цифровых архивах.

Подписывайтесь на Экосевер

Читайте также

Исследование НовГУ: рацион с жирным мясом и картофелем в два раза повышает риск ожирения у детей сегодня в 8:09
Жирное мясо с картошкой оказалось опаснее сладостей: врачи шокированы результатами

Учёные НовГУ доказали, что жирное мясо с картошкой опаснее сладостей. Такая еда формирует ожирение уже в детстве и повышает риск гипертонии во взрослом возрасте.

Читать полностью »
Российские учёные разработали катализатор на основе бентонита для очистки нефтепродуктов вчера в 23:59
Из грязи — в чистоту: глина Новосибирска очистит нефть лучше любой химии

Учёные из Новосибирска нашли способ очищать нефть при помощи глины. Разработка оказалась не только дешёвой, но и экологичной — и уже готовится к промышленным испытаниям.

Читать полностью »
Учёные впервые задокументировали, как летучая мышь ловит и ест птиц в воздухе вчера в 23:37
Охота в небе: учёные зафиксировали, как летучая мышь поймала малиновку в полёте

После 25 лет ожидания учёные доказали: крупнейшая летучая мышь Европы ловит и съедает птиц прямо в воздухе. Как вечерницы превратились в ночных охотников на уровне соколов.

Читать полностью »
Американские исследователи объяснили природу призраков — вспышек болотного света вчера в 22:56
Учёные засняли рождение призраков: разгадана тайна блуждающих огоньков

Американские учёные впервые засняли рождение "блуждающих огоньков". Исследование показало: призрачное свечение возникает из-за микромолний, воспламеняющих пузырьки метана в болотной воде.

Читать полностью »
Учёные предупредили о риске утраты коралловых рифов и вымирания Амазонии при потеплении выше 1,5 °C вчера в 21:16
Учёные предупредили: Земля вошла в новую реальность, где климат больше не подчиняется правилам

Учёные предупреждают: Земля приближается к климатической точке невозврата. Если температура превысит 1,5 °C, планету ждут необратимые изменения — от гибели Амазонии до остановки океанических течений.

Читать полностью »
ИИ совершил прорыв в физике, найдя способ решения задачи трёх тел вчера в 20:41
Прорыв, меняющий астрофизику: ИИ научился предсказывать поведение звёзд

Искусственный интеллект впервые предложил точный метод прогнозирования движения трёх тел, решив задачу, над которой человечество бьётся веками. Что это значит для науки и космоса?

Читать полностью »
Университет Бристоля: ночная активность в соцсетях связана с ухудшением психического здоровья вчера в 19:10
Один твит после полуночи — и мозг не отдыхает: как ночная активность разрушает сон

Учёные из Британии выяснили, что ночная активность в соцсетях повышает тревожность и нарушает сон. Почему посты после полуночи вредят психике и как восстановить режим.

Читать полностью »
Учёные из Цюриха и Кливленда доказали связь между загрязнением воздуха и ожирением вчера в 18:05
Дышишь — и толстеешь: загрязнение воздуха влияет на обмен веществ

Учёные доказали, что загрязнение воздуха влияет на обмен веществ и может вызывать диабет и ожирение. Как частицы пыли вмешиваются в работу наших генов и бурого жира.

Читать полностью »

Новости

На Камчатке суд продлил арест обвиняемому в особо тяжком наркопреступлении до 17 ноября
В Госдуме предложили ввести единую транспортную карту для студентов с льготами на билеты
Эксперт по домашней кухне назвал макароны по-флотски символом уюта и простоты в холодный сезон
Фуд-блогеры считают фаршированные перцы с томатным соусом классикой домашней кухни осеннего сезона
Врачи предупредили: мода среди зумеров на психиатрический детокс может закончиться зависимостью
Товарооборот России и Китая за девять месяцев 2025 года снизился на 9,4% — данные КНР
Экологи предупредили об угрозе катастрофы из-за строительства мегаплотины в Тибете
В Архангельской области нашли алмаз весом 340 карат — один из крупнейших в России