Почерк XVIII века стал прозрачным: новая технология Google видит смысл там, где люди видят каракули
Иногда новые технологии меняют представление о возможностях так стремительно, что даже опытные исследователи оказываются удивлены. Именно это произошло после того, как Google начал закрытое тестирование новой модели искусственного интеллекта, способной расшифровывать трудночитаемые рукописные документы. По отзывам специалистов, система демонстрирует результаты, близкие к работе профессиональных историков и архивистов, — а местами даже превосходит их по точности.
Модель пока не получила официального названия, но, как предполагают СМИ, функционирует на базе AI Studio. Первые испытания показали: ИИ уверенно работает с рукописями XVIII-XIX веков, справляется со сложным почерком, устаревшими формами слов и нестандартной пунктуацией. Это делает инструмент потенциально революционным для историков, музеев, архивов и всех, кто занимается оцифровкой культурного наследия.
Как специалисты оценили точность новой ИИ-модели
Первым, кому показали её возможности, стал заведующий кафедрой вычислительной нейробиологии Ноттингемского университета Марк Хамфрис. Для эксперимента ему предоставили не пять стандартных образцов, а трудные, ранее не публиковавшиеся рукописи. Задача была максимально близка к реальной научной работе — без подсказок и ранее известных текстов.
ИИ допустил примерно 1,7% ошибок, причем большинство относилось не к словам, а к пунктуации и заглавным буквам. Если исключить мелкие артефакты, итоговое отклонение снизилось до 0,56% — то есть примерно одна ошибка на 200 символов. Подобный уровень точности характерен для профессиональных историков, которые, сталкиваясь с нечёткими фрагментами, добавляют пометки вроде [неразборчиво] или допускают минимальные неточности.
Эксперты отмечают, что машина прекрасно справилась с документами самых разных типов — личными дневниками, торговыми записями, заметками, написанными неровным почерком, и листами с изношенной структурой бумаги.
Когда ИИ не просто читает текст, а делает выводы
Одним из самых удивительных моментов стал пример с дневником английского торговца XVIII века. В записи о покупке сахара было указано лишь число "145" — без единиц измерения. ИИ преобразовал его в "14 фунтов 5 унций". Это оказалось не предположением, а результатом вычислений: модель сопоставила общую стоимость покупки, систему мер того времени и курс валют.
Такой уровень контекстного анализа стал неожиданностью даже для специалистов. Фактически модель не ограничилась распознаванием текста — она реконструировала смысловую часть записи, применив исторические знания.
Сравнение: возможности ИИ и традиционной расшифровки
| Параметр | Профессиональный историк | Новая ИИ-модель Google |
| Скорость расшифровки | От нескольких часов до дней | Минуты или секунды |
| Ошибки | Возможны, особенно при плохом почерке | 0,56-1,7%, в основном пунктуация |
| Работа с контекстом | Требует опыта | Способна анализировать систему мер и валют |
| Зависимость от качества рукописи | Высокая | Снижена за счёт нейросетевых методов |
| Масштабируемость | Ограничена человеком | Практически неограничена |
Советы шаг за шагом: как ИИ может помочь архивистам и историкам
-
Использовать ИИ для первичной расшифровки объёмных корпусов текстов.
-
Применять модель как вспомогательный инструмент, ускоряющий анализ больших архивов.
-
Привлекать ИИ для реконструкции утерянных фрагментов или уточнения контекста.
-
Сравнивать расшифровку модели с оригиналом, избегая распространённых ошибок автоматизации.
-
Организовывать цифровые архивы, где ИИ обрабатывает новые документы сразу при загрузке.
Ошибка → Последствие → Альтернатива
• Ошибка: полностью доверять машине без проверки человеком.
Последствие: неточности в публикациях, искажение исторических данных.
Альтернатива: использовать ИИ как ускоритель, но не как конечный источник.
• Ошибка: вводить ИИ в архивный процесс без обучения сотрудников.
Последствие: неправильное использование алгоритма и некорректная расшифровка.
Альтернатива: проводить тренинги и интегрировать ИИ-процессы постепенно.
• Ошибка: ожидать от модели универсального понимания всех стилей письма.
Последствие: ошибки на нестандартных рукописях.
Альтернатива: дополнять обучение новыми историческими корпусами.
А что если историческая наука полностью перейдёт на ИИ?
Специалисты уверяют: полная автоматизация невозможна и нежелательна. Машина может ускорять процесс и помогать в рутинных задачах, но не заменит эксперта, который умеет интерпретировать культурные, исторические и семантические нюансы.
ИИ становится не заменой, а партнёром — инструментом, который освобождает исследователя от механической работы и даёт возможность сосредоточиться на анализе и интерпретации.
Плюсы и минусы ИИ-расшифровки архивов
| Плюсы | Минусы |
| Экономия времени исследователей | ИИ не понимает культурный контекст глубоко |
| Высокая точность распознавания | Ошибки всё равно требуют корректировки |
| Возможность массовой оцифровки | Сложность обучения на редких языках |
| Способность восстанавливать смысл | Опасность ошибочных интерпретаций |
FAQ
1. Может ли ИИ заменить архивиста?
Нет. ИИ ускоряет работу, но интерпретация остаётся задачей человека.
2. Работает ли модель с разными языками?
Потенциально — да, особенно с европейскими письменными традициями, но точность зависит от корпуса.
3. Можно ли использовать ИИ для юридически значимых документов?
Только после проверки специалистом.
Мифы и правда о цифровой расшифровке
• Миф: ИИ всегда понимает смысл текста.
Правда: он использует статистические модели и может ошибаться в сложных контекстах.
• Миф: машина работает идеально с любым почерком.
Правда: сильно испорченные рукописи вызывают трудности.
• Миф: цифровизация сделает архивистов ненужными.
Правда: наоборот, создаёт новые задачи и повышает значимость экспертов.
Три интересных факта
-
Ошибка 0,56% — показатель, сопоставимый с профессиональными дешифровщиками XVIII века.
-
AI Studio — платформа, на которой Google тестирует большинство моделей взаимодействия с текстом.
-
ИИ способен одновременно распознавать текст и анализировать экономические данные эпохи.
Исторический контекст
• В XIX веке расшифровка рукописей была делом отдельных специалистов-палеографов.
• XX век принёс массовую оцифровку, но расшифровка оставалась ручной.
• XXI век стал эпохой перехода от сканирования к интеллектуальной обработке.
Работы в этом направлении идут и внутри страны.
Сбер создаёт ИИ для обработки рукописей из национальных архивов, включая проект по документам Петра I — одной из ключевых коллекций российской истории.
Яндекс разрабатывает систему для поиска и дешифровки метрических книг, церковных документов и других рукописей, связанных с родословной и культурным наследием.
Эти технологии уже помогают историкам быстрее работать с массивами источников.
Подписывайтесь на Экосевер