Монах за работой
Монах за работой
Сергей Данилов Опубликована сегодня в 17:17

Почерк XVIII века стал прозрачным: новая технология Google видит смысл там, где люди видят каракули

Google тестирует ИИ для расшифровки рукописей

Иногда новые технологии меняют представление о возможностях так стремительно, что даже опытные исследователи оказываются удивлены. Именно это произошло после того, как Google начал закрытое тестирование новой модели искусственного интеллекта, способной расшифровывать трудночитаемые рукописные документы. По отзывам специалистов, система демонстрирует результаты, близкие к работе профессиональных историков и архивистов, — а местами даже превосходит их по точности.

Модель пока не получила официального названия, но, как предполагают СМИ, функционирует на базе AI Studio. Первые испытания показали: ИИ уверенно работает с рукописями XVIII-XIX веков, справляется со сложным почерком, устаревшими формами слов и нестандартной пунктуацией. Это делает инструмент потенциально революционным для историков, музеев, архивов и всех, кто занимается оцифровкой культурного наследия.

Как специалисты оценили точность новой ИИ-модели

Первым, кому показали её возможности, стал заведующий кафедрой вычислительной нейробиологии Ноттингемского университета Марк Хамфрис. Для эксперимента ему предоставили не пять стандартных образцов, а трудные, ранее не публиковавшиеся рукописи. Задача была максимально близка к реальной научной работе — без подсказок и ранее известных текстов.

ИИ допустил примерно 1,7% ошибок, причем большинство относилось не к словам, а к пунктуации и заглавным буквам. Если исключить мелкие артефакты, итоговое отклонение снизилось до 0,56% — то есть примерно одна ошибка на 200 символов. Подобный уровень точности характерен для профессиональных историков, которые, сталкиваясь с нечёткими фрагментами, добавляют пометки вроде [неразборчиво] или допускают минимальные неточности.

Эксперты отмечают, что машина прекрасно справилась с документами самых разных типов — личными дневниками, торговыми записями, заметками, написанными неровным почерком, и листами с изношенной структурой бумаги.

Когда ИИ не просто читает текст, а делает выводы

Одним из самых удивительных моментов стал пример с дневником английского торговца XVIII века. В записи о покупке сахара было указано лишь число "145" — без единиц измерения. ИИ преобразовал его в "14 фунтов 5 унций". Это оказалось не предположением, а результатом вычислений: модель сопоставила общую стоимость покупки, систему мер того времени и курс валют.

Такой уровень контекстного анализа стал неожиданностью даже для специалистов. Фактически модель не ограничилась распознаванием текста — она реконструировала смысловую часть записи, применив исторические знания.

Сравнение: возможности ИИ и традиционной расшифровки

Параметр Профессиональный историк Новая ИИ-модель Google
Скорость расшифровки От нескольких часов до дней Минуты или секунды
Ошибки Возможны, особенно при плохом почерке 0,56-1,7%, в основном пунктуация
Работа с контекстом Требует опыта Способна анализировать систему мер и валют
Зависимость от качества рукописи Высокая Снижена за счёт нейросетевых методов
Масштабируемость Ограничена человеком Практически неограничена

Советы шаг за шагом: как ИИ может помочь архивистам и историкам

  1. Использовать ИИ для первичной расшифровки объёмных корпусов текстов.

  2. Применять модель как вспомогательный инструмент, ускоряющий анализ больших архивов.

  3. Привлекать ИИ для реконструкции утерянных фрагментов или уточнения контекста.

  4. Сравнивать расшифровку модели с оригиналом, избегая распространённых ошибок автоматизации.

  5. Организовывать цифровые архивы, где ИИ обрабатывает новые документы сразу при загрузке.

Ошибка → Последствие → Альтернатива

Ошибка: полностью доверять машине без проверки человеком.
Последствие: неточности в публикациях, искажение исторических данных.
Альтернатива: использовать ИИ как ускоритель, но не как конечный источник.

Ошибка: вводить ИИ в архивный процесс без обучения сотрудников.
Последствие: неправильное использование алгоритма и некорректная расшифровка.
Альтернатива: проводить тренинги и интегрировать ИИ-процессы постепенно.

Ошибка: ожидать от модели универсального понимания всех стилей письма.
Последствие: ошибки на нестандартных рукописях.
Альтернатива: дополнять обучение новыми историческими корпусами.

А что если историческая наука полностью перейдёт на ИИ?

Специалисты уверяют: полная автоматизация невозможна и нежелательна. Машина может ускорять процесс и помогать в рутинных задачах, но не заменит эксперта, который умеет интерпретировать культурные, исторические и семантические нюансы.

ИИ становится не заменой, а партнёром — инструментом, который освобождает исследователя от механической работы и даёт возможность сосредоточиться на анализе и интерпретации.

Плюсы и минусы ИИ-расшифровки архивов

Плюсы Минусы
Экономия времени исследователей ИИ не понимает культурный контекст глубоко
Высокая точность распознавания Ошибки всё равно требуют корректировки
Возможность массовой оцифровки Сложность обучения на редких языках
Способность восстанавливать смысл Опасность ошибочных интерпретаций

FAQ

1. Может ли ИИ заменить архивиста?
Нет. ИИ ускоряет работу, но интерпретация остаётся задачей человека.

2. Работает ли модель с разными языками?
Потенциально — да, особенно с европейскими письменными традициями, но точность зависит от корпуса.

3. Можно ли использовать ИИ для юридически значимых документов?
Только после проверки специалистом.

Мифы и правда о цифровой расшифровке

Миф: ИИ всегда понимает смысл текста.
Правда: он использует статистические модели и может ошибаться в сложных контекстах.

Миф: машина работает идеально с любым почерком.
Правда: сильно испорченные рукописи вызывают трудности.

Миф: цифровизация сделает архивистов ненужными.
Правда: наоборот, создаёт новые задачи и повышает значимость экспертов.

Три интересных факта

  1. Ошибка 0,56% — показатель, сопоставимый с профессиональными дешифровщиками XVIII века.

  2. AI Studio — платформа, на которой Google тестирует большинство моделей взаимодействия с текстом.

  3. ИИ способен одновременно распознавать текст и анализировать экономические данные эпохи.

Исторический контекст

• В XIX веке расшифровка рукописей была делом отдельных специалистов-палеографов.
• XX век принёс массовую оцифровку, но расшифровка оставалась ручной.
• XXI век стал эпохой перехода от сканирования к интеллектуальной обработке.

Работы в этом направлении идут и внутри страны.
Сбер создаёт ИИ для обработки рукописей из национальных архивов, включая проект по документам Петра I — одной из ключевых коллекций российской истории.
Яндекс разрабатывает систему для поиска и дешифровки метрических книг, церковных документов и других рукописей, связанных с родословной и культурным наследием.
Эти технологии уже помогают историкам быстрее работать с массивами источников.

Подписывайтесь на Экосевер

Читайте также

Автоэксперты: в тумане водителям нужно включать задние огни сегодня в 9:01
Туман съедает дорогу за секунды: приём, который спасает водителей от невидимой ловушки

Туман способен буквально спрятать дорогу у вас перед капотом. Разбираемся, как в такой ситуации сохранить контроль над автомобилем и избежать опасных ошибок.

Читать полностью »
Доктор остановил эпилептические приступы у ребёнка с помощью кето-диеты сегодня в 8:17
Приступы исчезли за месяц: неожиданная диета вернула к жизни трёхлетнюю девочку

У трёхлетней девочки тяжёлая эпилепсия не поддавалась лечению, но кетодиета неожиданно остановила приступы. Как один метод изменил её судьбу?

Читать полностью »
Разработчики впервые добились призового места ИИ на олимпиаде сегодня в 7:46
Серебро на олимпиаде — и это только начало: что умеет ИИ, который мыслит формальной логикой

Новый ИИ AlphaProof впервые стал призёром международной матолимпиады — благодаря способности строить строгие доказательства и проверять себя формальной логикой.

Читать полностью »
NASA и ESA запустили спутник для мониторинга уровня океана сегодня в 6:20
Спутник, который видит волны толщиной с монету: зачем NASA наблюдает за океаном с такой точностью

Новый спутник Sentinel-6B отправился на орбиту с помощью Falcon 9. Он станет ключевым инструментом наблюдения за уровнем Мирового океана и глобальными климатическими процессами.

Читать полностью »
Учёные объяснили невозможность полёта к Солнцу из-за орбитальной скорости сегодня в 5:06
Полет на Солнце оказался сложнее побега из Солнечной системы: расчёты ошеломили учёных

Почему нельзя просто направить ракету на Солнце и ждать падения? Учёные объяснили, как гравитация превращает невозможную миссию в реальную.

Читать полностью »
Учёные показали, что соцсети выявляют угрозу раньше появления заболевших сегодня в 4:17
Посты предсказывают вспышки болезней точнее сводок Минздрава: как это возможно

Учёные нашли способ предсказывать вспышки болезней ещё до появления первых случаев. Соцсети стали источником ранних сигналов об угрозе.

Читать полностью »
Исследователи выявили рост углеродного следа от питомцев сегодня в 3:44
Собаки оказались невидимыми загрязнителями: новый фактор климатического кризиса удивил всех

Новое исследование показало: содержание собак влияет на климат больше, чем принято думать. Почему эта тема вызвала бурю эмоций и как найти баланс?

Читать полностью »
Учёные выявили центр принятия решений у животных сегодня в 2:11
В мозге животных нашли центр решений: одна зона управляет всем поведением

Учёные нашли участок мозга, который помогает животным понимать, что ситуация изменилась. Он позволяет им обновлять ожидания и принимать гибкие решения.

Читать полностью »