искусственный интеллект
искусственный интеллект
Андрей Лазарев Опубликована 19.11.2025 в 7:46

Серебро на олимпиаде — и это только начало: что умеет ИИ, который мыслит формальной логикой

Разработчики впервые добились призового места ИИ на олимпиаде

Новости об успехах искусственного интеллекта появляются постоянно, но одно из последних достижений выбилось из общего ряда. Впервые в истории ИИ стал призёром международной олимпиады по математике — области, где долгое время считалось, что машинам недоступно тонкое абстрактное мышление. Результат оказался настолько неожиданным, что вызвал бурные обсуждения и среди исследователей, и среди самих математиков-практиков: модель AlphaProof, созданная Google DeepMind, получила "серебро", соперничая с лучшими молодыми математиками планеты.

Этот успех стал возможным благодаря принципиально новому подходу: AlphaProof не просто решает задачи, как это делают языковые модели, а строит строгие доказательства, проверенные формальной логикой. Иными словами, машина учится мыслить как профессиональный математик — аккуратно, последовательно и точно.

Почему AlphaProof важна для математики

Большие языковые модели умеют решать множество задач, но в математике они часто ошибаются: рассуждения звучат убедительно, но могут содержать незаметные логические изъяны. Для олимпиадного уровня такая неточность недопустима. AlphaProof отличилась тем, что научилась не только находить решения, но и выявлять свои собственные ошибки.

Эта способность основана на использовании среды Lean — системы формальной верификации, созданной в Microsoft Research. Lean проверяет каждый шаг доказательства: если рассуждение нарушает правила строгой логики, оно просто не принимается. Такая схема делает процесс обучения похожим на работу студента-математика, который обязан представить доказательство, выдерживающее проверку эксперта.

Именно этот переход — от "правдоподобных рассуждений" к доказуемым утверждениям — стал переломным моментом.

Как обучали модель: три этапа сложного развития

Чтобы научить машину рассуждать как математик, исследователи использовали многоступенчатую стратегию.

1. Формирование базовой логической интуиции

AlphaProof обучили на массиве около 300 млрд токенов, содержащих программный код, учебные материалы, научные статьи. Это позволило модели освоить:

• структуру формальных языков,
• способы построения доказательств,
• правила логики,
• принципы трансформации выражений.

На этом этапе ИИ получил прочный фундамент, но ещё не умел создавать доказательства сам.

2. Изучение готовых доказательств

Далее систему "погрузили" в 300 тысяч доказательств, заранее оформленных в Lean. Так модель:

• переняла стиль мышления опытных математиков,
• увидела реальные цепочки рассуждений,
• научилась выбирать корректные шаги,
• получила ориентир, на который можно опираться.

Это похоже на многолетнюю стажировку — разбор чужих работ под руководством наставника.

3. Практика на 80 млн задач

На глубинном этапе AlphaProof дали огромный набор упражнений — 80 миллионов формализованных задач. Здесь включился механизм вознаграждения: каждая верная цепочка рассуждений усиливала модель.

Для особо сложных заданий исследователи применили Test-Time Reinforcement Learning (TTRL). Эта методика создаёт множество упрощённых версий исходной задачи, которые нужно решать последовательно. В процессе AlphaProof собирает полезные логические паттерны и переносит их на оригинальную, гораздо труднее формализуемую задачу.

Такой подход позволил ИИ открыть собственные стратегии рассуждений, а не только воспроизводить увиденное ранее.

Что делает AlphaProof уникальной

Модель не просто ищет решения — она умеет критически оценивать свою работу. Для математиков это свойственно, но для ИИ — почти революция. AlphaProof:

• обнаруживает ошибки внутри цепочки рассуждений,
• исправляет их самостоятельно,
• проверяет каждый шаг формально,
• строит доказательства, пригодные для публикации.

Большинство моделей способны генерировать ответ, но не способны гарантировать его корректность. AlphaProof впервые сочетает креативность и формальную строгость.

Сравнение: AlphaProof vs традиционные ИИ

Характеристика Обычные LLM AlphaProof
Тип ответа текст, приближённое решение формальное доказательство
Работа с ошибками неустойчивая, нет самопроверки встроенная самооценка
Среда проверки отсутствует Lean
Подходит для олимпиад редко да
Проверка логики косвенная строгая, пошаговая

Как AlphaProof решает задачу (HowTo)

  1. • Получает формализованное условие.

  2. • Генерирует цепочку рассуждений, используя знакомые логические паттерны.

  3. • Передаёт шаги в Lean для проверки.

  4. • Если найдена ошибка — корректирует фрагмент рассуждения.

  5. • Повторяет процесс, пока доказательство не станет полностью строгим.

  6. • Выдаёт итоговое решение, подтверждённое Lean.

Ошибка → Последствие → Альтернатива

• Пытаться решить задачу без формальной проверки → скрытые ошибки → использование Lean как строгого фильтра.
• Опираться на поверхностное обучение → модель рассуждает неточно → многоступенчатое обучение с реальными доказательствами.
• Применять обычное RL для абстрактных задач → слабый результат → TTRL с упрощёнными версиями задач.

А что если… использовать AlphaProof в реальной математике?

Исследователи считают, что модель пригодится не только для олимпиад. Строгая формальная проверка делает AlphaProof идеальным кандидатом для:

• анализа гипотез,
• поиска ошибок в опубликованных работах,
• автоматизации доказательств,
• создания новых теоретических идей,
• сотрудничества с математиками как "проверяющего ассистента".

ИИ может стать инструментом, ускоряющим математическую науку.

Плюсы и минусы AlphaProof

Плюсы:

• формальная точность;
• способность исправлять собственные ошибки;
• масштабируемость обучения;
• применение в научных исследованиях;
• высокий уровень абстракции.

Минусы:

• высокая сложность архитектуры;
• необходимость огромных массивов данных;
• ограниченная гибкость вне формальных языков;
• невозможность полностью заменить человеческую интуицию.

FAQ

1. Чем AlphaProof отличается от ChatGPT?
ChatGPT может объяснить идею, но не гарантирует строгого доказательства. AlphaProof работает только с формальной логикой и следит за корректностью.

2. Можно ли использовать модель студентам?
Да — как ассистента для проверки собственных доказательств.

3. Сможет ли ИИ открывать новые математические теоремы?
Исследователи считают это реальной перспективой.

Мифы и правда

Миф: ИИ просто "угадывает" ответы.
Правда: AlphaProof строит доказательства, подтверждённые формальной системой.

Миф: формальная проверка делает модель медленной.
Правда: Lean оптимизирован для больших объёмов доказательств.

Сон и психология

Интересно, что инструменты формальной верификации влияют и на эмоциональное состояние исследователей: математик, получая строгую проверку от ИИ, может снизить тревожность перед ошибками, улучшить концентрацию и быстрее двигаться в исследованиях.

Три интересных факта

  1. Lean используется для проверки реальных научных публикаций в области топологии и теории чисел.

  2. TTRL впервые применили именно для формальных доказательств.

  3. AlphaProof способна создавать доказательства, ранее доступные только узким специалистам.

Первые системы автоматического доказательства появились в середине XX века, но долгое время оставались игрушками для теоретиков. С развитием нейронных сетей стало возможным объединить машинное обучение и формальную логику. AlphaProof — кульминация десятилетий работы: от первых автоматических теорем-доказателей до гибридных систем, способных соперничать с людьми на олимпиадах.

Появление AlphaProof показывает: ИИ начинает осваивать самую сложную область человеческой мысли — строгую математику. И, возможно, это только начало пути.

Подписывайтесь на Экосевер

Читайте также

Физики предложили новый подход к квантовой гравитации — Университет Аалто вчера в 23:10
Квантовый мир сопротивлялся сто лет — теперь гравитация сыграла по правилам

Учёные предложили новый подход для объединения квантовой теории и гравитации, который может открыть путь к созданию единой теории всех сил природы.

Читать полностью »
Выявлена связь укладки ДНК с активностью генов — Northwestern University вчера в 19:01
ДНК оказалась не текстом, а сценой: как тайная геометрия генома управляет болезнями

Учёные создали самые детальные карты трёхмерной структуры ДНК, показав, как укладка генома влияет на работу генов и развитие болезней.

Читать полностью »
Гаджеты негативно влияют на мозг детей до двух лет — EBioMedicine вчера в 15:50
Младенец с планшетом — подросток с тревогой: найдена связь, которую долго не замечали

Учёные из Сингапура доказали: раннее знакомство детей с экранами может привести к тревожности и когнитивным нарушениям в подростковом возрасте.

Читать полностью »
77 процентов перемещений направлены вглубь океана — Nature Climate Change вчера в 11:10
Морские глубины спасают рыб от жары: океан скрывает удивительные секреты

Ученые фиксируют заметный дрейф морских видов к глубинам и холодным регионам, и новые данные показывают, насколько океан реагирует на изменение климата.

Читать полностью »
Телескоп Hubble обнаружил звёздно пустое облако Cloud-9 — NASA вчера в 7:21
Галактика-призрак без звёзд и света: в космосе нашли объект, который не должен был выжить

Астрономы обнаружили редкое облако тёмной материи и газа без звёзд. Находка меняет представления о том, как формируются галактики и что скрывает Вселенная.

Читать полностью »
Зафиксировано влияние текста песен на мировоззрение — Psychology of Music вчера в 3:37
Припев ещё звучит, а ты уже изменился: что делают с людьми тексты популярных песен

Психологи доказали: слова песен влияют на эмоции, установки и даже поведение людей. Просоциальные тексты вдохновляют на добро, а агрессивные усиливают враждебность.

Читать полностью »
Дэвис Джозеф выявил ключевой фактор болезни Альцгеймера — Planet Today 10.01.2026 в 22:10
Молекулы, которые могут спасти миллионы: будущее лечения заболеваний мозга

Учёные сделали важное открытие, которое может изменить подходы к лечению болезней Альцгеймера и Паркинсона. Открытие механизма открывает новые возможности.

Читать полностью »
Вибрация сухожилий снизила ощущение нагрузки при тренировке — биологи 10.01.2026 в 18:28
Тело выкладывается по максимуму, а мозг молчит: эффект, который пугающе хорошо работает

Почему одинаковая физическая нагрузка ощущается по-разному и как мозг влияет на чувство усталости. Учёные нашли неожиданный способ изменить восприятие усилия.

Читать полностью »