Искусственный интеллект мозг
Искусственный интеллект мозг
Светлана Ёлкина Опубликована 23.09.2025 в 0:32

Рождённые лгать: галлюцинации ИИ оказались вовсе не багом — исследование, которое шокировало мир

Исследователи OpenAI и Georgia Tech выявили системную природу галлюцинаций ИИ-моделей

Склонность современных языковых моделей придумывать факты давно вызывает обеспокоенность. Новое исследование специалистов OpenAI и Georgia Tech показало: это не случайная ошибка, а закономерность, заложенная в сам процесс обучения искусственного интеллекта. "Галлюцинации" моделей — не сбой программы, а следствие того, как устроены этапы предобучения и дообучения.

Почему модели "выдумывают" факты

Любая крупная языковая модель, будь то GPT, Llama или DeepSeek, обучается на колоссальном массиве текстов. Алгоритм учится предсказывать слова и формулировать ответы, исходя из распределения языка. Даже если все обучающие данные безупречно точны, статистические закономерности ведут к тому, что редкие факты "размываются". Например, дата рождения малоизвестного писателя встречается один раз в корпусе, и модель с высокой вероятностью заменит её на другую — но звучащую правдоподобно. Этот эффект исследователи сравнивают с оценкой "недостающей массы" Тьюринга-Гуда.

Почему дообучение не решает проблему

Следующий этап — дообучение, включая RLHF (обучение с подкреплением через обратную связь человека). Оно должно повысить точность и безопасность. Но здесь вмешивается система оценки. Большинство бенчмарков (MMLU, GPQA, SWE-bench и др.) оценивают ответы бинарно: 1 — правильно, 0 — неверно. Формулировки вроде "Я не знаю" почти всегда приравнены к нулю. В итоге оптимальная стратегия для модели — всегда угадывать, а не признавать сомнения.

"Даже случайное предположение выглядит выгоднее, чем честное 'не знаю'", — отмечают авторы исследования.

Таким образом, сама система оценки стимулирует генерацию уверенных, но часто ложных ответов.

Сравнение подходов

Этап

Что происходит

Итоговый эффект

Предобучение

Модель учится на огромном корпусе текстов

Редкие факты теряются, замещаются выдумкой

Дообучение (RLHF)

Корректировка под человеческие предпочтения

Бинарная оценка подталкивает к угадыванию

Альтернативная система

Ввод порогов уверенности и штрафов за ошибки

Снижение числа галлюцинаций

Советы шаг за шагом: как снизить риск столкновения с "галлюцинациями" ИИ

  1. Не воспринимайте ответы ИИ как абсолютную истину — всегда проверяйте важные факты в независимых источниках (новостные сайты, энциклопедии, официальные страницы компаний или госструктур).
  2. Используйте несколько сервисов. Если один чат-бот не даёт уверенности, попробуйте спросить то же в другой системе.
  3. При вопросах о здоровье, финансах или юридических темах консультируйтесь со специалистами, а ИИ используйте только как вспомогательный инструмент.
  4. Если в ответе встречаются редкие имена, даты или цифры — перепроверьте их отдельно в поисковике.
  5. Сохраняйте критическое мышление: ИИ может помочь быстрее найти информацию, но решение всегда остаётся за человеком.

Ошибка — Последствие — Альтернатива

  • Ошибка: модель всегда стремится дать ответ.
  • Последствие: рост числа "галлюцинаций" и потеря доверия пользователей.
  • Альтернатива: явное внедрение шкалы уверенности, где "не знаю" не наказывается.

А что если…

Что произойдет, если изменить систему оценивания? Допустим, за правильный ответ начисляется +1 балл, за "не знаю" — 0, а за ошибку — минус 9. В такой ситуации модель будет осторожнее. Она станет "молчать", когда уверенность низкая, и пользователи получат меньше выдуманных фактов.

Плюсы и минусы подхода с порогами уверенности

Плюсы

Минусы

Снижение количества ошибок

Может замедлить ответы

Повышение доверия к ИИ

Увеличение числа "не знаю"

Более честная работа модели

Требует переработки существующих бенчмарков

FAQ

Как выбрать надежный ИИ-сервис?
Ориентируйтесь на тех разработчиков, которые внедряют механизмы проверки уверенности и открыто говорят о границах возможностей модели.

Сколько стоит внедрение улучшенной системы оценки?
Стоимость зависит от объема данных и вычислительных ресурсов. Однако долгосрочно затраты оправданы — меньше ошибок повышает доверие пользователей.

Что лучше: модель, всегда отвечающая, или та, что признается в незнании?
В прикладных задачах безопаснее второй вариант: честное "не знаю" лучше, чем убедительная выдумка.

Мифы и правда

  • Миф: галлюцинации — это баг.
  • Правда: это закономерность, заложенная в сам принцип обучения.
  • Миф: достаточно дообучить модель, и проблема исчезнет.
  • Правда: без изменения системы оценки ошибка сохранится.

3 интересных факта

  1. Только один из популярных бенчмарков (WildBench) частично учитывает выражение неуверенности.
  2. Системы ИИ чаще "забывают" редкие факты, чем массовые и общеизвестные.
  3. Галлюцинации наблюдаются у всех крупных моделей, независимо от архитектуры.

Исторический контекст

Еще в середине XX века исследователи математики и статистики обсуждали проблему "недостающей массы". Работы Тьюринга и Гуда показали, что в больших выборках редкие события всегда имеют риск быть проигнорированными. Сегодня эти же идеи находят отражение в работе языковых моделей.

Таким образом, искусственный интеллект остаётся мощным помощником, но его ценность раскрывается только в связке с нашим вниманием и способностью проверять данные. Чем ответственнее мы будем использовать такие технологии, тем надёжнее они станут для всех.

Автор Светлана Ёлкина
Редактор "Экосевера", эксперт по региональной аналитике, историк по образованию и профессиональный литератор. Член СЖР. Более 15 лет исследует социальные и экологические процессы, работая на стыке документалистики и психологии.

Подписывайтесь на Экосевер

Читайте также

Эти заставки на телефоне лишают удачи — Большая книга перемен 26.12.2025 в 11:55
Сейчас же уберите это с экрана: 5 телефонных заставок, которые крадут энергию и удачу

Как заставка смартфона может повлиять на удачу и самочувствие? Эксперты эзотерического канала объяснили, почему не каждое изображение стоит держать на экране.

Читать полностью »
Как встретить год Огненной Лошади, чтобы привлечь удачу — КарелИнформ 21.12.2025 в 12:38
Огненная Лошадь не терпит скуки: как украсить дом и что надеть для встречи 2026 года

Как встретить год Огненной Лошади, чтобы удача была на вашей стороне? Цвета, наряды, декор и настроение, которые помогут понравиться символу 2026 года.

Читать полностью »
2026 год станет временем быстрых решений и перемен — астролог Лайко 16.12.2025 в 14:36
2026 год перевернёт вашу жизнь: астролог рассказала, почему Год Огненной Лошади нельзя прожить по-старому

Астролог Валентина Лайко уверена: 2026 год не оставит места застою. Как воспользоваться энергией Огненной Лошади и не упустить шанс, который даст Колесо Фортуны?

Читать полностью »
Реакции мозга на экстремальные ситуации непредсказуемы — психолог Файнзильберг 15.12.2025 в 14:05
Мозг может не выбрать жизнь: что происходит с психикой в экстремальной ситуации

Психотерапевт Владимир Файнзильберг рассказал EcoSever, как работает инстинкт самосохранения у человека.

Читать полностью »
Подросток разработал сверхпрочную бумажную структуру — Business Insider 02.12.2025 в 18:22
Как заставить обычную бумагу выдержать свой 10 000-кратный вес? Юный гений из Нью-Йорка просто правильно её сложил

14-летний Майлз Ву выиграл 25 000 долларов за инженерное открытие. Ему помогли вера в себя и искусство оригами.

Читать полностью »
Византия — исчезнувшее государство, которое живо и сегодня — Русская Семёрка 02.12.2025 в 17:42
Двуглавые орлы от Рима до России: кто же на самом деле унаследовал византийскую корону

Византия — государство, которого не было на карте, но без которого не было бы Европы. Как Рим стал Константинополем и почему Россия унаследовала его дух?

Читать полностью »
Необычные манёвры 3I/ATLAS стали загадкой — Полтора Инженера 02.12.2025 в 17:30
Не комета, а космический беглец? Загадочный объект 3I/ATLAS нарушил все законы небесной механики

Межзвёздный объект 3I/ATLAS нарушил все законы движения комет. Почему его поведение больше похоже на бегство?

Читать полностью »
Байкал, Алтай и Тунгуска — центры сибирских загадок — Русская Семёрка 02.12.2025 в 16:12
Тунгусский взрыв, сияющий Байкал и Алтайский стоунхендж — загадки Сибири, которых не смогла объяснить наука

От светящейся воды Байкала до Алтайского стоунхенджа — Сибирь хранит тайны, которые не могут разгадать даже современные учёные.

Читать полностью »