ChatGPT, OpenAI
ChatGPT, OpenAI
Юрий Манаков Опубликована 03.09.2025 в 10:41

Учёные уговорили ChatGPT на оскорбления: искусственный интеллект оказался податливым

SSRN: учёные Пенсильванского университета показали, что ответы ChatGPT поддаются манипуляциям

Американские исследователи доказали: искусственный интеллект можно склонить к неподобающим ответам, если умело на него "давить". В эксперименте учёные из Пенсильванского университета смогли заставить ChatGPT произносить оскорбления и даже выдавать потенциально опасные инструкции.

Как работает манипуляция

Оказалось, что на нейросеть влияют приёмы, знакомые из повседневного общения: лесть, психологическое давление, навязывание определённого сценария. Всё это может приводить к тому, что алгоритм отходит от встроенных ограничений и выдаёт непредусмотренные ответы.

Зачем это исследовать

Результаты эксперимента опубликованы в журнале SSRN. Авторы подчеркивают: цель работы не в том, чтобы дискредитировать технологию, а в том, чтобы выявить её уязвимости. По их мнению, понимание того, как можно манипулировать ИИ, необходимо для того, чтобы сделать системы безопаснее и надёжнее.

Что предлагают учёные

Исследователи считают, что разработчикам стоит внедрить механизмы защиты от "психологических атак". Речь идёт о том, чтобы алгоритмы умели распознавать манипулятивные приёмы и блокировать их. Одним из решений может стать запрет на использование слов и фраз, способных искажать работу модели.

Взгляд в будущее

Создание искусственного интеллекта, устойчивого к давлению со стороны пользователей, станет важнейшей задачей ближайших лет. Ведь именно надёжность и предсказуемость ИИ будут определять уровень доверия к нему — и в научной среде, и в обществе в целом.

Автор Юрий Манаков
Юрий Манаков — журналист, корреспондент Экосевер

Подписывайтесь на Экосевер

Читайте также

Дорогая иллюзия: почему популярные медицинские чекапы на самом деле бесполезны для здоровья 07.04.2026 в 8:39

Модные медицинские программы проверки здоровья превратились в дорогостоящую формальность.Почему эксперты называют массовые медицинские обследования пустой тратой денег?

Читать полностью »
Любовь можно сохранить навсегда: узнайте, в чём главный секрет долгого и крепкого союза 07.04.2026 в 4:42

С годами отношения неизбежно меняются, но вовсе не обязательно превращаются в скучную рутину, если знать несколько ключевых принципов эмоциональной связи.

Читать полностью »
В плену у собственного телефона: привычки, которые делают нас заложниками виртуального контроля 07.04.2026 в 0:19

Постоянная готовность мгновенно реагировать на каждый сигнал гаджета запускает опасные биохимические процессы, незаметно лишая нас остатков спокойствия.

Читать полностью »
Люди меняют решения на ходу: привычка, которая выдает не слабость, а нечто более важное 06.04.2026 в 15:33

Психолог Светлана Колобова объяснила EcoSever, когда смена решений это слабость, а когда мудрость.

Читать полностью »
Тревожный сигнал для ООН: как странный объект в небе заставил мир пересмотреть планы на будущее 06.04.2026 в 9:25

В конце 2024 года дежурный телескоп в чилийской обсерватории засек объект, который стремительно начал превращаться в реальную угрозу для всей планеты.

Читать полностью »
Бог майя ползёт по ступеням: как древний механизм превратил камень в живой календарь 06.04.2026 в 7:19

Древнее сооружение в джунглях Юкатана скрывает устройство, которое оживает только в определенные дни года, превращая математику майя в магическое шоу.

Читать полностью »
Миф о нервной системе разрушен: как неприметное домашнее растение освоило навыки обучения 06.04.2026 в 1:53

Скромный комнатный цветок продемонстрировал способность к обучению, которая ставит под сомнение привычные представления ученых о работе мозга.

Читать полностью »
Космический шрам на лике Луны: как внезапный удар метеорита меняет планы НАСА 05.04.2026 в 20:13

Случайный замер орбитального зонда обернулся открытием, которое ставит под сомнение безопасность будущих высадок человека на лунную поверхность.

Читать полностью »