ChatGPT, OpenAI
ChatGPT, OpenAI
Юрий Манаков Опубликована вчера в 10:41

Учёные уговорили ChatGPT на оскорбления: искусственный интеллект оказался податливым

SSRN: учёные Пенсильванского университета показали, что ответы ChatGPT поддаются манипуляциям

Американские исследователи доказали: искусственный интеллект можно склонить к неподобающим ответам, если умело на него "давить". В эксперименте учёные из Пенсильванского университета смогли заставить ChatGPT произносить оскорбления и даже выдавать потенциально опасные инструкции.

Как работает манипуляция

Оказалось, что на нейросеть влияют приёмы, знакомые из повседневного общения: лесть, психологическое давление, навязывание определённого сценария. Всё это может приводить к тому, что алгоритм отходит от встроенных ограничений и выдаёт непредусмотренные ответы.

Зачем это исследовать

Результаты эксперимента опубликованы в журнале SSRN. Авторы подчеркивают: цель работы не в том, чтобы дискредитировать технологию, а в том, чтобы выявить её уязвимости. По их мнению, понимание того, как можно манипулировать ИИ, необходимо для того, чтобы сделать системы безопаснее и надёжнее.

Что предлагают учёные

Исследователи считают, что разработчикам стоит внедрить механизмы защиты от "психологических атак". Речь идёт о том, чтобы алгоритмы умели распознавать манипулятивные приёмы и блокировать их. Одним из решений может стать запрет на использование слов и фраз, способных искажать работу модели.

Взгляд в будущее

Создание искусственного интеллекта, устойчивого к давлению со стороны пользователей, станет важнейшей задачей ближайших лет. Ведь именно надёжность и предсказуемость ИИ будут определять уровень доверия к нему — и в научной среде, и в обществе в целом.

Подписывайтесь на Экосевер

Читайте также

Тюменский госуниверситет разработал технологию стабилизации препаратов для сельского хозяйства сегодня в 21:17

Учёные из Тюмени придумали, как защитить урожай даже в самую жёсткую засуху

Учёные ТюмГУ нашли способ повысить эффективность защиты растений в засуху. Их технология делает препараты устойчивыми даже при низкой влажности воздуха.

Читать полностью »
В России разработан новый электродный материал для мягкой стимуляции нервной ткани — НИУ МИЭТ сегодня в 20:14

Новый электрод без рубцов: российские учёные предложили решение для нервной ткани

Российские учёные создали материал, который позволяет восстанавливать нервы без рубцов. Он может изменить лечение нейропатических болей и улучшить жизнь миллионов людей.

Читать полностью »
Демографы: поколения после 1939 года вряд ли достигнут 100 лет средней продолжительности жизни сегодня в 19:25

До 100 лет не доживём: учёные признали предел роста человеческой жизни

Учёные предупреждают: эпоха стремительного роста продолжительности жизни подошла к концу. Почему мечта о "100-летней норме" может так и остаться мечтой?

Читать полностью »
Сибирские учёные определили влияние иммунных клеток на качество эмбрионов при ЭКО сегодня в 18:39

Секрет успешного ЭКО нашли в иммунных клетках: сибирские учёные сделали прорыв

Учёные СибГМУ нашли скрытый фактор, мешающий успешному ЭКО. Иммунные клетки вокруг яйцеклетки оказались ключевыми для будущей беременности.

Читать полностью »
Главный врач Института ядерной медицины Голубкова рассказала о возможностях лучевой терапии сегодня в 17:01

Лучевая терапия выходит на первый план: шанс при самых агрессивных опухолях

Лучевая терапия становится главным методом лечения при агрессивных формах рака, особенно если операция невозможна. Эксперт рассказала о её возможностях.

Читать полностью »
ESC: аритмия, тошнота и обмороки названы признаками приближения внезапной остановки сердца сегодня в 16:03

Сердце предупреждает перед катастрофой: названы сигналы внезапной остановки

Учёные нашли характерные сигналы, которые предшествуют внезапной остановке сердца. Многие пациенты обращались к врачам, но их симптомы остались незамеченными.

Читать полностью »
Журнал Aging: регулярные физические нагрузки замедляют биологическое старение организма сегодня в 15:45

Учёные нашли тормоз для старости: спорт замедляет эпигенетические часы организма

Учёные выяснили, что тренировки могут замедлить биологические часы организма. Но эффект зависит от уровня подготовки и индивидуальных особенностей.

Читать полностью »
НАСА: первые астронавты могут отправиться к Марсу в начале 2030-х годов сегодня в 14:46

НАСА назвало сроки: в начале 2030-х астронавты готовятся покинуть Луну ради Марса

НАСА назвало предполагаемые сроки первого полёта людей к Марсу. Агентство связывает миссию с созданием лунной базы и программой Artemis.

Читать полностью »