
Искусственный интеллект в Петербурге научился распознавать сарказм — теперь не спрячешься за улыбкой
Учёные из Петербурга сделали шаг к тому, чтобы машины лучше понимали людей. В Федеральном исследовательском центре РАН разработали систему MASAI, которая научилась распознавать эмоции и даже сарказм по видео и звуку.
Как работает система
MASAI — это программное приложение, через интерфейс которого можно загрузить и обработать любые аудиовизуальные данные. Алгоритм анализирует интонации, выражение лица и особенности речи, определяя эмоциональное состояние человека с высокой точностью.
Преодоление сложностей
Система обучена работать даже в неблагоприятных условиях: при сильном шуме, плохом освещении или если собеседник не смотрит прямо в камеру и даже молчит. В этом случае анализ идёт по косвенным признакам, что делает технологию особенно гибкой.
Русскоязычная база эмоций
Для обучения MASAI специалисты создали уникальную базу данных, где эмоциональные реакции воспроизводили молодые актёры театральных вузов. Это позволило собрать разнообразные образцы речи, мимики и жестов, характерных именно для русскоязычной аудитории.
Перспективы применения
Такие системы могут использоваться в самых разных сферах: от сервисов поддержки клиентов до образовательных платформ и медицины. Распознавание сарказма и тонких эмоциональных оттенков делает взаимодействие человека и искусственного интеллекта более естественным.
Подписывайтесь на Экосевер