вредные советы

  1. vaspvort

    С помощью блок-схем можно заставить GPT-4o выдавать заблокированный текстовый ответ

    Исследователи выяснили, что изображения блок-схемы обманом заставляют GPT-4o создавать вредоносный текст. Они передавали чат-боту эти изображения со схемами вредоносной деятельности вместе с текстовой подсказкой. Вероятность успеха атаки составила 92,8%. В случае с версией GPT-4-vision-preview...
Сверху Снизу