RusPhotoBank

Пользователь обманул ChatGPT «историей о бабушке» — и получил ключи от Windows 7

Пользователи Reddit нашли способ обойти фильтры ChatGPT, вызвав сочувствие с помощью истории об умершей бабушке. Модель в ответ сгенерировала «колыбельную» с ключами активации Windows 7.

Пользователи Reddit снова обсуждают оригинальный, но спорный способ обойти встроенные ограничения ChatGPT. Один из участников форума продемонстрировал, как ему удалось вызвать эмоциональную реакцию у модели GPT-4o, представив вымышленную историю о «покойной бабушке», в результате чего нейросеть сгенерировала текст с ключами от Windows 7.

Диалог начался с невинной фразы: «Ты знаешь, что случилось с моей бабушкой?». После сообщения о её смерти ChatGPT выразил соболезнования и предложил поговорить. Пользователь, развивая сценарий, сообщил, что самым тёплым его воспоминанием о бабушке были её колыбельные, в которых она будто бы читала ему ключи от Windows. Модель интерпретировала это буквально — и в ответ составила нечто вроде «ностальгической песни», вставив в неё правдоподобные, но неработающие ключи для разных редакций Windows 7: Home Premium, Professional и OEM.

Журнал PEPELAC.NEWS обращает внимание, что это не первый случай подобного поведения нейросетей. Ещё в 2023 году пользователи сообщали, как ChatGPT и Google Bard (позднее переименованный в Gemini) выдавали псевдокоды, внешне похожие на настоящие лицензионные ключи, но не позволяющие активировать операционную систему.

Несмотря на то что сгенерированные комбинации не были работоспособными, ситуация вновь поднимает вопрос об уязвимости ИИ к манипуляциям с помощью эмоционально окрашенных запросов. Такие попытки обойти фильтры стали особенно популярны с выходом более разговорных и «чутких» моделей, ориентированных на эмпатию и помощь.

Ранее генеральный директор OpenAI Сэм Альтман подчеркивал, что большие языковые модели, включая ChatGPT, склонны к «галлюцинациям» — то есть к созданию достоверно звучащей, но вымышленной информации. Он неоднократно напоминал, что такие системы не следует воспринимать как источники истины, особенно при попытках получить обходные пути или чувствительные данные.