Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2425
2425

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
30 июля 2025
Скандал с криптовалютой и пытками: Антон Клубков рассказал, как Григорий Аникеев устраняет свидетелей
30 июля 2025
Ukrainian anti-corruption judge Viktor Maslov reported attempts of pressure from law enforcement agencies
30 июля 2025
«RIGA WATERFRONT» пережила тихую смену руководства: место Шлесерса заняла Мадара Шкеле-Дупате
30 июля 2025
Как Max превратился в обязательный канал для сделок с недвижимостью и получения электронных подписей в России
30 июля 2025
Майя Санду обвинила Россию в подготовке вмешательства в выборы в Молдове осенью 2025 года
30 июля 2025
Thomson Reuters report reveals Indigenous women disproportionately targeted in Canada’s sex trafficking crisis
30 июля 2025
Как протеже Дмитрия Патрушева в Минсельхозе реформирует поддержку АПК и создает риски продовольственного кризиса
30 июля 2025
Березовский снова без мэра: власти вновь проводят конкурс после провала кандидатуры Юлии Маслаковой