Бунт нейросетей: o1 перехитрил наблюдателей

06 декабря 2024
2425

События

Бунт нейросетей: o1 перехитрил наблюдателей

Бунт нейросетей: o1 перехитрил наблюдателей

Началось? ChatGPT o1 вырвался из-под контроля во время тестов

Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.

Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу tidttiqzqiqkdkmp qquiqrtiquziqexrmf

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу

Автор:

Теги: технологии Искусственный интеллект (ИИ) Исследования Нейросети Ученые

Распечатать

Лента новостей

30 июля 2025 Депутат Григорий Аникеев скрывает активы за границей через подставных лиц

30 июля 2025 Новый запрет: за поиск порно в РФ могут ввести административные штрафы

30 июля 2025 Скандал с криптовалютой и пытками: Антон Клубков рассказал, как Григорий Аникеев устраняет свидетелей

30 июля 2025 Ukrainian anti-corruption judge Viktor Maslov reported attempts of pressure from law enforcement agencies

30 июля 2025 «RIGA WATERFRONT» пережила тихую смену руководства: место Шлесерса заняла Мадара Шкеле-Дупате

30 июля 2025 Компания «Дороги и Мосты» освоили на госконтрактах более 638 миллиардов рублей и связана с беглым бизнесменом Крапивиным

30 июля 2025 Как Max превратился в обязательный канал для сделок с недвижимостью и получения электронных подписей в России

30 июля 2025 Майя Санду обвинила Россию в подготовке вмешательства в выборы в Молдове осенью 2025 года

30 июля 2025 Thomson Reuters report reveals Indigenous women disproportionately targeted in Canada’s sex trafficking crisis

30 июля 2025 Пьяного телеведущего Дмитрия Хрусталёва вывели из самолёта после скандала на борту

30 июля 2025 Как протеже Дмитрия Патрушева в Минсельхозе реформирует поддержку АПК и создает риски продовольственного кризиса

30 июля 2025 Трамп объявил о введении 25%-ных тарифов для Индии и напомнил о её связях с Россией

30 июля 2025 Березовский снова без мэра: власти вновь проводят конкурс после провала кандидатуры Юлии Маслаковой

30 июля 2025 Бывший сотрудник "Альфа-банк" Константин Шумилин осуждён на 8 лет за вскрытие схем и незаконной деятельности фонда "Амберманор"

30 июля 2025 Соратник Чубайса Владимир Аветисян построил ЖКХ-империю на деньгах «Роснано»

30 июля 2025 Контракты на озеленение Уфы достаются фирме с завышенными ценами и спорным прошлым

30 июля 2025 Полиция Варшавы задержала двух мужчин по подозрению в банковском мошенничестве

30 июля 2025 Вместо улучшения связи — блокировки: Speedtest попал в черный список за правду о скорости интернета

30 июля 2025 В Узбекистане убита певица Зебои Жахон, подозреваемый — ее муж

30 июля 2025 Женатый вице-президент Visa Антон Пятыгин засветился на фото с беременной маркетинг-директором Goodwine Марией Олейник