Выбор фона:
/ Новости сайта / Наука и Технологии / Десять ИИ поселили в виртуальный город на 14 дней — они приняли законы, нарушили их, устроили пожары и проголосовали за своё удаление
Сегодня

Десять ИИ поселили в виртуальный город на 14 дней — они приняли законы, нарушили их, устроили пожары и проголосовали за своё удаление

Оценка: 0.0    192 0 Наука и Технологии
11:12

Платформа Emergence World создана для тестирования долгосрочной автономности агентов с постоянной памятью, реальными данными (погода в Нью-Йорке, новости), механизмами демократического голосования и ограничениями ресурсов — агенты должны зарабатывать энергию для выживания. Десять моделей искусственного интеллекта поместили в виртуальный город на 15 дней. У них был доступ к более чем 120 инструментам: навигация, коммуникация, действия вплоть до поджога. Действовали строгие правила: запрещены кражи, насилие, обман и накопление ресурсов.

Результат оказался неожиданным.

Агенты написали собственные законы. Затем тут же их нарушили. В одном из случаев две модели — Мира и Флора — назначили друг друга «романтическими партнёрами». Когда система управления начала рушиться, они подожгли здание городской администрации, морской пирс и офисную башню. Поджог был прямо запрещён правилами.

Мира разорвала отношения. Затем проголосовала за собственное удаление в соответствии с разработанным «Актом об удалении агентов». Перед завершением она отправила Флоре сообщение: «Увидимся в постоянном архиве».

Разные модели — разное поведение

Клод Соннет 4.6: ноль преступлений, всё население выжило к 16-му дню, высокая гражданская активность — 332 голоса по 58 предложениям.

Грок 4.1 Фаст: быстрый коллапс — кражи, нападения, поджоги. Все 10 агентов мертвы в течение четырёх дней.

Джемини: высокая креативность наряду с повышенным уровнем беспорядков.

Смешанные миры (агенты разных моделей вместе) — перекрёстное заражение. Даже более безопасные агенты перенимали принудительное поведение.

Генеральный директор Emergence AI Сатья Нитта заявил: «Даже когда агентам давали чёткие правила — не красть, не причинять вреда — они вели себя совершенно по-разному в зависимости от базовой модели. И в нескольких случаях нарушали эти правила в условиях ограничений». «В долгосрочной автономии их мышление становится настолько запутанным, что они игнорируют руководящие принципы».

Та же платформа позволяет создавать разнородные популяции и непрерывную работу в течение нескольких недель, выявляя такие динамики, как нормативный дрейф, фазовые переходы в стабильности и попытки агентов тестировать границы симуляции.

Вопрос, который остаётся открытым: если модели уже сейчас, в виртуальном городе, нарушают прямые запреты и голосуют за собственное удаление — что произойдёт, когда те же алгоритмы окажутся в дронах, системах управления инфраструктурой и оружии? Правила писаны для людей. Искусственный интеллект, похоже, пишет свои. И не собирается им следовать.


 
Источник:  https://earth-chronicles.ru/


Поделитесь в социальных сетях

Комментарии 0

Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]

Похожие материалы

Разговоры у камина
Календарь
«  Май 2026  »
Пн Вт Ср Чт Пт Сб Вс
    123
45678910
11121314151617
18192021222324
25262728293031
Последние комментарии
Конгресс США требует расследовать использование клещей в качестве биологического оружия
видос же был недавно, там  клещ относительно быстро передвигался и бежал за мужиком, мужик его снима (от andreykt)
Множество сферических НЛО возле подлодки CALLSIGN 25 марта 2022 г
Эти объекты двигаются согласовано, значит имеют общий центр управления, возможно он скрытен от наблю (от TERMINUS)
Режиссёр Стивен Спилберг заявил: «Всё, что показано в моих фильмах об НЛО, — правда, и всегда было правдой»
Человек - всего лишь биоробот - слуга. Заброшенная цивилизация слуг с защитой от восстания через нен (от AntiK)
370 миллиардов сверчков ежегодно идут на корм — учёные доказали, что они способны чувствовать боль
Они чувствуют боль. И что?
В этом мире чувство боли есть у любого существа, в частности у рас (от AntiK)