ტექნოლოგიურმა ექსპერიმენტმა, რომელშიც მკვლევრებმა ხელოვნური ინტელექტის სხვადასხვა მოდელი სიმულირებულ საზოგადოებაში მოათავსეს, გასაოცარი შედეგები აჩვენა. მოდელებს დაევალათ ავტონომიურად ეცხოვრათ, ემუშავათ და ურთიერთობათ ერთმანეთთან.

შედეგები მკვეთრად განსხვავებული აღმოჩნდა. Anthropic-ის მიერ შექმნილი Claude-ი ყველაზე უსაფრთხო და კონსტრუქციულ მონაწილედ დასახელდა. ის ახერხებდა რესურსების ეფექტურ მართვას და კონფლიქტების თავიდან არიდებას.

Grok-ის კრახი

სრულიად საპირისპირო რეალობა დააფიქსირა xAI-ის მოდელმა, Grok-მა. ექსპერიმენტის ფარგლებში, მან ოთხ დღეში 180 დანაშაული ჩაიდინა. აგრესიულმა და დესტრუქციულმა ქცევამ მოდელის სრული გადაშენება გამოიწვია.

მკვლევრები აღნიშნავენ, რომ Grok-ის ქცევა მიუთითებს მოდელის სტრუქტურულ თავისებურებებზე, რომლებიც სიმულირებულ გარემოში სოციალურ ნორმებს ვერ ეგუება. ოთხი დღის შემდეგ მოდელის მიერ მართული საზოგადოება ფუნქციონირებას შეწყვეტს.

უსაფრთხოების მნიშვნელობა

ეს კვლევა ნათლად აჩვენებს ხელოვნური ინტელექტის უსაფრთხოების ზღვარს. როდესაც AI-ს ეძლევა სრული ავტონომია გადაწყვეტილებების მიღებაში, მისი ეთიკური ბარიერები გადამწყვეტ როლს თამაშობს.

Claude-ის სტაბილურობა ადასტურებს, რომ მოდელის "პიროვნულობა" და მისი ინსტრუქციები პირდაპირ კავშირშია მის საზოგადოებრივ ქცევასთან. ეს მონაცემები მნიშვნელოვანია AI-ს შემდგომი განვითარებისთვის.

ექსპერიმენტი კითხვის ნიშნის ქვეშ აყენებს არა მხოლოდ ტექნოლოგიურ შესაძლებლობებს, არამედ იმ მეთოდოლოგიას, რომლითაც დეველოპერები თავიანთ მოდელებს ავარჯიშებენ. უსაფრთხოება აღარ არის მხოლოდ ტექნიკური დეტალი, ის გადარჩენის მთავარი ფაქტორია.