აპრილში კომპანია Anthropic-მა ინიციატივა Project Glasswing წარადგინა. პროექტის მიზანი მარტივია: კომპანიებს საშუალება მისცენ, გამოიყენონ მათი ახალი AI მოდელი, Mythos, საკუთარ პროგრამულ უზრუნველყოფაში არსებული დაუცველობების აღმოსაჩენად და გამოსასწორებლად.

იდეამ მყისიერად მიიპყრო ყურადღება. მედიასაშუალებების დიდმა ნაწილმა პოზიტიურად შეაფასა ინიციატივა და გავრცელდა მოსაზრება, თითქოს Mythos-ი პროგრამული კოდის დაუცველობების პოვნაში სხვა მოდელებზე უკეთესია. თუმცა, უსაფრთხოების ექსპერტები ამტკიცებენ, რომ ეს პრეტენზია რეალობას არ შეესაბამება.

რა ხდება რეალურად?

Anthropic-მა პროექტის სტატუსის შესახებ ანგარიში გამოაქვეყნა. დოკუმენტში აღნიშნულია, რომ სისტემა მართლაც პოულობს პროგრამულ ხარვეზებს, მათ შორის ისეთებსაც, რომლებიც მომხმარებლებისთვის საფრთხის შემცველია.

თუმცა, ანგარიშში ერთი საყურადღებო დეტალია: აღმოჩენილი ხარვეზების აბსოლუტური უმრავლესობა კვლავ გაუსწორებელი რჩება. ეს ფაქტი ექსპერტებში უნდობლობას იწვევს.

„რაღაც საეჭვოა იმ მონაცემებში, რასაც გვთავაზობენ. პრობლემა ისაა, რომ Anthropic-ი უარს ამბობს დეტალების გასაჯაროებაზე და მხოლოდ „გვერწმუნეთ“ პრინციპით მოქმედებს“, — აღნიშნავენ კრიტიკოსები.

ინფორმაციის დეფიციტი

გამჭვირვალობის ნაკლებობა ტექნოლოგიურ სექტორში სერიოზულ პრობლემად ითვლება. როდესაც კომპანია აცხადებს, რომ მათმა ხელოვნურმა ინტელექტმა დაცვის ახალი სტანდარტი შექმნა, საზოგადოება ელის მტკიცებულებებს.

Anthropic-ის შემთხვევაში, მონაცემთა დახურულობა აჩენს კითხვას: არის თუ არა Glasswing რეალურად უსაფრთხოების გაძლიერების ინსტრუმენტი, თუ უბრალოდ კარგად დაგეგმილი PR-სვლა, რომელიც რეალურ შედეგებს არ იძლევა?

ამ ეტაპზე, უსაფრთხოების სპეციალისტები მოუწოდებენ კომპანიებს, თავი შეიკავონ AI-ის მიერ მოწოდებული გადაწყვეტილებების უპირობო ნდობისგან, სანამ დეტალური და დამოუკიდებელი აუდიტი არ დაადასტურებს სისტემის ეფექტურობას.