თანამედროვე ხელოვნური ინტელექტის განვითარების ტემპი შთამბეჭდავია, თუმცა სისტემების სიზუსტე კვლავ სერიოზული გამოწვევა რჩება. Lenz Research-ის უახლესი კვლევის თანახმად, ხუთი წამყვანი AI-მოდელი რეალურ სამყაროში არსებულ ფაქტობრივ საკითხებზე შეთანხმებას ვერ ახერხებს. 1,000 შემთხვევითი მომხმარებლის შეკითხვის ანალიზმა აჩვენა, რომ მოდელების პოზიციები 67%-იან შემთხვევაში ერთმანეთს არ ემთხვევა.
რა აჩვენა ექსპერიმენტმა?
მკვლევრებმა ხუთი წამყვანი AI-მოდელი გამოიყენეს, რათა შეეფასებინათ მომხმარებლების მიერ დაფიქსირებული რეალური ფაქტები. თითოეულ მოდელს უნდა მიენიჭებინა ვერდიქტი ოთხი კატეგორიიდან: „მართალი“, „უმეტესწილად მართალი“, „შეცდომაში შემყვანი“ და „მცდარი“.
შედეგები აჩვენებს, რომ მხოლოდ 33%-ში შეთანხმდნენ მოდელები ერთ პასუხზე. დანარჩენ შემთხვევებში კი დაფიქსირდა აზრთა სხვადასხვაობა, სადაც მინიმუმ ერთი მოდელი მაინც უპირისპირდებოდა უმრავლესობის აზრს, ან საერთოდ არ არსებობდა მკაფიო უმრავლესობა.
პრობლემა „ნაცრისფერ ზონაში“
კვლევის ავტორები აღნიშნავენ, რომ განსაკუთრებით რთულია ისეთი საკითხები, რომლებიც არ არის „შავი და თეთრი“. როდესაც საქმე ეხება „უმეტესწილად მართალ“ ან „შეცდომაში შემყვან“ კატეგორიებს, მოდელების ერთსულოვნება თითქმის ნულოვანია. ეს მიუთითებს იმაზე, რომ AI-სთვის ყველაზე რთული ნიუანსების და მრავალმხრივი სიმართლის აღქმაა.
„ხელოვნური ინტელექტის უმრავლესობის ვერდიქტი არ ნიშნავს აბსოლუტურ ჭეშმარიტებას. ხშირად, უმრავლესობაც ცდება, ხოლო გამონაკლისი მოდელი შეიძლება მართალი იყოს,“ — აღნიშნულია კვლევაში.
რატომ არის ეს მნიშვნელოვანი?
ეს კვლევა არ არის უბრალო ტესტირება; ეს არის გაფრთხილება მომხმარებლებისთვის. როდესაც AI-ს ვიყენებთ ინფორმაციის გადასამოწმებლად, უნდა გვახსოვდეს, რომ სისტემებს არ გააჩნიათ ერთიანი, უტყუარი „სიმართლის ბაზა“. ისინი ეყრდნობიან ალბათობას და სტატისტიკას, რაც ხშირად იწვევს წინააღმდეგობრივ პასუხებს.
კვლევამ ასევე აჩვენა, რომ მოდელებს შორის „აზრთა სხვადასხვაობა“ არ არის შემთხვევითი. ზოგიერთი მათგანი მიდრეკილია უკიდურესობებისკენ (მხოლოდ მართალი ან მცდარი), ხოლო სხვები უფრო ფრთხილად აფასებენ ინფორმაციას. ეს სტრუქტურული განსხვავება მიუთითებს იმაზე, რომ AI-ს მუშაობის პრინციპები ჯერ კიდევ შორსაა სრულყოფილებისგან.







დისკუსია
0 კომენტარი
ჯერ კომენტარი არ არის — იყავი პირველი.