ხელოვნური ინტელექტის განვითარებამ ეჭვქვეშ დააყენა ტრადიციული ონლაინ უსაფრთხოების მექანიზმების ეფექტიანობა. დღესდღეობით, ვიზუალური ენის მოდელებს (VLM) მარტივად შეუძლიათ ისეთი ამოცანების შესრულება, როგორებიცაა შუქნიშნების, ჰიდრანტების ან სხვა ობიექტების ამოცნობა CAPTCHA-ს ტესტებში.
თუმცა, Roundtable Technologies-ის მკვლევარების მიერ ჩატარებული კვლევა მიუთითებს, რომ შედეგის მიღწევა არ ნიშნავს ადამიანური პროცესის იმიტაციას. მიუხედავად იმისა, რომ AI და ადამიანი ერთნაირად წყვეტენ ტესტს, მათ მიერ გამოყენებული სტრატეგიები რადიკალურად განსხვავდება.
პროცესის მიხედვით ამოცნობა
მკვლევარებმა შეიმუშავეს CogCAPTCHA30, რომელიც აერთიანებს ტრადიციულ CAPTCHA-ს 29 კოგნიტურ ფსიქოლოგიურ ტესტთან. ექსპერიმენტის ფარგლებში შედარდა ადამიანებისა და AI-აგენტების ქმედებები. აღმოჩნდა, რომ არსებობს სტატისტიკურად მნიშვნელოვანი განსხვავებები ისეთ მაჩვენებლებში, როგორიცაა:
- თანმიმდევრული კლიკების ნიმუშები;
- კურსორის მიმართულების ცვლილებები;
- ინფორმაციის გადარჩევის ქცევა.
ავტორები გვთავაზობენ ე.წ. „პროცესის ტიურინგის ტესტს“. თუ კლასიკური ტიურინგის ტესტი მხოლოდ შედეგს აფასებს, ახალი მიდგომა აკვირდება, თუ როგორ მივიდა აგენტი კონკრეტულ პასუხამდე. ეს მეთოდი ბევრად უფრო რთულად დასაძლევია ხელოვნური ინტელექტისთვის.
მოდელების შედარება
კვლევამ მოულოდნელი შედეგი აჩვენა: უფრო მცირე ზომის მოდელები, როგორიცაა Qwen, უფრო „ადამიანურად“ მოქმედებენ, ვიდრე ისეთი გიგანტური მოდელები, როგორებიცაა GPT, Claude ან Gemini. ეს ადასტურებს, რომ AI-ის შესაძლებლობების ზრდა ავტომატურად არ ნიშნავს ადამიანური აზროვნების პროცესის მიბაძვას.
მკვლევარების თქმით, ეს პროცესი მყარია მანამ, სანამ ხელოვნურ ინტელექტს არ აქვს წვდომა შეფასების კრიტერიუმებზე. როგორც კი მოდელი სწავლობს, თუ როგორ ხდება მისი „გამოჭერა“, ის ცდილობს კორექტირებას. თუმცა, ადამიანის კოგნიტური ფსიქოლოგიის სრულად რეპლიკაცია AI-სთვის ამ ეტაპზე კვლავაც უზარმაზარ გამოწვევად რჩება.







დისკუსია
0 კომენტარი
ჯერ კომენტარი არ არის — იყავი პირველი.