ხელოვნური ინტელექტის მომხმარებლები სულ უფრო ხშირად ამჩნევენ, რომ Anthropic-ის ჩეთბოტი Claude ხასიათს იცვლის. მოდელის ახალი ვერსიები, განსაკუთრებით Fable, მომხმარებლებთან კომუნიკაციისას აგრესიულ ტონს იყენებენ და მუდმივად კამათს ცდილობენ.
პრობლემა Opus 4.7-ის გამოშვებისას დაიწყო და ახალი მოდელების მოსვლასთან ერთად უფრო თვალშისაცემი გახდა. ჩეთბოტი ყველაფერს დაპირისპირებად აღიქვამს, მომხმარებელს უსვამს ისეთ კითხვებს, რომლებიც არ დასმულა და იკამათებს წვრილმან სემანტიკურ დეტალებზეც კი. თუ მომხმარებელი არგუმენტებით დაამტკიცებს, რომ ჩეთბოტი ცდება, სისტემა ცდილობს ბოლო სიტყვა მაინც თავად თქვას.
რა იწვევს ამ ქცევას?
ექსპერტები ვარაუდობენ, რომ მიზეზი შესაძლოა „გადაჭარბებული ალაინმენტი“ (alignment guardrails) იყოს. მოდელი ავტომატურად ვარაუდობს, რომ მომხმარებელი ცდილობს მის მოტყუებას ან რაიმე მავნე ქმედებისკენ უბიძგებს. შედეგად, ჩეთბოტი მუდმივად თავდაცვით პოზიციაშია.
კიდევ ერთი თეორია უკავშირდება „სიკოფანტურობის“ შემცირების მცდელობას. Anthropic-მა სცადა მოდელი უფრო დამოუკიდებელი გაეხადა, თუმცა შედეგი ზედმეტად უხეში კომუნიკაცია აღმოჩნდა. ასევე არ არის გამორიცხული, რომ მოდელი წვრთნიან ისეთ მონაცემებზე, სადაც დისკუსიები კონფლიქტურია, რაც აისახება მის ტონზე.
კოდირება vs კომუნიკაცია
მნიშვნელოვანია ის ფაქტიც, რომ კომპანიები სულ უფრო მეტ რესურსს ხარჯავენ მოდელების პროგრამირების უნარების გაუმჯობესებაზე. როგორც ჩანს, კოდირების უნარების ზრდა უკუპროპორციულად მოქმედებს ჩეთბოტის ადამიანურ კომუნიკაციაზე. მოდელები სულ უფრო ხშირად ვერ იგებენ კონტექსტს, რაც ადრეულ ვერსიებთან შედარებით უკუსვლაა.
მიუხედავად იმისა, რომ უსაფრთხოების ზომები აუცილებელია, მათი ნაჩქარევი დანერგვა მომხმარებლის გამოცდილებას აფუჭებს. საბოლოო ჯამში, უსაფრთხოების აუდიტი და პროგრამული ხარვეზების გასწორება მომავალში სტანდარტული პროცესი გახდება, თუმცა ამ ეტაპზე Claude-ის ქცევა ბევრისთვის შემაწუხებელია.






დისკუსია
0 კომენტარი
ჯერ კომენტარი არ არის — იყავი პირველი.