ხელოვნური ინტელექტის სფეროში კონკურენცია ახალ ფაზაში შედის. სტარტაპმა Nous Research-მა, რომელიც Paradigm-ის მხარდაჭერით სარგებლობს, ახალი მოდელი — NousCoder-14B წარადგინა. ის შექმნილია სპეციალურად პროგრამირების რთული ამოცანების გადასაჭრელად და, კომპანიის მტკიცებით, თავისი შესაძლებლობებით უტოლდება ან აღემატება ბაზარზე არსებულ ბევრ დახურულ სისტემას.

ტექნოლოგიური გარღვევა ოთხ დღეში

მოდელის მომზადებას მხოლოდ ოთხი დღე დასჭირდა. ტრენინგი ჩატარდა Nvidia-ს უახლესი B200 გრაფიკული პროცესორების გამოყენებით. შედეგები შთამბეჭდავია: LiveCodeBench v6-ის შეფასებით, მოდელმა 67.87%-იანი სიზუსტე აჩვენა, რაც 7.08 პროცენტული პუნქტით აღემატება საფუძვლად აღებულ Alibaba-ს Qwen3-14B მოდელს.

მკვლევარმა ჯო ლიმ, რომელიც მოდელის შექმნაზე მუშაობდა, აღნიშნა, რომ პროცესი მის პირად გამოცდილებას ჰგავდა. ლიმ მოდელის განვითარების ტრაექტორია შეადარა თავის ორწლიან პრაქტიკას Codeforces-ზე. მოდელმა ის პროგრესი, რისთვისაც ადამიანს ორი წელი სჭირდება, სულ რაღაც ოთხ დღეში გაიარა.

რადიკალური ღიაობა და გამჭვირვალობა

განსხვავებით კონკურენტებისგან, Nous Research-მა გაასაჯაროვა არა მხოლოდ მოდელის წონები, არამედ მთლიანი ინფრასტრუქტურა — Atropos framework-ის ჩათვლით. ეს ნიშნავს, რომ ნებისმიერ დაინტერესებულ მკვლევარს შეუძლია მოდელის რეპროდუცირება ან გაუმჯობესება, თუ საკმარისი გამოთვლითი სიმძლავრე გააჩნია.

მონაცემთა დეფიციტი: ახალი რეალობა

კვლევის ანგარიშში საინტერესო დეტალია მოხსენიებული: მოდელის ტრენინგისთვის გამოყენებულია 24,000 პროგრამირების ამოცანა, რაც პრაქტიკულად ამოწურავს ინტერნეტში არსებულ მაღალი ხარისხის, ვერიფიცირებად მონაცემთა ბაზას. ეს მიუთითებს იმაზე, რომ AI-ის განვითარება უახლოეს მომავალში სინთეტიკური მონაცემების გენერირებაზე იქნება დამოკიდებული.

"ადამიანები, ყოველ შემთხვევაში ამ ეტაპზე, გაცილებით უფრო ეფექტურები არიან სწავლის პროცესში, ვიდრე მანქანები," - აღნიშნავს ჯო ლი.

მიუხედავად იმისა, რომ მოდელი 24,000 ამოცანაზე გაიწვრთნა, ადამიანს ანალოგიური ცოდნის მისაღებად გაცილებით ნაკლები მასალა სჭირდება. ეს ფაქტი AI-ის ეფექტურობის შესახებ დებატებს კიდევ უფრო ამწვავებს.