ხელოვნური ინტელექტის განვითარების ახალ ეტაპზე აქცენტი „აგენტურულ ეფექტურობაზე“ გადადის. ახლახან წარდგენილი Step 3.7 Flash სწორედ ამ მიზანს ემსახურება — ის არის მოდელი, რომელიც არა მხოლოდ კითხვებს პასუხობს, არამედ დამოუკიდებლად მოქმედებს ციფრულ გარემოში.
შესაძლებლობები და ფუნქციონალი
Step 3.7 Flash ორიენტირებულია რეალურ სამუშაო პროცესებზე. მოდელს შეუძლია გააანალიზოს სურათები — იქნება ეს პროდუქტის ინტერფეისი, დოკუმენტები თუ გრაფიკები — და მათ საფუძველზე დაწეროს კოდი ან გამოიყენოს შესაბამისი ხელსაწყოები დავალების შესასრულებლად.
მნიშვნელოვნად გაუმჯობესდა ვებ-ძიების ფუნქციაც. სისტემა ახლა უფრო ღრმად ამუშავებს ინფორმაციას და უკეთ ცნობს ახალ, ნაკლებად გავრცელებულ კონცეფციებს, რაც მას კონკურენტუნარიანს ხდის მსხვილ მოდელებთან შედარებით.
ოპტიმიზებული კოდირება და Advisor Mode
კოდირება ციფრული აგენტის მთავარი უნარია. Step 3.7 Flash-მა წინა ვერსიასთან შედარებით 5%-ით გააუმჯობესა შედეგები SWE-Bench Pro-ზე. მოდელი მხარს უჭერს ე.წ. „მრჩეველის რეჟიმს“ (Advisor Mode). ამ რეჟიმში ის დამოუკიდებლად ასრულებს დავალების უდიდეს ნაწილს, ხოლო რთულ მომენტებში რჩევას იღებს უფრო მძლავრი მოდელისგან. ეს მიდგომა 9-ჯერ ამცირებს ხარჯებს და ინარჩუნებს მაღალ ხარისხს.
ვიზუალური აღქმა და ავტონომია
მოდელი აღჭურვილია ვიზუალური ძიების გაფართოებული შესაძლებლობებით. მას შეუძლია სურათებზე ზუმირება, კადრის არჩევა და დეტალური ანალიზი, რაც მას საშუალებას აძლევს, შეასრულოს დავალებები, რომლებიც სხვა, ხუთჯერ დიდ მოდელებსაც კი უჭირთ.
Step 3.7 Flash-ის წარმატება აგენტურულ გარემოში დასტურდება Toolathlon-ზე მიღებული 49.5%-იანი მაჩვენებლით, რაც მრავალსაფეხურიანი ხელსაწყოების კოორდინაციის უნარს უსვამს ხაზს.
Step 3.7 Flash აერთიანებს Flash-ის კლასის ეფექტურობასა და ღრმა კვლევით შესაძლებლობებს, რაც მას პროფესიონალური დავალებების შესასრულებლად გამართულ იარაღად აქცევს.
მოდელი უკვე თავსებადია ისეთ გავრცელებულ პლატფორმებთან, როგორებიცაა Claude Code და Hermes Agent, რაც დეველოპერებისთვის ინტეგრაციის პროცესს ამარტივებს.






დისკუსია
0 კომენტარი
ჯერ კომენტარი არ არის — იყავი პირველი.