ხელოვნური ინტელექტის განვითარებამ მათემატიკური პრობლემების გადაჭრის ახალ ეტაპს მიაღწია. ახლახან წარდგენილმა ჩარჩომ, სახელწოდებით MaxProof, აჩვენა, რომ მანქანურ სწავლებას შეუძლია ოლიმპიური დონის მათემატიკური ამოცანების შესრულება, რაც აქამდე მხოლოდ ადამიანის ინტელექტის პრეროგატივად მიიჩნეოდა.

MaxProof წარმოადგენს MiniMax-M3 სერიის ნაწილს და ეფუძნება პოპულაციურ ტესტირების მასშტაბირებას. სისტემა მუშაობს რამდენიმე ძირითადი მიმართულებით: მტკიცებულებების გენერირება, მათი ვერიფიკაცია და კრიტიკაზე დაფუძნებული კორექტირება.

სისტემის ეფექტიანობა განპირობებულია მისი უნიკალური არქიტექტურით. M3 მოდელი იყენებს „გენერაციულ ვერიფიკატორს“, რომელიც მინიმუმამდე ამცირებს ცრუ დადებითი შედეგების ალბათობას. ეს მიდგომა უზრუნველყოფს, რომ მიღებული მათემატიკური დასკვნები იყოს არა მხოლოდ სწრაფი, არამედ აბსოლუტურად ზუსტი.

ტესტირება ოლიმპიურ დონეზე

ტესტირების პროცესში MaxProof მოდელი მოქმედებს როგორც გენერატორი, ვერიფიკატორი, რეფაინერი და რეიტინგის მიმნიჭებელი. ის განიხილავს მტკიცებულებების კანდიდატთა მთელ პოპულაციას და „ტურნირის შერჩევის“ მეთოდით ირჩევს საბოლოო, ყველაზე მყარ პასუხს.

შედეგები შთამბეჭდავია: M3 მოდელმა საერთაშორისო მათემატიკური ოლიმპიადის (IMO 2025) 42-დან 35 ქულა აიღო. ანალოგიურად, USAMO 2026-ზე მოდელმა 42-დან 36 ქულას მიაღწია. ორივე შემთხვევაში, შედეგმა გადააჭარბა ადამიანის ოქროს მედლისთვის საჭირო მინიმალურ ზღვარს.

ტექნოლოგიური უპირატესობა

Subjects:Machine Learning (cs.LG); Artificial Intelligence (cs.AI); Computation and Language (cs.CL)
Cite as:arXiv:2606.13473 [cs.LG]
(or arXiv:2606.13473v1 [cs.LG] for this version)
https://doi.org/10.48550/arXiv.2606.13473 arXiv-issued DOI via DataCite (pending registration)

მკვლევართა თქმით, სისტემის მთავარი სიძლიერე არა მხოლოდ გენერირების სიჩქარე, არამედ „დაცვის სიღრმეა“. ეს ნიშნავს, რომ მოდელი მუდმივად აკრიტიკებს და ასწორებს საკუთარ ნაშრომს მანამ, სანამ საბოლოო შედეგს წარადგენს. ეს პროცესი წააგავს გამოცდილი მათემატიკოსის მუშაობის სტილს, რომელიც მრავალჯერ ამოწმებს თეორემის მტკიცებულებას.

MaxProof-ის წარმატება მიანიშნებს, რომ ხელოვნური ინტელექტი სულ უფრო მეტად უახლოვდება რთული, აბსტრაქტული აზროვნების დონეს. თუ ადრე AI მხოლოდ მონაცემთა დამუშავებით შემოიფარგლებოდა, დღეს ის ლოგიკური დასკვნების გამოტანისა და მათემატიკური სიმკაცრის დაცვის უნარსაც ავლენს.