ხელოვნური ინტელექტი რთულ მათემატიკურ ამოცანებს ხსნის: OpenAI-ის ახალი მიღწევები და ერდეშის პრობლემები

პროგრამულმა ინჟინერმა, ყოფილმა მკვლევარმა და სტარტაპის დამფუძნებელმა, ნილ სომანიმ, OpenAI-ის ახალი მოდელის მათემატიკური შესაძლებლობების ტესტირებისას მოულოდნელი აღმოჩენა გააკეთა. ChatGPT-ში მათემატიკური ამოცანის შეყვანიდან 15 წუთის შემდეგ, სისტემამ სრული ამოხსნა შეთავაზა. სომანიმ მიღებული შედეგი შეაფასა და მისი ფორმალიზება Harmonic-ის ხელსაწყოს მეშვეობით მოახდინა — აღმოჩნდა, რომ ამოხსნა აბსოლუტურად ზუსტი იყო.

სომანის მიზანი იყო დაედგინა ზღვარი, თუ სად ახერხებენ დიდი ენობრივი მოდელები (LLM) ღია მათემატიკური პრობლემების ეფექტურად გადაჭრას და სად უჭირთ მათ მუშაობა. კვლევამ აჩვენა, რომ უახლესი მოდელების გამოყენებით ეს ზღვარი საგრძნობლად წინ მიიწევს. ChatGPT-ის ლოგიკური ჯაჭვი (chain of thought) განსაკუთრებით შთამბეჭდავი აღმოჩნდა: მოდელმა ოპერირება მოახდინა ისეთი მათემატიკური აქსიომებით, როგორიცაა ლეჟანდრის ფორმულა, ბერტრანის პოსტულატი და დავითის ვარსკვლავის თეორემა.

საბოლოოდ, მოდელმა მიაგნო 2013 წლის პოსტს პლატფორმაზე Math Overflow, სადაც ჰარვარდის მათემატიკოსმა, ნოამ ელკისმა, მსგავსი ამოცანის ელეგანტური გადაწყვეტა შემოგვთავაზა. თუმცა, ChatGPT-ის საბოლოო მტკიცებულება მნიშვნელოვნად განსხვავდებოდა ელკისის ნამუშევრისგან და წარმოადგენდა ლეგენდარული მათემატიკოსის, პოლ ერდეშის მიერ დასმული ამოცანის უფრო სრულყოფილ ვერსიას. ერდეშის გადაუჭრელი პრობლემების ვრცელი კოლექცია დიდი ხანია ხელოვნური ინტელექტის შესაძლებლობების გამოსაცდელ პოლიგონად იქცა.

ხელოვნური ინტელექტის როლი თანამედროვე მათემატიკაში

მათთვის, ვინც მანქანური ინტელექტის მიმართ სკეპტიკურადაა განწყობილი, ეს შედეგი მოულოდნელია, თუმცა ის ერთადერთი არ არის. AI ინსტრუმენტები მათემატიკაში უკვე ყველგანაა — დაწყებული ფორმალიზაციაზე ორიენტირებული მოდელებით, როგორიცაა Harmonic-ის Aristotle, დამთავრებული ლიტერატურის მიმოხილვის ხელსაწყოებით, როგორიცაა OpenAI-ის Deep Research. GPT 5.2-ის გამოშვების შემდეგ, რომელსაც სომანი წინა ვერსიებთან შედარებით მათემატიკურ მსჯელობაში გაცილებით დახვეწილად ახასიათებს, ამოხსნილი პრობლემების რაოდენობა იმდენად გაიზარდა, რომ მისი უგულებელყოფა შეუძლებელია.

სომანი სწავლობდა ერდეშის პრობლემებს — უნგრელი მათემატიკოსის მიერ დატოვებულ ათასზე მეტ ვარაუდს, რომლებიც ონლაინ რეჟიმშია ხელმისაწვდომი. ეს ამოცანები AI-ზე დაფუძნებული მათემატიკისთვის მიმზიდველ სამიზნეს წარმოადგენს, რადგან ისინი მნიშვნელოვნად განსხვავდებიან როგორც თემატიკით, ისე სირთულით.

მიღწეული შედეგები და სტატისტიკა

ავტონომიური ამოხსნების პირველი ტალღა ნოემბერში გამოჩნდა Gemini-ზე დაფუძნებული მოდელის, AlphaEvolve-ის მეშვეობით.
ბოლო პერიოდში სომანიმ და სხვა მკვლევარებმა აღმოაჩინეს, რომ GPT 5.2 განსაკუთრებით ძლიერია მაღალი დონის მათემატიკაში.
შობის შემდეგ, ერდეშის ვებგვერდზე 15 პრობლემა „ღია“ სტატუსიდან „ამოხსნილის“ კატეგორიაში გადავიდა.
ამ 15 შემთხვევიდან 11-ში ამოხსნის პროცესში ხელოვნური ინტელექტის მონაწილეობა ოფიციალურად დადასტურდა.

ექსპერტების შეფასება და სამომავლო პერსპექტივები

აღიარებული მათემატიკოსი ტერენს ტაო თავის GitHub გვერდზე უფრო დეტალურად განიხილავს ამ პროგრესს. მან დათვალა რვა სხვადასხვა შემთხვევა, როდესაც AI მოდელებმა დამოუკიდებლად მიაღწიეს მნიშვნელოვან პროგრესს ერდეშის პრობლემებზე, ხოლო ექვს სხვა შემთხვევაში პროგრესი წინა კვლევების მოძიებისა და მათზე დაშენების გზით მოხდა.

„AI სისტემების მასშტაბირებადი ბუნება მათ საუკეთესოდ აქცევს ერდეშის ნაკლებად ცნობილი პრობლემების სისტემატური გადაჭრისთვის, რომელთაგან ბევრს რეალურად მარტივი ამოხსნა აქვს.“

ტაოს აზრით, ბევრი შედარებით მარტივი ამოცანა ახლა უფრო მეტი ალბათობით სუფთა AI მეთოდებით ამოიხსნება, ვიდრე ადამიანური ან ჰიბრიდული ძალისხმევით. კიდევ ერთი მამოძრავებელი ძალაა გადასვლა ფორმალიზაციისკენ — შრომატევადი პროცესისკენ, რომელიც მათემატიკურ მსჯელობას უფრო ადვილად შესამოწმებელს ხდის.

ღია კოდის მქონე „მტკიცებულების ასისტენტი“ Lean, რომელიც Microsoft Research-ში 2013 წელს შეიქმნა, ფართოდ გამოიყენება მტკიცებულებების ფორმალიზებისთვის. ისეთი ინსტრუმენტები კი, როგორიცაა Harmonic-ის Aristotle, ამ პროცესის დიდ ნაწილს ავტომატურს ხდის. Harmonic-ის დამფუძნებლის, ტუდორ აჩიმის თქმით, ერდეშის ამოხსნილი ამოცანების რაოდენობაზე მნიშვნელოვანი ისაა, რომ მსოფლიოს წამყვანი მათემატიკოსები ამ ინსტრუმენტებს სერიოზულად აღიქვამენ.

ხელოვნური ინტელექტი რთულ მათემატიკურ ამოცანებს ხსნის: OpenAI-ის ახალი მიღწევები და ერდეშის პრობლემები

ხელოვნური ინტელექტის როლი თანამედროვე მათემატიკაში

მიღწეული შედეგები და სტატისტიკა

ექსპერტების შეფასება და სამომავლო პერსპექტივები

მსგავსი სტატიები

ილონ მასკმა დედამიწაზე მზის ენერგიის განვითარებაზე, შესაძლოა, უარი თქვა

Ferrari IBM-ის ხელოვნურ ინტელექტს ფორმულა 1-ის „სუპერფანების“ შესაქმნელად იყენებს

როგორ იყენებენ ვენჩურული კაპიტალისტები და დამფუძნებლები გაბერილ ARR-ს AI სტარტაპების „გასამეფებლად“