ხელოვნური ინტელექტი რთულ მათემატიკურ ამოცანებს ხსნის: OpenAI-ის ახალი მიღწევები და ერდეშის პრობლემები
ხელოვნური ინტელექტი უმაღლესი დონის მათემატიკურ გამოწვევებს უმკლავდება. GPT 5.2-მა და სხვა მოდელებმა პოლ ერდეშის არაერთი მანამდე გადაუჭრელი ამოცანა ამოხსნეს, რაც მეცნიერებაში ახალ ეპოქას მოასწავებს.

პროგრამულმა ინჟინერმა, ყოფილმა მკვლევარმა და სტარტაპის დამფუძნებელმა, ნილ სომანიმ, OpenAI-ის ახალი მოდელის მათემატიკური შესაძლებლობების ტესტირებისას მოულოდნელი აღმოჩენა გააკეთა. ChatGPT-ში მათემატიკური ამოცანის შეყვანიდან 15 წუთის შემდეგ, სისტემამ სრული ამოხსნა შეთავაზა. სომანიმ მიღებული შედეგი შეაფასა და მისი ფორმალიზება Harmonic-ის ხელსაწყოს მეშვეობით მოახდინა — აღმოჩნდა, რომ ამოხსნა აბსოლუტურად ზუსტი იყო.
სომანის მიზანი იყო დაედგინა ზღვარი, თუ სად ახერხებენ დიდი ენობრივი მოდელები (LLM) ღია მათემატიკური პრობლემების ეფექტურად გადაჭრას და სად უჭირთ მათ მუშაობა. კვლევამ აჩვენა, რომ უახლესი მოდელების გამოყენებით ეს ზღვარი საგრძნობლად წინ მიიწევს. ChatGPT-ის ლოგიკური ჯაჭვი (chain of thought) განსაკუთრებით შთამბეჭდავი აღმოჩნდა: მოდელმა ოპერირება მოახდინა ისეთი მათემატიკური აქსიომებით, როგორიცაა ლეჟანდრის ფორმულა, ბერტრანის პოსტულატი და დავითის ვარსკვლავის თეორემა.
საბოლოოდ, მოდელმა მიაგნო 2013 წლის პოსტს პლატფორმაზე Math Overflow, სადაც ჰარვარდის მათემატიკოსმა, ნოამ ელკისმა, მსგავსი ამოცანის ელეგანტური გადაწყვეტა შემოგვთავაზა. თუმცა, ChatGPT-ის საბოლოო მტკიცებულება მნიშვნელოვნად განსხვავდებოდა ელკისის ნამუშევრისგან და წარმოადგენდა ლეგენდარული მათემატიკოსის, პოლ ერდეშის მიერ დასმული ამოცანის უფრო სრულყოფილ ვერსიას. ერდეშის გადაუჭრელი პრობლემების ვრცელი კოლექცია დიდი ხანია ხელოვნური ინტელექტის შესაძლებლობების გამოსაცდელ პოლიგონად იქცა.
ხელოვნური ინტელექტის როლი თანამედროვე მათემატიკაში
მათთვის, ვინც მანქანური ინტელექტის მიმართ სკეპტიკურადაა განწყობილი, ეს შედეგი მოულოდნელია, თუმცა ის ერთადერთი არ არის. AI ინსტრუმენტები მათემატიკაში უკვე ყველგანაა — დაწყებული ფორმალიზაციაზე ორიენტირებული მოდელებით, როგორიცაა Harmonic-ის Aristotle, დამთავრებული ლიტერატურის მიმოხილვის ხელსაწყოებით, როგორიცაა OpenAI-ის Deep Research. GPT 5.2-ის გამოშვების შემდეგ, რომელსაც სომანი წინა ვერსიებთან შედარებით მათემატიკურ მსჯელობაში გაცილებით დახვეწილად ახასიათებს, ამოხსნილი პრობლემების რაოდენობა იმდენად გაიზარდა, რომ მისი უგულებელყოფა შეუძლებელია.
სომანი სწავლობდა ერდეშის პრობლემებს — უნგრელი მათემატიკოსის მიერ დატოვებულ ათასზე მეტ ვარაუდს, რომლებიც ონლაინ რეჟიმშია ხელმისაწვდომი. ეს ამოცანები AI-ზე დაფუძნებული მათემატიკისთვის მიმზიდველ სამიზნეს წარმოადგენს, რადგან ისინი მნიშვნელოვნად განსხვავდებიან როგორც თემატიკით, ისე სირთულით.
მიღწეული შედეგები და სტატისტიკა
- ავტონომიური ამოხსნების პირველი ტალღა ნოემბერში გამოჩნდა Gemini-ზე დაფუძნებული მოდელის, AlphaEvolve-ის მეშვეობით.
- ბოლო პერიოდში სომანიმ და სხვა მკვლევარებმა აღმოაჩინეს, რომ GPT 5.2 განსაკუთრებით ძლიერია მაღალი დონის მათემატიკაში.
- შობის შემდეგ, ერდეშის ვებგვერდზე 15 პრობლემა „ღია“ სტატუსიდან „ამოხსნილის“ კატეგორიაში გადავიდა.
- ამ 15 შემთხვევიდან 11-ში ამოხსნის პროცესში ხელოვნური ინტელექტის მონაწილეობა ოფიციალურად დადასტურდა.
ექსპერტების შეფასება და სამომავლო პერსპექტივები
აღიარებული მათემატიკოსი ტერენს ტაო თავის GitHub გვერდზე უფრო დეტალურად განიხილავს ამ პროგრესს. მან დათვალა რვა სხვადასხვა შემთხვევა, როდესაც AI მოდელებმა დამოუკიდებლად მიაღწიეს მნიშვნელოვან პროგრესს ერდეშის პრობლემებზე, ხოლო ექვს სხვა შემთხვევაში პროგრესი წინა კვლევების მოძიებისა და მათზე დაშენების გზით მოხდა.
„AI სისტემების მასშტაბირებადი ბუნება მათ საუკეთესოდ აქცევს ერდეშის ნაკლებად ცნობილი პრობლემების სისტემატური გადაჭრისთვის, რომელთაგან ბევრს რეალურად მარტივი ამოხსნა აქვს.“
ტაოს აზრით, ბევრი შედარებით მარტივი ამოცანა ახლა უფრო მეტი ალბათობით სუფთა AI მეთოდებით ამოიხსნება, ვიდრე ადამიანური ან ჰიბრიდული ძალისხმევით. კიდევ ერთი მამოძრავებელი ძალაა გადასვლა ფორმალიზაციისკენ — შრომატევადი პროცესისკენ, რომელიც მათემატიკურ მსჯელობას უფრო ადვილად შესამოწმებელს ხდის.
ღია კოდის მქონე „მტკიცებულების ასისტენტი“ Lean, რომელიც Microsoft Research-ში 2013 წელს შეიქმნა, ფართოდ გამოიყენება მტკიცებულებების ფორმალიზებისთვის. ისეთი ინსტრუმენტები კი, როგორიცაა Harmonic-ის Aristotle, ამ პროცესის დიდ ნაწილს ავტომატურს ხდის. Harmonic-ის დამფუძნებლის, ტუდორ აჩიმის თქმით, ერდეშის ამოხსნილი ამოცანების რაოდენობაზე მნიშვნელოვანი ისაა, რომ მსოფლიოს წამყვანი მათემატიკოსები ამ ინსტრუმენტებს სერიოზულად აღიქვამენ.
მსგავსი სტატიები

უსაფრთხოება „მკვდარია“ xAI-ში? ილონ მასკი Grok-ის კიდევ უფრო „თავაშვებულ“ მოდელად ქცევას ცდილობს
ილონ მასკის xAI-დან ინჟინრებისა და დამფუძნებლების მასობრივი გადინება დაიწყო. ყოფილი თანამშრომლები უსაფრთხოების ნორმების უგულებელყოფასა და ჩატბოტ Grok-ის „თავაშვებულ“ მოდელად ქცევის მცდელობაზე საუბრობენ.

ჰოლივუდი ByteDance-ის ახალი AI ვიდეო გენერატორის, Seedance 2.0-ის წინააღმდეგ გამოდის
ჰოლივუდის ორგანიზაციები და Disney ByteDance-ის ახალ AI ვიდეო გენერატორს, Seedance 2.0-ს, საავტორო უფლებების მასშტაბურ დარღვევაში ადანაშაულებენ.

რატომ ტოვებენ წამყვანი სპეციალისტები OpenAI-სა და xAI-ს: ტექნოლოგიური გიგანტების საკადრო კრიზისი
ხელოვნური ინტელექტის სფეროში საკადრო კრიზისია: xAI-ის დამფუძნებელი გუნდის ნახევარი დაიშალა, OpenAI-ში კი უსაფრთხოების გუნდების დაშლა და სკანდალური გათავისუფლებები გრძელდება.