Google-ის ახალმა Gemini Pro მოდელმა ბენჩმარკებში კვლავ რეკორდული შედეგები აჩვენა
Google-მა Gemini Pro-ს უახლესი, 3.1 ვერსია წარადგინა, რომელიც დამოუკიდებელ ტესტებში წინამორბედზე ბევრად უკეთეს შედეგებს აჩვენებს და AI აგენტების რეიტინგში პირველ ადგილს იკავებს.

ხუთშაბათს კომპანია Google-მა თავისი მძლავრი დიდი ენობრივი მოდელის (LLM), Gemini Pro-ს უახლესი ვერსია წარადგინა. მოდელი 3.1 ამჟამად სატესტო (preview) რეჟიმშია ხელმისაწვდომი, თუმცა კომპანიის განცხადებით, მისი სრული ვერსია მალე გამოვა. Google-ის ეს ახალი მოდელი, შესაძლოა, დღემდე შექმნილ ერთ-ერთ ყველაზე მძლავრ LLM-ად იქცეს.
დამკვირვებლების აღნიშვნით, Gemini 3.1 Pro მნიშვნელოვანი წინგადადგმული ნაბიჯია მის წინამორბედ Gemini 3-თან შედარებით. ეს უკანასკნელი ნოემბერში გამოვიდა და უკვე ითვლებოდა მაღალი შესაძლებლობების მქონე ხელოვნური ინტელექტის ინსტრუმენტად. ხუთშაბათს Google-მა ასევე გააზიარა დამოუკიდებელი ბენჩმარკების სტატისტიკა — მაგალითად, ერთ-ერთი, სახელწოდებით „Humanity’s Last Exam“, აჩვენებს, რომ ახალი ვერსია წინა მოდელზე მნიშვნელოვნად უკეთეს შედეგებს აღწევს.
Gemini 3.1 Pro-ს შესაძლებლობები დადებითად შეაფასა AI სტარტაპ Mercor-ის აღმასრულებელმა დირექტორმა, ბრენდან ფუდიმ (Brendan Foody). Mercor-ის ბენჩმარკინგის სისტემა, APEX, სპეციალურად იმის შესაფასებლად არის შექმნილი, თუ რამდენად კარგად ასრულებენ ხელოვნური ინტელექტის მოდელები რეალურ პროფესიულ დავალებებს.
„Gemini 3.1 Pro ახლა APEX-Agents-ის ლიდერბორდის სათავეშია“, — აღნიშნა ფუდიმ სოციალურ ქსელში გამოქვეყნებულ პოსტში. მან ასევე დასძინა, რომ მოდელის შთამბეჭდავი შედეგები ცხადყოფს, თუ „რამდენად სწრაფად უმჯობესდებიან AI აგენტები რეალური ინტელექტუალური სამუშაოს შესრულებისას“.
ეს სიახლე AI მოდელებს შორის მზარდი კონკურენციის ფონზე გავრცელდა. ტექნოლოგიური კომპანიები აგრძელებენ სულ უფრო მძლავრი მოდელების გამოშვებას, რომლებიც გათვლილია „აგენტურ“ (agentic) მუშაობასა და მრავალსაფეხურიან ლოგიკურ მსჯელობაზე. ბოლო პერიოდში ახალი მოდელები სხვა მსხვილმა მოთამაშეებმაც წარადგინეს, მათ შორის OpenAI-მ და Anthropic-მა.
მსგავსი სტატიები

Nvidia აძლიერებს პოზიციებს ინდოეთის ხელოვნური ინტელექტის სტარტაპ ეკოსისტემაში: ახალი პარტნიორობები და სტრატეგიული გეგმები
Nvidia აძლიერებს თანამშრომლობას ინდოეთის AI სტარტაპებთან ადრეულ ეტაპზე, რათა უზრუნველყოს გრძელვადიანი მოთხოვნა თავის გამოთვლით ინფრასტრუქტურაზე მსოფლიოს ერთ-ერთ უმსხვილეს ბაზარზე.

General Catalyst ინდოეთის სტარტაპ ეკოსისტემაში 5 მილიარდი დოლარის ინვესტირებას გეგმავს
ვენჩურული გიგანტი General Catalyst ინდოეთში 5 მილიარდი დოლარის ინვესტირებას აანონსებს. თანხა ხელოვნური ინტელექტის, ჯანდაცვისა და თავდაცვის ტექნოლოგიების განვითარებას მოხმარდება.

Reload-ი ხელოვნური ინტელექტის აგენტებისთვის „საერთო მეხსიერების“ პლატფორმას ქმნის
სტარტაპმა Reload-მა ახალი პროდუქტი Epic წარადგინა, რომელიც AI აგენტებს შორის კონტექსტის შენარჩუნებასა და სამუშაო პროცესების კოორდინაციას უზრუნველყოფს.