Skip to main content
ხელოვნური ინტელექტი20.2.20264 ნახვა

Google-ის ახალმა Gemini Pro მოდელმა ბენჩმარკებში კვლავ რეკორდული შედეგები აჩვენა

Google-მა Gemini Pro-ს უახლესი, 3.1 ვერსია წარადგინა, რომელიც დამოუკიდებელ ტესტებში წინამორბედზე ბევრად უკეთეს შედეგებს აჩვენებს და AI აგენტების რეიტინგში პირველ ადგილს იკავებს.

Google-ის ახალმა Gemini Pro მოდელმა ბენჩმარკებში კვლავ რეკორდული შედეგები აჩვენა

ხუთშაბათს კომპანია Google-მა თავისი მძლავრი დიდი ენობრივი მოდელის (LLM), Gemini Pro-ს უახლესი ვერსია წარადგინა. მოდელი 3.1 ამჟამად სატესტო (preview) რეჟიმშია ხელმისაწვდომი, თუმცა კომპანიის განცხადებით, მისი სრული ვერსია მალე გამოვა. Google-ის ეს ახალი მოდელი, შესაძლოა, დღემდე შექმნილ ერთ-ერთ ყველაზე მძლავრ LLM-ად იქცეს.

დამკვირვებლების აღნიშვნით, Gemini 3.1 Pro მნიშვნელოვანი წინგადადგმული ნაბიჯია მის წინამორბედ Gemini 3-თან შედარებით. ეს უკანასკნელი ნოემბერში გამოვიდა და უკვე ითვლებოდა მაღალი შესაძლებლობების მქონე ხელოვნური ინტელექტის ინსტრუმენტად. ხუთშაბათს Google-მა ასევე გააზიარა დამოუკიდებელი ბენჩმარკების სტატისტიკა — მაგალითად, ერთ-ერთი, სახელწოდებით „Humanity’s Last Exam“, აჩვენებს, რომ ახალი ვერსია წინა მოდელზე მნიშვნელოვნად უკეთეს შედეგებს აღწევს.

Gemini 3.1 Pro-ს შესაძლებლობები დადებითად შეაფასა AI სტარტაპ Mercor-ის აღმასრულებელმა დირექტორმა, ბრენდან ფუდიმ (Brendan Foody). Mercor-ის ბენჩმარკინგის სისტემა, APEX, სპეციალურად იმის შესაფასებლად არის შექმნილი, თუ რამდენად კარგად ასრულებენ ხელოვნური ინტელექტის მოდელები რეალურ პროფესიულ დავალებებს.

„Gemini 3.1 Pro ახლა APEX-Agents-ის ლიდერბორდის სათავეშია“, — აღნიშნა ფუდიმ სოციალურ ქსელში გამოქვეყნებულ პოსტში. მან ასევე დასძინა, რომ მოდელის შთამბეჭდავი შედეგები ცხადყოფს, თუ „რამდენად სწრაფად უმჯობესდებიან AI აგენტები რეალური ინტელექტუალური სამუშაოს შესრულებისას“.

ეს სიახლე AI მოდელებს შორის მზარდი კონკურენციის ფონზე გავრცელდა. ტექნოლოგიური კომპანიები აგრძელებენ სულ უფრო მძლავრი მოდელების გამოშვებას, რომლებიც გათვლილია „აგენტურ“ (agentic) მუშაობასა და მრავალსაფეხურიან ლოგიკურ მსჯელობაზე. ბოლო პერიოდში ახალი მოდელები სხვა მსხვილმა მოთამაშეებმაც წარადგინეს, მათ შორის OpenAI-მ და Anthropic-მა.

წყარო: TechCrunch AI
გაზიარება:

მსგავსი სტატიები

SpaceX-ის საბაზრო ღირებულებამ 2.6 ტრილიონ დოლარს მიაღწია და მცირე ხნით Amazon-საც გადაასწრო
ხელოვნური ინტელექტი

SpaceX-ის საბაზრო ღირებულებამ 2.6 ტრილიონ დოლარს მიაღწია და მცირე ხნით Amazon-საც გადაასწრო

SpaceX-ის საბაზრო ღირებულება 2.6 ტრილიონ დოლარამდე გაიზარდა, რითაც მან მცირე ხნით Amazon-საც გადაასწრო. აქციების ზრდა Cursor-ის შესყიდვამ და AI სტრატეგიამ განაპირობა.

17.6.2026
Anthropic-ის დაპირისპირება ტრამპის ადმინისტრაციასთან: რატომ შეიძლება ეს კომპანიისთვის სასარგებლო აღმოჩნდეს?
ხელოვნური ინტელექტი

Anthropic-ის დაპირისპირება ტრამპის ადმინისტრაციასთან: რატომ შეიძლება ეს კომპანიისთვის სასარგებლო აღმოჩნდეს?

Anthropic-მა ბიზნეს სექტორში OpenAI-ს გადაასწრო. მიუხედავად ტრამპის ადმინისტრაციასთან დაპირისპირებისა და მოდელების აკრძალვისა, კომპანიის პოპულარობა და გაყიდვები იზრდება.

17.6.2026
კვლევა: აშშ-ის მომხმარებელთა 60%-ისთვის ბრენდების მიერ AI-ის გამოყენება გამაღიზიანებელია
ხელოვნური ინტელექტი

კვლევა: აშშ-ის მომხმარებელთა 60%-ისთვის ბრენდების მიერ AI-ის გამოყენება გამაღიზიანებელია

WordPress VIP-ის კვლევის თანახმად, ამერიკელი მომხმარებლების 60% ბრენდების მიერ AI-ის გამოყენებას უარყოფითად აფასებს, ხოლო 86% ხელოვნურ ინტელექტს სრულად არ ენდობა.

16.6.2026