Skip to main content
ხელოვნური ინტელექტი20.2.20263 ნახვა

Google-ის ახალმა Gemini Pro მოდელმა ბენჩმარკებში კვლავ რეკორდული შედეგები აჩვენა

Google-მა Gemini Pro-ს უახლესი, 3.1 ვერსია წარადგინა, რომელიც დამოუკიდებელ ტესტებში წინამორბედზე ბევრად უკეთეს შედეგებს აჩვენებს და AI აგენტების რეიტინგში პირველ ადგილს იკავებს.

Google-ის ახალმა Gemini Pro მოდელმა ბენჩმარკებში კვლავ რეკორდული შედეგები აჩვენა

ხუთშაბათს კომპანია Google-მა თავისი მძლავრი დიდი ენობრივი მოდელის (LLM), Gemini Pro-ს უახლესი ვერსია წარადგინა. მოდელი 3.1 ამჟამად სატესტო (preview) რეჟიმშია ხელმისაწვდომი, თუმცა კომპანიის განცხადებით, მისი სრული ვერსია მალე გამოვა. Google-ის ეს ახალი მოდელი, შესაძლოა, დღემდე შექმნილ ერთ-ერთ ყველაზე მძლავრ LLM-ად იქცეს.

დამკვირვებლების აღნიშვნით, Gemini 3.1 Pro მნიშვნელოვანი წინგადადგმული ნაბიჯია მის წინამორბედ Gemini 3-თან შედარებით. ეს უკანასკნელი ნოემბერში გამოვიდა და უკვე ითვლებოდა მაღალი შესაძლებლობების მქონე ხელოვნური ინტელექტის ინსტრუმენტად. ხუთშაბათს Google-მა ასევე გააზიარა დამოუკიდებელი ბენჩმარკების სტატისტიკა — მაგალითად, ერთ-ერთი, სახელწოდებით „Humanity’s Last Exam“, აჩვენებს, რომ ახალი ვერსია წინა მოდელზე მნიშვნელოვნად უკეთეს შედეგებს აღწევს.

Gemini 3.1 Pro-ს შესაძლებლობები დადებითად შეაფასა AI სტარტაპ Mercor-ის აღმასრულებელმა დირექტორმა, ბრენდან ფუდიმ (Brendan Foody). Mercor-ის ბენჩმარკინგის სისტემა, APEX, სპეციალურად იმის შესაფასებლად არის შექმნილი, თუ რამდენად კარგად ასრულებენ ხელოვნური ინტელექტის მოდელები რეალურ პროფესიულ დავალებებს.

„Gemini 3.1 Pro ახლა APEX-Agents-ის ლიდერბორდის სათავეშია“, — აღნიშნა ფუდიმ სოციალურ ქსელში გამოქვეყნებულ პოსტში. მან ასევე დასძინა, რომ მოდელის შთამბეჭდავი შედეგები ცხადყოფს, თუ „რამდენად სწრაფად უმჯობესდებიან AI აგენტები რეალური ინტელექტუალური სამუშაოს შესრულებისას“.

ეს სიახლე AI მოდელებს შორის მზარდი კონკურენციის ფონზე გავრცელდა. ტექნოლოგიური კომპანიები აგრძელებენ სულ უფრო მძლავრი მოდელების გამოშვებას, რომლებიც გათვლილია „აგენტურ“ (agentic) მუშაობასა და მრავალსაფეხურიან ლოგიკურ მსჯელობაზე. ბოლო პერიოდში ახალი მოდელები სხვა მსხვილმა მოთამაშეებმაც წარადგინეს, მათ შორის OpenAI-მ და Anthropic-მა.

წყარო: TechCrunch AI
გაზიარება:

მსგავსი სტატიები

Google-მა Chrome-ში AI Mode-ით ვებგვერდების გვერდიგვერდ დათვალიერების ფუნქცია დაამატა
ხელოვნური ინტელექტი

Google-მა Chrome-ში AI Mode-ით ვებგვერდების გვერდიგვერდ დათვალიერების ფუნქცია დაამატა

Google-მა Chrome-ის დესკტოპ ვერსიაში AI Mode-ის ახალი ფუნქცია დაამატა, რომელიც ვებგვერდების გვერდიგვერდ დათვალიერებისა და რამდენიმე ჩანართში ერთდროული ძიების საშუალებას იძლევა.

16.4.2026
Anthropic-ის პროდუქტების დირექტორმა Figma-ს საბჭო დატოვა: მოსალოდნელია კონკურენცია AI დიზაინის სფეროში
ხელოვნური ინტელექტი

Anthropic-ის პროდუქტების დირექტორმა Figma-ს საბჭო დატოვა: მოსალოდნელია კონკურენცია AI დიზაინის სფეროში

Anthropic-ის პროდუქტების დირექტორმა, მაიკ კრიგერმა, Figma-ს საბჭო დატოვა. მიზეზად Anthropic-ის მიერ დიზაინის ახალი AI ხელსაწყოების შესაძლო გამოშვება სახელდება.

16.4.2026
OpenAI-მ Codex-ი განაახლა: ხელოვნური ინტელექტი თქვენს კომპიუტერზე კონტროლს ამყარებს
ხელოვნური ინტელექტი

OpenAI-მ Codex-ი განაახლა: ხელოვნური ინტელექტი თქვენს კომპიუტერზე კონტროლს ამყარებს

OpenAI-მ Codex-ის მნიშვნელოვანი განახლება წარადგინა, რომელიც ხელოვნურ ინტელექტს კომპიუტერის აპლიკაციების მართვისა და ფონურ რეჟიმში მუშაობის შესაძლებლობას აძლევს.

16.4.2026