ტექნოლოგიური გიგანტების შეჯიბრი: Google-ის ახალი AI აგენტი და OpenAI-ს პასუხი GPT-5.2-ით

Google-მა ხუთშაბათს თავისი კვლევითი აგენტის, Gemini Deep Research-ის, განახლებული ვერსია წარადგინა, რომელიც კომპანიის უახლეს და მძლავრ მოდელზე, Gemini 3 Pro-ზეა დაფუძნებული. ეს ახალი ინსტრუმენტი მხოლოდ კვლევითი ანგარიშების მოსამზადებლად არ არის შექმნილი; ის დეველოპერებს საშუალებას აძლევს, Google-ის კვლევითი შესაძლებლობები პირდაპირ საკუთარ აპლიკაციებში ჩააშენონ.

ეს ფუნქციონალი Google-ის ახალი Interactions API-ის მეშვეობით ხდება შესაძლებელი, რომელიც დეველოპერებს მეტ კონტროლს სთავაზობს ხელოვნური ინტელექტის აგენტების ეპოქაში. ახალი Gemini Deep Research ინსტრუმენტი წარმოადგენს აგენტს, რომელსაც შეუძლია უზარმაზარი მოცულობის ინფორმაციის სინთეზირება და მოთხოვნაში მიწოდებული დიდი კონტექსტის დამუშავება. Google-ის თქმით, მომხმარებლები მას სხვადასხვა ამოცანისთვის იყენებენ, დაწყებული ბიზნესის სიღრმისეული ანალიზით, დამთავრებული მედიკამენტების ტოქსიკურობის კვლევით.

კომპანია ასევე აცხადებს, რომ მალე ამ ახალი კვლევითი აგენტის ინტეგრაციას მოახდენს ისეთ სერვისებში, როგორებიცაა Google Search, Google Finance, Gemini App და NotebookLM. ეს კიდევ ერთი ნაბიჯია იმ მომავლისკენ, სადაც ინფორმაციას ადამიანების ნაცვლად მათი პერსონალური AI აგენტები მოიძიებენ.

ტექნოლოგიური გიგანტის განცხადებით, Deep Research-ის უპირატესობა Gemini 3 Pro-ს „ყველაზე ფაქტობრივ“ მოდელზე დაფუძნებაა, რომელიც რთული ამოცანების შესრულებისას „ჰალუცინაციების“ მინიმიზაციისთვის არის შექმნილი. AI ჰალუცინაციები, როდესაც მოდელი ფაქტებს იგონებს, განსაკუთრებით კრიტიკული პრობლემაა ხანგრძლივი, ავტონომიური ამოცანებისთვის, სადაც გადაწყვეტილებები წუთების ან საათების განმავლობაში მიიღება. რაც უფრო მეტ არჩევანს აკეთებს მოდელი, მით მეტია შანსი, რომ ერთმა მცდარმა გადაწყვეტილებამ მთელი შედეგი გააბათილოს.

საკუთარი მიღწევების დასამტკიცებლად, Google-მა ახალი ტესტირების სტანდარტი, ანუ ბენჩმარკი შექმნა, სახელწოდებით DeepSearchQA. ის მიზნად ისახავს აგენტების შემოწმებას რთულ, მრავალეტაპიან ინფორმაციის მოძიების ამოცანებში და მისი კოდი საჯაროდ ხელმისაწვდომია. Google-მა თავისი აგენტი ასევე გამოსცადა ორ სხვა ბენჩმარკზე: Humanity’s Last Exam, რომელიც ზოგად ცოდნას ამოწმებს, და BrowserComp, რომელიც ბრაუზერზე დაფუძნებულ ამოცანებზეა ორიენტირებული.

როგორც მოსალოდნელი იყო, Google-ის ახალმა აგენტმა საუკეთესო შედეგი აჩვენა საკუთარ ბენჩმარკსა და Humanity’s Last Exam-ზე. თუმცა, OpenAI-ს ChatGPT 5 Pro მასთან ძალიან ახლოს იყო და მცირედით აჯობა კიდეც BrowserComp-ის ტესტში. მაგრამ ეს შედარებები თითქმის გამოქვეყნებისთანავე მოძველდა.

საქმე ისაა, რომ იმავე დღეს OpenAI-მ თავისი დიდი ხნის ნანატრი მოდელი, GPT 5.2 გამოუშვა, კოდური სახელწოდებით „Garlic“. OpenAI-ს მტკიცებით, მათი უახლესი მოდელი კონკურენტებს, განსაკუთრებით კი Google-ს, სტანდარტული ბენჩმარკების უმეტესობაზე, მათ შორის საკუთარ ტესტებზეც, სჯობნის.

მსგავსი სტატიები