OpenAI-მ GPT-5.4 წარადგინა: ხელმისაწვდომია Pro და Thinking ვერსიები

ხუთშაბათს OpenAI-მ ახალი საბაზისო მოდელი, GPT-5.4 გამოუშვა, რომელიც კომპანიის მიერ აღწერილია, როგორც „ყველაზე ძლიერი და ეფექტური მოწინავე მოდელი პროფესიული საქმიანობისთვის“. სტანდარტულ ვერსიასთან ერთად, GPT-5.4 ხელმისაწვდომია ლოგიკური მსჯელობის მოდელის (GPT-5.4 Thinking) და მაღალი წარმადობისთვის ოპტიმიზებული ვერსიის (GPT-5.4 Pro) სახით.

მოდელის API ვერსია მხარს უჭერს 1 მილიონამდე ტოკენის მქონე კონტექსტურ ფანჯარას, რაც OpenAI-ს მიერ შემოთავაზებულ ვერსიებს შორის ყველაზე დიდი მაჩვენებელია. კომპანიამ ასევე ხაზი გაუსვა ტოკენების გამოყენების გაუმჯობესებულ ეფექტურობას და აღნიშნა, რომ GPT-5.4-ს შეუძლია იგივე ამოცანების გადაჭრა მნიშვნელოვნად ნაკლები ტოკენის გამოყენებით, ვიდრე მის წინამორბედს.

ახალ მოდელს მნიშვნელოვნად გაუმჯობესებული ბენჩმარკების შედეგები აქვს, მათ შორის რეკორდული ქულები კომპიუტერის გამოყენების ტესტებში, როგორიცაა OSWorld-Verified და WebArena Verified. გარდა ამისა, GPT-5.4-მა დააფიქსირა რეკორდული 83% OpenAI-ს GDPval ტესტში, რომელიც ინტელექტუალურ სამუშაო ამოცანებს აფასებს.

პროფესიული უნარები და ეფექტურობა

Mercor-ის აღმასრულებელი დირექტორის, ბრენდან ფუდის განცხადებით, GPT-5.4-მა ლიდერობა მოიპოვა APEX-Agents ბენჩმარკში, რომელიც სპეციალურად სამართლისა და ფინანსების სფეროში პროფესიული უნარების შესამოწმებლად არის შექმნილი.

„[GPT-5.4] საუკეთესო შედეგებს აჩვენებს გრძელვადიანი პროექტების მომზადებისას, როგორიცაა პრეზენტაციების (slide decks) შექმნა, ფინანსური მოდელირება და იურიდიული ანალიზი. ის უზრუნველყოფს უმაღლეს წარმადობას, ამასთანავე მუშაობს უფრო სწრაფად და ნაკლები დანახარჯებით, ვიდრე კონკურენტი მოწინავე მოდელები“, — აღნიშნა ფუდიმ თავის განცხადებაში.

GPT-5.4 აგრძელებს კომპანიის მცდელობებს ჰალუცინაციებისა და ფაქტობრივი შეცდომების შესამცირებლად. OpenAI-ს მონაცემებით, ახალი მოდელი 33%-ით ნაკლებ შეცდომას უშვებს ცალკეულ მტკიცებულებებში GPT 5.2-თან შედარებით, ხოლო პასუხების საერთო სიზუსტე 18%-ით არის გაუმჯობესებული.

API-ს განახლებები და Tool Search სისტემა

გამოშვების ფარგლებში, OpenAI-მ გადაამუშავა GPT-5.4-ის API ვერსიის მიერ ინსტრუმენტების გამოძახების (tool calling) მართვის პრინციპი და დანერგა ახალი სისტემა — Tool Search. მანამდე, სისტემური მითითებები (prompts) განსაზღვრავდა ყველა ხელმისაწვდომი ინსტრუმენტის დეფინიციას მოდელის გამოძახებისას, რაც ინსტრუმენტების რაოდენობის ზრდასთან ერთად დიდი რაოდენობით ტოკენებს მოიხმარდა.

ახალი სისტემა მოდელებს საშუალებას აძლევს, საჭიროებისამებრ მოიძიონ ინსტრუმენტების აღწერილობები. ეს ცვლილება უზრუნველყოფს უფრო სწრაფ და იაფ მოთხოვნებს იმ სისტემებში, სადაც ბევრი სხვადასხვა ინსტრუმენტია ხელმისაწვდომი.

უსაფრთხოება და „აზროვნების ჯაჭვი“

OpenAI-მ ასევე წარადგინა უსაფრთხოების ახალი შეფასება მოდელების „აზროვნების ჯაჭვის“ (chain-of-thought) შესამოწმებლად. ეს არის მოდელის მიერ მოწოდებული მიმდინარე კომენტარები, რომლებიც აჩვენებს მის მსჯელობის პროცესს მრავალსაფეხურიანი ამოცანების შესრულებისას.

ხელოვნური ინტელექტის უსაფრთხოების მკვლევრები დიდი ხანია გამოთქვამენ შეშფოთებას იმის შესახებ, რომ ლოგიკური მსჯელობის მოდელებმა შესაძლოა არასწორად წარმოაჩინონ თავიანთი აზროვნების პროცესი. ტესტირებამ აჩვენა, რომ გარკვეულ პირობებში ეს შესაძლებელია. თუმცა, OpenAI-ს ახალი შეფასება აჩვენებს, რომ GPT-5.4-ის Thinking ვერსიაში მსგავსი მოტყუების ალბათობა ნაკლებია.

კომპანიის განცხადებით, ეს მიუთითებს იმაზე, რომ მოდელს არ აქვს უნარი დამალოს თავისი მსჯელობა და „აზროვნების ჯაჭვის“ (CoT) მონიტორინგი კვლავ რჩება უსაფრთხოების ეფექტურ ინსტრუმენტად.

OpenAI-მ GPT-5.4 წარადგინა: ხელმისაწვდომია Pro და Thinking ვერსიები

პროფესიული უნარები და ეფექტურობა

API-ს განახლებები და Tool Search სისტემა

უსაფრთხოება და „აზროვნების ჯაჭვი“

მსგავსი სტატიები

SpaceX-ის საბაზრო ღირებულებამ 2.6 ტრილიონ დოლარს მიაღწია და მცირე ხნით Amazon-საც გადაასწრო

Anthropic-ის დაპირისპირება ტრამპის ადმინისტრაციასთან: რატომ შეიძლება ეს კომპანიისთვის სასარგებლო აღმოჩნდეს?

კვლევა: აშშ-ის მომხმარებელთა 60%-ისთვის ბრენდების მიერ AI-ის გამოყენება გამაღიზიანებელია