Skip to main content
ხელოვნური ინტელექტი5.3.20269 ნახვა

OpenAI-მ GPT-5.4 წარადგინა: ხელმისაწვდომია Pro და Thinking ვერსიები

OpenAI-მ გამოუშვა GPT-5.4, რომელიც პროფესიული საქმიანობისთვისაა ოპტიმიზებული. მოდელს აქვს 1 მილიონიანი კონტექსტური ფანჯარა და გაუმჯობესებული ლოგიკური მსჯელობის უნარი.

OpenAI-მ GPT-5.4 წარადგინა: ხელმისაწვდომია Pro და Thinking ვერსიები

ხუთშაბათს OpenAI-მ ახალი საბაზისო მოდელი, GPT-5.4 გამოუშვა, რომელიც კომპანიის მიერ აღწერილია, როგორც „ყველაზე ძლიერი და ეფექტური მოწინავე მოდელი პროფესიული საქმიანობისთვის“. სტანდარტულ ვერსიასთან ერთად, GPT-5.4 ხელმისაწვდომია ლოგიკური მსჯელობის მოდელის (GPT-5.4 Thinking) და მაღალი წარმადობისთვის ოპტიმიზებული ვერსიის (GPT-5.4 Pro) სახით.

მოდელის API ვერსია მხარს უჭერს 1 მილიონამდე ტოკენის მქონე კონტექსტურ ფანჯარას, რაც OpenAI-ს მიერ შემოთავაზებულ ვერსიებს შორის ყველაზე დიდი მაჩვენებელია. კომპანიამ ასევე ხაზი გაუსვა ტოკენების გამოყენების გაუმჯობესებულ ეფექტურობას და აღნიშნა, რომ GPT-5.4-ს შეუძლია იგივე ამოცანების გადაჭრა მნიშვნელოვნად ნაკლები ტოკენის გამოყენებით, ვიდრე მის წინამორბედს.

ახალ მოდელს მნიშვნელოვნად გაუმჯობესებული ბენჩმარკების შედეგები აქვს, მათ შორის რეკორდული ქულები კომპიუტერის გამოყენების ტესტებში, როგორიცაა OSWorld-Verified და WebArena Verified. გარდა ამისა, GPT-5.4-მა დააფიქსირა რეკორდული 83% OpenAI-ს GDPval ტესტში, რომელიც ინტელექტუალურ სამუშაო ამოცანებს აფასებს.

პროფესიული უნარები და ეფექტურობა

Mercor-ის აღმასრულებელი დირექტორის, ბრენდან ფუდის განცხადებით, GPT-5.4-მა ლიდერობა მოიპოვა APEX-Agents ბენჩმარკში, რომელიც სპეციალურად სამართლისა და ფინანსების სფეროში პროფესიული უნარების შესამოწმებლად არის შექმნილი.

„[GPT-5.4] საუკეთესო შედეგებს აჩვენებს გრძელვადიანი პროექტების მომზადებისას, როგორიცაა პრეზენტაციების (slide decks) შექმნა, ფინანსური მოდელირება და იურიდიული ანალიზი. ის უზრუნველყოფს უმაღლეს წარმადობას, ამასთანავე მუშაობს უფრო სწრაფად და ნაკლები დანახარჯებით, ვიდრე კონკურენტი მოწინავე მოდელები“, — აღნიშნა ფუდიმ თავის განცხადებაში.

GPT-5.4 აგრძელებს კომპანიის მცდელობებს ჰალუცინაციებისა და ფაქტობრივი შეცდომების შესამცირებლად. OpenAI-ს მონაცემებით, ახალი მოდელი 33%-ით ნაკლებ შეცდომას უშვებს ცალკეულ მტკიცებულებებში GPT 5.2-თან შედარებით, ხოლო პასუხების საერთო სიზუსტე 18%-ით არის გაუმჯობესებული.

API-ს განახლებები და Tool Search სისტემა

გამოშვების ფარგლებში, OpenAI-მ გადაამუშავა GPT-5.4-ის API ვერსიის მიერ ინსტრუმენტების გამოძახების (tool calling) მართვის პრინციპი და დანერგა ახალი სისტემა — Tool Search. მანამდე, სისტემური მითითებები (prompts) განსაზღვრავდა ყველა ხელმისაწვდომი ინსტრუმენტის დეფინიციას მოდელის გამოძახებისას, რაც ინსტრუმენტების რაოდენობის ზრდასთან ერთად დიდი რაოდენობით ტოკენებს მოიხმარდა.

ახალი სისტემა მოდელებს საშუალებას აძლევს, საჭიროებისამებრ მოიძიონ ინსტრუმენტების აღწერილობები. ეს ცვლილება უზრუნველყოფს უფრო სწრაფ და იაფ მოთხოვნებს იმ სისტემებში, სადაც ბევრი სხვადასხვა ინსტრუმენტია ხელმისაწვდომი.

უსაფრთხოება და „აზროვნების ჯაჭვი“

OpenAI-მ ასევე წარადგინა უსაფრთხოების ახალი შეფასება მოდელების „აზროვნების ჯაჭვის“ (chain-of-thought) შესამოწმებლად. ეს არის მოდელის მიერ მოწოდებული მიმდინარე კომენტარები, რომლებიც აჩვენებს მის მსჯელობის პროცესს მრავალსაფეხურიანი ამოცანების შესრულებისას.

ხელოვნური ინტელექტის უსაფრთხოების მკვლევრები დიდი ხანია გამოთქვამენ შეშფოთებას იმის შესახებ, რომ ლოგიკური მსჯელობის მოდელებმა შესაძლოა არასწორად წარმოაჩინონ თავიანთი აზროვნების პროცესი. ტესტირებამ აჩვენა, რომ გარკვეულ პირობებში ეს შესაძლებელია. თუმცა, OpenAI-ს ახალი შეფასება აჩვენებს, რომ GPT-5.4-ის Thinking ვერსიაში მსგავსი მოტყუების ალბათობა ნაკლებია.

კომპანიის განცხადებით, ეს მიუთითებს იმაზე, რომ მოდელს არ აქვს უნარი დამალოს თავისი მსჯელობა და „აზროვნების ჯაჭვის“ (CoT) მონიტორინგი კვლავ რჩება უსაფრთხოების ეფექტურ ინსტრუმენტად.

წყარო: TechCrunch AI
გაზიარება:

მსგავსი სტატიები

ილონ მასკმა დაადასტურა, რომ xAI-მ Grok-ის მოსამზადებლად OpenAI-ის მოდელები გამოიყენა
ხელოვნური ინტელექტი

ილონ მასკმა დაადასტურა, რომ xAI-მ Grok-ის მოსამზადებლად OpenAI-ის მოდელები გამოიყენა

ილონ მასკმა სასამართლო პროცესზე აღიარა, რომ xAI-მ Grok-ის მოსამზადებლად ნაწილობრივ OpenAI-ის მოდელები გამოიყენა, რაც AI ინდუსტრიაში გავრცელებული პრაქტიკაა.

30.4.2026
OpenAI-მ ChatGPT-ის ანგარიშების უსაფრთხოების ახალი სისტემა და Yubico-სთან პარტნიორობა დააანონსა
ხელოვნური ინტელექტი

OpenAI-მ ChatGPT-ის ანგარიშების უსაფრთხოების ახალი სისტემა და Yubico-სთან პარტნიორობა დააანონსა

OpenAI-მ წარადგინა „ანგარიშის გაძლიერებული უსაფრთხოების“ (AAS) პროგრამა და Yubico-სთან პარტნიორობით ფიზიკური უსაფრთხოების გასაღებები გამოუშვა ChatGPT-ის მომხმარებელთა დასაცავად.

30.4.2026
OpenAI ზღუდავს წვდომას ახალ კიბერინსტრუმენტზე, მიუხედავად Anthropic-ის მსგავსი ნაბიჯის ადრინდელი კრიტიკისა
ხელოვნური ინტელექტი

OpenAI ზღუდავს წვდომას ახალ კიბერინსტრუმენტზე, მიუხედავად Anthropic-ის მსგავსი ნაბიჯის ადრინდელი კრიტიკისა

სემ ალტმანმა დაადასტურა, რომ OpenAI ზღუდავს წვდომას GPT-5.5 Cyber-ზე, მიუხედავად იმისა, რომ ადრე Anthropic-ს მსგავსი ქმედების გამო „შიშზე დაფუძნებულ მარკეტინგში“ ადანაშაულებდა.

30.4.2026