Skip to main content
ხელოვნური ინტელექტი5.3.20269 ნახვა

OpenAI-მ GPT-5.4 წარადგინა: ხელმისაწვდომია Pro და Thinking ვერსიები

OpenAI-მ გამოუშვა GPT-5.4, რომელიც პროფესიული საქმიანობისთვისაა ოპტიმიზებული. მოდელს აქვს 1 მილიონიანი კონტექსტური ფანჯარა და გაუმჯობესებული ლოგიკური მსჯელობის უნარი.

OpenAI-მ GPT-5.4 წარადგინა: ხელმისაწვდომია Pro და Thinking ვერსიები

ხუთშაბათს OpenAI-მ ახალი საბაზისო მოდელი, GPT-5.4 გამოუშვა, რომელიც კომპანიის მიერ აღწერილია, როგორც „ყველაზე ძლიერი და ეფექტური მოწინავე მოდელი პროფესიული საქმიანობისთვის“. სტანდარტულ ვერსიასთან ერთად, GPT-5.4 ხელმისაწვდომია ლოგიკური მსჯელობის მოდელის (GPT-5.4 Thinking) და მაღალი წარმადობისთვის ოპტიმიზებული ვერსიის (GPT-5.4 Pro) სახით.

მოდელის API ვერსია მხარს უჭერს 1 მილიონამდე ტოკენის მქონე კონტექსტურ ფანჯარას, რაც OpenAI-ს მიერ შემოთავაზებულ ვერსიებს შორის ყველაზე დიდი მაჩვენებელია. კომპანიამ ასევე ხაზი გაუსვა ტოკენების გამოყენების გაუმჯობესებულ ეფექტურობას და აღნიშნა, რომ GPT-5.4-ს შეუძლია იგივე ამოცანების გადაჭრა მნიშვნელოვნად ნაკლები ტოკენის გამოყენებით, ვიდრე მის წინამორბედს.

ახალ მოდელს მნიშვნელოვნად გაუმჯობესებული ბენჩმარკების შედეგები აქვს, მათ შორის რეკორდული ქულები კომპიუტერის გამოყენების ტესტებში, როგორიცაა OSWorld-Verified და WebArena Verified. გარდა ამისა, GPT-5.4-მა დააფიქსირა რეკორდული 83% OpenAI-ს GDPval ტესტში, რომელიც ინტელექტუალურ სამუშაო ამოცანებს აფასებს.

პროფესიული უნარები და ეფექტურობა

Mercor-ის აღმასრულებელი დირექტორის, ბრენდან ფუდის განცხადებით, GPT-5.4-მა ლიდერობა მოიპოვა APEX-Agents ბენჩმარკში, რომელიც სპეციალურად სამართლისა და ფინანსების სფეროში პროფესიული უნარების შესამოწმებლად არის შექმნილი.

„[GPT-5.4] საუკეთესო შედეგებს აჩვენებს გრძელვადიანი პროექტების მომზადებისას, როგორიცაა პრეზენტაციების (slide decks) შექმნა, ფინანსური მოდელირება და იურიდიული ანალიზი. ის უზრუნველყოფს უმაღლეს წარმადობას, ამასთანავე მუშაობს უფრო სწრაფად და ნაკლები დანახარჯებით, ვიდრე კონკურენტი მოწინავე მოდელები“, — აღნიშნა ფუდიმ თავის განცხადებაში.

GPT-5.4 აგრძელებს კომპანიის მცდელობებს ჰალუცინაციებისა და ფაქტობრივი შეცდომების შესამცირებლად. OpenAI-ს მონაცემებით, ახალი მოდელი 33%-ით ნაკლებ შეცდომას უშვებს ცალკეულ მტკიცებულებებში GPT 5.2-თან შედარებით, ხოლო პასუხების საერთო სიზუსტე 18%-ით არის გაუმჯობესებული.

API-ს განახლებები და Tool Search სისტემა

გამოშვების ფარგლებში, OpenAI-მ გადაამუშავა GPT-5.4-ის API ვერსიის მიერ ინსტრუმენტების გამოძახების (tool calling) მართვის პრინციპი და დანერგა ახალი სისტემა — Tool Search. მანამდე, სისტემური მითითებები (prompts) განსაზღვრავდა ყველა ხელმისაწვდომი ინსტრუმენტის დეფინიციას მოდელის გამოძახებისას, რაც ინსტრუმენტების რაოდენობის ზრდასთან ერთად დიდი რაოდენობით ტოკენებს მოიხმარდა.

ახალი სისტემა მოდელებს საშუალებას აძლევს, საჭიროებისამებრ მოიძიონ ინსტრუმენტების აღწერილობები. ეს ცვლილება უზრუნველყოფს უფრო სწრაფ და იაფ მოთხოვნებს იმ სისტემებში, სადაც ბევრი სხვადასხვა ინსტრუმენტია ხელმისაწვდომი.

უსაფრთხოება და „აზროვნების ჯაჭვი“

OpenAI-მ ასევე წარადგინა უსაფრთხოების ახალი შეფასება მოდელების „აზროვნების ჯაჭვის“ (chain-of-thought) შესამოწმებლად. ეს არის მოდელის მიერ მოწოდებული მიმდინარე კომენტარები, რომლებიც აჩვენებს მის მსჯელობის პროცესს მრავალსაფეხურიანი ამოცანების შესრულებისას.

ხელოვნური ინტელექტის უსაფრთხოების მკვლევრები დიდი ხანია გამოთქვამენ შეშფოთებას იმის შესახებ, რომ ლოგიკური მსჯელობის მოდელებმა შესაძლოა არასწორად წარმოაჩინონ თავიანთი აზროვნების პროცესი. ტესტირებამ აჩვენა, რომ გარკვეულ პირობებში ეს შესაძლებელია. თუმცა, OpenAI-ს ახალი შეფასება აჩვენებს, რომ GPT-5.4-ის Thinking ვერსიაში მსგავსი მოტყუების ალბათობა ნაკლებია.

კომპანიის განცხადებით, ეს მიუთითებს იმაზე, რომ მოდელს არ აქვს უნარი დამალოს თავისი მსჯელობა და „აზროვნების ჯაჭვის“ (CoT) მონიტორინგი კვლავ რჩება უსაფრთხოების ეფექტურ ინსტრუმენტად.

წყარო: TechCrunch AI
გაზიარება:

მსგავსი სტატიები

იაპონიაში რობოტები სამუშაო ადგილებს კი არ ართმევენ ადამიანებს, არამედ იმ ვაკანსიებს ავსებენ, რომლებზეც მუშაობა არავის სურს
ხელოვნური ინტელექტი

იაპონიაში რობოტები სამუშაო ადგილებს კი არ ართმევენ ადამიანებს, არამედ იმ ვაკანსიებს ავსებენ, რომლებზეც მუშაობა არავის სურს

იაპონია ფიზიკური ხელოვნური ინტელექტის სექტორში ლიდერობას ცდილობს, რათა მწვავე დემოგრაფიული კრიზისი და მუშახელის დეფიციტი დაძლიოს.

5.4.2026
შეუძლია თუ არა ორბიტალურ მონაცემთა ცენტრებს SpaceX-ის 1.75-ტრილიონიანი ღირებულების გამართლება?
ხელოვნური ინტელექტი

შეუძლია თუ არა ორბიტალურ მონაცემთა ცენტრებს SpaceX-ის 1.75-ტრილიონიანი ღირებულების გამართლება?

SpaceX-ის გეგმები ორბიტალური მონაცემთა ცენტრების შესახებ კომპანიის 1.75-ტრილიონიანი შეფასების გამართლებას ემსახურება. გაიგეთ, რა გამოწვევების წინაშე დგას პროექტი.

5.4.2026
Microsoft-ის განცხადებით, Copilot მხოლოდ „გასართობი მიზნებისთვისაა“ განკუთვნილი
ხელოვნური ინტელექტი

Microsoft-ის განცხადებით, Copilot მხოლოდ „გასართობი მიზნებისთვისაა“ განკუთვნილი

Microsoft-ის მომსახურების პირობების თანახმად, Copilot მხოლოდ გასართობი მიზნებისთვისაა შექმნილი. კომპანია მომხმარებლებს ურჩევს, მნიშვნელოვანი გადაწყვეტილებებისას AI-ს პასუხებს ბრმად არ ენდონ.

5.4.2026