OpenAI-მ API-სთვის ხმოვანი ინტელექტის ახალი ფუნქციები წარადგინა
OpenAI-მ API-სთვის ხმოვანი ინტელექტის ახალი მოდელები წარადგინა, რომლებიც რეალურ დროში თარგმნის, ტრანსკრიფციისა და რთული ლოგიკური ამოცანების შესრულების საშუალებას იძლევა.

OpenAI-მ ხუთშაბათს განაცხადა, რომ მის API-ს ხმოვანი ინტელექტის რამდენიმე ახალი ფუნქცია დაემატება. ეს სიახლეები დეველოპერებს საშუალებას მისცემს, შექმნან აპლიკაციები, რომლებსაც მომხმარებლებთან საუბარი, საუბრის ტრანსკრიფცია და თარგმნა შეეძლებათ.
კომპანიის ახალი მოდელი, GPT-Realtime-2, შექმნილია რეალისტური ვოკალური სიმულაციისთვის, რომელსაც მომხმარებლებთან დიალოგის წარმართვა შეუძლია. მისი წინამორბედისგან (GPT-Realtime-1.5) განსხვავებით, ეს ვერსია დაფუძნებულია GPT-5 კლასის ლოგიკურ აზროვნებაზე (reasoning), რაც OpenAI-ის განცხადებით, მომხმარებლის რთული მოთხოვნების უკეთ დამუშავებას უზრუნველყოფს.
ახალი ფუნქციების მიმოხილვა
OpenAI-მ ერთდროულად რამდენიმე მნიშვნელოვანი ინსტრუმენტი წარადგინა, რომლებიც ხმოვან ინტერფეისებთან მუშაობას ამარტივებს:
- GPT-Realtime-Translate: ეს ფუნქცია უზრუნველყოფს რეალურ დროში თარგმნის სერვისს, რომელიც საუბრის ტემპს მიჰყვება. სისტემას შეუძლია 70-ზე მეტი შესაყვანი ენის აღქმა და 13 გამომავალ ენაზე პასუხის გაცემა.
- GPT-Realtime-Whisper: ახალი ტრანსკრიფციის შესაძლებლობა, რომელიც მომხმარებლებს მეტყველების ტექსტად გარდაქმნის (speech-to-text) ფუნქციას სთავაზობს უშუალოდ ინტერაქციის პროცესში.
„წარდგენილი მოდელები რეალურ დროში აუდიოს მარტივი კითხვა-პასუხის რეჟიმიდან სრულფასოვან ხმოვან ინტერფეისებად აქცევს, რომლებსაც რეალური სამუშაოს შესრულება შეუძლიათ: მოსმენა, ლოგიკური მსჯელობა, თარგმნა, ტრანსკრიფცია და მოქმედება საუბრის მიმდინარეობისას“, — აცხადებენ კომპანიაში.
გამოყენების სფეროები და უსაფრთხოება
ეს განახლებები განსაკუთრებით მიმზიდველია იმ კომპანიებისთვის, რომლებსაც მომხმარებელთა მომსახურების შესაძლებლობების გაფართოება სურთ. თუმცა, OpenAI ასევე აღნიშნავს, რომ ახალი ფუნქციები სასარგებლო იქნება სხვადასხვა სფეროში, მათ შორის განათლებაში, მედიაში, ღონისძიებების მართვასა და კრეატორთა პლატფორმებზე.
მიუხედავად ტექნოლოგიის სარგებლიანობისა, არსებობს მისი ბოროტად გამოყენების რისკიც. კომპანიამ დანერგა დამცავი მექანიზმები (guardrails) სპამის, თაღლითობისა და სხვა სახის ონლაინ დარღვევების თავიდან ასაცილებლად. სისტემაში ჩაშენებულია სპეციალური ტრიგერები, რომელთა მეშვეობითაც საუბარი შეიძლება შეწყდეს, თუ გამოვლინდება მავნე კონტენტის შესახებ გაიდლაინების დარღვევა.
ხმოვანი მოდელები ხელმისაწვდომია OpenAI-ის Realtime API-ში. ფასწარმოების მოდელი განსხვავებულია: Translate და Whisper-ის საფასური წუთობრივად ითვლება, ხოლო GPT-Realtime-2-ის ღირებულება ტოკენების მოხმარებაზეა დამოკიდებული.
მსგავსი სტატიები

OpenAI-ის წინააღმდეგ აშშ-ის რამდენიმე შტატის გენერალური პროკურორი გამოძიებას იწყებს
OpenAI-ის წინააღმდეგ აშშ-ის რამდენიმე შტატის გენერალურმა პროკურორმა გამოძიება დაიწყო. ნიუ-იორკის პროკურატურა კომპანიისგან მონაცემთა დაცვისა და უსაფრთხოების შესახებ დოკუმენტაციას ითხოვს.

Amazon-ის აღმასრულებელი დირექტორი Anthropic-ის მოდელებთან დაკავშირებით შეშფოთებას გამოთქვამს: რა გახდა სამთავრობო შეზღუდვების მიზეზი?
Amazon-ის აღმასრულებელი დირექტორის, ენდი ჯასის მიერ გამოთქმული უსაფრთხოების რისკების გამო, აშშ-ის მთავრობამ Anthropic-ის ორ მოდელზე ექსპორტის აკრძალვა დააწესა.

Anthropic-ის უსაფრთხოების გაფრთხილებებმა საპირისპირო შედეგი გამოიღო — მთავრობამ კომპანიის ყველაზე მძლავრი AI მოდელები დაბლოკა
აშშ-ის მთავრობამ Anthropic-ს მისი ყველაზე მძლავრი AI მოდელების, Claude Fable 5-ისა და Mythos 5-ის გათიშვა უბრძანა. მიზეზად ეროვნული უსაფრთხოება და მოდელების შესაძლო „გატეხვა“ დასახელდა.