ხელოვნური ინტელექტის ომი გრძელდება: OpenAI-მ Google-თან კონკურენციის ფონზე ახალი გამოსახულების მოდელი გამოუშვა
OpenAI-მ Google-თან კონკურენციის ფონზე ახალი, 4-ჯერ სწრაფი გამოსახულების მოდელი, GPT Image 1.5 გამოუშვა, რომელიც გაუმჯობესებულ რედაქტირებას გვთავაზობს.

OpenAI-მ ChatGPT Images-ის ახალი ვერსია, GPT Image 1.5 წარადგინა, რომელიც მომხმარებლებს ინსტრუქციების უკეთ შესრულებას, უფრო ზუსტ რედაქტირებასა და გამოსახულების 4-ჯერ უფრო სწრაფ გენერაციას ჰპირდება. ახალი მოდელი სამშაბათიდან ხელმისაწვდომია ChatGPT-ის ყველა მომხმარებლისთვის და API-ის საშუალებით.
ეს ნაბიჯი წარმოადგენს Google-ის Gemini-სთან კონკურენციის გამწვავებას, მას შემდეგ, რაც OpenAI-ის აღმასრულებელმა დირექტორმა, სემ ალტმანმა, გასულ თვეს შიდა დოკუმენტში „წითელი კოდი“ გამოაცხადა. დოკუმენტში დეტალურად იყო აღწერილი OpenAI-ის გეგმები, დაებრუნებინა ლიდერის პოზიცია ხელოვნური ინტელექტის სფეროში.
ლიდერობისთვის ბრძოლა მას შემდეგ გამწვავდა, რაც Google-მა თავისი ფლაგმანი მოდელი Gemini 3 და ვირუსული გამოსახულების გენერატორის უახლესი ვერსია, Nano Banana Pro გამოუშვა. ორივე პროდუქტმა მრავალი კრიტერიუმით დაიკავა პირველი ადგილი LMArena-ს ლიდერბორდზე და Google-ს ბაზრის წილის გაზრდაში დაეხმარა.
Google-ი ლიდერობას ინარჩუნებს იმის მიუხედავად, რომ OpenAI-მ გასულ კვირას GPT-5.2 გამოუშვა, რომელიც დეველოპერებისა და პროფესიონალებისთვის განკუთვნილ ყველაზე მოწინავე მოდელად იყო წარდგენილი. გავრცელებული ინფორმაციით, OpenAI ახალი გამოსახულების გენერატორის გამოშვებას იანვრის დასაწყისში გეგმავდა, თუმცა კონკურენციის გამო პროცესი დააჩქარა. კომპანიის წინა მოდელი, GPT Image 1, აპრილში გამოვიდა.
GPT Image 1.5-ის ერთ-ერთი მთავარი უპირატესობა პოსტ-პროდუქციის დახვეწილი ფუნქციებია, რაც Nano Banana Pro-ს შესაძლებლობებს ჰგავს. ის მომხმარებლებს რედაქტირებისას ვიზუალური თანმიმდევრულობის შენარჩუნების საშუალებას აძლევს, მათ შორის სახის ნაკვთების, განათების, კომპოზიციისა და ფერების ტონის კუთხით. ეს მნიშვნელოვანი წინსვლაა, რადგან გენერაციული ხელოვნური ინტელექტის მოდელების უმეტესობას უჭირს ცვლილებების თანმიმდევრულად შეტანა.
ხშირად, ისეთი მარტივი მოთხოვნისას, როგორიცაა „შეცვალე სახის გამომეტყველება“ ან „გახადე განათება უფრო ცივი“, მოდელები მთლიანად ცვლიან გამოსახულებას, რაც არათანმიმდევრულ შედეგს იწვევს. GPT Image 1.5 ამ პრობლემის გადაჭრას ისახავს მიზნად.
განახლება მხოლოდ ახალ ფუნქციებს არ მოიცავს. OpenAI-ის აპლიკაციების აღმასრულებელი დირექტორის, ფიჯი სიმოს თქმით, ChatGPT-ის გვერდითა პანელში შეიქმნა სპეციალური სივრცე, რომელიც „უფრო კრეატიულ სტუდიას“ ჰგავს. „გამოსახულების დათვალიერებისა და რედაქტირების ახალი ეკრანები ამარტივებს თქვენს ხედვასთან შესაბამისი სურათების შექმნას და გაძლევთ შთაგონებას ტრენდული მოთხოვნებისა და წინასწარ დაყენებული ფილტრების მეშვეობით“, - წერს სიმომ ბლოგპოსტში.
ამასთან ერთად, OpenAI გეგმავს ChatGPT-ის გამოცდილება უფრო მეტი ვიზუალური ელემენტით გააუმჯობესოს. გეგმის მიხედვით, საძიებო მოთხოვნებზე პასუხები უფრო მეტ ვიზუალს მოიცავს მკაფიო წყაროებით, რაც სასარგებლო იქნება ისეთი ამოცანებისთვის, როგორიცაა საზომი ერთეულების კონვერტაცია ან სპორტული ანგარიშების შემოწმება.
„როდესაც რაღაცას ქმნით, უნდა შეგეძლოთ დაინახოთ და ფორმა მისცეთ მას. როდესაც ვიზუალი ამბავს სიტყვებზე უკეთ გადმოსცემს, ChatGPT-მ ის უნდა გამოიყენოს. ჩვენი მიზანია, შევამციროთ მანძილი თქვენს გონებაში არსებულ იდეასა და მის რეალობად ქცევის უნარს შორის“, - აღნიშნავს ფიჯი სიმო.
მსგავსი სტატიები

„სათამაშოების ისტორია 5“ ხელოვნური ინტელექტის მქონე საშიშ სათამაშოებს უპირისპირდება: „მე ყოველთვის გისმენთ“
Pixar-ის საკულტო ფრენჩაიზის ახალი ნაწილი თანამედროვე გამოწვევებს ეხმიანება. „სათამაშოების ისტორია 5“-ში ვუდი და მისი მეგობრები ბოროტ AI პლანშეტს უპირისპირდებიან.

სიახლეები xAI-სთვის: Grok-მა Baldur’s Gate-ის შესახებ კითხვებზე პასუხის გაცემა წარმატებით ისწავლა
ილონ მასკის xAI-მ Grok-ის მოდელი ვიდეო თამაშების გზამკვლევების მიმართულებით დახვეწა. გაიგეთ, როგორ გაუმკლავდა ჩატბოტი Baldur’s Gate-ის შესახებ დასმულ კითხვებს.

InScope-მა ფინანსური ანგარიშგების პროცესის გასამარტივებლად 14.5 მილიონი დოლარი მოიზიდა
InScope-მა, ხელოვნურ ინტელექტზე დაფუძნებულმა ფინანსური ანგარიშგების პლატფორმამ, 14.5 მილიონი დოლარი მოიზიდა. სტარტაპი ბუღალტრებს შრომატევადი მექანიკური სამუშაოს ავტომატიზაციაში ეხმარება.