Decart-ის ახალი მოდელი რეალისტური მართვის სიმულაციას საათობით ახერხებს — თუმცა გარკვეული ხარვეზებით
AI სტარტაპმა Decart-მა წარადგინა Oasis 3 — ინტერაქციული სამყაროს მოდელი, რომელიც რეალურ დროში ფოტორეალისტურ მართვის გარემოს ქმნის და ავტონომიური ტრანსპორტის განვითარებას ისახავს მიზნად.

ხელოვნური ინტელექტის სტარტაპმა Decart-მა წარმოადგინა Oasis 3 — ინტერაქციული სამყაროს უახლესი მოდელი, რომელსაც რეალურ დროში ფოტორეალისტური მართვის გარემოს გენერირება შეუძლია. მოდელი ამჟამად ხელმისაწვდომია API-ს მეშვეობით. სტარტაპის პირველადი სამიზნე აუდიტორია ავტონომიური სატრანსპორტო საშუალებების მწარმოებელი კომპანიებია, რომლებსაც იშვიათი საგზაო სცენარების მასშტაბური სიმულაცია სჭირდებათ. სამომავლოდ კომპანია რობოტოტექნიკისა და ფიზიკური AI-ს სხვა სფეროებში გაფართოებას გეგმავს.
Decart-ის მთავარი სტრატეგია დეველოპერებზეა გათვლილი: API-ზე წვდომის პირველივე დღიდან შეთავაზებით, კომპანია ცდილობს სამყაროს მოდელების გარშემო ისეთივე დეველოპერული ეკოსისტემა შექმნას, როგორიც OpenAI-მ ენობრივი მოდელების შემთხვევაში შეძლო. „ეს იქნება სამყაროს პირველი გამოსაყენებელი მოდელი, რომელზეც ადამიანები რეალურად შეძლებენ პროგრამირებას“, — განუცხადა TechCrunch-ს დინ ლეიტერსდორფმა, Decart-ის თანადამფუძნებელმა და აღმასრულებელმა დირექტორმა.
სტარტაპს უკვე ჰყავს 100,000-ზე მეტი დეველოპერისგან შემდგარი საზოგადოება, რომელთა დიდი ნაწილი პროდუქტებს კომპანიის რეალური დროის ვიდეო მოდელის, Lucy-ს ბაზაზე ქმნის, ძირითადად ელექტრონული კომერციისა და პირდაპირი ტრანსლაციების სფეროში. Oasis 3 სწორედ ამ ფუნდამენტურ მოდელს ეფუძნება და კომპანიის ფიზიკურ AI-ში დამკვიდრების მცდელობას წარმოადგენს. მოდელზე წვდომის ფასი წამში 0.02 დოლარია, ხოლო კორპორატიული ტარიფები კონკრეტულ საჭიროებებზეა დამოკიდებული.
კონკურენცია და ფინანსური ზრდა
Decart-ს საკმაოდ კონკურენტულ გარემოში უწევს ოპერირება. გასულ წელს Google-მა წარადგინა Genie 3-ის კვლევითი ვერსია, ფეი-ფეი ლის World Labs-მა გამოუშვა Marble კომერციული გამოყენებისთვის, ხოლო ვიდეო გენერაციის სტარტაპები, როგორიცაა Luma და Runway, ასევე მუშაობენ ფიზიკის აღქმის მქონე ვიდეო მოდელების სამყაროს მოდელებად გარდაქმნაზე.

Oasis 3-ის გამოშვებას წინ უძღოდა კომპანიის მიერ 300 მილიონი დოლარის მოზიდვა, რაც ლეიტერსდორფის თქმით, განპირობებული იყო ელექტრონულ კომერციაში, სტრიმინგსა და ფიზიკურ AI-ში მათ მოდელებზე გაზრდილი მოთხოვნით. ამ რაუნდმა Decart-ის საბაზრო ღირებულება თითქმის 4 მილიარდ დოლარამდე გაზარდა და მასში ისეთი სტრატეგიული ინვესტორები ჩაერთნენ, როგორიცაა Toyota, Adobe და eBay. ინვესტორებს შორის ასევე არის Nvidia.
ტექნიკური უპირატესობები და ეფექტურობა
Oasis 3-ის მთავარი უპირატესობა მოდელების ფოტორეალიზმი და უსასრულო გენერირების შესაძლებლობაა. ეს მიიღწევა Decart-ის ოპტიმიზაციის პროგრამული უზრუნველყოფის (DOS - Decart Optimization Stack) მეშვეობით, რომელიც მოდელებს საშუალებას აძლევს ეფექტურად იმუშაონ Nvidia-ს, Amazon-ისა და Google-ის აპარატურაზე. ეს მათ გამოყენებას კონკურენტებთან შედარებით ბევრად იაფს ხდის.
ლეიტერსდორფის განმარტებით, მოდელები იმდენად ეფექტურია, რომ კომპანიამ არსებობის მანძილზე 100 მილიონ დოლარზე გაცილებით ნაკლები დახარჯა. Oasis 3 ქმნის ფიზიკურად ზუსტ, მრავალკამერიან გარემოს (ერთი წინა და ორი გვერდითი ხედით) სისტემების მოსამზადებლად და ტესტირებისთვის. შეზღუდული დემო ვერსიების ნაცვლად, დეველოპერებს შეუძლიათ სცენარების უსასრულოდ გენერირება, რაც იდეალურია ავტონომიური მართვის სისტემებისთვის იშვიათი შემთხვევების (edge cases) დასამუშავებლად.
ტესტირების შედეგები და ხარვეზები
სხვა მოდელებთან შედარებით, როგორიცაა Google-ის Genie 3 ან World Labs-ის Marble, Oasis 3 ტექსტური მითითებიდან (prompt) ყველაზე ფოტორეალისტურ გარემოს ქმნის. თუმცა, ხანგრძლივი გენერირებისას მოდელი მნიშვნელოვან დეგრადაციას განიცდის. ტესტირებისას გამოიკვეთა შემდეგი გარემოებები:
- თემატური მთლიანობის დაკარგვა: მოდელმა თავდაპირველად ზუსტად შექმნა ნიუ-იორკის ქუჩის სცენა, თუმცა მოძრაობის გაგრძელებისას გარემო თანდათან ნებისმიერ დასავლურ ქალაქს დაემსგავსა.
- ლოკაციის ცვლილება: უკან მობრუნების მცდელობისას, საწყისი გზაჯვარედინი გამქრალი და სრულიად ახალი გარემოთი ჩანაცვლებული აღმოჩნდა.
- მართვის სირთულეები: კონტროლის მექანიზმები არ არის საკმარისად მგრძნობიარე, რაც ხშირად ავტომობილზე კონტროლის დაკარგვას იწვევს.
- ფიზიკის კანონების დარღვევა: ავტომობილს შეუძლია სხვა მანქანებში „გაიაროს“, რაც იმას ნიშნავს, რომ მოდელი გარემოს ფიზიკას ჯერჯერობით სრულყოფილად ვერ აღიქვამს.
ლეიტერსდორფი ამას „მთავარ საკვლევ პრობლემას“ უწოდებს და განმარტავს, რომ ეს გამოწვეულია მონაცემთა ბაზებში უსაფრთხო მართვის შესახებ ინფორმაციის სიჭარბით ავარიულ სიტუაციებთან შედარებით.
არქიტექტურა და მომავალი
Oasis 3 არის ავტორეგრესიული მოდელი, რაც იმას ნიშნავს, რომ ის კადრებს სათითაოდ აგენერირებს და წინა კადრებს ეყრდნობა შემდეგის შესაქმნელად. ეს პროცესი დიდ გამოთვლით რესურსებს მოითხოვს. კონსისტენტურობის შესანარჩუნებლად გუნდი მოდელის მეხსიერების ხანგრძლივობის გაუმჯობესებაზე მუშაობს.
„თითოეული კადრი, რომელსაც ვაგენერირებთ, დაახლოებით 8,000 ტოკენია. წამში ათეულობით კადრის გენერირება ნიშნავს ასობით ათას ტოკენს წამში. კონტექსტური ფანჯარა ძალიან სწრაფად ივსება. ჩვენ ვიკვლევთ, როგორ შევინახოთ მილიონობით მეტი ტოკენი და როგორ მოვახდინოთ მეხსიერების კომპრესია“, — ამბობს ლეიტერსდორფი.
კომპანიის ვარაუდით, კონსისტენტურობის პრობლემა ნაწილობრივ მოგვარდება შემდეგ ვერსიაში, რომელიც მომხმარებლებს საშუალებას მისცემს სამყაროს გენერირება არა მხოლოდ სურათის, არამედ ვიდეოს საფუძველზეც დაიწყონ. მიუხედავად არსებული შეზღუდვებისა, დამფუძნებელი ოპტიმისტურად არის განწყობილი და თვლის, რომ დეველოპერები მალე იპოვიან Oasis-ის გამოყენების უამრავ ახალ გზას, რაც ტექნოლოგიის განვითარებას კიდევ უფრო დააჩქარებს.
მსგავსი სტატიები

რატომ იქცევა ყველა ავტომწარმოებელი ენერგეტიკულ კომპანიად?
ავტომწარმოებლები, როგორიცაა Tesla და GM, ენერგიის შენახვის ბაზარზე გადადიან. სტატიაში განხილულია ნატრიუმ-იონური ბატარეების უპირატესობები და ბაზრის ზრდის მიზეზები.

Wing-ის დრონებით მიწოდება აღარ არის სიახლე: Alphabet-ის კომპანია Walmart-თან პარტნიორობას აფართოებს
Wing და Walmart დრონებით მიწოდების ქსელს აშშ-ის კიდევ 7 ქალაქში აფართოებენ. სერვისი, რომელმაც უკვე 1 მილიონზე მეტი შეკვეთა შეასრულა, ყოველდღიურობის ნაწილი ხდება.

GM ენერგიის შენახვის ბაზარზე შედის: ახალი ბატარეები AI მონაცემთა ცენტრებისა და ელექტროქსელებისთვის
General Motors ენერგიის შენახვის ბაზარზე ამბიციური გეგმებით შედის, რაც ნატრიუმ-იონური ბატარეების განვითარებას და AI მონაცემთა ცენტრების ენერგიით უზრუნველყოფას გულისხმობს.