Google-ის Genie-ს სამყაროს მოდელს ახლა Street View-ს მეშვეობით რეალური ქუჩების სიმულაცია შეუძლია
Google DeepMind-მა Project Genie-სა და Street View-ს ინტეგრაცია წარადგინა, რაც რეალური ქალაქების ინტერაქტიული სიმულაციის საშუალებას იძლევა.

Google Maps-ის Street View-ს მეშვეობით ბევრს უნახავს ბავშვობის სახლი ან პარიზის ქუჩები სასტუმროს დაჯავშნამდე. Google-ის უახლესი ინტეგრაცია ამ გამოცდილებას კიდევ უფრო შთამბეჭდავს ხდის და მომხმარებელს საშუალებას აძლევს, ქუჩებისა და მათი შემოგარენის სრული სიმულაცია მოახდინოს. ახალი ფუნქციით შესაძლებელია ამინდის შეცვლა ან იმის ნახვა, თუ როგორ გამოიყურებოდა კონკრეტული ადგილი კატასტროფის ფილმის სცენარში.
Google DeepMind-მა Street View დააკავშირა Project Genie-სთან — კომპანიის ზოგადი დანიშნულების სამყაროს მოდელთან, რომელსაც მრავალფეროვანი, ინტერაქტიული გარემოს გენერირება შეუძლია. ეს სიახლე Google I/O დეველოპერთა კონფერენციაზე დაანონსდა. პროექტი მნიშვნელოვანია როგორც რობოტოტექნიკისთვის, ისე ჩვეულებრივი მომხმარებლებისთვის, რაც თავიდანვე იყო Genie-ს შექმნის მთავარი თეზისი.
ჯეკ პარკერ-ჰოლდერმა, DeepMind-ის მკვლევარმა, მაგალითად მოიყვანა ლონდონში განლაგებული რობოტი, სადაც მზე იშვიათად ანათებს. Genie-ს შეუძლია მოახდინოს იმ იშვიათი მომენტების სიმულაცია, როდესაც მზის სხივები ვიქტორიანულ შენობებს ეცემა, რათა რეალურ პირობებში ამ მოვლენამ რობოტის სენსორების შეფერხება არ გამოიწვიოს. გარდა ამისა, მომხმარებელს შეუძლია ნახოს, თუ როგორ გამოიყურება ნიუ-იორკის კონკრეტული უბანი თოვლიან ამინდში, მაშინაც კი, თუ იქ სხვა სეზონზე აპირებს გამგზავრებას.
მონაცემთა მასშტაბები და Waymo-სთან თანამშრომლობა
Google უკვე 20 წელია აგროვებს Street View-ს მონაცემებს კამერებით აღჭურვილი ავტომობილებისა და სპეციალური ზურგჩანთების მქონე ადამიანების მეშვეობით. ტექნოლოგიურმა გიგანტმა 110 ქვეყანასა და შვიდ კონტინენტზე 280 მილიარდზე მეტი გამოსახულება შეაგროვა. მსოფლიოს შესახებ ამ მასშტაბის ინფორმაციის გაერთიანება სამყაროს სიმულაციის უნართან უდიდეს პოტენციალს ქმნის.
Genie 3 უკვე ეხმარება Waymo-ს სიმულატორს თვითმართვადი ავტომობილების მომზადებაში „უკიდურესად იშვიათი მოვლენებისთვის“, როგორიცაა ტორნადო ან გზაზე სპილოსთან შეხვედრა. Street View-ს მონაცემების დამატება Waymo-ს დაეხმარება, უფრო სწრაფად გაფართოვდეს მსოფლიოს სხვადასხვა ქალაქში. აქამდე Waymo საკუთარ სიმულატორს ეყრდნობოდა, რომელიც მხოლოდ ავტომობილის ხედვის კუთხით მუშაობდა. Genie-ს უპირატესობა კი ისაა, რომ მას შეუძლია ხედვის წერტილი შეცვალოს და გარემო სხვადასხვა აგენტის, მაგალითად, ადამიანის ან რობოტის პერსპექტივიდან დაანახოს.
ხელმისაწვდომობა და ტექნიკური გამოწვევები
Google-მა Street View-ს მხარდაჭერა Genie-ში აშშ-ში მყოფი ზოგიერთი Ultra მომხმარებლისთვის უკვე გაააქტიურა. გლობალური მასშტაბით Ultra მომხმარებლები წვდომას უახლოეს კვირებში მიიღებენ. DeepMind-ის პროდუქტების მენეჯერის, დიეგო რივასის თქმით, მიზანია ეს შესაძლებლობა რაც შეიძლება მეტ ადამიანს მიეცეს, თუმცა აღნიშნავს, რომ პროექტი ჯერ კიდევ ექსპერიმენტულ ფაზაშია და სიზუსტის მხრივ ბევრი რამ არის გასაუმჯობესებელი.
წარმოდგენილ ნიმუშებში შედეგები შთამბეჭდავია, თუმცა ვიზუალური ხარისხი უფრო ვიდეო თამაშს ჰგავს, ვიდრე ფოტორეალისტურ გამოსახულებას. გარდა ამისა, მოდელებს ჯერ არ აქვთ „ფიზიკის შეგრძნება“, რაც იმას ნიშნავს, რომ მათ არ ესმით მიზეზშედეგობრიობა. მაგალითად, თოვლიან გარემოში მორბენალი ქალის სიმულაციისას, პერსონაჟმა პირდაპირ კაქტუსებსა და ბუჩქებში გაიარა.
შედარებისთვის, Google-ის სხვა მოდელები, როგორიცაა Nano Banana (ინფოგრაფიკების გენერატორი) ან Veo (ვიდეო გენერატორი), უკვე უკეთ აღიქვამენ ფიზიკურ კანონებს — მაგალითად, იმას, რომ ქაღალდის ნავი წყლის დინებას მიჰყვება ან ქსოვილი სხეულზე ფორმას იღებს. მკვლევარების პროგნოზით, Genie-ს ამ დონის სიზუსტის მისაღწევად დაახლოებით 6-12 თვე დასჭირდება.
სივრცითი უწყვეტობა და მომავლის პერსპექტივა
ჯონათან ჰერბერტმა, Google Maps-ის დირექტორმა, აღნიშნა, რომ მიუხედავად იმისა, რომ Genie-ს ჯერ არ შეუძლია ქუჩის აბსოლუტურად ზუსტი რეკონსტრუქცია, მისი მთავარი მიღწევა სივრცითი უწყვეტობაა. თუ სიმულაციაში 360 გრადუსით შემობრუნდებით, ხელოვნურ ინტელექტს ზუსტად ახსოვს და აღადგენს თქვენს უკან არსებულ გარემოს. ამ ბაზაზე მოდელს შეუძლია სრულიად ახალი გარემოს აშენება.
Street View-ს მონაცემების ახლებურად გამოყენება და მათი ხელოვნური ინტელექტის კვლევებში ინტეგრირება Google-ის გუნდისთვის დიდი ხნის მიზანი იყო, რაც ახლა რეალობად იქცა.
მსგავსი სტატიები

Gemini 3.5 Flash: Google ხელოვნური ინტელექტის ახალ ტალღას ჩატბოტების ნაცვლად ავტონომიურ აგენტებზე აფუძნებს
Google-მა წარადგინა Gemini 3.5 Flash, რომელიც ორიენტირებულია ავტონომიურ AI აგენტებზე, კოდირებასა და რთული პროექტების დამოუკიდებელ მართვაზე.

Google Meta-ს კვალდაკვალ: კომპანიამ ხელოვნურ ინტელექტზე დაფუძნებული ახალი აუდიო-სათვალეები წარადგინა
Google ჭკვიანი სათვალეების ბაზარზე ბრუნდება. კომპანიამ Warby Parker-თან და Samsung-თან თანამშრომლობით ხელოვნურ ინტელექტზე დაფუძნებული „აუდიო-სათვალეები“ წარადგინა.

SandboxAQ-მ წამლების აღმოჩენის მოდელები Claude-ში დანერგა — კომპიუტერული მეცნიერების დოქტორის ხარისხი საჭირო აღარ არის
SandboxAQ და Anthropic თანამშრომლობენ, რათა რთული სამეცნიერო მოდელები Claude-ის ინტერფეისში გააერთიანონ, რაც წამლების აღმოჩენის პროცესს მნიშვნელოვნად გაამარტივებს.