DeepMind-მა SIMA 2 წარადგინა: AI აგენტი, რომელიც ვიდეოთამაშებში Gemini-ს გონებით მოქმედებს
Google DeepMind-მა SIMA 2 წარადგინა — AI აგენტი, რომელიც Gemini-ს მსჯელობის უნარს ვირტუალურ სამყაროებში მოქმედებისთვის იყენებს და საკუთარ შეცდომებზე სწავლობს.

Google DeepMind-მა თავისი უახლესი კვლევა, SIMA 2, წარადგინა. ეს არის ახალი თაობის უნივერსალური ხელოვნური ინტელექტის აგენტი, რომელიც Google-ის მძლავრ ენობრივ მოდელს, Gemini-ს, იყენებს. მისი მიზანია არა მხოლოდ ინსტრუქციების შესრულება, არამედ ვირტუალური გარემოს გააზრება და მასთან ინტერაქცია.
SIMA-ს პირველი ვერსია, რომელიც 2024 წლის მარტში გამოვიდა, ვიდეოთამაშების მონაცემებზე იყო გაწვრთნილი, რათა ადამიანის მსგავსად ეთამაშა სხვადასხვა 3D თამაში. თუმცა, რთული ამოცანების შესრულებისას მისი წარმატების მაჩვენებელი მხოლოდ 31% იყო, მაშინ როცა ადამიანისთვის ეს მაჩვენებელი 71%-ს შეადგენს. DeepMind-ის უფროსი მეცნიერ-მკვლევრის, ჯო მარინოს თქმით, „SIMA 2 შესაძლებლობების თვალსაზრისით მნიშვნელოვანი ნახტომია. ის უფრო ზოგადი აგენტია, რომელსაც შეუძლია რთული ამოცანების შესრულება უცხო გარემოში და საკუთარ გამოცდილებაზე დაყრდნობით განვითარება“.
SIMA 2-ის მუშაობას Gemini 2.5 flash-lite მოდელი უზრუნველყოფს. მისი განვითარება ხელოვნური ზოგადი ინტელექტის (AGI) შექმნისკენ გადადგმული ნაბიჯია — სისტემის, რომელსაც ინტელექტუალური ამოცანების ფართო სპექტრის შესრულება და ცოდნის სხვადასხვა სფეროში განზოგადება შეუძლია. მარინოს განმარტებით, SIMA 2 „განხორციელებული აგენტია“, რომელიც ფიზიკურ ან ვირტუალურ სამყაროსთან სხეულის მეშვეობით ურთიერთობს, ისევე როგორც რობოტი ან ადამიანი.
Gemini-ს ინტეგრაციამ SIMA 2-ის წარმადობა წინამორბედთან შედარებით გააორმაგა. დემონსტრაციისას, როდესაც აგენტს სთხოვეს მისულიყო „მწიფე პომიდვრის ფერის სახლთან“, მან ჯერ იფიქრა — „მწიფე პომიდორი წითელია, შესაბამისად, წითელ სახლთან უნდა მივიდე“ — შემდეგ კი ამოცანა შეასრულა. მას ასევე ესმის ემოჯი-ინსტრუქციები: მაგალითად, 🪓🌲 ბრძანების მიღების შემდეგ, ის ხის მოსაჭრელად მიდის.
DeepMind-ის კიდევ ერთი უფროსი მეცნიერ-მკვლევარი, ჯეინ ვონგი, აღნიშნავს, რომ SIMA 2-ის შესაძლებლობები უბრალო თამაშს სცილდება. „ჩვენ მას ვთხოვთ, გაიგოს, რა ხდება, რას ითხოვს მომხმარებელი და შემდეგ საღი აზრის საფუძველზე იმოქმედოს, რაც საკმაოდ რთულია“, — ამბობს ვონგი. აგენტმა წარმატებით გაიარა ტესტირება DeepMind-ის სხვა მოდელის, Genie-ს მიერ გენერირებულ ფოტორეალისტურ სამყაროებშიც, სადაც მან სწორად ამოიცნო და იმოქმედა ისეთ ობიექტებთან, როგორიცაა სკამები, ხეები და პეპლები.
SIMA 2-ის ერთ-ერთი მთავარი უპირატესობა თვითგანვითარების უნარია. თუ SIMA 1 სრულად ადამიანების თამაშის მონაცემებზე იყო დამოკიდებული, SIMA 2 ამ მონაცემებს მხოლოდ საწყის ბაზად იყენებს. ახალ გარემოში მოხვედრისას, სხვა Gemini მოდელი მისთვის ახალ დავალებებს ქმნის, ხოლო ცალკე შემფასებელი მოდელი მის მცდელობებს აფასებს. ამგვარად, აგენტი საკუთარ შეცდომებზე სწავლობს და ვითარდება, რაც ადამიანის სწავლის პროცესის მსგავსია.
DeepMind-ში მიიჩნევენ, რომ SIMA 2-ის განვითარება უნივერსალური რობოტების შექმნისკენ გადადგმული მნიშვნელოვანი ნაბიჯია. უფროსი ინჟინერ-მკვლევრის, ფრედერიკ ბესეს თქმით, რეალურ სამყაროში მოქმედ რობოტს ორი კომპონენტი სჭირდება: მაღალი დონის გააზრება (მაგალითად, რა არის სამზარეულო) და დაბალი დონის მოქმედებები (ფიზიკური მოძრაობა). SIMA 2 სწორედ პირველ, მაღალი დონის მსჯელობის კომპონენტზეა ფოკუსირებული.
ამ ეტაპზე, გუნდი არ ასახელებს კონკრეტულ ვადებს, თუ როდის შეიძლება SIMA 2-ის ფიზიკურ რობოტებში ინტეგრირება. პროექტის ამჟამინდელი კვლევითი ვერსიის წარდგენის მიზანია მიღწეული პროგრესის ჩვენება და პოტენციური თანამშრომლობის შესაძლებლობების მოძიება.
მსგავსი სტატიები

Peripheral Labs-ი თვითმართვადი ავტომობილების სენსორებს სპორტის გულშემატკივრებისთვის იმერსიული გამოცდილების შესაქმნელად იყენებს
სტარტაპი Peripheral Labs-ი ავტონომიური მართვის ტექნოლოგიებს სპორტული ტრანსლაციების რევოლუციისთვის იყენებს, რაც გულშემატკივრებს თამაშის ნებისმიერი რაკურსით ნახვის საშუალებას აძლევს.

ChatGPT-ის მობილურმა აპლიკაციამ შემოსავლების ახალ რეკორდულ ნიშნულს — 3 მილიარდ დოლარს მიაღწია
ChatGPT-ის მობილურმა აპლიკაციამ 3 მილიარდ დოლარიან შემოსავალს რეკორდულ დროში მიაღწია, რითაც TikTok-სა და წამყვან სტრიმინგ პლატფორმებს აჯობა.

რატომ გადადიან ბრიტანელი პოლიტიკოსები ამერიკულ ტექნოლოგიურ გიგანტებში
ბრიტანეთის ყოფილი ფინანსთა მინისტრი ჯორჯ ოსბორნი OpenAI-სა და Coinbase-ს უერთდება. გაიგეთ, რატომ ირჩევენ ბრიტანელი პოლიტიკოსები ამერიკულ ტექნოლოგიურ გიგანტებს და რა გავლენას ახდენს ეს გლობალურ AI პოლიტიკაზე.