სიახლეები xAI-სთვის: Grok-მა Baldur’s Gate-ის შესახებ კითხვებზე პასუხის გაცემა წარმატებით ისწავლა
ილონ მასკის xAI-მ Grok-ის მოდელი ვიდეო თამაშების გზამკვლევების მიმართულებით დახვეწა. გაიგეთ, როგორ გაუმკლავდა ჩატბოტი Baldur’s Gate-ის შესახებ დასმულ კითხვებს.

ხელოვნური ინტელექტის სხვადასხვა ლაბორატორიას განსხვავებული პრიორიტეტები აქვს. მაგალითად, OpenAI ტრადიციულად ორიენტირებულია რიგით მომხმარებლებზე, ხოლო მისი კონკურენტი Anthropic, როგორც წესი, ბიზნეს სექტორს (enterprises) სამიზნე აუდიტორიად მიიჩნევს. ილონ მასკის xAI-ის შემთხვევაში კი, როგორც ბოლო დროს გაირკვა, განსაკუთრებული ყურადღება ვიდეო თამაშების გზამკვლევებს ეთმობა.
Business Insider-ის მიერ გამოქვეყნებულ ვრცელ ანგარიშში დეტალურად არის განხილული xAI-ის საქმიანობა — ხელოვნური ინტელექტის სტარტაპის, რომელიც ახლახან SpaceX-მა შეიძინა. სტატიაში ხაზგასმულია, თუ როგორ ართულებს მასკი თანამშრომლების სამუშაო პროცესს. ერთ-ერთი კონკრეტული შემთხვევა განსაკუთრებით საყურადღებოა: გასულ წელს მოდელის გამოშვება რამდენიმე დღით გადაიდო, რადგან მასკი უკმაყოფილო იყო იმით, თუ როგორ პასუხობდა ჩატბოტი დეტალურ კითხვებს ვიდეო თამაშის, „Baldur’s Gate“-ის შესახებ.
საკითხში ჩახედული პირების ინფორმაციით, მაღალი რანგის ინჟინრები სხვა პროექტებიდან მოხსნეს, რათა მოდელის პასუხები გაეუმჯობესებინათ მის ოფიციალურ გაშვებამდე. ბუნებრივია, გამოცდილი ინჟინრებისთვის, რომლებიც სამუშაოზე ფუნდამენტური ცოდნისა და მანქანური ინტელექტის საკითხების გადასაჭრელად მიდიან, იმედგაცრუების საფუძველი შეიძლება გახდეს ისეთი დავალება, რომელიც 54 წლის მამაკაცისთვის ვიდეო თამაშის დახურვაში დახმარებას გულისხმობს. თუმცა, ეს შემთხვევა უფრო მნიშვნელოვან კითხვას ბადებს: მიაღწია თუ არა მასკმა სასურველ შედეგს გეიმინგის მიმართულებით?
BaldurBench: მოდელების შედარებითი ტესტირება
ამ კითხვაზე პასუხის გასაცემად მომზადდა ხუთი ზოგადი კითხვა Baldur’s Gate-ის შესახებ, რომლებიც xAI-ის მოდელსა და სამ სხვა წამყვან მოდელს დაუსვეს. ამ ექსპერიმენტს პირობითად „BaldurBench“ ეწოდა. გამჭვირვალობისთვის, ჩატის ყველა ტრანსკრიპტი საჯაროა: Grok, ChatGPT, Claude და Gemini.
ტესტირების შედეგად გამოიკვეთა, რომ Grok-ი რეალურად საკმაოდ კარგ ინფორმაციას იძლევა. მისი პასუხები გაჯერებული იყო გეიმერული ჟარგონით — მაგალითად, ტერმინი „save-scumming“ გამოყენებული იყო თამაშის ხშირი შენახვის ნაცვლად, ხოლო „DPS“ — მიყენებული ზიანის (damage) აღსანიშნავად. პასუხები სასარგებლო და კომპეტენტური აღმოჩნდა, თუმცა მომხმარებლისგან მოითხოვდა შესაბამისი ტერმინოლოგიის ცოდნას. Grok-ს ასევე განსაკუთრებით უყვარს ცხრილებისა და თეორიული გათვლების (theorycraft) გამოყენება.
სტილისტური განსხვავებები მოდელებს შორის
ვინაიდან Baldur’s Gate-ის შესახებ უამრავი გზამკვლევი არსებობს და მოდელები ძირითადად ერთსა და იმავე წყაროებს ეყრდნობოდნენ, მათ შორის ძირითადი განსხვავება სტილისტური იყო:
- ChatGPT: უპირატესობას ანიჭებს პუნქტებით ჩამოთვლილ სიებსა და მოკლე ფრაზებს.
- Gemini: ხშირად იყენებს მუქ შრიფტს (bold) მნიშვნელოვანი სიტყვების გამოსაკვეთად.
- Claude: ყველაზე მეტად ზრუნავს იმაზე, რომ მომხმარებელს არ მიაწოდოს ისეთი ინფორმაცია, რომელიც თამაშის სიუჟეტს ნაადრევად გაამჟღავნებს (spoilers). გუნდის შემადგენლობის შესახებ კითხვის დასმისას, მან რჩევა შემდეგი სიტყვებით დაასრულა: „ზედმეტად ნუ ინერვიულებთ და უბრალოდ ითამაშეთ ისე, როგორც თქვენთვის სასიამოვნო იქნება“.
მნიშვნელოვანია გავითვალისწინოთ, რომ xAI-მ მიზანმიმართულად იმუშავა ამ კონკრეტულ სფეროში კონკურენტებთან გასათანაბრებლად. შესაბამისად, ის ფაქტი, რომ Grok-ის რჩევები სხვა მოდელების დონეზეა, მოულოდნელი არ არის. მიუხედავად ამისა, აღსანიშნავია, რომ xAI-ს შეუძლია სასურველი შედეგის მიღწევა, როდესაც ამისთვის სათანადო ძალისხმევას ხარჯავს.
მსგავსი სტატიები

Snap-ის აქციების ფასი მკვეთრად დაეცა ძვირადღირებული AR სათვალეების წარდგენის შემდეგ
Snap-ის ახალი AR სათვალეების, Specs-ის პრეზენტაციას აქციების ფასის 5%-იანი ვარდნა მოჰყვა. 2,200-დოლარიანი ფასი ინვესტორებში პროდუქტის მომგებიანობის შესახებ კითხვებს აჩენს.

როგორ გავთიშოთ Gemini AI-ს შეტყობინებები Google Docs-ში: ნაბიჯ-ნაბიჯ ინსტრუქცია
შეიტყვეთ, როგორ გათიშოთ Gemini AI-ს შემაწუხებელი ფანჯრები Google Docs-ში და მართოთ Google Workspace-ის ჭკვიანი ფუნქციები Gmail-ის პარამეტრებიდან.

რულოფ ბოთა SpaceX-ის დირექტორთა საბჭოს შეუერთდა: დეტალები კომპანიის მმართველობაში მომხდარი ცვლილების შესახებ
[ქართული აღწერა] Former Sequoia Capital managing partner Roelof Botha is joining SpaceX’s board of directors, less than a week after the company went public in the lar...