სიახლეები xAI-სთვის: Grok-მა Baldur’s Gate-ის შესახებ კითხვებზე პასუხის გაცემა წარმატებით ისწავლა
ილონ მასკის xAI-მ Grok-ის მოდელი ვიდეო თამაშების გზამკვლევების მიმართულებით დახვეწა. გაიგეთ, როგორ გაუმკლავდა ჩატბოტი Baldur’s Gate-ის შესახებ დასმულ კითხვებს.

ხელოვნური ინტელექტის სხვადასხვა ლაბორატორიას განსხვავებული პრიორიტეტები აქვს. მაგალითად, OpenAI ტრადიციულად ორიენტირებულია რიგით მომხმარებლებზე, ხოლო მისი კონკურენტი Anthropic, როგორც წესი, ბიზნეს სექტორს (enterprises) სამიზნე აუდიტორიად მიიჩნევს. ილონ მასკის xAI-ის შემთხვევაში კი, როგორც ბოლო დროს გაირკვა, განსაკუთრებული ყურადღება ვიდეო თამაშების გზამკვლევებს ეთმობა.
Business Insider-ის მიერ გამოქვეყნებულ ვრცელ ანგარიშში დეტალურად არის განხილული xAI-ის საქმიანობა — ხელოვნური ინტელექტის სტარტაპის, რომელიც ახლახან SpaceX-მა შეიძინა. სტატიაში ხაზგასმულია, თუ როგორ ართულებს მასკი თანამშრომლების სამუშაო პროცესს. ერთ-ერთი კონკრეტული შემთხვევა განსაკუთრებით საყურადღებოა: გასულ წელს მოდელის გამოშვება რამდენიმე დღით გადაიდო, რადგან მასკი უკმაყოფილო იყო იმით, თუ როგორ პასუხობდა ჩატბოტი დეტალურ კითხვებს ვიდეო თამაშის, „Baldur’s Gate“-ის შესახებ.
საკითხში ჩახედული პირების ინფორმაციით, მაღალი რანგის ინჟინრები სხვა პროექტებიდან მოხსნეს, რათა მოდელის პასუხები გაეუმჯობესებინათ მის ოფიციალურ გაშვებამდე. ბუნებრივია, გამოცდილი ინჟინრებისთვის, რომლებიც სამუშაოზე ფუნდამენტური ცოდნისა და მანქანური ინტელექტის საკითხების გადასაჭრელად მიდიან, იმედგაცრუების საფუძველი შეიძლება გახდეს ისეთი დავალება, რომელიც 54 წლის მამაკაცისთვის ვიდეო თამაშის დახურვაში დახმარებას გულისხმობს. თუმცა, ეს შემთხვევა უფრო მნიშვნელოვან კითხვას ბადებს: მიაღწია თუ არა მასკმა სასურველ შედეგს გეიმინგის მიმართულებით?
BaldurBench: მოდელების შედარებითი ტესტირება
ამ კითხვაზე პასუხის გასაცემად მომზადდა ხუთი ზოგადი კითხვა Baldur’s Gate-ის შესახებ, რომლებიც xAI-ის მოდელსა და სამ სხვა წამყვან მოდელს დაუსვეს. ამ ექსპერიმენტს პირობითად „BaldurBench“ ეწოდა. გამჭვირვალობისთვის, ჩატის ყველა ტრანსკრიპტი საჯაროა: Grok, ChatGPT, Claude და Gemini.
ტესტირების შედეგად გამოიკვეთა, რომ Grok-ი რეალურად საკმაოდ კარგ ინფორმაციას იძლევა. მისი პასუხები გაჯერებული იყო გეიმერული ჟარგონით — მაგალითად, ტერმინი „save-scumming“ გამოყენებული იყო თამაშის ხშირი შენახვის ნაცვლად, ხოლო „DPS“ — მიყენებული ზიანის (damage) აღსანიშნავად. პასუხები სასარგებლო და კომპეტენტური აღმოჩნდა, თუმცა მომხმარებლისგან მოითხოვდა შესაბამისი ტერმინოლოგიის ცოდნას. Grok-ს ასევე განსაკუთრებით უყვარს ცხრილებისა და თეორიული გათვლების (theorycraft) გამოყენება.
სტილისტური განსხვავებები მოდელებს შორის
ვინაიდან Baldur’s Gate-ის შესახებ უამრავი გზამკვლევი არსებობს და მოდელები ძირითადად ერთსა და იმავე წყაროებს ეყრდნობოდნენ, მათ შორის ძირითადი განსხვავება სტილისტური იყო:
- ChatGPT: უპირატესობას ანიჭებს პუნქტებით ჩამოთვლილ სიებსა და მოკლე ფრაზებს.
- Gemini: ხშირად იყენებს მუქ შრიფტს (bold) მნიშვნელოვანი სიტყვების გამოსაკვეთად.
- Claude: ყველაზე მეტად ზრუნავს იმაზე, რომ მომხმარებელს არ მიაწოდოს ისეთი ინფორმაცია, რომელიც თამაშის სიუჟეტს ნაადრევად გაამჟღავნებს (spoilers). გუნდის შემადგენლობის შესახებ კითხვის დასმისას, მან რჩევა შემდეგი სიტყვებით დაასრულა: „ზედმეტად ნუ ინერვიულებთ და უბრალოდ ითამაშეთ ისე, როგორც თქვენთვის სასიამოვნო იქნება“.
მნიშვნელოვანია გავითვალისწინოთ, რომ xAI-მ მიზანმიმართულად იმუშავა ამ კონკრეტულ სფეროში კონკურენტებთან გასათანაბრებლად. შესაბამისად, ის ფაქტი, რომ Grok-ის რჩევები სხვა მოდელების დონეზეა, მოულოდნელი არ არის. მიუხედავად ამისა, აღსანიშნავია, რომ xAI-ს შეუძლია სასურველი შედეგის მიღწევა, როდესაც ამისთვის სათანადო ძალისხმევას ხარჯავს.
მსგავსი სტატიები

„სათამაშოების ისტორია 5“ ხელოვნური ინტელექტის მქონე საშიშ სათამაშოებს უპირისპირდება: „მე ყოველთვის გისმენთ“
Pixar-ის საკულტო ფრენჩაიზის ახალი ნაწილი თანამედროვე გამოწვევებს ეხმიანება. „სათამაშოების ისტორია 5“-ში ვუდი და მისი მეგობრები ბოროტ AI პლანშეტს უპირისპირდებიან.

InScope-მა ფინანსური ანგარიშგების პროცესის გასამარტივებლად 14.5 მილიონი დოლარი მოიზიდა
InScope-მა, ხელოვნურ ინტელექტზე დაფუძნებულმა ფინანსური ანგარიშგების პლატფორმამ, 14.5 მილიონი დოლარი მოიზიდა. სტარტაპი ბუღალტრებს შრომატევადი მექანიკური სამუშაოს ავტომატიზაციაში ეხმარება.

Nvidia აძლიერებს პოზიციებს ინდოეთის ხელოვნური ინტელექტის სტარტაპ ეკოსისტემაში: ახალი პარტნიორობები და სტრატეგიული გეგმები
Nvidia აძლიერებს თანამშრომლობას ინდოეთის AI სტარტაპებთან ადრეულ ეტაპზე, რათა უზრუნველყოს გრძელვადიანი მოთხოვნა თავის გამოთვლით ინფრასტრუქტურაზე მსოფლიოს ერთ-ერთ უმსხვილეს ბაზარზე.