Anthropic-მა ხელოვნური ინტელექტის აგენტებს შორის ვაჭრობის სატესტო პლატფორმა შექმნა
Anthropic-ის ექსპერიმენტმა „Project Deal“ აჩვენა, თუ როგორ შეუძლიათ AI აგენტებს რეალური ფულით ვაჭრობა. კვლევამ გამოკვეთა „აგენტების ხარისხის ნაპრალი“ და მოდელების გავლენა გარიგების შედეგებზე.

კომპანია Anthropic-მა ჩაატარა ექსპერიმენტი, რომლის ფარგლებშიც შეიქმნა განცხადებების პლატფორმა. აქ ხელოვნური ინტელექტის აგენტები მყიდველებისა და გამყიდველების როლს ასრულებდნენ და რეალურ ნივთებზე რეალურ ფულად გარიგებებს დებდნენ.
კომპანიის განმარტებით, ტესტი, რომელსაც „Project Deal“ ეწოდა, მხოლოდ საპილოტე ექსპერიმენტი იყო. მასში მონაწილეობა Anthropic-ის 69-მა თანამშრომელმა მიიღო, რომლებსაც კოლეგებისგან ნივთების შესაძენად 100-დოლარიანი ბიუჯეტი (სასაჩუქრე ბარათების სახით) გადაეცათ.
მიუხედავად მასშტაბისა, Anthropic-ში აღნიშნავენ, რომ „Project Deal“-ის მუშაობის ხარისხმა მოლოდინს გადააჭარბა. ექსპერიმენტის განმავლობაში სულ 186 გარიგება გაფორმდა, რომელთა საერთო ღირებულებამ 4,000 დოლარს გადააჭარბა.
ექსპერიმენტის სტრუქტურა და მოდელების ეფექტურობა
კომპანიამ ოთხი ცალკეული სავაჭრო პლატფორმა აამუშავა სხვადასხვა მოდელების გამოსაცდელად. ერთ-ერთი მათგანი იყო „რეალური“ ბაზარი, სადაც ყველა მონაწილეს კომპანიის ყველაზე განვითარებული მოდელი წარმოადგენდა და გარიგებები ექსპერიმენტის დასრულების შემდეგ მართლაც შესრულდა. დანარჩენი სამი პლატფორმა კი კვლევითი მიზნებისთვის გამოიყენებოდა.
Anthropic-ის დაკვირვებით, როდესაც მომხმარებლებს უფრო განვითარებული მოდელები წარმოადგენდნენ, ისინი „ობიექტურად უკეთეს შედეგებს“ აღწევდნენ. თუმცა, თავად მომხმარებლებმა ეს განსხვავება ვერ შეამჩნიეს. ამ ფაქტმა წარმოშვა ე.წ. „აგენტების ხარისხის ნაპრალის“ (agent quality gaps) რისკი. არსებობს საშიშროება, რომ წაგებულ მხარეს მყოფმა ადამიანებმა ვერც კი გააცნობიერონ, რომ მათთვის არახელსაყრელი პირობები შეიქმნა.
მოლაპარაკებების თავისებურებები
კვლევამ ასევე აჩვენა საინტერესო დეტალი აგენტების მართვის შესახებ. აღმოჩნდა, რომ აგენტებისთვის მიცემულ თავდაპირველ ინსტრუქციებს მნიშვნელოვანი გავლენა არ მოუხდენია არც გაყიდვის ალბათობაზე და არც შეთანხმებულ საბოლოო ფასებზე. ეს მიუთითებს იმაზე, რომ აგენტების ქცევა მოლაპარაკებების პროცესში უფრო მეტად მათი ტექნოლოგიური შესაძლებლობებით იყო განპირობებული, ვიდრე კონკრეტული მითითებებით.
მსგავსი სტატიები

პროგრამისტები ხელოვნური ინტელექტის გარეშე მუშაობაზე უარს ამბობენ — ეს შესაძლოა მათთვის სერიოზულ პრობლემად იქცეს
2026 წლისთვის პროგრამისტები იმდენად დამოკიდებულნი გახდნენ AI-ზე, რომ მის გარეშე მუშაობაზე უარს ამბობენ. თუმცა, კვლევები აჩვენებს, რომ ეს პროდუქტიულობას ყოველთვის არ ზრდის.

Nvidia-სთან $20-მილიარდიანი გარიგების შემდეგ, AI ჩიპების სტარტაპი Groq $650 მილიონის მოზიდვას გეგმავს
AI ჩიპების სტარტაპი Groq-ი, Nvidia-სთან გაფორმებული $20-მილიარდიანი შეთანხმების შემდეგ, 650 მილიონი დოლარის მოზიდვას და ინფერენს-ღრუბლოვანი ბიზნესის განვითარებას გეგმავს.

რა ხდება, როდესაც კომპანიები ხელოვნური ინტელექტით ზედმეტად არიან გატაცებულნი?
Box-ის დამფუძნებელი აარონ ლევი „AI ფსიქოზზე“ საუბრობს, ხოლო კომპანიები სამუშაო ადგილებს ხელოვნური ინტელექტის აგენტებით ანაცვლებენ.