Anthropic-მა ხელოვნური ინტელექტის აგენტებს შორის ვაჭრობის სატესტო პლატფორმა შექმნა

Anthropic-ის ექსპერიმენტმა „Project Deal“ აჩვენა, თუ როგორ შეუძლიათ AI აგენტებს რეალური ფულით ვაჭრობა. კვლევამ გამოკვეთა „აგენტების ხარისხის ნაპრალი“ და მოდელების გავლენა გარიგების შედეგებზე.

კომპანია Anthropic-მა ჩაატარა ექსპერიმენტი, რომლის ფარგლებშიც შეიქმნა განცხადებების პლატფორმა. აქ ხელოვნური ინტელექტის აგენტები მყიდველებისა და გამყიდველების როლს ასრულებდნენ და რეალურ ნივთებზე რეალურ ფულად გარიგებებს დებდნენ.

კომპანიის განმარტებით, ტესტი, რომელსაც „Project Deal“ ეწოდა, მხოლოდ საპილოტე ექსპერიმენტი იყო. მასში მონაწილეობა Anthropic-ის 69-მა თანამშრომელმა მიიღო, რომლებსაც კოლეგებისგან ნივთების შესაძენად 100-დოლარიანი ბიუჯეტი (სასაჩუქრე ბარათების სახით) გადაეცათ.

მიუხედავად მასშტაბისა, Anthropic-ში აღნიშნავენ, რომ „Project Deal“-ის მუშაობის ხარისხმა მოლოდინს გადააჭარბა. ექსპერიმენტის განმავლობაში სულ 186 გარიგება გაფორმდა, რომელთა საერთო ღირებულებამ 4,000 დოლარს გადააჭარბა.

ექსპერიმენტის სტრუქტურა და მოდელების ეფექტურობა

კომპანიამ ოთხი ცალკეული სავაჭრო პლატფორმა აამუშავა სხვადასხვა მოდელების გამოსაცდელად. ერთ-ერთი მათგანი იყო „რეალური“ ბაზარი, სადაც ყველა მონაწილეს კომპანიის ყველაზე განვითარებული მოდელი წარმოადგენდა და გარიგებები ექსპერიმენტის დასრულების შემდეგ მართლაც შესრულდა. დანარჩენი სამი პლატფორმა კი კვლევითი მიზნებისთვის გამოიყენებოდა.

Anthropic-ის დაკვირვებით, როდესაც მომხმარებლებს უფრო განვითარებული მოდელები წარმოადგენდნენ, ისინი „ობიექტურად უკეთეს შედეგებს“ აღწევდნენ. თუმცა, თავად მომხმარებლებმა ეს განსხვავება ვერ შეამჩნიეს. ამ ფაქტმა წარმოშვა ე.წ. „აგენტების ხარისხის ნაპრალის“ (agent quality gaps) რისკი. არსებობს საშიშროება, რომ წაგებულ მხარეს მყოფმა ადამიანებმა ვერც კი გააცნობიერონ, რომ მათთვის არახელსაყრელი პირობები შეიქმნა.

მოლაპარაკებების თავისებურებები

კვლევამ ასევე აჩვენა საინტერესო დეტალი აგენტების მართვის შესახებ. აღმოჩნდა, რომ აგენტებისთვის მიცემულ თავდაპირველ ინსტრუქციებს მნიშვნელოვანი გავლენა არ მოუხდენია არც გაყიდვის ალბათობაზე და არც შეთანხმებულ საბოლოო ფასებზე. ეს მიუთითებს იმაზე, რომ აგენტების ქცევა მოლაპარაკებების პროცესში უფრო მეტად მათი ტექნოლოგიური შესაძლებლობებით იყო განპირობებული, ვიდრე კონკრეტული მითითებებით.

Anthropic-მა ხელოვნური ინტელექტის აგენტებს შორის ვაჭრობის სატესტო პლატფორმა შექმნა

ექსპერიმენტის სტრუქტურა და მოდელების ეფექტურობა

მოლაპარაკებების თავისებურებები

მსგავსი სტატიები

PGP-დან Mythos-მდე: საექსპორტო კონტროლის მოკლე ისტორია, რომელმაც ტექნოლოგიების გავრცელება ვერ შეაფერხა

მილიარდერ მუკეშ ამბანის სურს, ხელოვნური ინტელექტი ყველა სატელეფონო ზარში, აპლიკაციასა და სახლში დანერგოს

აშშ-მ Anthropic-ის Fable 5-ის გამოშვება აკრძალა, თუმცა ციფრებზე ეს არ ასახულა