Skip to main content
სტარტაპი18.3.20262 ნახვა

ლიდერბორდი, რომლის „მოტყუებაც“ შეუძლებელია: Arena-ს გზა ბერკლის კვლევიდან 1.7 მილიარდ დოლარამდე

Arena, რომელიც ბერკლის უნივერსიტეტის კვლევით დაიწყო, 1.7 მილიარდ დოლარად შეფასებულ სტარტაპად იქცა. გაიგეთ, როგორ ქმნის ის AI მოდელების ობიექტურ რეიტინგს.

ლიდერბორდი, რომლის „მოტყუებაც“ შეუძლებელია: Arena-ს გზა ბერკლის კვლევიდან 1.7 მილიარდ დოლარამდე

ხელოვნური ინტელექტის მოდელების რაოდენობა ელვისებური სისწრაფით იზრდება და ბაზარზე კონკურენცია სულ უფრო მძაფრდება. ამ მრავალფეროვნებაში საუკეთესოს გამოვლენა და იმის განსაზღვრა, თუ ვინ უნდა დაადგინოს ლიდერი, გადამწყვეტი მნიშვნელობის საკითხია. სწორედ ამ გამოწვევას პასუხობს Arena (ყოფილი LM Arena), რომელიც დიდი ენობრივი მოდელების (LLM) დე ფაქტო საჯარო ლიდერბორდად იქცა.

პლატფორმა მნიშვნელოვან გავლენას ახდენს დაფინანსების მოპოვებაზე, ახალი პროდუქტების გაშვებასა და კომპანიების პიარ კამპანიებზე. სულ რაღაც შვიდ თვეში, პროექტი ბერკლის უნივერსიტეტის (UC Berkeley) სადოქტორო კვლევიდან 1.7 მილიარდი დოლარის ღირებულების სტარტაპად გარდაიქმნა.

Equity-ის წამყვანი რებეკა ბელანი Arena-ს თანადამფუძნებლებს, ანასტასიოს ანგელოპულოსსა და ვეი-ლინ ჩიანგს ესაუბრა იმის შესახებ, თუ როგორ გახდა მათი პლატფორმა წამყვანი AI მოდელების შეფასების მთავარი ორიენტირი. საუბარი ასევე შეეხო ნეიტრალური ბენჩმარკის შექმნის სირთულეებს იმ პირობებში, როდესაც პროექტს ისეთი გიგანტები უჭერენ მხარს, როგორიცაა OpenAI, Google და Anthropic.

როგორ მუშაობს Arena და რატომ არის ის სანდო

დამფუძნებლებმა დეტალურად განმარტეს Arena-ს მუშაობის პრინციპი და ის მიზეზები, რის გამოც მისი შედეგების მანიპულირება (gaming) გაცილებით რთულია, ვიდრე ტრადიციული, სტატიკური ბენჩმარკების შემთხვევაში. პლატფორმის წარმატების ერთ-ერთი გასაღები „სტრუქტურული ნეიტრალიტეტია“, რაც ობიექტური შეფასების გარანტიას იძლევა.

ინტერვიუში განხილულია შემდეგი საკითხები:

  • მუშაობის მექანიზმი: რატომ არის Arena-ს სისტემა უფრო მდგრადი მანიპულაციების მიმართ, ვიდრე სხვა სტანდარტული ტესტები.
  • სტრუქტურული ნეიტრალიტეტი: რას ნიშნავს ეს ტერმინი პრაქტიკაში და როგორ ინარჩუნებს კომპანია დამოუკიდებლობას მსხვილი ინვესტორების ფონზე.
  • Claude-ის წარმატება: რატომ იკავებს ეს მოდელი ამჟამად წამყვან პოზიციებს იურიდიულ და სამედიცინო სფეროებში ექსპერტთა ლიდერბორდებზე.

გაფართოება და სამომავლო გეგმები

Arena მხოლოდ ჩატ-ბოტების შეფასებით არ შემოიფარგლება. კომპანია აქტიურად მუშაობს ახალ კორპორაციულ პროდუქტზე, რომელიც საშუალებას მისცემს შეაფასონ ხელოვნური ინტელექტის აგენტები, პროგრამული კოდის წერის უნარები და რეალური ამოცანების შესრულების ხარისხი. ეს ნაბიჯი მიზნად ისახავს AI მოდელების შესაძლებლობების უფრო კომპლექსურ და პრაქტიკულ ანალიზს.

წყარო: TechCrunch Startups
გაზიარება:

მსგავსი სტატიები

Pramaana Labs-მა 27 მილიონი დოლარი მოიზიდა: ხელოვნური ინტელექტის საიმედოობის უზრუნველყოფა მათემატიკური ვერიფიკაციით
სტარტაპი

Pramaana Labs-მა 27 მილიონი დოლარი მოიზიდა: ხელოვნური ინტელექტის საიმედოობის უზრუნველყოფა მათემატიკური ვერიფიკაციით

Pramaana Labs-მა 27 მილიონი დოლარი მოიზიდა მათემატიკური ვერიფიკაციისა და ხელოვნური ინტელექტის გასაერთიანებლად, რათა აღმოფხვრას შეცდომები სამართლისა და მედიცინის სფეროებში.

17.6.2026
რობოტების სწავლება რთული და შრომატევადი პროცესია: სტარტაპი XDOF ხელოვნური ინტელექტის ლაბორატორიებს მონაცემების მოპოვებაში ეხმარება
სტარტაპი

რობოტების სწავლება რთული და შრომატევადი პროცესია: სტარტაპი XDOF ხელოვნური ინტელექტის ლაბორატორიებს მონაცემების მოპოვებაში ეხმარება

სტარტაპმა XDOF-მა $70 მილიონი მოიზიდა რობოტების საწვრთნელი მონაცემების შესაგროვებლად. კომპანია მიზნად ისახავს შეავსოს დეფიციტი, რომელიც ხელოვნური ინტელექტის ფიზიკურ სამყაროში ინტეგრაციას აფერხებს.

17.6.2026
მსოფლიო მოდელების შემქმნელმა Odyssey-მ $1.45-მილიარდიანი შეფასება მიიღო: სტარტაპს Amazon და სხვა გიგანტები უჭერენ მხარს
სტარტაპი

მსოფლიო მოდელების შემქმნელმა Odyssey-მ $1.45-მილიარდიანი შეფასება მიიღო: სტარტაპს Amazon და სხვა გიგანტები უჭერენ მხარს

ხელოვნური ინტელექტის სტარტაპმა Odyssey-მ $310 მილიონი მოიზიდა. კომპანია, რომელსაც Amazon უჭერს მხარს, ფიზიკური სამყაროს სიმულაციისთვის „მსოფლიო მოდელებს“ ქმნის.

17.6.2026