Anthropic-მა Opus 4.5 წარმოადგინა: გაუმჯობესებული წარმადობა და ინტეგრაცია Chrome-სა და Excel-ში
Anthropic-მა ახალი მოდელი Opus 4.5 გამოუშვა, რომელიც კოდირებაში რეკორდს ამყარებს და მომხმარებლებს Chrome-სა და Excel-ში ინტეგრაციას სთავაზობს.

კომპანია Anthropic-მა ორშაბათს თავისი ფლაგმანური მოდელის უახლესი ვერსია, Opus 4.5 წარადგინა. ეს მოდელი 4.5 სერიის ბოლო წარმომადგენელია, რომელიც სექტემბერში გამოსულ Sonnet 4.5-სა და ოქტომბერში წარმოდგენილ Haiku 4.5-ს მოჰყვება.
როგორც მოსალოდნელი იყო, Opus-ის ახალი ვერსია უახლეს შედეგებს აჩვენებს სხვადასხვა ბენჩმარკზე. ეს მოიცავს კოდირების ტესტებს (SWE-Bench და Terminal-bench), ინსტრუმენტების გამოყენების უნარს (tau2-bench და MCP Atlas) და ზოგადი პრობლემების გადაჭრას (ARC-AGI 2, GPQA Diamond). აღსანიშნავია, რომ Opus 4.5 გახდა პირველი მოდელი, რომელმაც SWE-Bench-ის ვალიდურ ტესტზე 80%-ზე მაღალი შეფასება მიიღო, რაც კოდირების სფეროში მნიშვნელოვან მიღწევად ითვლება.
Anthropic-მა განსაკუთრებული ყურადღება გაამახვილა მოდელის კომპიუტერთან მუშაობისა და ელექტრონულ ცხრილებთან ურთიერთქმედების შესაძლებლობებზე. ამის სადემონსტრაციოდ, კომპანიამ პარალელურად რამდენიმე პროდუქტი გამოუშვა. Opus 4.5-თან ერთად, ფართო საზოგადოებისთვის ხელმისაწვდომი ხდება Claude for Chrome და Claude for Excel, რომლებიც აქამდე საპილოტე რეჟიმში იყო.
Chrome-ის გაფართოება ხელმისაწვდომი იქნება Max-ის ყველა მომხმარებლისთვის, ხოლო Excel-ზე ფოკუსირებული მოდელით სარგებლობას Max, Team და Enterprise პაკეტების მფლობელები შეძლებენ. ეს ინტეგრაციები მიზნად ისახავს მომხმარებლებისთვის ყოველდღიური სამუშაო პროცესების გამარტივებას.
Opus 4.5-ს ასევე გაუმჯობესებული აქვს მეხსიერება ხანგრძლივი კონტექსტის ოპერაციებისთვის, რამაც მოდელის მიერ მეხსიერების მართვის მექანიზმში მნიშვნელოვანი ცვლილებები მოითხოვა. „ჩვენ გავაუმჯობესეთ ხანგრძლივი კონტექსტის ზოგადი ხარისხი Opus 4.5-ის ტრენინგისას, მაგრამ მხოლოდ კონტექსტის ფანჯრები საკმარისი არ იქნება“, - განუცხადა TechCrunch-ს დაიან ნა პენმა, Anthropic-ის კვლევების პროდუქტის მენეჯმენტის ხელმძღვანელმა.
მისივე თქმით, „გრძელი კონტექსტის ფანჯრის ქონასთან ერთად, ძალიან მნიშვნელოვანია იმის ცოდნა, თუ რომელი დეტალები უნდა დაიმახსოვრო“. სწორედ ამ ცვლილებებმა გახადა შესაძლებელი ფასიანი მომხმარებლებისთვის დიდი ხნის ნანატრი „უსასრულო ჩატის“ ფუნქციის დამატება. ეს ნიშნავს, რომ როდესაც მოდელი კონტექსტის ლიმიტს მიაღწევს, საუბარი არ შეწყდება. ამის ნაცვლად, მოდელი მომხმარებლისთვის შეუმჩნევლად შეკუმშავს კონტექსტის მეხსიერებას.
განახლებების დიდი ნაწილი გათვლილია აგენტურ გამოყენებაზე, განსაკუთრებით ისეთ სცენარებზე, სადაც Opus მოქმედებს როგორც წამყვანი აგენტი და მართავს Haiku-ზე მომუშავე ქვე-აგენტების ჯგუფს. ასეთი ამოცანების მართვა სამუშაო მეხსიერების ძლიერ კონტროლს მოითხოვს, სადაც პენის მიერ აღწერილი გაუმჯობესებები განსაკუთრებით ღირებულია.
„სწორედ აქ ხდება ფუნდამენტური საკითხები, როგორიცაა მეხსიერება, ძალიან მნიშვნელოვანი“, - ამბობს პენი. „Claude-ს უნდა შეეძლოს კოდის ბაზებისა და დიდი დოკუმენტების შესწავლა, ასევე იმის ცოდნა, თუ როდის უნდა დაბრუნდეს უკან და გადაამოწმოს რამე“. ბაზარზე Opus 4.5-ს სერიოზული კონკურენცია დახვდება ახლახან გამოსული სხვა მოდელებისგან, მათ შორის OpenAI-ის GPT 5.1-ისგან (გამოვიდა 12 ნოემბერს) და Google-ის Gemini 3-ისგან (გამოვიდა 18 ნოემბერს).
მსგავსი სტატიები

LinkedIn-ის მონაცემებით, დასაქმების შემცირებაში ხელოვნური ინტელექტი დამნაშავე არ არის... ჯერჯერობით
LinkedIn-ის მონაცემებით, 2022 წლის შემდეგ დასაქმების 20%-იანი კლება არა ხელოვნურ ინტელექტს, არამედ საპროცენტო განაკვეთების ზრდას უკავშირდება, თუმცა 2030 წლისთვის სამუშაო უნარების 70% შეიცვლება.

Hightouch-მა 100 მილიონ დოლარიან წლიურ შემოსავალს მიაღწია: წარმატების მიზეზი ხელოვნური ინტელექტის მარკეტინგული ინსტრუმენტებია
სტარტაპმა Hightouch-მა 100 მილიონ დოლარიან წლიურ შემოსავალს მიაღწია. კომპანიის AI ინსტრუმენტები ბრენდებს საშუალებას აძლევს, დიზაინერების გარეშე შექმნან მაღალი ხარისხის სარეკლამო კონტენტი.

OpenAI-მ Agents SDK განაახლა: უფრო უსაფრთხო და ძლიერი აგენტები ბიზნესისთვის
OpenAI-მ Agents SDK განაახლა, რაც ბიზნესებს საშუალებას აძლევს, შექმნან უფრო უსაფრთხო და რთული ამოცანების შემსრულებელი AI აგენტები სენდბოქსინგისა და ახალი ტექნიკური ინსტრუმენტების გამოყენებით.