Anthropic-მა Opus 4.5 წარმოადგინა: გაუმჯობესებული წარმადობა და ინტეგრაცია Chrome-სა და Excel-ში
Anthropic-მა ახალი მოდელი Opus 4.5 გამოუშვა, რომელიც კოდირებაში რეკორდს ამყარებს და მომხმარებლებს Chrome-სა და Excel-ში ინტეგრაციას სთავაზობს.

კომპანია Anthropic-მა ორშაბათს თავისი ფლაგმანური მოდელის უახლესი ვერსია, Opus 4.5 წარადგინა. ეს მოდელი 4.5 სერიის ბოლო წარმომადგენელია, რომელიც სექტემბერში გამოსულ Sonnet 4.5-სა და ოქტომბერში წარმოდგენილ Haiku 4.5-ს მოჰყვება.
როგორც მოსალოდნელი იყო, Opus-ის ახალი ვერსია უახლეს შედეგებს აჩვენებს სხვადასხვა ბენჩმარკზე. ეს მოიცავს კოდირების ტესტებს (SWE-Bench და Terminal-bench), ინსტრუმენტების გამოყენების უნარს (tau2-bench და MCP Atlas) და ზოგადი პრობლემების გადაჭრას (ARC-AGI 2, GPQA Diamond). აღსანიშნავია, რომ Opus 4.5 გახდა პირველი მოდელი, რომელმაც SWE-Bench-ის ვალიდურ ტესტზე 80%-ზე მაღალი შეფასება მიიღო, რაც კოდირების სფეროში მნიშვნელოვან მიღწევად ითვლება.
Anthropic-მა განსაკუთრებული ყურადღება გაამახვილა მოდელის კომპიუტერთან მუშაობისა და ელექტრონულ ცხრილებთან ურთიერთქმედების შესაძლებლობებზე. ამის სადემონსტრაციოდ, კომპანიამ პარალელურად რამდენიმე პროდუქტი გამოუშვა. Opus 4.5-თან ერთად, ფართო საზოგადოებისთვის ხელმისაწვდომი ხდება Claude for Chrome და Claude for Excel, რომლებიც აქამდე საპილოტე რეჟიმში იყო.
Chrome-ის გაფართოება ხელმისაწვდომი იქნება Max-ის ყველა მომხმარებლისთვის, ხოლო Excel-ზე ფოკუსირებული მოდელით სარგებლობას Max, Team და Enterprise პაკეტების მფლობელები შეძლებენ. ეს ინტეგრაციები მიზნად ისახავს მომხმარებლებისთვის ყოველდღიური სამუშაო პროცესების გამარტივებას.
Opus 4.5-ს ასევე გაუმჯობესებული აქვს მეხსიერება ხანგრძლივი კონტექსტის ოპერაციებისთვის, რამაც მოდელის მიერ მეხსიერების მართვის მექანიზმში მნიშვნელოვანი ცვლილებები მოითხოვა. „ჩვენ გავაუმჯობესეთ ხანგრძლივი კონტექსტის ზოგადი ხარისხი Opus 4.5-ის ტრენინგისას, მაგრამ მხოლოდ კონტექსტის ფანჯრები საკმარისი არ იქნება“, - განუცხადა TechCrunch-ს დაიან ნა პენმა, Anthropic-ის კვლევების პროდუქტის მენეჯმენტის ხელმძღვანელმა.
მისივე თქმით, „გრძელი კონტექსტის ფანჯრის ქონასთან ერთად, ძალიან მნიშვნელოვანია იმის ცოდნა, თუ რომელი დეტალები უნდა დაიმახსოვრო“. სწორედ ამ ცვლილებებმა გახადა შესაძლებელი ფასიანი მომხმარებლებისთვის დიდი ხნის ნანატრი „უსასრულო ჩატის“ ფუნქციის დამატება. ეს ნიშნავს, რომ როდესაც მოდელი კონტექსტის ლიმიტს მიაღწევს, საუბარი არ შეწყდება. ამის ნაცვლად, მოდელი მომხმარებლისთვის შეუმჩნევლად შეკუმშავს კონტექსტის მეხსიერებას.
განახლებების დიდი ნაწილი გათვლილია აგენტურ გამოყენებაზე, განსაკუთრებით ისეთ სცენარებზე, სადაც Opus მოქმედებს როგორც წამყვანი აგენტი და მართავს Haiku-ზე მომუშავე ქვე-აგენტების ჯგუფს. ასეთი ამოცანების მართვა სამუშაო მეხსიერების ძლიერ კონტროლს მოითხოვს, სადაც პენის მიერ აღწერილი გაუმჯობესებები განსაკუთრებით ღირებულია.
„სწორედ აქ ხდება ფუნდამენტური საკითხები, როგორიცაა მეხსიერება, ძალიან მნიშვნელოვანი“, - ამბობს პენი. „Claude-ს უნდა შეეძლოს კოდის ბაზებისა და დიდი დოკუმენტების შესწავლა, ასევე იმის ცოდნა, თუ როდის უნდა დაბრუნდეს უკან და გადაამოწმოს რამე“. ბაზარზე Opus 4.5-ს სერიოზული კონკურენცია დახვდება ახლახან გამოსული სხვა მოდელებისგან, მათ შორის OpenAI-ის GPT 5.1-ისგან (გამოვიდა 12 ნოემბერს) და Google-ის Gemini 3-ისგან (გამოვიდა 18 ნოემბერს).
მსგავსი სტატიები

AWS-ი ხელოვნურ ინტელექტზე დიდ ფსონს დებს, მაგრამ შეძლებს თუ არა ლიდერებს დაეწიოს?
AWS-მა re:Invent 2025-ზე ხელოვნური ინტელექტის აგენტების ახალი ინსტრუმენტები წარადგინა, თუმცა კომპანიას ჯერ კიდევ უწევს დამტკიცება, რომ ინფრასტრუქტურის მიღმაც კონკურენტუნარიანია.

AI სტარტაპი Aaru, რომელიც ადამიანის ქცევის სიმულაციას ახდენს, მილიარდიან შეფასებას აღწევს
AI სტარტაპმა Aaru, რომელიც მომხმარებლის ქცევის სიმულაციას ახდენს, $1 მილიარდიანი „სათაურე“ შეფასებით დაფინანსება მოიზიდა Redpoint Ventures-ისგან.

Google-ის ყოფილი თანამშრომლის AI სტარტაპი, რომელიც ადამიანებს ცვლის ნაცვლად ეხმარება, $300 მილიონად შეფასდა
ხელოვნური ინტელექტის სტარტაპმა Yoodli-მ, რომელიც ადამიანებს კომუნიკაციის უნარების გაუმჯობესებაში ეხმარება, $300 მილიონზე მეტი შეფასება მოიპოვა.