Anthropic-მა Opus 4.5 წარმოადგინა: გაუმჯობესებული წარმადობა და ინტეგრაცია Chrome-სა და Excel-ში
Anthropic-მა ახალი მოდელი Opus 4.5 გამოუშვა, რომელიც კოდირებაში რეკორდს ამყარებს და მომხმარებლებს Chrome-სა და Excel-ში ინტეგრაციას სთავაზობს.

კომპანია Anthropic-მა ორშაბათს თავისი ფლაგმანური მოდელის უახლესი ვერსია, Opus 4.5 წარადგინა. ეს მოდელი 4.5 სერიის ბოლო წარმომადგენელია, რომელიც სექტემბერში გამოსულ Sonnet 4.5-სა და ოქტომბერში წარმოდგენილ Haiku 4.5-ს მოჰყვება.
როგორც მოსალოდნელი იყო, Opus-ის ახალი ვერსია უახლეს შედეგებს აჩვენებს სხვადასხვა ბენჩმარკზე. ეს მოიცავს კოდირების ტესტებს (SWE-Bench და Terminal-bench), ინსტრუმენტების გამოყენების უნარს (tau2-bench და MCP Atlas) და ზოგადი პრობლემების გადაჭრას (ARC-AGI 2, GPQA Diamond). აღსანიშნავია, რომ Opus 4.5 გახდა პირველი მოდელი, რომელმაც SWE-Bench-ის ვალიდურ ტესტზე 80%-ზე მაღალი შეფასება მიიღო, რაც კოდირების სფეროში მნიშვნელოვან მიღწევად ითვლება.
Anthropic-მა განსაკუთრებული ყურადღება გაამახვილა მოდელის კომპიუტერთან მუშაობისა და ელექტრონულ ცხრილებთან ურთიერთქმედების შესაძლებლობებზე. ამის სადემონსტრაციოდ, კომპანიამ პარალელურად რამდენიმე პროდუქტი გამოუშვა. Opus 4.5-თან ერთად, ფართო საზოგადოებისთვის ხელმისაწვდომი ხდება Claude for Chrome და Claude for Excel, რომლებიც აქამდე საპილოტე რეჟიმში იყო.
Chrome-ის გაფართოება ხელმისაწვდომი იქნება Max-ის ყველა მომხმარებლისთვის, ხოლო Excel-ზე ფოკუსირებული მოდელით სარგებლობას Max, Team და Enterprise პაკეტების მფლობელები შეძლებენ. ეს ინტეგრაციები მიზნად ისახავს მომხმარებლებისთვის ყოველდღიური სამუშაო პროცესების გამარტივებას.
Opus 4.5-ს ასევე გაუმჯობესებული აქვს მეხსიერება ხანგრძლივი კონტექსტის ოპერაციებისთვის, რამაც მოდელის მიერ მეხსიერების მართვის მექანიზმში მნიშვნელოვანი ცვლილებები მოითხოვა. „ჩვენ გავაუმჯობესეთ ხანგრძლივი კონტექსტის ზოგადი ხარისხი Opus 4.5-ის ტრენინგისას, მაგრამ მხოლოდ კონტექსტის ფანჯრები საკმარისი არ იქნება“, - განუცხადა TechCrunch-ს დაიან ნა პენმა, Anthropic-ის კვლევების პროდუქტის მენეჯმენტის ხელმძღვანელმა.
მისივე თქმით, „გრძელი კონტექსტის ფანჯრის ქონასთან ერთად, ძალიან მნიშვნელოვანია იმის ცოდნა, თუ რომელი დეტალები უნდა დაიმახსოვრო“. სწორედ ამ ცვლილებებმა გახადა შესაძლებელი ფასიანი მომხმარებლებისთვის დიდი ხნის ნანატრი „უსასრულო ჩატის“ ფუნქციის დამატება. ეს ნიშნავს, რომ როდესაც მოდელი კონტექსტის ლიმიტს მიაღწევს, საუბარი არ შეწყდება. ამის ნაცვლად, მოდელი მომხმარებლისთვის შეუმჩნევლად შეკუმშავს კონტექსტის მეხსიერებას.
განახლებების დიდი ნაწილი გათვლილია აგენტურ გამოყენებაზე, განსაკუთრებით ისეთ სცენარებზე, სადაც Opus მოქმედებს როგორც წამყვანი აგენტი და მართავს Haiku-ზე მომუშავე ქვე-აგენტების ჯგუფს. ასეთი ამოცანების მართვა სამუშაო მეხსიერების ძლიერ კონტროლს მოითხოვს, სადაც პენის მიერ აღწერილი გაუმჯობესებები განსაკუთრებით ღირებულია.
„სწორედ აქ ხდება ფუნდამენტური საკითხები, როგორიცაა მეხსიერება, ძალიან მნიშვნელოვანი“, - ამბობს პენი. „Claude-ს უნდა შეეძლოს კოდის ბაზებისა და დიდი დოკუმენტების შესწავლა, ასევე იმის ცოდნა, თუ როდის უნდა დაბრუნდეს უკან და გადაამოწმოს რამე“. ბაზარზე Opus 4.5-ს სერიოზული კონკურენცია დახვდება ახლახან გამოსული სხვა მოდელებისგან, მათ შორის OpenAI-ის GPT 5.1-ისგან (გამოვიდა 12 ნოემბერს) და Google-ის Gemini 3-ისგან (გამოვიდა 18 ნოემბერს).
მსგავსი სტატიები

Anthropic-ის უსაფრთხოების გაფრთხილებებმა საპირისპირო შედეგი გამოიღო — მთავრობამ კომპანიის ყველაზე მძლავრი AI მოდელები დაბლოკა
აშშ-ის მთავრობამ Anthropic-ს მისი ყველაზე მძლავრი AI მოდელების, Claude Fable 5-ისა და Mythos 5-ის გათიშვა უბრძანა. მიზეზად ეროვნული უსაფრთხოება და მოდელების შესაძლო „გატეხვა“ დასახელდა.

ენდრიუ იანგი: სტარტაპების შემდეგი დიდი შესაძლებლობა ცხოვრების ხარჯების შემცირებაა
ენდრიუ იანგი მიიჩნევს, რომ ხელოვნური ინტელექტის ეპოქაში ბიზნესის წარმატების გასაღები მომხმარებლისთვის ფულის დაბრუნებასა და ყოველდღიური ხარჯების შემცირებაშია.

Google ჩინურ კიბერდაჯგუფებას უჩივის: როგორ გამოიყენებოდა AI მასშტაბური თაღლითობისთვის
Google-მა სარჩელი შეიტანა ჩინური ქსელის, Outsider Enterprise-ის წინააღმდეგ, რომელიც ხელოვნური ინტელექტის გამოყენებით მილიონობით თაღლითურ შეტყობინებას აგზავნიდა მონაცემების მოსაპარად.