Anthropic-ის ახალი მოდელი Fable: რატომ არიან უკმაყოფილო კიბერუსაფრთხოების მკვლევრები?
Anthropic-ის ახალი მოდელი Fable კიბერუსაფრთხოების მკვლევრების კრიტიკის ქარცეცხლში მოექცა. მკაცრი შეზღუდვები უწყინარი დავალებების შესრულებასაც კი აფერხებს.

Anthropic-მა სამშაბათს თავისი უახლესი მოდელი, Fable წარადგინა. კომპანია მას აღწერს, როგორც მძლავრი და დიდი მოლოდინების მქონე კიბერუსაფრთხოების მოდელის, Mythos-ის საჯარო და შეზღუდულ ვერსიას. თუმცა, დაწესებული შეზღუდვებით ყველა კმაყოფილი არ არის და კიბერუსაფრთხოების არაერთმა მკვლევარმა თუ პროფესიონალმა ინტერნეტში უკვე გამოხატა საკუთარი პრეტენზიები.
„[Fable] უარყოფს ნებისმიერ მოთხოვნას, რომელიც შეიძლება ირიბად ეხებოდეს კიბერსფეროს. ისეთ უწყინარ დავალებებსაც კი, როგორიცაა ბლოგპოსტის წაკითხვა,“ — აცხადებს ვალენტინა „Chompie“ პალმიოტი, IBM X-Force-ის ცნობილი მკვლევარი. როდესაც პრომტი უსაფრთხოების ფილტრებს ააქტიურებს, Fable აჩერებს ჩატს და მომხმარებელს ატყობინებს, რომ „უსაფრთხოების ზომებმა ეს შეტყობინება კიბერუსაფრთხოების ან ბიოლოგიის თემების გამო მონიშნა“.
ეს შეზღუდვები დაწესდა იმ რისკების შესამცირებლად, რომ Fable შესაძლოა გამოყენებულ იქნას მავნე პროგრამების შესაქმნელად ან პროგრამული უზრუნველყოფის გასატეხად — ეს საკითხი Anthropic-ისთვის დიდი ხანია შეშფოთების საგანია. ბიოლოგიასთან დაკავშირებული შეზღუდვები კი ბიოლოგიური იარაღის შექმნის პრევენციას ემსახურება.
პროექტი Glasswing და Mythos-ის გაფართოება
აპრილში, როდესაც AI გიგანტმა Mythos-ი გამოუშვა, მოდელზე წვდომა მხოლოდ რამდენიმე კომპანიასა და ორგანიზაციას მისცა პროექტ Glasswing-ის ფარგლებში. ეს იყო მცდელობა, მოდელი კრიტიკული პროგრამული უზრუნველყოფისა და ინფრასტრუქტურის დასაცავად გამოეყენებინათ. გასულ კვირას Anthropic-მა Mythos-ზე წვდომა 15 ქვეყნის ასობით ორგანიზაციაზე გააფართოვა.
მიუხედავად კეთილი განზრახვისა, ბევრი ექსპერტი უკმაყოფილოა შეზღუდვების ქაოტური ბუნებით. კიბერუსაფრთხოების ვეტერანმა, მეტ სუიშმა TechCrunch-ს განუცხადა: „თუ მოდელს უსაფრთხო კოდის დაწერას სთხოვთ, ის ამას პროგრამული ინჟინერიის საუკეთესო პრაქტიკის ნაცვლად კიბერუსაფრთხოების სამუშაოდ აღიქვამს და მუშაობის ხარისხს აქვეითებს“.
ტექნიკური ბარიერები და სამომავლო პერსპექტივები
Fable დაპროგრამებულია ისე, რომ შეზღუდვის ამოქმედების შემთხვევაში Claude Opus 4.8-ზე გადაერთოს. სუიშის თქმით, სისტემა, როგორც ჩანს, საკვანძო სიტყვებზეა დაფუძნებული და ნებისმიერი ტერმინი „კიბერუსაფრთხოების“ ლექსიკონიდან ფილტრებს ააქტიურებს.
„ეს გასაგებია, რადგან ჯერ კიდევ ადრეულ ეტაპზე ვართ და ისინი ახლა ახდენენ შეზღუდვების ადაპტირებას. დარწმუნებული ვარ, დროთა განმავლობაში ეს დაიხვეწება, რადგან Anthropic და სხვა წამყვანი კომპანიები უფრო მეტად ითანამშრომლებენ ახალი თაობის კიბერუსაფრთხოების კომპანიებთან,“ — აღნიშნა სუიშმა, რომელიც AI სტარტაპ Tolmo-ს ტექნიკური გუნდის წევრია. „ასეთი გამოშვებისას სჯობს იმაზე მეტი ადამიანი მოხვდეს ფილტრში, ვიდრე საჭიროა, და შეზღუდვები ეტაპობრივად შემსუბუქდეს“.
კიდევ ერთმა მკვლევარმა X-ზე (ყოფილი Twitter) აღნიშნა, რომ კოდის რევიუზე (code review) თხოვნაც კი Fable-ის ბლოკირებას იწვევს. Anthropic-ს ამ საკითხზე კომენტარის მოთხოვნით მიმართეს, თუმცა პასუხი დაუყოვნებლივ არ მიუღიათ.
ვერიფიკაციის პროგრამები
მოდელებში ჩაშენებული შეზღუდვების გარდა, Anthropic-ი კიბერუსაფრთხოების პროფესიონალებს სთავაზობს Cyber Verification Program-ში რეგისტრაციას. დამტკიცების შემთხვევაში, აპლიკანტებს Claude-ის გამოყენებისას ნაკლები შეზღუდვა ექნებათ. OpenAI-ს მსგავსი პროგრამა აქვს, სახელწოდებით Trusted Access for Cyber.
კონტაქტი ინფორმაციისთვის
თუ გაქვთ დამატებითი ინფორმაცია იმის შესახებ, თუ როგორ იყენებენ ჰაკერები ხელოვნურ ინტელექტს, ან როგორ იყენებენ მას კიბერუსაფრთხოების კომპანიები, შეგიძლიათ დაუკავშირდეთ ლორენცო ფრანჩესკი-ბიკიერაის უსაფრთხო არხების მეშვეობით (სამუშაო მოწყობილობისა და ქსელის გარეშე):
- Signal: +1 917 257 1382
- Telegram და Keybase: @lorenzofb
- ელ-ფოსტა: lorenzo@techcrunch.com
მსგავსი სტატიები

Anthropic-მა Claude Sonnet 5 გამოუშვა – აგენტური ფუნქციები უფრო იაფი და ხელმისაწვდომი ხდება
Anthropic-მა Claude Sonnet 5 წარადგინა, რომელიც აგენტურ ფუნქციებსა და ავტონომიურ მუშაობას უფრო იაფად და ეფექტურად სთავაზობს დეველოპერებსა და მომხმარებლებს.

Nvidia-ს კონკურენტი Etched: 5 მილიარდი დოლარის შეფასება და 1 მილიარდის შეკვეთები AI ჩიპებზე
AI ჩიპების მწარმოებელმა სტარტაპმა Etched-მა 1 მილიარდი დოლარის შეკვეთები მიიღო და მისი საბაზრო ღირებულება 5 მილიარდ დოლარამდე გაიზარდა. კომპანია Nvidia-სთვის კონკურენციის გაწევას გეგმავს.

Google-მა Nano Banana 2 Lite წარადგინა: უფრო სწრაფი და ხელმისაწვდომი გამოსახულების გენერატორი
Google-მა Nano Banana 2 Lite წარადგინა, რომელიც გამოსახულებებს 4 წამში ქმნის და 1000 სურათზე მხოლოდ $0.034 ჯდება. გაიგეთ მეტი ახალი მოდელისა და Gemini Omni Flash-ის შესახებ.