Anthropic-ის ახალი მოდელი Fable: რატომ არიან უკმაყოფილო კიბერუსაფრთხოების მკვლევრები?
Anthropic-ის ახალი მოდელი Fable კიბერუსაფრთხოების მკვლევრების კრიტიკის ქარცეცხლში მოექცა. მკაცრი შეზღუდვები უწყინარი დავალებების შესრულებასაც კი აფერხებს.

Anthropic-მა სამშაბათს თავისი უახლესი მოდელი, Fable წარადგინა. კომპანია მას აღწერს, როგორც მძლავრი და დიდი მოლოდინების მქონე კიბერუსაფრთხოების მოდელის, Mythos-ის საჯარო და შეზღუდულ ვერსიას. თუმცა, დაწესებული შეზღუდვებით ყველა კმაყოფილი არ არის და კიბერუსაფრთხოების არაერთმა მკვლევარმა თუ პროფესიონალმა ინტერნეტში უკვე გამოხატა საკუთარი პრეტენზიები.
„[Fable] უარყოფს ნებისმიერ მოთხოვნას, რომელიც შეიძლება ირიბად ეხებოდეს კიბერსფეროს. ისეთ უწყინარ დავალებებსაც კი, როგორიცაა ბლოგპოსტის წაკითხვა,“ — აცხადებს ვალენტინა „Chompie“ პალმიოტი, IBM X-Force-ის ცნობილი მკვლევარი. როდესაც პრომტი უსაფრთხოების ფილტრებს ააქტიურებს, Fable აჩერებს ჩატს და მომხმარებელს ატყობინებს, რომ „უსაფრთხოების ზომებმა ეს შეტყობინება კიბერუსაფრთხოების ან ბიოლოგიის თემების გამო მონიშნა“.
ეს შეზღუდვები დაწესდა იმ რისკების შესამცირებლად, რომ Fable შესაძლოა გამოყენებულ იქნას მავნე პროგრამების შესაქმნელად ან პროგრამული უზრუნველყოფის გასატეხად — ეს საკითხი Anthropic-ისთვის დიდი ხანია შეშფოთების საგანია. ბიოლოგიასთან დაკავშირებული შეზღუდვები კი ბიოლოგიური იარაღის შექმნის პრევენციას ემსახურება.
პროექტი Glasswing და Mythos-ის გაფართოება
აპრილში, როდესაც AI გიგანტმა Mythos-ი გამოუშვა, მოდელზე წვდომა მხოლოდ რამდენიმე კომპანიასა და ორგანიზაციას მისცა პროექტ Glasswing-ის ფარგლებში. ეს იყო მცდელობა, მოდელი კრიტიკული პროგრამული უზრუნველყოფისა და ინფრასტრუქტურის დასაცავად გამოეყენებინათ. გასულ კვირას Anthropic-მა Mythos-ზე წვდომა 15 ქვეყნის ასობით ორგანიზაციაზე გააფართოვა.
მიუხედავად კეთილი განზრახვისა, ბევრი ექსპერტი უკმაყოფილოა შეზღუდვების ქაოტური ბუნებით. კიბერუსაფრთხოების ვეტერანმა, მეტ სუიშმა TechCrunch-ს განუცხადა: „თუ მოდელს უსაფრთხო კოდის დაწერას სთხოვთ, ის ამას პროგრამული ინჟინერიის საუკეთესო პრაქტიკის ნაცვლად კიბერუსაფრთხოების სამუშაოდ აღიქვამს და მუშაობის ხარისხს აქვეითებს“.
ტექნიკური ბარიერები და სამომავლო პერსპექტივები
Fable დაპროგრამებულია ისე, რომ შეზღუდვის ამოქმედების შემთხვევაში Claude Opus 4.8-ზე გადაერთოს. სუიშის თქმით, სისტემა, როგორც ჩანს, საკვანძო სიტყვებზეა დაფუძნებული და ნებისმიერი ტერმინი „კიბერუსაფრთხოების“ ლექსიკონიდან ფილტრებს ააქტიურებს.
„ეს გასაგებია, რადგან ჯერ კიდევ ადრეულ ეტაპზე ვართ და ისინი ახლა ახდენენ შეზღუდვების ადაპტირებას. დარწმუნებული ვარ, დროთა განმავლობაში ეს დაიხვეწება, რადგან Anthropic და სხვა წამყვანი კომპანიები უფრო მეტად ითანამშრომლებენ ახალი თაობის კიბერუსაფრთხოების კომპანიებთან,“ — აღნიშნა სუიშმა, რომელიც AI სტარტაპ Tolmo-ს ტექნიკური გუნდის წევრია. „ასეთი გამოშვებისას სჯობს იმაზე მეტი ადამიანი მოხვდეს ფილტრში, ვიდრე საჭიროა, და შეზღუდვები ეტაპობრივად შემსუბუქდეს“.
კიდევ ერთმა მკვლევარმა X-ზე (ყოფილი Twitter) აღნიშნა, რომ კოდის რევიუზე (code review) თხოვნაც კი Fable-ის ბლოკირებას იწვევს. Anthropic-ს ამ საკითხზე კომენტარის მოთხოვნით მიმართეს, თუმცა პასუხი დაუყოვნებლივ არ მიუღიათ.
ვერიფიკაციის პროგრამები
მოდელებში ჩაშენებული შეზღუდვების გარდა, Anthropic-ი კიბერუსაფრთხოების პროფესიონალებს სთავაზობს Cyber Verification Program-ში რეგისტრაციას. დამტკიცების შემთხვევაში, აპლიკანტებს Claude-ის გამოყენებისას ნაკლები შეზღუდვა ექნებათ. OpenAI-ს მსგავსი პროგრამა აქვს, სახელწოდებით Trusted Access for Cyber.
კონტაქტი ინფორმაციისთვის
თუ გაქვთ დამატებითი ინფორმაცია იმის შესახებ, თუ როგორ იყენებენ ჰაკერები ხელოვნურ ინტელექტს, ან როგორ იყენებენ მას კიბერუსაფრთხოების კომპანიები, შეგიძლიათ დაუკავშირდეთ ლორენცო ფრანჩესკი-ბიკიერაის უსაფრთხო არხების მეშვეობით (სამუშაო მოწყობილობისა და ქსელის გარეშე):
- Signal: +1 917 257 1382
- Telegram და Keybase: @lorenzofb
- ელ-ფოსტა: lorenzo@techcrunch.com
მსგავსი სტატიები

როგორ აუარესებს მეხსიერების ხელსაწყოები ხელოვნური ინტელექტის მოდელების მუშაობას
ახალი კვლევის თანახმად, ხელოვნური ინტელექტის მეხსიერების ხელსაწყოებმა შესაძლოა მოდელების მუშაობა გააუარესოს, რადგან ისინი მომხმარებლის მცდარ შეხედულებებს უფრო მეტად ეთანხმებიან, ვიდრე ფაქტობრივ სიზუსტეს.

„AI-ზე დამოკიდებული“ კომპანიები თითო თანამშრომელზე თვეში 7,500 დოლარს ხარჯავენ
Ramp AI Index-ის კვლევის თანახმად, ხელოვნური ინტელექტის აქტიური მომხმარებელი კომპანიები თითო თანამშრომელზე თვეში საშუალოდ 7,500 დოლარს ხარჯავენ, რაც ჯერ კიდევ ჩამორჩება ინჟინრების ხელფასებს.

როგორ დააბანდა ჯასტინ ერნესტმა 500 მილიონი დოლარი პოპულარულ სტარტაპებში ტრადიციული ვენჩურული ფონდის გარეშე
ჯასტინ ერნესტმა Sabertooth Capital-ის მეშვეობით 500 მილიონი დოლარი დააბანდა SpaceX-ში, Anthropic-სა და სხვა გიგანტებში ტრადიციული ფონდის გარეშე. გაიგეთ მისი სტრატეგია.