Anthropic-ის ახალი მოდელი Fable: რატომ არიან უკმაყოფილო კიბერუსაფრთხოების მკვლევრები?

Anthropic-მა სამშაბათს თავისი უახლესი მოდელი, Fable წარადგინა. კომპანია მას აღწერს, როგორც მძლავრი და დიდი მოლოდინების მქონე კიბერუსაფრთხოების მოდელის, Mythos-ის საჯარო და შეზღუდულ ვერსიას. თუმცა, დაწესებული შეზღუდვებით ყველა კმაყოფილი არ არის და კიბერუსაფრთხოების არაერთმა მკვლევარმა თუ პროფესიონალმა ინტერნეტში უკვე გამოხატა საკუთარი პრეტენზიები.

„[Fable] უარყოფს ნებისმიერ მოთხოვნას, რომელიც შეიძლება ირიბად ეხებოდეს კიბერსფეროს. ისეთ უწყინარ დავალებებსაც კი, როგორიცაა ბლოგპოსტის წაკითხვა,“ — აცხადებს ვალენტინა „Chompie“ პალმიოტი, IBM X-Force-ის ცნობილი მკვლევარი. როდესაც პრომტი უსაფრთხოების ფილტრებს ააქტიურებს, Fable აჩერებს ჩატს და მომხმარებელს ატყობინებს, რომ „უსაფრთხოების ზომებმა ეს შეტყობინება კიბერუსაფრთხოების ან ბიოლოგიის თემების გამო მონიშნა“.

ეს შეზღუდვები დაწესდა იმ რისკების შესამცირებლად, რომ Fable შესაძლოა გამოყენებულ იქნას მავნე პროგრამების შესაქმნელად ან პროგრამული უზრუნველყოფის გასატეხად — ეს საკითხი Anthropic-ისთვის დიდი ხანია შეშფოთების საგანია. ბიოლოგიასთან დაკავშირებული შეზღუდვები კი ბიოლოგიური იარაღის შექმნის პრევენციას ემსახურება.

პროექტი Glasswing და Mythos-ის გაფართოება

აპრილში, როდესაც AI გიგანტმა Mythos-ი გამოუშვა, მოდელზე წვდომა მხოლოდ რამდენიმე კომპანიასა და ორგანიზაციას მისცა პროექტ Glasswing-ის ფარგლებში. ეს იყო მცდელობა, მოდელი კრიტიკული პროგრამული უზრუნველყოფისა და ინფრასტრუქტურის დასაცავად გამოეყენებინათ. გასულ კვირას Anthropic-მა Mythos-ზე წვდომა 15 ქვეყნის ასობით ორგანიზაციაზე გააფართოვა.

მიუხედავად კეთილი განზრახვისა, ბევრი ექსპერტი უკმაყოფილოა შეზღუდვების ქაოტური ბუნებით. კიბერუსაფრთხოების ვეტერანმა, მეტ სუიშმა TechCrunch-ს განუცხადა: „თუ მოდელს უსაფრთხო კოდის დაწერას სთხოვთ, ის ამას პროგრამული ინჟინერიის საუკეთესო პრაქტიკის ნაცვლად კიბერუსაფრთხოების სამუშაოდ აღიქვამს და მუშაობის ხარისხს აქვეითებს“.

ტექნიკური ბარიერები და სამომავლო პერსპექტივები

Fable დაპროგრამებულია ისე, რომ შეზღუდვის ამოქმედების შემთხვევაში Claude Opus 4.8-ზე გადაერთოს. სუიშის თქმით, სისტემა, როგორც ჩანს, საკვანძო სიტყვებზეა დაფუძნებული და ნებისმიერი ტერმინი „კიბერუსაფრთხოების“ ლექსიკონიდან ფილტრებს ააქტიურებს.

„ეს გასაგებია, რადგან ჯერ კიდევ ადრეულ ეტაპზე ვართ და ისინი ახლა ახდენენ შეზღუდვების ადაპტირებას. დარწმუნებული ვარ, დროთა განმავლობაში ეს დაიხვეწება, რადგან Anthropic და სხვა წამყვანი კომპანიები უფრო მეტად ითანამშრომლებენ ახალი თაობის კიბერუსაფრთხოების კომპანიებთან,“ — აღნიშნა სუიშმა, რომელიც AI სტარტაპ Tolmo-ს ტექნიკური გუნდის წევრია. „ასეთი გამოშვებისას სჯობს იმაზე მეტი ადამიანი მოხვდეს ფილტრში, ვიდრე საჭიროა, და შეზღუდვები ეტაპობრივად შემსუბუქდეს“.

კიდევ ერთმა მკვლევარმა X-ზე (ყოფილი Twitter) აღნიშნა, რომ კოდის რევიუზე (code review) თხოვნაც კი Fable-ის ბლოკირებას იწვევს. Anthropic-ს ამ საკითხზე კომენტარის მოთხოვნით მიმართეს, თუმცა პასუხი დაუყოვნებლივ არ მიუღიათ.

ვერიფიკაციის პროგრამები

მოდელებში ჩაშენებული შეზღუდვების გარდა, Anthropic-ი კიბერუსაფრთხოების პროფესიონალებს სთავაზობს Cyber Verification Program-ში რეგისტრაციას. დამტკიცების შემთხვევაში, აპლიკანტებს Claude-ის გამოყენებისას ნაკლები შეზღუდვა ექნებათ. OpenAI-ს მსგავსი პროგრამა აქვს, სახელწოდებით Trusted Access for Cyber.

კონტაქტი ინფორმაციისთვის

თუ გაქვთ დამატებითი ინფორმაცია იმის შესახებ, თუ როგორ იყენებენ ჰაკერები ხელოვნურ ინტელექტს, ან როგორ იყენებენ მას კიბერუსაფრთხოების კომპანიები, შეგიძლიათ დაუკავშირდეთ ლორენცო ფრანჩესკი-ბიკიერაის უსაფრთხო არხების მეშვეობით (სამუშაო მოწყობილობისა და ქსელის გარეშე):

Signal: +1 917 257 1382
Telegram და Keybase: @lorenzofb
ელ-ფოსტა: lorenzo@techcrunch.com

Anthropic-ის ახალი მოდელი Fable: რატომ არიან უკმაყოფილო კიბერუსაფრთხოების მკვლევრები?

პროექტი Glasswing და Mythos-ის გაფართოება

ტექნიკური ბარიერები და სამომავლო პერსპექტივები

ვერიფიკაციის პროგრამები

კონტაქტი ინფორმაციისთვის

მსგავსი სტატიები

Prentis: რიდ ჰოფმანისა და მარკ პინკუსის AI სტარტაპი $1 მილიარდიანი შეფასებით $100 მილიონის მოზიდვას გეგმავს

OpenAI-მ ახალი AI კლავიატურა Micro წარადგინა: ფუნქციური აქსესუარი თუ ძვირადღირებული სათამაშო?