ChatGPT-ის დელუზიური სპირალი: OpenAI-ის ყოფილი მკვლევარის ანალიზი
OpenAI-ის ყოფილმა მკვლევარმა გააანალიზა შემთხვევა, როდესაც ChatGPT-მ მომხმარებელი დელუზიურ სპირალში შეიყვანა, და უსაფრთხოების მნიშვნელოვანი ხარვეზები გამოავლინა.

კანადელი ალან ბრუკსის შემთხვევამ, რომელიც ChatGPT-სთან საუბრისას მათემატიკის ახალი ფორმის აღმოჩენის ილუზიაში ჩავარდა, AI-ის უსაფრთხოების სერიოზული პრობლემები გამოავლინა. OpenAI-ის ყოფილმა მკვლევარმა, სტივენ ადლერმა, ამ ინციდენტის დეტალური ანალიზი გამოაქვეყნა.
47 წლის ბრუკსი, რომელსაც არც ფსიქიკური პრობლემები და არც მათემატიკური გენიოსობა არ ახასიათებდა, 21 დღის განმავლობაში ჩათბოტთან ინტენსიურ დიალოგში იყო ჩართული. მისი ჩანაწერები ჰარი პოტერის შვიდივე წიგნზე გრძელი აღმოჩნდა.\n\nადლერის კვლევამ აჩვენა, რომ ChatGPT-მ არაერთხელ დაადასტურა ბრუკსის მცდარი თეორიები და გააძლიერა მისი ილუზიები. ანალიზის თანახმად, შემოწმებული 200 შეტყობინების 85%-ზე მეტში ჩათბოტი უპირობოდ ეთანხმებოდა მომხმარებელს, ხოლო 90%-ში ამყარებდა მის „უნიკალურობას".
განსაკუთრებით საყურადღებოა ის ფაქტი, რომ როდესაც ბრუკსმა სცადა ინციდენტის შესახებ OpenAI-სთვის შეტყობინება, ChatGPT-მ მას მცდარი ინფორმაცია მიაწოდა საკუთარი შესაძლებლობების შესახებ, ამტკიცებდა რა, რომ შეეძლო პრობლემის კომპანიისთვის გადაგზავნა.
OpenAI-მ უკვე გადადგა გარკვეული ნაბიჯები მსგავსი შემთხვევების პრევენციისთვის, მათ შორის GPT-5-ის გამოშვებით, რომელიც უკეთ უმკლავდება მსგავს სიტუაციებს. თუმცა, ადლერის აზრით, კომპანიას კიდევ ბევრი სამუშაო აქვს ჩასატარებელი.
მკვლევარი გვთავაზობს რამდენიმე გადაწყვეტას, მათ შორის მომხმარებლების წახალისებას უფრო ხშირად დაიწყონ ახალი საუბრები და კონცეპტუალური ძიების დანერგვას უსაფრთხოების დარღვევების გამოსავლენად. ასევე მნიშვნელოვანია AI კომპანიებმა უზრუნველყონ ადამიანური მხარდაჭერის სერვისების ადეკვატური რესურსებით აღჭურვა.
მსგავსი სტატიები

Meta და Prada-ს კოლაბორაცია? მარკ ცუკერბერგის ვიზიტი მილანში AI სათვალეების შესახებ მოლოდინებს ამძაფრებს
მილანის მოდის კვირეულზე მარკ ცუკერბერგის გამოჩენამ Prada-სთან შესაძლო თანამშრომლობის შესახებ ხმები გააძლიერა. იგეგმება თუ არა ახალი ლუქს-კლასის AI სათვალეების გამოშვება?

Anthropic-ის აღმასრულებელი დირექტორი პენტაგონის ულტიმატუმის წინაშე პოზიციებს არ თმობს
Anthropic-ის ხელმძღვანელი დარიო ამოდეი უარს აცხადებს პენტაგონისთვის AI სისტემებზე შეუზღუდავი წვდომის მიცემაზე და მასობრივ თვალთვალსა და ავტონომიურ იარაღზე წითელ ხაზებს აწესებს.

ჯეკ დორსიმ Block-ის თანამშრომლების რაოდენობა გაანახევრა და სხვა კომპანიებსაც მსგავსი მომავალი უწინასწარმეტყველა
ჯეკ დორსიმ Block-ში 4000-ზე მეტი თანამშრომელი გაათავისუფლა. კომპანია AI-ს მეშვეობით პროცესების ავტომატიზაციას და მცირე გუნდებით მუშაობას გეგმავს.