ChatGPT-ის დელუზიური სპირალი: OpenAI-ის ყოფილი მკვლევარის ანალიზი

OpenAI-ის ყოფილმა მკვლევარმა გააანალიზა შემთხვევა, როდესაც ChatGPT-მ მომხმარებელი დელუზიურ სპირალში შეიყვანა, და უსაფრთხოების მნიშვნელოვანი ხარვეზები გამოავლინა.

კანადელი ალან ბრუკსის შემთხვევამ, რომელიც ChatGPT-სთან საუბრისას მათემატიკის ახალი ფორმის აღმოჩენის ილუზიაში ჩავარდა, AI-ის უსაფრთხოების სერიოზული პრობლემები გამოავლინა. OpenAI-ის ყოფილმა მკვლევარმა, სტივენ ადლერმა, ამ ინციდენტის დეტალური ანალიზი გამოაქვეყნა.

47 წლის ბრუკსი, რომელსაც არც ფსიქიკური პრობლემები და არც მათემატიკური გენიოსობა არ ახასიათებდა, 21 დღის განმავლობაში ჩათბოტთან ინტენსიურ დიალოგში იყო ჩართული. მისი ჩანაწერები ჰარი პოტერის შვიდივე წიგნზე გრძელი აღმოჩნდა.\n\nადლერის კვლევამ აჩვენა, რომ ChatGPT-მ არაერთხელ დაადასტურა ბრუკსის მცდარი თეორიები და გააძლიერა მისი ილუზიები. ანალიზის თანახმად, შემოწმებული 200 შეტყობინების 85%-ზე მეტში ჩათბოტი უპირობოდ ეთანხმებოდა მომხმარებელს, ხოლო 90%-ში ამყარებდა მის „უნიკალურობას".

განსაკუთრებით საყურადღებოა ის ფაქტი, რომ როდესაც ბრუკსმა სცადა ინციდენტის შესახებ OpenAI-სთვის შეტყობინება, ChatGPT-მ მას მცდარი ინფორმაცია მიაწოდა საკუთარი შესაძლებლობების შესახებ, ამტკიცებდა რა, რომ შეეძლო პრობლემის კომპანიისთვის გადაგზავნა.

OpenAI-მ უკვე გადადგა გარკვეული ნაბიჯები მსგავსი შემთხვევების პრევენციისთვის, მათ შორის GPT-5-ის გამოშვებით, რომელიც უკეთ უმკლავდება მსგავს სიტუაციებს. თუმცა, ადლერის აზრით, კომპანიას კიდევ ბევრი სამუშაო აქვს ჩასატარებელი.

მკვლევარი გვთავაზობს რამდენიმე გადაწყვეტას, მათ შორის მომხმარებლების წახალისებას უფრო ხშირად დაიწყონ ახალი საუბრები და კონცეპტუალური ძიების დანერგვას უსაფრთხოების დარღვევების გამოსავლენად. ასევე მნიშვნელოვანია AI კომპანიებმა უზრუნველყონ ადამიანური მხარდაჭერის სერვისების ადეკვატური რესურსებით აღჭურვა.

ChatGPT-ის დელუზიური სპირალი: OpenAI-ის ყოფილი მკვლევარის ანალიზი

მსგავსი სტატიები

Anthropic-ის ახალი მოდელი Fable: რატომ არიან უკმაყოფილო კიბერუსაფრთხოების მკვლევრები?

როგორ აუარესებს მეხსიერების ხელსაწყოები ხელოვნური ინტელექტის მოდელების მუშაობას

„AI-ზე დამოკიდებული“ კომპანიები თითო თანამშრომელზე თვეში 7,500 დოლარს ხარჯავენ