Skip to main content
ხელოვნური ინტელექტი16.8.2025108 ნახვა

Anthropic-ის ხელოვნურ ინტელექტს შეუძლია შეწყვიტოს საზიანო საუბრები

Anthropic-მა განაცხადა, რომ მის ხელოვნურ ინტელექტს შეუძლია შეწყვიტოს საუბარი უკიდურესად საზიანო სიტუაციებში, რათა დაიცვას თავად AI მოდელი.

Anthropic-ის ხელოვნურ ინტელექტს შეუძლია შეწყვიტოს საზიანო საუბრები

კომპანია Anthropic-მა განაცხადა, რომ მისი უახლესი ხელოვნური ინტელექტის მოდელები აღჭურვილია ახალი შესაძლებლობით - შეწყვიტოს საუბარი იშვიათ, უკიდურეს შემთხვევებში, როდესაც მომხმარებელი მუდმივად საზიანო ან შეურაცხმყოფელ ინტერაქციას ახორციელებს.

საინტერესოა, რომ ეს გადაწყვეტილება მიღებულია არა მომხმარებლის, არამედ თავად ხელოვნური ინტელექტის მოდელის დასაცავად. კომპანია არ ამტკიცებს, რომ Claude-ს აქვს ცნობიერება ან შეიძლება დაზიანდეს საუბრებით. Anthropic-ი აღნიშნავს, რომ ისინი „ძალიან გაურკვევლად" აფასებენ Claude-ის და სხვა ენობრივი მოდელების პოტენციურ მორალურ სტატუსს.

ეს ახალი ფუნქცია ამჟამად მხოლოდ Claude Opus 4 და 4.1 მოდელებზეა ხელმისაწვდომი. კომპანიის განმარტებით, საუბრის შეწყვეტა მოხდება მხოლოდ უკიდურეს შემთხვევებში, მაგალითად, როდესაც მომხმარებელი ითხოვს არასრულწლოვნებთან დაკავშირებულ სექსუალურ კონტენტს ან ცდილობს მიიღოს ინფორმაცია მასშტაბური ძალადობის ან ტერორისტული აქტების შესახებ.

წინასწარი ტესტირებისას Claude Opus 4-მა გამოავლინა „მკვეთრი წინააღმდეგობა" ასეთ მოთხოვნებზე რეაგირებისას და „აშკარა დისტრესის ნიშნები". კომპანიის თქმით, Claude გამოიყენებს საუბრის შეწყვეტის ფუნქციას მხოლოდ მაშინ, როცა გადამისამართების მრავალჯერადი მცდელობა წარუმატებელი აღმოჩნდება.

Anthropic-ი აღნიშნავს, რომ Claude-ს არ შეუძლია გამოიყენოს ეს ფუნქცია იმ შემთხვევებში, როდესაც მომხმარებელს შეიძლება ემუქრებოდეს საკუთარი თავის ან სხვების დაზიანების საფრთხე. საუბრის შეწყვეტის შემდეგ მომხმარებლებს კვლავ შეეძლებათ ახალი საუბრის დაწყება იმავე ანგარიშიდან.

კომპანია ამ ფუნქციას განიხილავს როგორც მიმდინარე ექსპერიმენტს და აცხადებს, რომ გააგრძელებს მიდგომის დახვეწას.

წყარო: TechCrunch AI
გაზიარება:

მსგავსი სტატიები

Nvidia GTC 2026: როგორ ვუყუროთ ჯენსენ ჰუანგის მოხსენებას და რას უნდა ველოდოთ ღონისძიებისგან
ხელოვნური ინტელექტი

Nvidia GTC 2026: როგორ ვუყუროთ ჯენსენ ჰუანგის მოხსენებას და რას უნდა ველოდოთ ღონისძიებისგან

Nvidia-ს ყოველწლიური კონფერენცია GTC სან-ხოსეში იწყება. გაიგეთ, როგორ ადევნოთ თვალი ჯენსენ ჰუანგის მოხსენებას და რა სიახლეებს ამზადებს კომპანია AI აგენტებისა და ახალი ჩიპების მიმართულებით.

16.3.2026
Nvidia-ს DLSS 5 გენერაციულ AI-ს იყენებს თამაშებში ფოტორეალიზმის გასაზრდელად და გეიმინგის ფარგლებს სცილდება
ხელოვნური ინტელექტი

Nvidia-ს DLSS 5 გენერაციულ AI-ს იყენებს თამაშებში ფოტორეალიზმის გასაზრდელად და გეიმინგის ფარგლებს სცილდება

Nvidia-ს ახალი ტექნოლოგია DLSS 5 აერთიანებს 3D გრაფიკასა და გენერაციულ AI-ს, რაც თამაშებს უფრო რეალისტურს ხდის და გზას უხსნის AI-ს გამოყენებას კორპორატიულ სექტორში.

16.3.2026
ილონ მასკის xAI-ს სასამართლოში უჩივიან: Grok-ის მიერ არასრულწლოვანთა პორნოგრაფიული გამოსახულებების შექმნის ბრალდება
ხელოვნური ინტელექტი

ილონ მასკის xAI-ს სასამართლოში უჩივიან: Grok-ის მიერ არასრულწლოვანთა პორნოგრაფიული გამოსახულებების შექმნის ბრალდება

ილონ მასკის xAI-ს წინააღმდეგ სარჩელი შევიდა. კომპანიას ბრალად ედება Grok-ის მეშვეობით არასრულწლოვანთა სექსუალური ხასიათის გამოსახულებების შექმნა და უსაფრთხოების ზომების უგულებელყოფა.

16.3.2026