ჰარვარდის კვლევა: ხელოვნურმა ინტელექტმა გადაუდებელი დახმარების განყოფილებაში ექიმებზე უფრო ზუსტი დიაგნოზები დასვა

ახალი კვლევა მიმოიხილავს, თუ როგორ ართმევენ თავს დიდი ენობრივი მოდელები სხვადასხვა სამედიცინო ამოცანას, მათ შორის რეალურ შემთხვევებს გადაუდებელი დახმარების განყოფილებაში. შედეგების მიხედვით, მინიმუმ ერთმა მოდელმა ადამიან ექიმებზე უფრო ზუსტი დიაგნოზები აჩვენა. კვლევა ჟურნალ Science-ში გამოქვეყნდა და მას ჰარვარდის სამედიცინო სკოლისა და Beth Israel Deaconess-ის სამედიცინო ცენტრის ექიმებისა და კომპიუტერული მეცნიერების სპეციალისტებისგან შემდგარი გუნდი ხელმძღვანელობდა.

მკვლევარებმა ჩაატარეს სხვადასხვა ექსპერიმენტი OpenAI-ის მოდელების ადამიან ექიმებთან შესადარებლად. ერთ-ერთ ექსპერიმენტში ყურადღება გამახვილდა 76 პაციენტზე, რომლებიც Beth Israel-ის გადაუდებელი დახმარების განყოფილებაში მოხვდნენ. შინაგანი მედიცინის ორი ექიმის მიერ დასმული დიაგნოზები შედარდა OpenAI-ის o1 და 4o მოდელების მიერ გენერირებულ ვერსიებს. მიღებული შედეგები კიდევ ორმა ექიმმა შეაფასა, რომლებმაც არ იცოდნენ, რომელი დიაგნოზი ეკუთვნოდა ადამიანს და რომელი — ხელოვნურ ინტელექტს.

კვლევაში აღნიშნულია, რომ დიაგნოსტირების თითოეულ ეტაპზე o1 მოდელი ან ნომინალურად უკეთეს შედეგს აჩვენებდა, ან არ ჩამოუვარდებოდა ორ ექიმსა და 4o მოდელს. განსხვავება განსაკუთრებით თვალსაჩინო იყო პირველადი ტრიაჟის ეტაპზე, როდესაც პაციენტის შესახებ მინიმალური ინფორმაციაა ხელმისაწვდომი და სწორი გადაწყვეტილების მიღების აუცილებლობა ყველაზე კრიტიკულია.

მონაცემები და შედეგები

ჰარვარდის სამედიცინო სკოლის პრესრელიზში მკვლევარებმა ხაზგასმით აღნიშნეს, რომ მონაცემები წინასწარ არ დამუშავებულა — ხელოვნური ინტელექტის მოდელებს მიეწოდათ ზუსტად ის ინფორმაცია, რაც დიაგნოსტირების მომენტში ელექტრონულ სამედიცინო ჩანაწერებში იყო ხელმისაწვდომი. ამ მონაცემებზე დაყრდნობით:

o1 მოდელმა ტრიაჟის შემთხვევების 67%-ში ზუსტი ან ძალიან მიახლოებული დიაგნოზი დასვა.
ერთმა ექიმმა ზუსტი ან მიახლოებული დიაგნოზი შემთხვევათა 55%-ში დააფიქსირა.
მეორე ექიმის მაჩვენებელმა კი 50% შეადგინა.

„ჩვენ გამოვცადეთ ხელოვნური ინტელექტის მოდელი პრაქტიკულად ყველა სტანდარტთან მიმართებით და მან გადააჭარბა როგორც წინა მოდელებს, ისე ჩვენს ექიმებს,“ — განაცხადა არჯუნ მანრაიმ, ჰარვარდის სამედიცინო სკოლის ხელოვნური ინტელექტის ლაბორატორიის ხელმძღვანელმა და კვლევის ერთ-ერთმა წამყვანმა ავტორმა.

გამოწვევები და შეზღუდვები

მიუხედავად შთამბეჭდავი შედეგებისა, კვლევა არ ამტკიცებს, რომ ხელოვნური ინტელექტი მზად არის გადაუდებელი დახმარების განყოფილებაში სიცოცხლისა და სიკვდილის საკითხებზე დამოუკიდებელი გადაწყვეტილებების მისაღებად. ნაშრომში ხაზგასმულია „გადაუდებელი საჭიროება პერსპექტიული კვლევებისა, რათა შეფასდეს ეს ტექნოლოგიები პაციენტების მოვლის რეალურ პირობებში“.

მკვლევარებმა ასევე აღნიშნეს, რომ მათ მხოლოდ ტექსტურ ინფორმაციაზე მომუშავე მოდელები შეისწავლეს. არსებული მონაცემებით, თანამედროვე საბაზისო მოდელებს უჭირთ ლოგიკური დასკვნების გამოტანა არატექსტური მონაცემების საფუძველზე. ადამ როდმანმა, Beth Israel-ის ექიმმა და კვლევის თანაავტორმა, გააფრთხილა საზოგადოება, რომ ამჟამად არ არსებობს ხელოვნური ინტელექტის დიაგნოზებზე პასუხისმგებლობის ფორმალური ჩარჩო. გარდა ამისა, პაციენტებს კვლავ სურთ, რომ კრიტიკულ მომენტებში და მკურნალობის რთული გზების არჩევისას მათ გვერდით ადამიანი იყოს.

კრიტიკული ხედვა

კრისტენ პანტაგანმა, გადაუდებელი დახმარების ექიმმა, აღნიშნა, რომ კვლევა საინტერესოა, თუმცა ზოგიერთი სათაური გადაჭარბებულ მოლოდინებს ქმნის. მისი თქმით, ხელოვნური ინტელექტის დიაგნოზები შედარებული იყო შინაგანი მედიცინის ექიმების და არა გადაუდებელი დახმარების სპეციალისტების (ER physicians) მუშაობასთან.

„თუ ხელოვნური ინტელექტის ინსტრუმენტებს ექიმების კლინიკურ უნარებს ვადარებთ, უნდა შევადაროთ იმ სპეციალისტებს, რომლებიც რეალურად მუშაობენ ამ სფეროში,“ — განაცხადა პანტაგანმა. მან ასევე განმარტა, რომ გადაუდებელი დახმარების ექიმის მთავარი მიზანი პაციენტის პირველადი ნახვისას არა საბოლოო დიაგნოზის გამოცნობა, არამედ იმის დადგენაა, აქვს თუ არა პაციენტს სიცოცხლისთვის საშიში მდგომარეობა.

მონაცემები და შედეგები

გამოწვევები და შეზღუდვები

კრიტიკული ხედვა

მსგავსი სტატიები

აშშ-ის მთავრობის მიერ Anthropic-ის მოდელების აკრძალვა: მიზეზი არა AI-ის „გატეხვა“, არამედ პოლიტიკური ზეწოლაა

სუნდარ პიჩაის სტენფორდის უნივერსიტეტის გამოსაშვებ ცერემონიაზე სტუდენტებმა პროტესტით და სტვენით უპასუხეს

მალაიზიური AI პლატფორმა Respond.io-მ $62.5 მილიონი მოიზიდა და კომპანიების შესყიდვას გეგმავს