ჰარვარდის კვლევა: ხელოვნურმა ინტელექტმა გადაუდებელი დახმარების განყოფილებაში ექიმებზე უფრო ზუსტი დიაგნოზები დასვა
ჰარვარდის ახალი კვლევის თანახმად, OpenAI-ის o1 მოდელმა გადაუდებელი დახმარების განყოფილების პაციენტების დიაგნოსტირებაში ექიმებს აჯობა, განსაკუთრებით პირველადი ტრიაჟის ეტაპზე.

ახალი კვლევა მიმოიხილავს, თუ როგორ ართმევენ თავს დიდი ენობრივი მოდელები სხვადასხვა სამედიცინო ამოცანას, მათ შორის რეალურ შემთხვევებს გადაუდებელი დახმარების განყოფილებაში. შედეგების მიხედვით, მინიმუმ ერთმა მოდელმა ადამიან ექიმებზე უფრო ზუსტი დიაგნოზები აჩვენა. კვლევა ჟურნალ Science-ში გამოქვეყნდა და მას ჰარვარდის სამედიცინო სკოლისა და Beth Israel Deaconess-ის სამედიცინო ცენტრის ექიმებისა და კომპიუტერული მეცნიერების სპეციალისტებისგან შემდგარი გუნდი ხელმძღვანელობდა.
მკვლევარებმა ჩაატარეს სხვადასხვა ექსპერიმენტი OpenAI-ის მოდელების ადამიან ექიმებთან შესადარებლად. ერთ-ერთ ექსპერიმენტში ყურადღება გამახვილდა 76 პაციენტზე, რომლებიც Beth Israel-ის გადაუდებელი დახმარების განყოფილებაში მოხვდნენ. შინაგანი მედიცინის ორი ექიმის მიერ დასმული დიაგნოზები შედარდა OpenAI-ის o1 და 4o მოდელების მიერ გენერირებულ ვერსიებს. მიღებული შედეგები კიდევ ორმა ექიმმა შეაფასა, რომლებმაც არ იცოდნენ, რომელი დიაგნოზი ეკუთვნოდა ადამიანს და რომელი — ხელოვნურ ინტელექტს.
კვლევაში აღნიშნულია, რომ დიაგნოსტირების თითოეულ ეტაპზე o1 მოდელი ან ნომინალურად უკეთეს შედეგს აჩვენებდა, ან არ ჩამოუვარდებოდა ორ ექიმსა და 4o მოდელს. განსხვავება განსაკუთრებით თვალსაჩინო იყო პირველადი ტრიაჟის ეტაპზე, როდესაც პაციენტის შესახებ მინიმალური ინფორმაციაა ხელმისაწვდომი და სწორი გადაწყვეტილების მიღების აუცილებლობა ყველაზე კრიტიკულია.
მონაცემები და შედეგები
ჰარვარდის სამედიცინო სკოლის პრესრელიზში მკვლევარებმა ხაზგასმით აღნიშნეს, რომ მონაცემები წინასწარ არ დამუშავებულა — ხელოვნური ინტელექტის მოდელებს მიეწოდათ ზუსტად ის ინფორმაცია, რაც დიაგნოსტირების მომენტში ელექტრონულ სამედიცინო ჩანაწერებში იყო ხელმისაწვდომი. ამ მონაცემებზე დაყრდნობით:
- o1 მოდელმა ტრიაჟის შემთხვევების 67%-ში ზუსტი ან ძალიან მიახლოებული დიაგნოზი დასვა.
- ერთმა ექიმმა ზუსტი ან მიახლოებული დიაგნოზი შემთხვევათა 55%-ში დააფიქსირა.
- მეორე ექიმის მაჩვენებელმა კი 50% შეადგინა.
„ჩვენ გამოვცადეთ ხელოვნური ინტელექტის მოდელი პრაქტიკულად ყველა სტანდარტთან მიმართებით და მან გადააჭარბა როგორც წინა მოდელებს, ისე ჩვენს ექიმებს,“ — განაცხადა არჯუნ მანრაიმ, ჰარვარდის სამედიცინო სკოლის ხელოვნური ინტელექტის ლაბორატორიის ხელმძღვანელმა და კვლევის ერთ-ერთმა წამყვანმა ავტორმა.
გამოწვევები და შეზღუდვები
მიუხედავად შთამბეჭდავი შედეგებისა, კვლევა არ ამტკიცებს, რომ ხელოვნური ინტელექტი მზად არის გადაუდებელი დახმარების განყოფილებაში სიცოცხლისა და სიკვდილის საკითხებზე დამოუკიდებელი გადაწყვეტილებების მისაღებად. ნაშრომში ხაზგასმულია „გადაუდებელი საჭიროება პერსპექტიული კვლევებისა, რათა შეფასდეს ეს ტექნოლოგიები პაციენტების მოვლის რეალურ პირობებში“.
მკვლევარებმა ასევე აღნიშნეს, რომ მათ მხოლოდ ტექსტურ ინფორმაციაზე მომუშავე მოდელები შეისწავლეს. არსებული მონაცემებით, თანამედროვე საბაზისო მოდელებს უჭირთ ლოგიკური დასკვნების გამოტანა არატექსტური მონაცემების საფუძველზე. ადამ როდმანმა, Beth Israel-ის ექიმმა და კვლევის თანაავტორმა, გააფრთხილა საზოგადოება, რომ ამჟამად არ არსებობს ხელოვნური ინტელექტის დიაგნოზებზე პასუხისმგებლობის ფორმალური ჩარჩო. გარდა ამისა, პაციენტებს კვლავ სურთ, რომ კრიტიკულ მომენტებში და მკურნალობის რთული გზების არჩევისას მათ გვერდით ადამიანი იყოს.
კრიტიკული ხედვა
კრისტენ პანტაგანმა, გადაუდებელი დახმარების ექიმმა, აღნიშნა, რომ კვლევა საინტერესოა, თუმცა ზოგიერთი სათაური გადაჭარბებულ მოლოდინებს ქმნის. მისი თქმით, ხელოვნური ინტელექტის დიაგნოზები შედარებული იყო შინაგანი მედიცინის ექიმების და არა გადაუდებელი დახმარების სპეციალისტების (ER physicians) მუშაობასთან.
„თუ ხელოვნური ინტელექტის ინსტრუმენტებს ექიმების კლინიკურ უნარებს ვადარებთ, უნდა შევადაროთ იმ სპეციალისტებს, რომლებიც რეალურად მუშაობენ ამ სფეროში,“ — განაცხადა პანტაგანმა. მან ასევე განმარტა, რომ გადაუდებელი დახმარების ექიმის მთავარი მიზანი პაციენტის პირველადი ნახვისას არა საბოლოო დიაგნოზის გამოცნობა, არამედ იმის დადგენაა, აქვს თუ არა პაციენტს სიცოცხლისთვის საშიში მდგომარეობა.
მსგავსი სტატიები

AI-გენერირებული მსახიობები და სცენარები „ოსკარის“ მიღმა რჩებიან: აკადემიის ახალი რეგულაციები
კინოხელოვნებისა და მეცნიერების აკადემიამ „ოსკარის“ ახალი წესები დააწესა, რომელთა მიხედვითაც ხელოვნური ინტელექტის მიერ შექმნილი მსახიობები და სცენარები ნომინაციებს ვერ მიიღებენ.

საუკეთესო AI კარნახის აპლიკაციები: ტესტირების შედეგები და რეიტინგი
გაეცანით საუკეთესო AI კარნახის აპლიკაციებს, რომლებიც მეტყველებას ზუსტად გარდაქმნიან ტექსტად, ასწორებენ შეცდომებს და მუშაობენ როგორც ონლაინ, ისე ხაზგარეშე რეჟიმში.

Meta-მ ჰუმანოიდური რობოტიკის სტარტაპი ARI შეიძინა: კომპანიის ამბიციები ხელოვნურ ინტელექტში იზრდება
Meta-მ რობოტიკის სტარტაპი Assured Robot Intelligence (ARI) შეიძინა, რათა გააძლიეროს მუშაობა ჰუმანოიდურ რობოტებზე და მათ ფიზიკურ სამყაროში ადაპტაციაზე.