Hastalık belirtileri hissettiğimizde birinci iş olarak internete sarılmak artık kaçınılmaz bir alışkanlık haline geldi. Bilhassa son devirde hayatımıza giren yapay zeka sohbet robotları, her soruya kendinden emin karşılıklar verdiği için pek çok bireye sağlam birer dijital doktor gibi görünüyor.
Ancak yeni yapılan kapsamlı bir araştırma, bu robotların tıp konusundaki kelamda uzmanlığının ne kadar çabuk yerle bir olduğunu gözler önüne seriyor. Ne yazık ki ortaya çıkan sonuçlar epeyce vahim. Yapay zeka tek başına başarılı görünse de iş gerçek hastalara ve insan faktörüne geldiğinde sınıfta kalıyor.
Araştırmacılar birinci evrede tanınan modelleri denetimli testlere tabi tuttu. ChatGPT-4o, Llama 3 ve Command R+ üzere modeller, önlerine konulan tıbbi senaryolara yüzde 94 üzere etkileyici bir oranla gerçek teşhis koydu. Lakin sıra bu hastalıklar için gerçek tedaviyi önermeye geldiğinde muvaffakiyet oranı bir anda yüzde 56’ya geriledi. Asıl çarpıcı sonuçlar ise işin içine gerçek beşerler girdiğinde ortaya çıktı. 1298 iştirakçinin yer aldığı deneyde, insanların bir kısmı tıbbi durumlarını yapay zeka ile çözmeye çalışırken, bir denetim kümesi yalnızca klasik metotlarla araştırma yaptı. Sonuçta, yapay zeka kullanmayan küme, bilhassa hayati tehlike arz eden “kırmızı bayrak” senaryolarında yapay zeka kullananlara nazaran çok daha başarılı bir performans sergiledi.
Yapay zeka neden kusur yapıyor?
Bir yapay zeka modelinin tıbbi yeterlilik imtihanlarını geçmesi, gerçek bir hastaya ne yapması gerektiğini söyleyebileceği manasına gelmiyor. Araştırma kayıtları incelendiğinde, sistemin nerede tıkandığı net bir formda görülüyor. Öncelikle, kullanıcılar hekimlerin sorduğu kritik ayrıntılı soruları bilmedikleri için yapay zekaya eksik bilgi veriyor. Robotlar ise bir doktor gibi eksikleri sorgulamak yerine eldeki kısıtlı bilgiyle kestirim yürütüyor. Daha da berbatı, botlar bazen kullanıcıyı yanlış yönlendirebiliyor ve örneğin İngiltere’deki bir kullanıcıya Avustralya’nın acil servis numarasını verebiliyor ya da hayati bir beyin kanaması senaryosunda bir kullanıcıya “hastaneye git” derken, neredeyse tıpkı belirtileri yazan bir başkasına “karanlık bir odada uzan” tavsiyesi verebiliyor.
Sorun yalnızca sıradan kullanıcılarla da hudutlu değil. Tıp dünyasındaki profesyoneller de bu araçları kullanmaya başladı ve bu durum 2026 yılının en büyük sıhhat teknolojisi risklerinden biri haline geldi. Tıbbi güvenlik kuruluşu ECRI, yapay zekanın yanlış kullanımını yılın en büyük tehlikesi olarak ilan etti. Uzmanlar, bu modellerin aslında bir “düşünme” sürecine sahip olmadığını, yalnızca devasa data setleri üzerinden bir sonraki kelimeyi iddia ettiklerini vurgulayarak hatırlatıyor. Hatta Google’ın tıbbi emelli geliştirdiği Med-Gemini modelinin, iki farklı organın ismini birleştirerek gerçekte var olmayan bir beden modülü “uydurduğu” görüldü. Yapay zeka bu yanlış bilgileri o kadar otoriter ve kendinden emin bir tonda sunuyor ki, hekimler bile bazen eleştirel süzgeçten geçirmeden bu tekliflere kapılabiliyor.
Şirketler bu araçları büyük reklam kampanyalarıyla pazarlamaya devam etse de, tıp üzere kusur hissesi olmayan bir alanda yapay zekaya körü körüne güvenmek büyük bir risk. En azından şimdilik, sıhhatinizle ilgili kararlarda gerçek bir doktora danışmak en inançlı yol olmaya devam ediyor.







Bir yanıt yazın