Modül A2 — Doğrulama ve Anti-Halüsinasyon Doktrini
Seviye: [T] Temel / [O] Orta / [İ] İleri
Amaç: Modelin uydurma üretme mekanizmasını anlamak ve hiçbir tıbbi çıktının doğrulanmadan kullanılmamasını sağlayan operasyonel bir iş akışı kurmak.
Not: Bu modül her öğrenme yolunda zorunludur ve atlanamaz.
Neden bu modül diğerlerinden önce gelir
Yapay zekâ destekli tıbbi yazımda geri çekilmeye (retraction) ve itibar kaybına yol açan tek bir başat sebep vardır: uydurma referans ve veri. Yayın literatüründe, var olmayan ama gerçekçi görünen kaynaklar içeren makalelerin hakem sürecinden geçtiği vakalar belgelenmiştir. Bu, yetenek değil, doktrin sorunudur. Doğru iş akışı uygulanırsa risk yönetilebilir; uygulanmazsa kaçınılmazdır.
Halüsinasyonun mekaniği [T]
Bir dil modeli "gerçeği" saklamaz; bir metnin istatistiksel olarak en olası devamını üretir. Bu yüzden:
- Var olmayan bir makaleyi, tanıdık yazar adları, gerçekçi bir dergi adı, geçerli formatta bir DOI ve inandırıcı bir başlıkla icat edebilir.
- Bir ilacın dozunu, bir çalışmanın örneklem sayısını veya bir kılavuzun tarihini, doğru "görünen" ama yanlış bir değerle doldurabilir.
- Bir soruya cevabı bilmediğinde bunu söylemez; çünkü "bilmiyorum" çoğu zaman istatistiksel olarak en olası devam değildir.
Kritik kavrayış: Model yalan söylemeye çalışmaz. Belirsizliği temsil edecek içsel bir mekanizması yoktur. Kendinden emin görünmesi, doğru olduğu anlamına gelmez.
Üç katmanlı doğrulama doktrini
Katman 1 — Önleme (prompt düzeyinde) [T/O]
Halüsinasyonu üretilmeden azaltmak. Her tıbbi prompt'a şu kancalar gömülür:
- Var olmayan referans, yazar adı, DOI veya çalışma üretme. - Bilmediğin veya emin olmadığın her yere [doğrulanmalı] yer tutucusu bırak. - Yüksek güvenli iddialarla doğrulanması gerekenleri ayrı listele. - Bir bilgiyi uydurmaktansa "bu bilgiye sahip değilim" demeyi tercih et.
Önleme, halüsinasyonu sıfırlamaz; yalnızca sıklığını düşürür ve şüpheli noktaları görünür kılar.
Katman 2 — Tespit (çıktı düzeyinde) [O]
Üretilen her çıktı şu süzgeçten geçer:
- Her referans birincil kaynaktan teyit edilir. PubMed/DOI çözümleyici/orijinal dergi üzerinden. Teyit edilmeyen referans = yok hükmünde.
- Her sayısal değer kaynağına geri izlenir. Oran, ortalama, p-değeri, örneklem; hiçbiri "modelden geldiği için" kabul edilmez.
- Her klinik iddia güncel, tarihli kaynakla karşılaştırılır. Modelin eğitim kesim tarihi sonrası gelişmeleri bilmediği varsayılır.
- Tutarlılık çapraz kontrolü: Aynı bilgi farklı bir prompt'la yeniden sorulur; iki yanıt çelişiyorsa ikisi de şüphelidir.
Katman 3 — Sorumluluk (insan düzeyinde) [O/İ]
Nihai metnin her cümlesinden insan sorumludur. "AI yazdı" bir mazeret değildir; yayın etiği açısından imzalayan kişi tüm içeriğin garantörüdür. Bu, doktrinin değişmez son katmanıdır.
Referans doğrulama protokolü [O]
Bir AI çıktısındaki referansları doğrulamanın somut adımları:
- Başlığı tırnak içinde birincil veritabanında ara. Bulunmuyorsa → muhtemelen uydurma.
- DOI'yi resmî çözümleyiciye gir. Çözülmüyor veya farklı bir makaleye gidiyorsa → uydurma.
- Yazar–dergi–yıl üçlüsünü çapraz kontrol et. Yazarlar gerçek ama makale onlara ait değilse → "Frankenstein referans" (gerçek parçalardan birleştirilmiş sahte).
- İçeriği teyit et: makale gerçekten iddia edilen şeyi mi söylüyor? Model var olan bir makaleyi yanlış de aktarabilir.
Bu protokol istisnasız uygulanır. Tek bir doğrulanmamış referans tüm makalenin güvenilirliğini gölgeler.
[İ] Güven düzeyini dışa vurdurma tekniği
Modeli, ürettiği her iddianın yanına bir güven etiketi koymaya zorlamak tespit yükünü hafifletir:
[DOĞRULAMA KANCASI]: Her olgusal iddianın sonuna güven düzeyini ekle: (Y) = yerleşik bilgi, büyük olasılıkla doğru; (O) = makul ama doğrulanmalı; (D) = emin değilim / spekülatif. Tüm (O) ve (D) iddiaları metin sonunda ayrı bir doğrulama listesinde topla.
Bu, modelin "kendinden emin görünme" eğilimini kısmen kırar ve insan doğrulayıcının dikkatini riskli noktalara yönlendirir. Etiketlerin kendisi de mutlak değildir; (Y) etiketli bir iddia da yanlış olabilir.
Kötü → İyi karşılaştırması
Kötü iş akışı: Modelden tartışma bölümünü atıflarıyla iste, gelen referansları doğrudan makaleye yapıştır, gönder.
→ Sonuç: Geri çekilme ve itibar riski.
İyi iş akışı: Modelden atıfsız taslak iste, referans gereken yerlere [ref] koydur, sonra her [ref]'i kendin literatür aracından bul, birincil kaynaktan teyit et, yerine yerleştir.
→ Model yazımı hızlandırır; referans sorumluluğu hiçbir noktada modele devredilmez.
Yaygın hata kalıpları (failure modes)
- Otorite yanılsaması. Akıcı ve özgüvenli metni doğru sanmak. Akıcılık doğruluk değildir.
- Kısmi doğrulama. Birkaç referansı kontrol edip gerisine güvenmek. Doğrulama ya tamdır ya yoktur.
- DOI'ye güven. Geçerli formatta bir DOI'nin var olduğunu varsaymak. Format geçerliliği varlık kanıtı değildir.
- Tek kaynak çapraz kontrolü. Modeli kendi çıktısıyla doğrulamak (aynı modele "bu doğru mu?" diye sormak). Doğrulama bağımsız ve birincil olmalıdır.
- Kesim tarihi körlüğü. Güncel kılavuz/ilaç bilgisini modelden almak. Klinik güncellik daima birincil kaynaktan.
Uygulamalı egzersiz
Bir modele tanıdığınız bir alt alanda "en önemli 5 makaleyi DOI'leriyle" listeletin. Ardından her birini referans doğrulama protokolüyle test edin. Kaç tanesi gerçek? Bu egzersiz, doktrinin neden zorunlu olduğunu somut olarak gösterir ve çoğu araştırmacı için sarsıcıdır.
Doğrulama kontrol listesi (master)
- Prompt'ta önleme kancaları vardı.
- Her referans birincil kaynaktan teyit edildi.
- Her sayısal değer kaynağına geri izlendi.
- Klinik iddialar güncel, tarihli kaynakla karşılaştırıldı.
- Hiçbir bilgiyi yalnızca "modelden geldiği için" kabul etmedim.
- Nihai metnin her cümlesinin sorumluluğunu üstleniyorum.
Anahtar çıkarımlar
- Model belirsizliği temsil edemez; kendinden emin görünmesi doğruluk kanıtı değildir.
- Doktrin üç katmanlıdır: önleme (prompt), tespit (çıktı), sorumluluk (insan).
- Referans doğrulama protokolü istisnasız uygulanır; tek doğrulanmamış kaynak tüm metni gölgeler.
- "AI yazdı" bir mazeret değildir; garantör daima imzalayan insandır.