Görüntü Standartlaştırma

Hasta popülasyonlarından elde edilen görüntü veri gruplarının niceliksel karşılaştırmasına izin veren görüntü standartlaştırma tekniklerinde yararlanılmıştır. Bu teknik standart veri kümelerinin yaratılması (metinsel veriler için standart referans terminolojilerine benzer şekilde) ve görüntü veri kümelerinin (otomatikleştirilmiş eşleştirme yöntemleri ve metinsel verinin standart terminolojisine benzer şekilde) eşleştirilmesi için yöntemler içermektedir. Görüntü standartlaştırılmasına başlamadan önce, yakından ilgili iki konuyu tartışacağız, DICOM ve DICOM-yapısal raporlama (DICOM-SR). DICOM ve DICOM-SR’nin tek başlarına görüntü içerik standardizasyonu yapmadıkları, fakat standart bir formatta önemli görüntü elde etme bilgisi ve görüntü içerik standartlaştırılması için ön koşul sağladığı unutulmamalıdır.

DICOM ve DICOM-SR

DICOM standardı, Ulusal Elektrik Üreticileri Derneği (NEMA) tarafından, tıbbi görüntülerin dağıtılması ve görüntülenmesine yardım için oluşturulmuştur. Tek bir DICOM dosyası, hem hasta demografik bilgisi ve görüntü elde edilmesi ile ilgili parametreleri tutan başlık bilgisini hem de görüntü verisini içerir. Bu standart, kullanıcının, görüntü geometrisinin ve kontrastının (örn. MR’ın içindeki sıra tipi ve parametreler) belirlenmesinin zor olduğu elde edilme bilgisinin tutulduğu alanlara erişimini sağlar. Bu bilgi, görüntü içeriği tarafından daha detaylı sınıflandırılmasından daha çok görüntü çalışmalarının (modalite, ardışıklık tipi ve oriyantasyon tarafından) sınıflandırılmasında önemlidir. DICOM standardı aynı zamanda ok ve gösterge gibi anotasyonları içeren görüntü sunum durumlarını kaydetmek için standart alanlar sağlar. DICOM-SR listeleri ve hiyerarşik ilişkileri, metine ek olarak kodlanmış ya da sayısal içeriğin kullanımını, kavramlar arasındaki ilişkilerin kullanımını ve görüntülere ve diğer nesnelere gömülü referansları destekleyen bir yapısal raporlama altyapısıdır. DICOM-SR’nin yalnızca modeli tanımladığı; örnekleme işlemi için doğal dil işlemcisinin ya doğrudan yapılandırılmış girdisine (şablon kullanımı olsun ya da olmasın) ya da yapılandırılmış çıktısına ihtiyaç duyulduğu anlaşılmalıdır.

Atlaslar

Anatominin standartlaşmış 3 boyutlu koordinat sistemi içindeki detaylı sunumu atlas olarak tanımlanmıştır. Bu anlatımda konu görüntüleme verisinden yaratılmış dijital atlaslarla sınırlandırılmıştır. Atlaslar ortak bir referans sistemiyle eşleştirildiklerinden standart veri olarak değerlendirilebilirler. Çeşitli hasta koşulları için çok modaliteli, çoklu organ atlasları olduğu halde atlas gelişiminin büyük bölümü normal beyin üzerinde yoğunlaşmıştır. Bunlar, beynin ve son dönemde, beyinkökünün etiketlenmiş atlaslarını ve hastalığa ve yaşa özel veri kümelerini kapsar. MR beyin atlaslarının gelişimi 2 şekilde olur: (1) tek tek taramalardan elde edilmiş referans atlasları ve (2) birçok konuda yapılan taramaların ortalaması olan olasılıklı atlaslar. Atlasların farklı kullanımları vardır; etiketlenmiş referans atlasları öğretim amaçlı ve model-temelli bölme için, olasılıklı atlaslar ise, model-tabanlı bölümlerde, hedef popülasyonlar genelinde bulunan yapılardaki gizli morfolojik değişiklikleri takip etmek için kullanılmaktadır. Olasılıklı atlaslar, birkaç gönüllüden ortak bir şablona kadar yapılan taramaların esnek şekilde deformasyonu için karmaşık işlemlere ihtiyaç duyar. Olasılıklı atlaslarda yapıların etiketlenmesi referans atlasında etiketlenmesine göre daha gereklidir, çünkü herbir orijinal görüntünün el ile etikletlenmesi, en son etiketi hesaplamak için kullanılır.

Morfolojik atlas kavramı, MR parametrik görüntüleri gibi diğer atlaslara genişletilebilir. Fakat şimdiye kadar, klinik sonuç üretilen zamanlarda dönüş-kafesi gevşemesi (T1), dönüş-dönüş gevşemesi (T2) ve belli difüzyon katsayısı (ADC) gibi MR parametreleri elde edilememiştir. Yüksek hızlı elde etme tekniklerinin gelişmesiyle, parametrik görüntüler günümüzde klinik bir gerçek olarak ortaya çıkar. Şu anda, MR görüntü karşılaştırmaları için sayısal standartlar sağlamak amacıyla, MR parametrelerinin beyin atlasları geliştirilmektedir. Parametrik atlaslar morfolojik değişimlerin ötesinde bilgi sağlayacak ve çeşitli hastalık süreçleriyle  ve normal büyüme şablonlarıyla ilgili derinde yatan fizyolojik süreçleri imkan dahilinde yansıtacaktır. T1, T2 ve ADC gibi MR parametrelerinin çoklu skleroz, epilepsi ve felç gibi hastalık süreçlerinin hassas göstergeleri olduğunu ispatlayan raporların sayısı artmaktadır.

Atlas ile Eşleştirme

Atlasların oluşturulması ve yeni görüntü kümelerinin var olan bir atlas ile eşleştirilmesi farklı veri kümelerindeki yapıları sıralayabilen özel kayıt algoritmalarına ihtiyaç duyar. Değişmez vücut dönüşümü, farklı elde etme yolları arasındaki hasta oryantasyonundaki değişiklikler için düzeltilebilir fakat morfolojik farklılıklarda hesaba katılamazlar. Anatominin normal fizyolojik farklılıklarından ya da hastalık sürecinden kaynaklanan bu farklılıkları modellemek için esnek deformasyon algoritmaları gerekir. Yeniden, görüntü kayıt algoritmasının gelişimi görüntü işleme alanında düşüşe geçmektedir ve okuyucu, hem doğrusal olan hem de doğrusal olmayan kayıt tekniklerini inceleyen kapsamlı makalelere yönlendirilmiştir. Dijital atlas gelişiminde olduğu gibi, kayıt algoritmalarının çoğu beyin veri kümeleri için geliştirilmiş ve doğrulanmıştır, fakat günümüzde beyne ait olmayan yapılara ait başvurular da raporlanmaktadır.

İçerik Tabanlı Tıbbi Görüntü Erişimi

Büyük görüntü veritabanları sayesinde görüntü içeriğiyle arama yapabilmenin önemi artmaktadır. Görüntü içeriğinden erişimi desteklemek için metin-tabanlı sorgulamayı genişleten yeni teknikler gereklidir.  Bu, özellikle, sistem yalnız görüntü içeriğine ya da ilgili metin verisiyle bağlantısına dayalı erişime sahip olduğunda desteklenebilen, kanıta dayalı tıp uygulamasına yönelik şu anki eğilim için doğrudur. Geniş kapsamda bütün görüntüleri ele alırsak (tıbbi görüntülerle sınırlı kalmadan) içerik-tabanlı görüntü erişimi şu anda ticari ya da prototip uygulamaları (örn. QBIC, VIRAGE, Photobook, Blobworld ve Netra Sistemleri) olan, çok sayıda sistemi etkileyen aktif araştırma alanıdır. Çoğu içerik-tabanlı görüntü erişim algoritmasının öncelikli tekniği, her görüntünün piksel değerlerine göre imzasını çıkarmak ve imzaları kıyaslamak için bir kural oluşturmaktır. İmza, görüntü sunumu olarak hizmet eder ve imzanın öğeleri özellik olarak adlandırılır. Renk, doku ve şekil, çoğu içerik-tabanlı görüntü erişim sistemine görüntü sunumunun özellikleri olarak dahil edilmiştir. Temel şema, tüm görüntüyü sorgu görüntüsü olarak kullanır fakat başka birçok sorgulama şeması da mevcuttur: erişimin görüntüdeki belirli bir alana dayandığı ya da erişilecek görüntü/objelerin renk histogramının ya da nesne modalitesinin belirtilmesiyle bölge tabanlı arama. Görüntü özelliklerinde sadece indeksleme yapmak, arama alanını daraltacak bir yol sağlar fakat önemli anlamsal bilgi, uygulama sırasında kaybolabilir. Görüntüleri anlamlı katsayılar ile küçük parçalara bölen Photobook projesi, öz temel görüntü kümesinden oluşan depolanmış görüntülerin algısal olarak belirgin unsurlarını ifade etmek amacıyla oluşturulmuştur. Fakat bu sistemlerden hiçbiri, tıbbi görüntüler için özelleştirilmemiştir ve genel içerik-tabanlı görüntü algoritmalarını tıbbi görüntülere uyarlama çalışmaları yapılmasına karşın bu açılımı  yapmak boş bir adım değildir. Tıbbi görüntülere odaklanan içerik-tabanlı erişim sistemleri şunları içerir:

  1. I2C bilgi sistemi, tıbbi görüntülerin görsel içerikleriyle indekslenmesine ve erişimine izin verir. Sistem, belirli görüntü sınıflarını temel alan görüntü analiz alışkanlıklarını tanımlamak için kullanılan araçları birleştirir, bu algoritmalardan bazıları etkileşimli, bazıları ise otomatiktir. I2C, mini-PACS sisteminin bir parçası olarak değerlendirilmiş ve aynı zamanda webde dağıtılmıştır.
  2. Sistem, birleşik tıbbi dil sistemi (UMLS) sağlık kavramları sözlüğü ve bilgi tabanlı görüntü analizi kullanan anlamsal indeksleme ile birleştirilmiş bir metoda dayanır. Bu sistem, radyoloji raporlarının doğal dil işlemesini ve DICOM başlık bilgisini, çalışmadan görüntüler seçmek için bir araya getirir. Yazarlar, görüntüleri bölmek için aynı zamanda bazı bilgi tabanlı görüntü işlemenin entegrasyonunu da önermektedirler.
  3. Serbest metin dokümanlarını aramak için N-gram metodunun uzantısına dayanan, soyut manada görüntü içeriğini anlatan, global imzanın hesaplandığı CANDID sistemi, görüntü indeksleme için kullanılıyor. Bu sistem, göğüs CT görüntülerine erişmek için değerlendirilmektedir ve doku özelliklerini esas alır.
  4. ASSERT sistemi, ROI’yi (hastalık taşıyan bölge) tanımlamak için bir doktora ihtiyaç duyar. Görüntü, ROI için hesaplanmış özelliklerle indekslenmiştir. Sistem, şu anda yüksek çözünürlüklü CT akciğer görüntüleri üzerinde klinik olarak değerlendirilmektedir.
  5. Sorgu görüntüsüyle en iyi uyumu sağlayan görüntüyü, otomatik olarak seçmek için metin bilgisiyle, üç boyutlu yerleşimle ve özellik çıkarımı ile birleştirilen,  nörolojik görüntüler için olan içerik-tabanlı görüntü erişim sistemi, patoloji (felç, kanama, ve tümör) içeren görüntülerle değerlendirilmektedir. Kullanıcıların, görüntü arama alanını daraltmak için sorgu görüntüsü ile ilgili metin verisi girmesi gerekmektedir.
  6. Görüntü tabanlı veritabanı (IRDB) sistemi, temel öğe analizine dayanan ve MR beyin görüntülerinin erişimine göre değerlendirilmiş olan tıbbi görüntü indekslemeyi kapsar. Bu ilk çalışma, yöntemi incelemek için genişletilmiş ve performansı nicelik açısından değerlendirilmiştir.
  7. Son çalışma, patoloji görüntülerinin çok çözünürlüklü alan tabanlı araması için genel içerik-tabanlı görüntü erişim algoritmasının (SIMPLICITY) genişletilmesini ele almaktadır.
  8. Farklı görüntü eşleştirme algoritmalarına ev sahipliği için altyapı sağlayan PACS ortamına entegre edilen içerik-tabanlı erişim sistemi de son zamanlarda tanımlanmıştır.

Bu gelişmeler, içerik-tabanlı tıbbi görüntü indeksleme ve erişiminde öncülük eden çabalardır. Yukarıda, içerik-tabanlı görüntü erişimi için özetlenen metodolojiler özellik çıkarımına dayanır, özelliklerin detayları ise uygulamaya bağlıdır. Kullanıcı etkileşiminin boyutu, kapsamlıdan en az kapsamlıya kadar değişir ve görüntü bölmenin zor olan tarafının üstesinden gelmek için gereklidir. SIMPLICITY, wavelet (dalgacık) tabanlı doku özellikleri kullanır ve görüntüyü yaklaşık olarak bölerek görüntü alt bölgelerini eşleştirir. Yan et al. tarafından tanımlanan bu algoritma, beyin simetrisine dayanır ve özellikler, yarısı çıkartılmış beyinler için hesaplanır. Buna karşın, bu tekniğin diğer vücut bölgelerinde kullanılabilirliği kolay değildir. Öz görüntü metodolojisinin kullanımı, görüntü erişiminin kesinliğinin arttırılmasını gerektiren görüntü önişleme adımlarına odaklanarak incelenmiştir. Ayrıca, bu metodoloji, beynin içindeki yapıları tanımlamak için de kullanılmıştır. Bu yöntem, beyin görüntülerinden oluşan bir veritabanı üzerinde doğrulanmış olsa da kavramsal olarak diğer organlar için de kullanılabilir.

İçerik-tabanlı Görüntü Erişimi’nde Öz Görüntü Metodolojisi

Alıştırma görüntülerinin olduğu küme, {xk} vektörleri olarak tanımlanmıştır ve m=Σ{x} ise C = Σ{(x − m)(x − m)T} ortak değişken matrisini oluşturmak için kullanılmıştır. vn ve λn’i sırasıyla C’nin öz vektörleri ve öz değerleri olarak tanımlayalım ve bu durumda ortak değişken matrisi C = Σnλn vn vn T olarak açıklanabilir. En büyük öz değerlere sahip öz vektörler bir çok bilgi içerir, bir anlamda prototip görüntüler olarak düşünülebilirler. Kümedeki her görüntü, sonradan xk ≈ Σpcp vp olan öz vektörlerin doğrusal kombinasyonuna yaklaştırılabilir, buradaki cp katsayısı, her birinin farklı k sınıflarına atandığı xk görüntüsü için özellik açıklamasıdır. Yeni bir sorgu görüntüsü olan qi, benzer şekilde özuzaya yöneltilmiştir ve cq katsayıları hesaplanmıştır. Sorgu görüntüsünü en iyi tanımlayan sınıf, alıştırma kümesindeki k sınıfları için p = {1,2,…,k} olduğunda, cq ve cp kaysayılarının Öklid uzaklığının karşılaştırılmasına göre belirlenir. Böylece sorgu görüntüsü, alıştırma kümesi sınıfına atanarak sonuçlanır ya da yeni bir sınıf oluşturur. Erişimin kesinliğini arttırmak amacıyla, ortak değişken matrisini (C  =  Σ{log(x/m)log(x/m)T} gibi) oluşturmak için kullanılan şartlardaki değişimlerin yanı sıra, birçok otomatik önişleme stratejisi de incelenmiştir. Farklı yöntemlerle elde edilen görüntüler arasındaki yoğunluk farklılıklarına olan duyarlılığı azaltmak için görüntü oranları incelenmiştir. Görüntü oran yöntemi, günlük indeks olarak anılırken, görüntü farklarından oluşan ortak değişken matrisi, çıkarma indeks yöntemi olarak anılmaktadır.

Alıştırma görüntü kümesi, tek bir MR serisinden elde edilen ardışık 100 dilimden oluşturulmuştur (bkz. ŞEKİL 4). Farklı boyutsal seviyelerdeki hastalardan alınan 100 görüntü, alıştırma kümesinden daha çok sorgu görüntüsüne benzeyen görüntü çekmek amacıyla, sorgu görüntüsü olarak kullanılmıştır. Sorgu görüntüleri, tümörü olan ve organları çıkarılmış hastaları dahil edecek şekilde seçilmiştir. Bir uzman, doğru eşleşmeden alınan dilimin dilim sapmalarını sınıflandırarak performansı değerlendirmiştir (2mm’lik sapma, alıştırma kümesinden alınan dilimin, doğru eşleşme diliminden 2 mm farklı bir yere hareket ettiği anlamına gelmektedir).

ŞEKİL 5, çeşitli ön işleme ve erişim indeks şemaları için kullanılan erişim profilini özetlemektedir. Erişim kesinliği, hem 3-boyutlu alanda görüntü uyumu, hem de yoğunluk standartlaştırılması açısından görüntü standartlaştırılması ile ilişkilidir (üç boyutlu hizalamanın olduğu 3’ten 5’e kadar olan Serilerin üzerine, tahminen 2-boyutlu hizalama kullanmış olan Seri 1 ve Seri 2’nin erişim performansını karşılaştırın). Görüntü yoğunluklarına olan duyarlılık, günlük indeksi uygulanarak azaltılmıştır (Seri 4 ve Seri 5 aynı performansa sahiptir). Bu ön çalışma, tam bir eşleşmenin gerçekleşmesi için hem alıştırma kümesi hem de sorgu görüntüleri için uygulanan bölge ve yoğunluk standartlaştırması için gerçekleştirilen önişleme adımlarının dahil edilmesinin önemini vurgulamaktadır.

Yapılandırılmış Metin Verisi

Birçok araştırmacı, kanıta dayalı tıbbi pratik ve araştırmayı kolaylaştırmak için metni ve görüntüleme verisini yapılandırmaya duyulan ihtiyaca dikkat çekmiştir. Tıp bilişiminde, klinik hikayelerden, ameliyat raporlarından ve radyoloji raporlarından alınan paralel metin bilgisinin, görüntü verisine uygun içerik sağlamak için önemli olduğunun anlaşılması gerekmektedir. Örnek verilecek olursa; bir çalışmanın ilgili görüntülerinin seçilmesi, (GÖRÜNTÜ ÇALIŞMA ÖZET’ine bakınız) radyoloji raporlarının doğal dil işlemesi ile elde edilmiş olan yapılandırılmış verinin etiketlenmiş atlasların hasta görüntü verisine otomatik eşleştirmesi ile entagrasyonuna ihtiyaç duyar. Metin bilgisi, Yan vb. ve Lowe vb.’nin içerik-tabanlı tıbbi görüntü erişim algoritmalarının içine de eklenmiştir.

 

ŞEKİL 4. Alıştırma kümesinden alınan görüntülerin alt kümesi (solda) ve bu alıştırma kümesi için en önce gelen 16 öz görüntü (sağda).

 


Şekil 5. Görüntülerin görüntü erişim kesinliği şu şekildedir: 1’den 4’e kadar olan

Seriler çıkarma indeksi kullanır. Seri 1, 2-boyutlu hizalama yapılmış, histogram açışından eşitlenmiştir; seri 2, 2-boyutlu hizalama yapılmış, histogram açısından eşitlenmiş, Gaussian filtresi uygulanmıştır; seri 3, 3-boyutlu kaydedilmiş, orijinal yoğunluklara sahiptir; seri 4, 3-boyutlu kaydedilmiş, histogram açısından eşitlenmiştir; seri 5, 3-boyutlu kaydedilmiş, orijinal yoğunluklara sahip, kayıt indeksi vardır.

Karar desteği ve tıbbi kaydın sunumunu düzenlemeye ve geliştirmeye yardım etmek için, yapılandırılmış raporlamanın olası yararlarını gösteren birçok çalışma yapılmıştır. Sadece yapılandırılmış veri, günümüzde bilgisayar biliminin bir alanından geliştirilen gelişmiş boyutsal, zamansal ve evrimsel veritabanı modelleme tekniklerinden etkilenir. Metinsel veriyi yapılandırmak için iki temel yaklaşım vardır: Geleneksel yapılandırılmış veri girişi ve doğal dil işleme teknikleri.

Geleneksel Yapılandırılmış Veri Girişi

Geleneksel yapılandırılmış veri girişi (SDE), kullanıcıyı, formlar, taslaklar ve/veya makrolar kullanarak sınırlı denetimli sözlükten açıklamalar yazmaya zorlar. Birçok sistem geliştirilmiştir: radyoloji için işaretleyici, ilerleme raporları için pen-ivory sistemi ve gastrointestinal endoskopi için raporlama sistemi. Çeşitli kullanıcı arayüzü tasarımları (sayfa, devamlı mı sayfa-kaydırmalı mı; palet, sabit mi dinamik değiştiricili mi; ve arama sonuçları, kısmi listeli mi tam listeli mi) ve girdi araçları (elektronik kalem ve sayısallaştırma tableti) değerlendirilmiştir. Şekil tabanlı yapılandırılmış raporlamanın olumlu yönleri, tutarlı kapsam, karar desteği ve uyumdan emin olmayı kapsar. Şekil tabanlı yapılandırılmış raporlama sistemlerinin yararlarına rağmen bu sistemler, yaygın şekilde benimsenmemiştir. Bazı engelli prototipler ve ticari ürünlerde rapor sapmaları, sınırlı ifade edilebilirlik, rapor kusurları, emek yoğunluğu, zaman alıcılık ve geleneksel iş akışı karmaşası bulunur.

Doğal Dil İşleme Yaklaşımı

Yapılandırılmış raporlamaya yönelik doğal dil işleme (NLP) yaklaşımı, doktorların istedikleri gibi rapor yazdırmalarına izin vermektedir. Bir bilgisayar programı, doktorların serbest-metin açıklamalarını otomatik olarak yorumlar ve bilgiyi bilgi yapılarının içine formüle eder. (örn., çerçeveler). NLP yaklaşımının en önemli avantajı, raporlama yapan doktora görünür olan bir veri yapılandırma gerçekleştirmesidir. Tıbbi doğal dil işleme problemi üzerinde çalışan sınırlı sayıda araştırma grubu bulunur; bu konunun tam bir özeti Referans 65’te bulunabilir. Şimdiye kadar, birçok tıbbi doğal dil işleme, sözdizimsel ve anlamsal gramerlerin birleştirilmesine dayanan sembolik metodlar kullanılarak uygulanmıştır. Bu sistemlerin açıklanmış doğruluğu, incelenen alanlar içinde  anlamlandırılabilir olmuştur. Ancak bu sistemlerin yeni tıbbi alanlardaki başarısı ve uyumluluğu tam anlamıyla, henüz incelenmektedir. Birçok klinik öncesi değerlendirme olduğu halde, NLP sistemleri klinik ortamlara seyrek olarak yerleştirilir. MedLEE sistemi, bugün belki de en çok uygulanan ve en kapsamlı tıbbi doğal dil işleme sistemidir ve 1995’ten beri düzenli olarak Kolombiya-Presbiteryan Tıbbi Merkezi’ndeki radyoloji raporlarına rutin olarak uygulanmaktadır. MedLEE bağımsız olarak değerlendirilmiş ve bazı klinik tanıma görevlerinin pratik kullanımı için etkili bulunmuştur.

Ortak referans çözünürlüğü, sözcük özelliklerinin dinamik değişimi, var olan elektronik tıbbi veri sözlüklerinin entegrasyonu, birleşik listelerin ve parantez içindeki deyimlerin gelişmiş kullanımı, tamamen sözdizimsel ayrıştırma, anlamsal yorumlama, bilinmeyen sözcüklerin kullanımı ve sistem çıktısını açıklayıcı kuralsal sunum ile eşleştirme gibi tıbbi doğal dil işleme alanındaki birçok problem devam etmektedir. İstatistiki doğal dil işleyiciler, sembolik yöntemlerdeki temel eksiklikler nedeniyle, günümüzde daha çok dikkat çekmektedir. İlk olarak, birinin, dili yalnızca kural-tabanlı bir sistem kullanarak modelleme başarı olasılığı olmayan bir yöntemdir, çünkü kurallar hiçbir zaman kapsamlı olmayacaktır ve çoğu kural ne kesin ne de bağımsız değildir (çoklu kurallar kendi aralarında zayıf etkileşime sahiptir). İkincisi, ortaya çıkan belirsizliği azaltırken kural kapsamını arttırma amacı, esasen sembolik NLP sistemleriyle uyuşmaz. Çizimleri belirsizleştirmek için gramer kapsamını genişletmek, sık sık, planlanmamış inceleme sayısının artışını beraberinde getirir. Üçüncü olarak, sembolik sistemlerde kural tabanı yöntemini yönetmek zaman alıcı ve zordur. Genelde, kural-tabanlı sistemler iyi şekilde ölçeklendirilmez. Son olarak ise, kural-tabanlı sistemler, daha önce görülmemiş modellerle ve dildeki değişikliklerle iyi bir uyum göstermez. Burada, radyoloji raporlarının geniş açıyla değerlendirildiği istatistiki doğal dil işleyicisi tanıtılmaktadır.

İstatistiki Doğal Dil İşleyicisi

Doğal dil işleyicisinin amacı, tıbbi raporun önemli bulgularını çıkarmaktır. İlk işi, bu raporlardan çıkarmak için bilginin türünü belirlemektir. Hastanın durumunu nitelendirmek için mümkün olduğunca çok detay çıkarılmıştır.

Örnek 1 [Örn-1] Beyin tümörü/ödemi olan bir hastanın raporundan örnek bir parçayı gösterir.

[Örn-1] FLAIR’de ve T2 ağırlıklı görüntülerde, sağ ön çeperde ve ön çeperde beyaz madde içeren etrafı kaplamış ödem işaretlenmiştir. Bu yaklaşım, basit mantıksal ilgi ilişkisini tanımlamak ve herbir ilişki için ayrı doku eşleştiricisi geliştirmek için var olmuştur. Mantıksal bir ilişki, bir dayanaktan ve bir ya da daha fazla değişkenin düzenlenmiş listesinden oluşur. Bu dayanak, değişkenler arasındaki ilişkinin tipini gösterir. Birçok durumda, her mantıksal ilişki üç değişkenden oluşur: bir başlık, bir ilişki ve bir değer. Başlık, değer tarafından değiştirilen bir kavramdır. Genellikle ilişki için EQUALS’un varsayılan değeri kullanılır. Örneğin, [Örn-1]’de bulunan mantıksal ilişkiler TABLO 1’de listelenmiştir. Alandaki çalışmalarda göğüse ait radyoloji alanında 120 mantıksal ilişki tanımlanmıştır.

NLP sisteminin mimarisi, beş etkileşimli modül içerir.

  1. Yapısal analizci, bir tıbbi raporu bağımsız bölümlere ve cümlelere ayrıştırır.
  2. Anlamsal analizci, anlamsal ve sözdizimsel etiketleri cümledeki her bir kelimeye veya kelime grubuna atar. Şu anda, sözlüğün içinde 250 anlamsal etiket ve 12 sözdizimsel kategori vardır.
  3. Ayrıştırıcı, kelime-kelime bağımlılık ağacı üretmek için istatistiki yöntemler kullanır. Bağımlılık ağacı, bir cümlenin yapısını cümlenin kelimelerindeki ikili sistem başlık düzenleyici ilişkisine (bağımlılık olarak da bilinir) göre belirler. Ayrıştırıcı, tüm başlık düzenleyici bağlantılarının genel sonuç olasılığını en üst düzeye çıkaran ağaç konfigürasyonunu belirlemek için istatistiki yöntemler kullanır.
  4. Anlamsal yorumlayıcı, TABLO 1’de gösterildiği gibi mantıksal ilişkiler kümesi oluşturarak ayrıştırıcı bağlantılarının anlamsal içeriğini sağlar.
  5. Çerçeve yapıcı, bütün mantıksal ilişkileri, yapılandırılmış çerçeveler içinde toplar. Herbir çerçeve, seçilmiş özelliklerin açıklamalarıyla birlikte belirli bir konu (örn. kütle) hakkında bilgi sunar.

Metin Verisini Standartlaştırma

Serbest metnin yapılandırılmasına ek olarak, yapılandırılmış terimlerin, standartlaştırılmış terminolojiyle eşleştirilebilmesi de önemlidir. Birçok çalışma, standart terminolojilerin (UMLS ve SNOMED-RT) kavram kapsamını, romatizmal hastalık yönetiminde sağlık durumu değerlendirmesi, klinik radyoloji, tıbbi prosedürler, klinik hemşireliği dili ve klinik problem listesinin kodlanması gibi tıp ile ilgili çeşitli alanlarda değerlendirmiştir. Bu değerlendirmelerin genel sonucu, belirli terminolojiler belli alanlara daha çok uyuyormuş gibi görünse de her iki terminolojinin kavram içeriğinin, incelenen tıbbi alanların herhangi birinde tam olmadığıdır. Bu değerlendirmelerde, kavramların standart terminolojilerle eşleştirilmesi ya bir uzman tarafından el ile ya da otomatik çalışan indeksleme araçlarıyla gerçekleştirilmiştir. Literatürde ileri sürülen otomatik yöntemler, tam terim eşleşmesini içeren nispeten basit tekniklerle anlamsal uzaklık ölçülerinin birleştirilmesi, trigram indeksleme, vektör alanları ve deneye dayalı erişim gibi daha karmaşık teknikler arasında değişiyor.

TABLO 1. Mantıksal ilişkiler örnek olarak [Örn-1

 

Standart sunumla tıbbi raporlardaki kavramların SNOMEDIII gibi otomatik eşleştirme incelenmiştir. İlk uygulama, NLP tarafından, göğse ait radyoloji raporlarından çıkarılan kavramların otomatik eşleştirilmesini değerlendirmiştir. Değerlendirme, otomatik eşleştirmenin, terimlerin 87%’si için doğru olduğunu göstermiştir(toplamda 700 terim değerlendirilmiştir). Terimlerin 12% kadarı SNOMED 3.5’un içinde bulunmuyordu (değerlendirme zamanında var olan versiyon); bu terimler aslında radyolojiye özel kavramlardı.

 

One Response to “Medikal Görüntü İşleme II”

  1. At last! Someone who understands! Thanks for potnisg!

Leave a Reply