TURKISH JOURNAL OF ONCOLOGY 2008 , Vol 23 , Num 2
Identification of the criteria list for evaluation of the scientific quality of clinical oncology research
Hilal KÖKSALAN,1 Mustafa ŞENOCAK2
1 İstanbul Üniversitesi Onkoloji Enstitüsü, İstanbul
2 İstanbul Üniversitesi Cerrahpaşa Tıp Fakültesi, Biyoistatistik Bilim Dalı, İstanbul

Summary

AMAÇ
Randomize kontrollü klinik araştırmaların kalite değerlendirmesi için genel kabul görmüş ve birçok uluslararası dergide kullanımı zorunlu hale getirilmiş ölçek ve skalalar bulunmaktadır. Bu çalışmada, söz konusu ölçek ve skalalardan eleyerek ortaya çıkardığımız yöntembilimsel maddelerin anketlerle irdelenmesi ve sonuçta onkolojiye özgü yeni bir ölçüt listesinin tasarlanması hedeflendi.

GEREÇ VE YÖNTEM
İlk olarak çalışmada onkoloji alt branşları da dikkate alınarak, Jadad, Delphi, PEDro, CONSORT gibi ölçek ve skalaların tüm maddelerinin dökümü yapıldı, hedefe yönelik olarak “Yayın” ve “Tasarım” adı altında iki ayrı anket formu oluşturuldu. Anket formları onkoloji alanında çalışan araştırmacı hekimlerce dolduruldu.

BULGULAR
Onkoloji alt alan uzmanlıklarının (cerrahi, radyoterapi, kemoterapi) gerek “Tasarım” gerekse “Yayın” anketindeki ölçütlere farklı yaklaştıkları, sonuçta onkoloji adına tek bir ölçüt listesi oluşturmanın mümkün olmadığı gözlendi.

SONUÇ
Her bir alt alan uzmanlığı için çalışma yaklaşımlarına göre farklı modüler gruplar içeren ölçekler oluşturulabilir. Bu modüller ilgili alanın özellik ve koşullarına uygun olarak birleştirilerek daha gerçekçi ve verimli olunabilir.

Introduction

Klinik kararlar alınırken başvurulan kanıta dayalı tıp kaynaklarının içerisinde, güçlü deliller içermesi ve yüksek bilimsel kaliteye sahip olması nedeni ile randomize kontrollü klinik araştırmalar (RKA) ilk sırada yer alırlar,[1] ancak bu kadar etkili bir kaynağın geçerli ve güvenilir sonuçlar çıkarabilmesi için doğru kurgulanması oldukça önemlidir.[2]

Randomize kontrollü araştırmalar çok büyük emek ve maliyetle ortaya çıkan çalışmalardır. Ortaya konan bu büyük emek ve maliyetin boşa gitmemesi, en kötüsü de yanlış sonuçlara neden olmaması için uygulama kadar elde edilen her verinin yorumu ve okuyucuya aktarımının da eksiksiz olması gerekir. Son 30 yılda araştırmalardaki sistematik hataları (bias)[3] önleyebilmek, çalışmalara standardizasyon ve kalite[4] kazandırabilmek amacı yla bir takım yöntembilimsel ilkeler içeren skala ve ölçekler geliştirilmiştir. Bu ölçek ve skalaların amacı RKA'ların bilimsel kalite düzeyini yükseltmek, değerlendirmek ve denetlemektir.[5]

Klinik çalışmalarda bilimsel kalite konusu özellikle 1980 yılından sonra[4] ciddi bir ivme kazanmıştır. Özellik olarak bu kalite değerlendirmeleri farklı iki yöntemle uygulanmaktadır. Birincisi çalışmaları n niteliksel gerekliliklerinin madde, alt-madde özelliklerinin uygunluğuna göre belirli puanlar almasıyla ortaya çıkan ölçeksel değerlendirmeler (skala), ikincisi öngörülmüş olan niteliksel özelliklerin varlığının denetlenmesiyle yapılan gözden geçirmelerdir (onay listesi). Bu skala ve onay listeleri zaman içersinde kullanım gerekleri ve alanlarına göre çeşitlenmiş ve sayıca artmıştır. 1995'de yapılan bir araştırmaya göre 25 skala ve 9 onay listesinin (checklist) varlığı bildirilmiştir.[6]

Bu çalışmada, Jadad, Delphi, PEDro, Consolidated Standarts for Reporting Trials (CONSORT) gibi birçok uluslararası dergide genel kabul görerek kullanımı zorunlu hale getirilmiş ölçek ve skalalardan eleyerek ortaya çıkardığımız yöntembilimsel maddeleri, onkoloji alanında klinik araştırma yapan hekimlere anketlerle sorgulayarak, tüm alt uzmanlık branşlar için olmazsa olmaz ortak yöntembilimsel ilkeleri vurgulamayı ve aradaki farkları irdelemeye çalıştık.

Methods

Onkoloji alanında geçmişten günümüze yüzlerce RKA sonucu yayınlanmıştır. Soren'in 1998'deki bir çalışmasına göre,[7] bu sayı sadece onkolojinin bir alt grubu olan radyasyon onkolojisinde bile 250'yi bulmaktadır. Aradan geçen süreç içerisinde bu sayının çok daha artmış olması doğaldır. Her ne kadar onkoloji alanında yayınlanan RKA sonuçları yüzlerle ifade edilse de tüm çalışmalarda sabit olarak vurgulanan konu “randomize kontrollü klinik araştırma kalitesinin; tasarım, yürütme, analiz ve rapor edilmesinin geliştirilmesine ihtiyaç olduğu”dur.

Anlaşılacağı üzere tasarımı belirleyen ölçütler ve bunların bir yayın oluştururken sunumunu belirleyen-kısıtlayan ölçütler farklı özellikler içerebilmektedir. Bu nedenle iki ayrı alana ilişkin sorgulamayı da farklı gerçekleştirmeyi uygun bulduk.

Çalışmanın ilk adımında; CONSORT, Jadad, Delphi, PEDro gibi ölçek ve skalalardaki temel yöntembilimsel ilkeler taranarak dökümü yapıldı, bu ilkelerden maddeler oluşturularak kullanım hedefine yönelik olarak “Tasarım” ve “Yayın” adı altında iki adet anket oluşturuldu.

Oluşturulan “Randomize Kontrollü Klinik Araştırma Tasarım” anketinde 16, “Randomize Kontrollü Klinik Araştırma Yayın” anketinde 22 soru yer aldı.

Sorular “Mutlaka Gerekir (MG)”, “Zorunlu Değil (ZD)” ve “Gereksiz (G)” şeklinde üç seçenekli idi. Bu anketlerin her biri (43: RKA yayın -47: RKA tasarım) 29 Mart-10 Mayıs 2006 tarihleri arasında ilgili hekimlerle (cerrah, radyasyon onkoloğu, tıbbi onkolog) yüz yüze görüşülerek dolduruldu.

29 Mart 2006'da Antalya'da gerçekleştirilen Tıbbi Onkoloji Kongresi'nde elde edilen 69 anket formuna ek olarak, İstanbul Üniversitesi Onkoloji Enstitüsü'nde ve Cerrahi Monoblokta daha önce formu doldurmamış ve en az bir klinik araştırmada yardımcı araştırmacı olarak bulunmuş hekimlerin de katılımı ile toplam 80 anket değerlendirmeye alındı.

İstatistiksel analiz: Anket maddeleri, farklı branş çalışanlarının yanıtlarının dağılımı açısından irdelendi. Dağılımlar ikili olarak Fisher kesin olasılık testi ile değerlendirildi. Bonferroni düzeltmesine göre anlamlılık sınırı p=0,017 alındı. Tanı mlayıcı dökümlerde yüzde değerler verildi.

Results

Tasarım anketi 14 cerrah, 9 radyasyon onkoloğu, 20 tıbbi onkolog olmak üzere 43 kişi tarafından dolduruldu.

Yayın anketi ise 14 cerrah, 12 radyasyon onkoloğu, 19 tıbbi onkolog olmak üzere 45 kişi tarafından dolduruldu.

Onkoloji tıpsal bir alt branş olmasına karşılık kendi içersinde cerrahi, tıbbi onkoloji, radyasyon onkolojisi, psikososyal onkoloji gibi alt birimleri olan multidisipliner bir alandır. Dolayısıyla onkoloji alanında yapılan bir klinik araştırmanın kalite değerlendirmesinde farklı branşlardan aynı soruya cevapların mutlak olarak faklı geleceği[8] çalışmamızda bir öngörü olarak kabul edildi. Tablo 1 ve Tablo 3'te bu döküm yüzde değerleri ile birlikte verilmiştir.

Tablo 1: RKA Tasarım anketine verilen cevapların onkoloji alt branşları arasındaki dağılımları

Tablo 2: Tasarım anketinde yüzde ve üzeri “mutlaka gerekir” cevabı alınan branşlar

Ön kabulsel olarak %70 ağırlığı özgün bir net seçimin göstergesi olarak kabul edersek; branşlar açısından %70 ve üzeri “mutlaka gerekir” yanıtının alındığı sorular ve branşlar Tablo 2 ve Tablo 4'te verilmiştir.

Tablo 3: RKA Yayın anketine verilen cevapların onkoloji alt branşları arasındaki dağılımları

Tablo 4: Yayın anketinde yüzde ve üzeri “mutlaka gerekir” cevabı alınan branşlar

Diğer bir değerlendirme yönü olarak, her iki ankette de her soru için, üç uzmanlığın verdikleri yanıtların dağılımı ikili kıyaslamalarla incelendi. Sonuçlar Tablo 5 ve Tablo 6'da verilmiştir.

Tablo 5: RKA Tasarım anketine verilen cevapların onkoloji alt branşları arasındaki anlamlılık düzeyleri

Tablo 6: RKA Yayın anketine verilen cevapların onkoloji alt branşları arasındaki anlamlılık düzeyleri

p<0,017'ye göre yargılandığında: Yöntembilimsel RKA-tasarım anketi sorularının onkoloji alt branşlarındaki dağılımı irdelendiğinde; 16 sorudan 6'sında en az iki branş arasında cevap dağılımı açısından anlamlı fark bulunduğu gözlendi (3. soru, 4. soru, 5. soru, 11. soru, 14. soru, 15. soru). Anlamlılığın gözlendiği altı sorudan birinde cerrahlar diğer iki branştan da farklı bulundu.

Cerrahların diğer branşlardan farklı olarak örneklem sayısı belirlenmesi (4. soru) ve çalışmaya biyoistatistikçi katılımını (14. soru) zorunlu görmedikleri ilgi çekici idi. Aynı şekilde “son nokta” tanımlaması ve “çalışmaya alınma, dışlama” ölçütleri diğer branşlarda %100 zorunlu görülürken, cerrahların %50'ye varan oranlarla bu konuları “zorunlu değil” olarak nitelemesi, araştırma yöntembiliminin nesnel ilkelerinin tanımlanması açısından düşündürücü bulundu.

Tıbbi onkologlarla, radyasyon onkologları arasında hiçbir soruda sorulara verdikleri yanıtlar açısından anlamlı fark gözlenmedi. Sorulardan 8'inde “gereksiz” seçeneği hiçbir branş tarafından belirtilmedi. Bu seçeneğin belirtildiği sekiz sorudan ise (4. soru, 6. soru, 7. soru, 9. soru, 10. soru, 11. soru, 12. soru, 16. soru) dördünde sadece cerrahların bu seçeneği belirttiği gözlendi. Bir soruda (9. soru) cerrahi dışı tek bir branş “gereksiz” olarak bildirildi, beş soru açısından branşlar arasında hiçbir farklılaşım gözlenmedi (6. soru, 8. soru, 9. soru, 12. soru, 16. soru).

Bu sorulardan randomizasyonun ve körlüğün zorunlu olmadığı, belli koşullarda uygulanmasının sorunlu olabileceği anlaşılmaktadır. Aynı şekilde plasebo kullanımı da zorunlu görülmemektedir. Bu sonuçlar onkolojik araştırmaların kendilerine özgü koşullarının bir yansıması olarak düşünülmelidir. Branşlar arasında uzlaşmanın gözlendiği son soru olan “intention to treat” değerlendirmesinin ise bu konu henüz yeterince tanınmadığından zorunlu görülmediği düşüncesindeyiz.

p< 0, 0 1 7'ye göre yargılandığında RKA yayın anketi sorularının onkoloji alt branşlarındaki dağılımı incelendiğinde, 22 sorudan en az 9'unda (1. soru, 8. soru, 11. soru, 15. soru, 16. soru, 17. soru, 18. soru, 21. soru, 22. soru) iki branş arasında anlamlı fark bulunduğu gözlendi.

Anlamlılığın gözlendiği dokuz sorudan üçünde (1. soru, 18. soru ve 21. soru) cerrahlar diğer iki branştan farklı bulundu. Tıbbi onkologlar ile radyasyon onkologları arasında hiçbir soruda anlamlı bir fark izlenmedi.

Cerrahların çalışma amacının yöntembilimsel bir hipotez olarak sunulması (1. soru), çalışmaya alınma kriterlerinin belirlenmesi (8. soru) ve çalışmanın odak, son nokta tanımının yapılması (18. soru) sorularını diğer branşlardan farklı olarak zorunlu görmedikleri izlendi. Tasarım anketinde de aynı konular hakkında benzer cevapların alınması anketlerimizin geçerliliğini doğrular niteliktedir.

Yayın anketindeki 22 sorudan 12'sinde “gereksiz” seçeneği hiçbir branş tarafından işaretlenmedi. “Gereksiz” şıkkının işaretlendiği 10 sorunun (2. soru, 3. soru, 4. soru, 5. soru, 6. soru, 7. soru, 13. soru, 15. soru, 21. soru ve 22. soru) dördünde sadece cerrahlar (2. soru, 13. soru, 21. soru ve 22. soru), ikisinde her üç branş tarafından (19. soru, 3. soru), ikisinde hem cerrah hem radyasyon onkologları (20. soru, 4. soru), ikisinde hem cerrah hem tıbbi onkologlar (21. soru, 5. soru), ikisinde sadece tıbbi onkologlar (22. soru, 6. soru), ikisinde sadece radyasyon onkologları (7. soru, 15. soru) “Gereksiz” olarak cevaplandırdı.

On üç soruda ise (2. soru, 3. soru, 4. soru, 5. soru, 6. soru, 7. soru, 9. soru, 10. soru, 12. soru, 13. soru, 14. soru, 19. soru ve 20. soru) branşlar arası nda anlamlı bir farklılaşma gözlenmedi.

Discussion

Ülkemizde 60 tıbbi dergiden 1250 klinik araştırma makalesinin değerlendirildiği 1992 yılında yayınlanan bir çalışmada, makalelerin %88'inde araştırma tasarımının belirtilmediği, %87'sinde hipotezin olmadığı, %98'inde örneklem büyüklüğü hesabının olmadığı, %56'sında ise istatistiksel analizin yetersiz olduğu bildirilmiştir.[9] Bizim bulgularımızda da oranlar biraz daha yüksek olmasına rağmen, özellikle cerrahların, araştırma yöntembiliminin nesnel zorunluluklarına gereken önemi pek atfetmedikleri gözlenmektedir.

Uluslararası düzeyi incelediğimizde, en kaliteli ve impakt değerleri yüksek tıp dergilerindeki RKA'larda bile (NEJM, Lancet, BJM), CONSORT öncesi dönemde (1980), önemli yöntembilimsel özellik olarak düşünülen koşullara bile uyumun çok düşük olabildiği saptanmıştır; örneğin yayınların %19'unda randomizasyon yönteminin açıklanmasına, %12'sinde örneklem hesabı ile ilgili olarak “güç” irdelenmesine, %37'sinde çalışmaya alınma koşullarının açıklanmasına rastlandığı bildirilmektedir.[10] Günümüzde bilimsel kalitenin çok yükselmesine karşılık, RKA'ların tümünde, CONSORT'a uymayı öngörsün veya öngörmesin tüm maddelere uygunluk gözlenmemektedir.[11] Anlaşıldığı üzere hem maddeler boyutunda farklılıklar söz konusudur hem de kesin bir uygunluğa her durumda rastlanmamaktadır. Bunun nedenlerinden biri bilimsel kalite yetersizliği olsa da bir diğeri çalışmanın özelliklerinin tüm maddelerin gerçekleşmesine doğası gereği uygun olmamasıdır. Daha önce onkoloji alanındaki kanser dergileri ile yaptığımız çalışmamamızda,[5] randomizasyonu gerçekleştirenlerin açıklanması sadece bir yayında (%3) tam olarak bulunmaktadır ve bu madde en düşük puana sahiptir. Obstetrik alanında gerçekleştirilmiş RKA'ların irdelendiği bir araştırmada aynı maddenin uygunluğu %10 ile yine çok düşük olarak saptanmıştır. “Körlük” gibi RKA için çok yaşamsal olarak düşünülebilecek bir madde, tam yanıt oranı açısından %27 düzeyindedir.[12] İlk bakışta RKA özellikleri ile çelişkili gözüken bu durumun, maddenin içeriği çerçevesinde tam olarak sağlanması aslında zor olabilmekte hatta konu çerçevesinde olanaksız olabilmektedir. Gerçekten de oftalmolojik RKA'ları konu eden bir çalışmada sonuçları kaydedenlerin ve değerlendirenlerin körlük oranı ancak %4,5 oranındadır.[12] Obstetrik çalışmasında olguların körlüğü bile %66'dır.[12] Buradan anlaşılacağı gibi körlüğü, olgu, tedavi uygulayıcı, sonuç saptayıcı üçlü boyutunda her seferinde sağlayabilmek söz konusu değildir; bu durumun gerçekliği ilk CONSORT listesinde yer alan[13] ve körlüğün üçlü denetimini üç ayrı madde ile yapan yaklaşımın yeni listede tek soruda toplanması ile de gözlenmektedir. Anlaşılacağı üzere, sadece araştırmamızın konu alanı olan onkolojide değil, pek çok tıpsal alanda kanıt kalitesinin sağlanması ve sunulması açısından farklılıklar hatta çelişkiler bulunmaktadır.

Sonuç olarak, çalışmamızda elde edilen bulgulara göre alt alan uzmanlıklarının da, (alanların doğası gereği) kendi aralarında ters düşebildikleri (örneğin tasarım anketimizin 13. sorusu olan istatistiksel yöntemin belirlenmesi ile ile ilgili madde) hatta CONSORT listesindeki bazı maddelerin uygulanamaz olduğu veya önem taşımadığı konumların bulunduğu söylenebilir.

Cerrahi branşlar ile cerrahi olmayan branşlar gerek tasarım gerekse yayın açısında birbirinden farklı olabilir. Genellersek aynı branşın altındaki farklı tedavi yaklaşımları bile gerek tasarım gerek yayında ölçütlere farklı bakmakta, bu da bütün araştırmalar için tek bir ölçüt oluşturmanın mümkün olmadığını göstermektedir. Farklı branşlar ve tedavi yaklaşımlarına göre alt modüler gruplar içeren, alanların özellik ve koşullarına uygun olarak birleştirilerek kullanılabilecek olan ölçeklerin daha gerçekçi ve verimli olacağı düşünülebilir.

References

1) Huwiler-Müntener K, Jüni P, Junker C, Egger M. Quality of reporting of randomized trials as a measure of methodologic quality. JAMA 2002;287(21):2801-4.

2) Sauerland S, Davis TR. The Consolidated Standards of Reporting Trials (CONSORT): better presentation of surgical trials in the Journal of Hand Surgery. J Hand Surg [Br] 2004;29(6):621-4.

3) Schulz KF, Chalmers I, Hayes RJ, Altman DG. Empirical evidence of bias. Dimensions of methodological quality associated with estimates of treatment effects in controlled trials. JAMA 1995;273(5):408-12.

4) Chalmers TC, Smith H Jr, Blackburn B, Silverman B, Schroeder B, Reitman D, et al. A method for assessing the quality of a randomized control trial. Control Clin Trials 1981;2(1):31-49.

5) Şenocak M, Uysal Ö, Süt N, Köksalan H. Seçkin kanser dergilerindeki randomize kontrollü araştırmaların “Consort” ölçütleri ile değerlendirilmesi. VII. Ulusal Biyoistatistik Kongresi Bildiri Kitabı 2005. p. 251-61.

6) Moher D, Jadad AR, Nichol G, Penman M, Tugwell P, Walsh S. Assessing the quality of randomized controlled trials: an annotated bibliography of scales and checklists. Control Clin Trials 1995;16(1):62-73.

7) Bentzen SM. Towards evidence based radiation oncology: improving the design, analysis, and reporting of clinical outcome studies in radiotherapy. Radiother Oncol 1998;46(1):5-18.

8) Ioannidis JP, Evans SJ, Gøtzsche PC, O'Neill RT, Altman DG, Schulz K, et al. Better reporting of harms in randomized trials: an extension of the CONSORT statement. Ann Intern Med 2004;141(10):781-8.

9) Akan H. Klinik araştırmalar kitabı. Ankara: Bilimsel Tıp Yayınevi; 2006.

10) DerSimonian R, Charette LJ, McPeek B, Mosteller F. Reporting on methods in clinical trials. N Engl J Med 1982;306(22):1332-7.

11) Devereaux PJ, Manns BJ, Ghali WA, Quan H, Guyatt GH. The reporting of methodological factors in randomized controlled trials and the association with a journal policy to promote adherence to the Consolidated Standards of Reporting Trials (CONSORT) checklist. Control Clin Trials 2002;23(4):380-8.

12) Sánchez-Thorin JC, Cortés MC, Montenegro M, Villate N. The quality of reporting of randomized clinical trials published in Ophthalmology. Ophthalmology 2001;108(2):410-5.

13) Begg C, Cho M, Eastwood S, Horton R, Moher D, Olkin I, et al. Improving the quality of reporting of randomized controlled trials. The CONSORT statement. JAMA 1996;276(8):637-9.