Wie glaubwürdig ist Evidenz? – Die Wahrheit ist ein Kind des Studientyps!

So wurde z. B. kaum ein Thema in unserem Fachbereich in den letzten Jahren wissenschaftlich so kontroversiell diskutiert wie Nutzen und Risiken einer Hormontherapie (HT) nach der Menopause. Im Fokus der Diskussion standen vor allen deren Einfluss auf kardiovaskuläre Parameter und, besonders medienwirksam, auf das Brustkrebsrisiko. Die Ergebnisse der Vielzahl an wissenschaftlichen Publikationen waren zu diesem Thema reichlich widersprüchlich. Drei Arbeiten aus dem angloamerikanischen Raum sorgten für besonderes Aufsehen, weisen sie doch auf ein erhöhtes Brustkrebsrisiko unter und nach HT hin: Es sind dies die Women’s Health Initiative (WHI) Study1, die Million Women Study2 und ganz rezent eine Studie der Collaborative Group on Hormonal Factors in Breast Cancer3 aus Großbritannien.
Nun, auch die Ergebnisse in diesen drei Arbeiten sind zumindest in Bezug auf einige Parameter keineswegs einheitlich: Unterschiedlich wurde u. a. die Dauer der „gefahrenlosen“ Medikation bewertet (ein erhöhtes Brustkrebsrisiko nach 5 Jahren HT oder evtl. schon nach einem Jahr), das Andauern eines erhöhten Risikos nach Absetzen der HT und das Risiko in Bezug auf die Medikation mit kombinierter HT (E/P) bzw. Östrogen-Monotherapie (E). Es soll im Weiteren nicht näher auf die Detailergebnisse der 3 Studien eingegangen werden, sondern auf basale Unterschiede im Studienansatz, die für die divergierenden Studienergebnisse zumindest mitverantwortlich sind.

Die randomisiert-kontrollierte Studie

Die WHI-Studie ist eine randomisiert-kontrollierte Studie (RCT – Randomized Controlled Trial), sie wurde in den USA durchgeführt und ist nicht zuletzt aufgrund der Zahl an Studienteilnehmerinnen einzigartig. Im Arm 1 der Studie erhielten 8.102 Frauen eine Scheinmedikation (Placebo), ihnen wurden 8.506 Frauen gegenübergestellt, die eine Kombination aus konjugierten equinen Östrogenen (CEE) und mit Medroxyprogesteronacetat (MPA) einnahmen. Im Studienarm 2 standen 5.429 Frauen mit Placebo 5.310 Frauen mit CEE (ohne MPA) gegenüber.
Die WHI-Study ist die bisher größte und deshalb auch eine weitgehend bestimmende RCT zur HT. Randomisiert-kontrollierte Studien in der medizinischen Forschung sind aufgrund ihres „optimalen Studiendesigns“ geeignet, auf eine eindeutige Fragestellung eine eindeutige Antwort zu geben und eine Kausalität zu belegen. Deshalb wird auch vom „Gold-Standard“ einer Studienplanung bzw. des Forschungsdesigns gesprochen.
Nun, zwar gilt eine RCT in der medizinischen Forschung als bestes Studiendesign, gerade die WHI-Studie weist allerdings erhebliche Schwächen auf. Die in der WHI-Study untersuchte Population ist hoch selektiv, nur 4,5 % der Frauen erfüllten die Einschlusskriterien, so dass diese Studie mit Sicherheit nicht repräsentativ ist. Es wurden überwiegend Frauen eingeschlossen, die keiner HRT bedurft hätten, klimakterische Beschwerden waren Ausschlusskriterium. Im Übrigen betrug das durchschnittliche Alter bei Beginn der Studie 63,3 Jahre, nur 10 % der Frauen befanden sich im Arm der kombinierten HT in der relevanten Altersgruppe bis zum 54. Lebensjahr und weitere 20 % bis zum 59. Lebensjahr, im ET-Arm waren nur 50 % der Frauen im Alter zwischen 50 und 59 Jahren. Darüber hinaus litt die Studie darunter, dass ein großer Teil der Frauen die HT nicht regelmäßig einnahm – 42 % der Frauen im E/P-Arm, 54 % im E-Arm –, im Übrigen begannen 5 % bzw. 9,1 % der Frauen in den Placebogruppen eine HT.
Im Studienarm wurden aus unterschiedlichen Gründen rund 54 % der mit E/P- und 6 % der mit Placebo behandelten Frauen entblindet. Nicht zuletzt ist eine weitere Einschränkung darin zu sehen, dass die WHI-Study nicht mit einem heute üblichen Östrogen bzw. Gestagen durchgeführt wurde.
Zusammenfassend ist demnach festzustellen, dass das der WHI-Studie zugrundeliegende Studiendesign der medizinischen Forschung derzeit zwar als Goldstandard anzusehen ist, wobei auch die Zahl der Studienteilnehmerinnen für ein RCT sehr eindrucksvoll ist, jedoch aufgrund der oben angeführten Kritikpunkte durchaus Einschränkungen in der Aussagekraft der Studienergebnisse bestehen; die Wertigkeit der Studienergebnisse wurde in den letzten Jahren auch mehrfach von WHI-Studienautoren selbst relativiert.

Die Kohortenstudie

Bei der Million Women Study handelt es sich um eine prospektive, bevölkerungsbezogene Kohorentenstudie, sie war ein Gemeinschaftsprojekt der britischen Organisation Cancer Research UK und des staatlichen Gesundheitssystems Großbritanniens (NHS) und wurde zusätzlich vom britischen Medical Research Council finanziert. Sie ist weltweit die größte derartige Studie zu HT und Krebsrisiko.
Eine Kohortenstudie ist ein beobachtendes Studiendesign der Epidemiologie mit dem Ziel, einen Zusammenhang zwischen einer oder mehreren Expositionen und Auftreten einer Krankheit aufzudecken. Dabei wird eine Gruppe exponierter und eine Gruppe nichtexponierter Personen über einen bestimmten Zeitraum hinsichtlich des Auftretens der Krankheit (und der Sterblichkeit) beobachtet. Der Million Women Study lag eine sog. prospektive Studienanordnung mit langem Beobachtungszeitraum zugrunde. Es wurde ein Risikofaktor (in diesem Fall HT) retrospektiv (!) erfasst und die Kohorte über Jahre prospektiv (!) beobachtet. Für die Million Women Study wurden durch 66 NHS Breast Screening Centers in England und Schottland zwischen 1996 und 2001 insgesamt 1.084.110 Frauen im Alter zwischen 50 und 64 Jahren rekrutiert. Die Hälfte der Studienteilnehmerinnen hatte sich einer HT unterzogen. Es gibt allerdings eine Reihe unterschiedlicher Bias, die bei diesem Studiendesign entstehen können. So kann eine unterschiedliche Qualität der Information durch exponierte und nicht exponierte Probandinnen gegeben sein, ein weiteres Bias kann durch frühzeitiges Ausscheiden aus der Nachbeobachtung vorliegen, was die Interpretation der Studienergebnisse erheblich erschwert.

Die Metaanalyse

Aktuell hat die Collaborative Group on Hormonal Factors in Breast Cancer um die Oxford-Epidemiologin Valerie Beral (sie war auch bei der Million Women Study federführend) die Arbeit Type and timing of menopausal hormone therapy and breast cancer risk: individual participant meta-analysis of the worldwide epidemiological evidence veröffentlicht. Analysiert wurden in der Metaanalyse individuelle prospektive Daten aus 58 Studien mit 108.647 Frauen, die im mittleren Alter von 65 +/– 7 Jahre an Brustkrebs erkrankt waren. Von ihnen hatten sich 51 % einer HT unterzogen, mit Beginn im Alter von 50 +/– 6 Jahren. Die Dauer der Einnahme betrug 10 +/– 6 Jahre bei den aktuellen und 7 +/– 6 Jahre bei den früheren Anwenderinnen. Die in die Metaanalyse einbezogenen Publikationen waren zwischen 1992 und 2018 erschienen. Dazu ist generell anzumerken, dass eine Metaanalyse als eine Zusammenfassung von Primär-Untersuchungen versucht, diese Forschungsarbeiten quantitativ bzw. statistisch zusammenzufassen. Der Unterschied zur systematischen Übersichtsarbeit (Review) liegt darin, dass eine Review die früheren Forschungsdaten und Publikationen kritisch würdigt, während die Metaanalyse nur die quantitative und statistische Aufarbeitung der früheren Ergebnisse umfasst. Kritisiert werden Metaanalysen also aufgrund der Tatsache, weil jede beliebige Studie, unabhängig von ihrer methodischen Qualität, in die Metaanalyse eingehen kann. Allerdings gehört zu den Qualitätskriterien einer qualitativ hervorstechenden Metaanalyse, dass die inkooperierten Studien nach ihren methodischen Qualität gruppiert und separat ausgewertet werden. Tatsächlich wurde die vorliegende Metaanalyse umgehend und zwar interessanterweise von Autoren der WHI-Studie kritisiert, wobei nicht zuletzt angemerkt wird, dass sich Frauen unter HT öfter einem Mammografiescreening unterziehen und dabei entdeckte Mammakarzinome nicht selten eine Überdiagnostik mit konsekutiver Übertherapie darstellen.

Sehr geehrte Frau Kollegin, sehr geehrter Herr Kollege,

Medizin auf Basis belastbarer Daten zu betreiben ist eine zu befürwortende Forderung, wobei klinische Entscheidungen allerdings auf 3 Säulen beruhen sollten, nämlich auf den besten verfügbaren wissenschaftlichen Erkenntnissen, der klinischen Erfahrung des Arztes und den Präferenzen der Patientin. Erst alle 3 Säulen gemeinsam ergeben Evidenz-based Medicine (EBM). Und um wissenschaftliche Veröffentlichungen beurteilen zu können, ist es notwendig, die wichtigsten Arten von Studien zu kennen, da es im Einzelnen um die Hierarchie der Beweiskraft geht (Abb.). Für uns praktisch Tätige können die Ergebnisse wissenschaftlicher Publikationen eine gewisse Hilfestellung geben, sie sollten allerdings nicht überbewertet werden. Hilfreicher in der Bewertung von Nutzen und Risiken der HT in der Postmenopause wird sicherlich die ganz rezent von der DGGG gemeinsam mit 26 Fachgesellschaften (u. a. OEGGG und SGGG) erarbeitete S3-Leitlinie zur Peri- und Postmenopaus e-Diagnostik und Intervention sein, die in Kürze
erscheinen wird.

1WHI Writing Group, JAMA 2002; 288: 321–333
2Beral V. et al., Million Women Study Collaborators, Lancet 2003; 362: 419–427
3Beral V. et al. for the Collaborative Group on Hormonal Factors in Breast Cancer, Lancet 2019; 394 (10204): 1159–1168