Manchmal wiederholen sich die Zeiten doch. Am 4. Oktober 2011 veröffentlichte der G-BA die erste Dossierbewertung im damals neuen AMNOG-Verfahren: Ticagrelor. Die deutsche Arzneimittelwelt starrte damals auf eine Website, die bis dahin vermutlich nicht zu den meistbesuchten Orten des Internets gehörte. Schon am frühen Morgen gingen die ersten Anfragen ein. [1]
Fast 15 Jahre später wiederholt sich die Szene, nur mit europäischem Bühnenbild. Die erste europäische Nutzenbewertung, das erste Joint Clinical Assessment, kurz JCA, ist veröffentlicht. In Zeiten von LinkedIn ist es nahezu unmöglich, so etwas zu verpassen. Kaum war der Bericht online, häuften sich die ersten Analysen und Kritiken. Das war bemerkenswert – schon deshalb, weil dieses erste JCA nicht gerade ein Haiku ist, das man mit einem Blick erfassen kann. Es ist eher die Art von Dokument, bei der man sich einzelne Seiten ausdruckt, um zumindest physisch das Gefühl des Begreifens zu haben. [2]
Damals Ticagrelor, heute Tovorafenib
Die Parallele zwischen AMNOG 2011 und EU-HTA 2026 liegt auf der Hand: ein neues Verfahren, ein erstes Produkt, große Aufmerksamkeit, viele Teilfragestellungen. Inhaltlich aber könnten die Ausgangslagen kaum unterschiedlicher sein.
Bei Ticagrelor stand eine große randomisierte Studie im Hintergrund. Für eine der vier Teilpopulationen sah das IQWiG damals einen beträchtlichen Zusatznutzen. [1]
Bei Tovorafenib sieht die Welt anders aus. Bewertet wird ein Arzneimittel für Kinder mit seltenen Hirntumoren. Die Evidenzbasis besteht im Wesentlichen aus einarmigen Studiendaten und indirekten Vergleichen. Im JCA wurden acht Fragen gestellt; befriedigende Antworten (robuste vergleichende Aussagen) waren aber nur sehr eingeschränkt möglich. Genau an dieser Stelle wiederholt sich die Debatte, die aus dem AMNOG bekannt ist und das EU-HTA-Verfahren vermutlich noch lange begleiten wird. [2]
PICO: die Kunst der Entscheidungsfrage
PICO steht für Population, Intervention, Comparator und Outcome – also für das Schema, nach dem eine Bewertungsfrage strukturiert wird. Auf Deutsch bedeutet das: Welche Probanden werden herangezogen? Welche therapeutische Maßnahme wird untersucht? Welche (andere) Therapie dient zum Vergleich? Womit wird der Erfolg gemessen? Die Logik der PICO – Festlegung ist im europäischen Recht (hier: Scoping-Prozess) angelegt. [3, 4] Seit geraumer Zeit wird bereits diskutiert, ob die „PICO-Fragen“ realistisch beantwortet werden können. [5–8] Mit dem ersten JCA hat diese Diskussion nun ihr konkretes Anschauungsmaterial bekommen: acht Fragen in einer seltenen pädiatrischen Indikation und die Bewertung nur eines Teiles der vorgelegten Nachweise.
Manche Reaktionen lesen sich fast wie eine Anklageschrift: Die Anforderungen der europäischen Nutzenbewertung seien nicht erfüllbar, das System nehme keine Rücksicht auf seltene Erkrankungen und produziere Fragen, auf die es keine Antworten gebe. Die Heftigkeit mancher Empörung überzeugt nicht. Denn was wäre die Alternative? Sollte die HTA-Koordinierungsgruppe zunächst eine systematische Literaturrecherche durchführen und anschließend nur noch solche Fragen stellen, die mit der vorhandenen Evidenz bequem beantwortbar sind?
Ein HTA-Verfahren ist kein Marketingtool für pharmazeutische Produkte, keine Zulassungsentscheidung und keine klinische Leitlinie. Es soll die Grundlage für Entscheidungen der Gesundheitssysteme liefern. Die Mitgliedstaaten definieren die für ihr System relevanten Fragestellungen: „Was müssen wir wissen, um Versorgung, Erstattung und Einsatz eines Arzneimittels verantwortbar zu beurteilen?“ Anschließend wird geprüft, welche Evidenz darauf antworten kann. Nicht umgekehrt. Die Frage darf nicht erst so formuliert werden, dass sie möglichst gut zu der Antwort passt, die die vorhandenen Studien vermeintlich geben.
Erklärung tut Not
Die europäische HTA-Verordnung verlangt, dass die Mitgliedstaaten ihre (oft verschiedenen) Entscheidungsbedarfe einbringen sollen. Und ja: Das JCA muss alle diese unterschiedlichen Bedarfe abbilden, damit die Mitgliedstaaten den Bericht in ihren nationalen Verfahren berücksichtigen können. Eine gewisse Vielfalt der Fragen ist also unvermeidlich. Trotzdem muss ein Verfahren, das für ganz Europa Akzeptanz beansprucht, auch noch irgendwie erklärbar sein. [3] Das ist nicht immer einfach.
Bei Tovorafenib unterscheiden sich beispielsweise einzelne Fragen nur marginal (im Wirkstoffpool für die patientenindividuelle Therapie). Aus dem System heraus kann man das erklären: Jeder Mitgliedstaat hat das Recht, seine Entscheidungsfrage in das europäische HTA-Verfahren einzubringen. Kein Land lässt sich vorschreiben, was die bessere Frage gewesen wäre. Hinzu kommt, dass ein Mitgliedstaat sein HTA-PICO i.d.R. auch im nationalen Verfahren nutzen möchte. Man kann also nicht nach Belieben Fragen modifizieren, nur damit sie für das europäische Verfahren eleganter wirken.
Versucht man allerdings, diese Logik einer mit dem Verfahren nicht vertrauten Person zu erklären, kann man das innere Augenklimpern des Gegenübers fast hören. Ein bisschen wie bei der „Sendung mit der Maus“ – nur dass am Ende niemand trötend davonstapft, sondern alle mit der Frage zurückbleiben, ob eine systemkonforme Erklärung auch schon eine überzeugende Erklärung ist. Das europäische HTA-System sollte sich deshalb nicht hinter dem Hinweis verstecken: „So steht es eben im Gesetz.“ Die Koordinierungsgruppe muss erklären können, warum Populationen abgegrenzt werden und warum bestimmte Komparatoren aufgenommen werden – ohne die Fragen zwingend einzelnen Mitgliedstaaten zuzuordnen. Im ersten JCA werden die PICOs und die Evidenzlücken transparent dokumentiert. Eine konkrete Herleitung, warum genau diese PICO-Abgrenzungen in dieser Form gewählt wurden, findet sich jedoch nur begrenzt. [2] Das ist unbefriedigend. Eine nachvollziehbare Herleitung wäre weit mehr als eine PR-Maßnahme. Man muss das Verfahren nicht jedem schmackhaft machen und so tun, als sei methodische Stringenz nur ein Kommunikationsproblem. Aber ein Verfahren, das auf Akzeptanz angewiesen ist, muss seine eigene Logik nachvollziehbar machen und auch Augenmaß walten lassen.
Vom zVT-Schock zum PICO-Schock
Ein gewisses Restrisiko wird jedoch immer bleiben. Das AMNOG hat über die Jahre eine gewisse Vorhersagbarkeit entwickelt. Es gibt Kriterien für die Festlegung der zweckmäßigen Vergleichstherapie (zVT) und es gibt Beratungen. Und trotzdem gibt es ab und an den zVT-Schock: den Moment, in dem Unternehmen feststellen, dass die zweckmäßige Vergleichstherapie anders formuliert wurde als erwartet, andere Patientenpopulationen abgegrenzt oder Gruppen anders zusammengefasst wurden. Manchmal ist diese Überraschung berechtigt, manchmal hätte man sie kommen sehen können, und manchmal bleibt auch nach längerem Nachdenken die Frage: Warum eigentlich genau so?
Bei EU-HTA ist das anders. Die „PICO-Prediction“ ist anspruchsvoll. Unternehmen investieren in aufwendige PICO-Simulationen, analysieren nationale Leitlinien, HTA-Praxen und erstellen Szenarien. Und dennoch können auch hier bei den vorgegebenen Vergleichstherapien (im „Komparatorenpool“) Wirkstoffe auftauchen, die kaum jemand erwartet hatte. Ebenso sind Patientenpopulationen nicht immer vorhersehbar: Mal wird zusammengeführt, mal aufgeteilt, mal entsteht aus einer Indikation eine PICO-Landschaft.
Die richtige Frage – aber verständlich
Kritik ist daher berechtigt und sollte genutzt werden für die Frage: Findet das JCA die richtige Balance? Es geht nicht darum, unbequeme Fragen zu vermeiden. Es geht schon gar nicht darum, Evidenzlücken wie Schönheitsfehler aussehen zu lassen. Evidenzlücken bleiben Evidenzlücken. Und gerade bei teuren neuen Arzneimitteln darf ein Gesundheitssystem wissen wollen, ob der behauptete Nutzen im Vergleich zu relevanten Alternativen oder dem aktuellen Therapiegeschehen tatsächlich trägt. Übrigens ganz besonders bei Orphan Drugs.
HTA-Verfahren dienen der gesamten Gesellschaft. Sie hat Anspruch darauf, dass neue Therapien fair bewertet, Ressourcen verantwortungsvoll eingesetzt und eine gute Arzneimittelversorgung sichergestellt werden. Gerade deshalb reicht es nicht, komplexe Anforderungen nur mit methodischen Zwängen oder juristischen Formeln zu begründen. Die gesellschaftliche Legitimation wird dadurch nicht stärker. Die Öffentlichkeit darf erwarten, dass die großen Linien erklärbar sind – und dass das Verfahren fair ist: gegenüber den Bewertenden ebenso wie gegenüber den Bewerteten.
Die europäischen Assessoren und Co-Assessoren müssen unter hohem Zeitdruck ein neues Verfahren zum Laufen bringen, das politisch mit Erwartungen überfrachtet ist. Dabei ist Transparenz unabdingbar – wie sie im AMNOG seit über einem Jahrzehnt praktiziert wird. Und Fairness gilt auch gegenüber den pharmazeutischen Unternehmen. Sie haben Anspruch auf Vorhersehbarkeit und ein effizientes Verfahren. Fragen, die niemand ahnen konnte, lösen keine Begeisterung aus, wie auch die dazu geforderten Zusatzanalysen. Die Attraktivität des europäischen Marktes sollte nicht unnötig gefährdet werden. Es braucht eine Balance.
Fazit: Nicht jede unbeantwortete Frage ist ein Systemversagen
Das erste JCA zeigt: Das Verfahren ist grundsätzlich arbeitsfähig. Die Methoden, die sich die Koordinierungsgruppe gegeben hat, sind in der Praxis anwendbar. Gleichzeitig ließ die Evidenz in diesem ersten Verfahren kaum ein befriedigendes Ergebnis erwarten. Einarmige Studien erlauben in einem HTA-Verfahren nur sehr selten robuste vergleichende Schlussfolgerungen. Ein JCA-Bericht, der vor allem die Unsicherheiten der vorgelegten Nachweise analysiert, war daher absehbar. Mit einer besseren Studienlage hätte sich manches vermeiden lassen.
In Deutschland hat inzwischen die Orphan-Drug-Bewertung von Tovorafenib begonnen; das von Deutschland eingebrachte PICO hat für dieses Verfahren vorerst keine unmittelbare Bedeutung (weil der Zusatznutzen bei Orphan Drugs anfangs gesetzlich garantiert ist). Dennoch ist das erste JCA mehr als ein Dokument mit vielen unbeantworteten Fragen. Es ist ein Stresstest. Und es ist eine Evidenzlandkarte für das Anwendungsgebiet. Für die einzelnen Fragestellungen wurde die vorhandene Evidenz recherchiert und eingeordnet. Das ist eine wertvolle Erkenntnis – auch wenn die JCA nicht die erwarteten Antworten liefern konnte.
Das AMNOG hat nach seinem Start viele Schleifen gedreht. EU-HTA wird das auch müssen. Die erste europäische Nutzenbewertung sollte deshalb nicht zerredet werden. Sie sollte ernst genommen werden – als Auftakt zu einem Verfahren, das nur dann dauerhaft Akzeptanz finden wird, wenn es streng bleibt, aber erklärbar.
Kurz gesagt: Nicht jede unbeantwortete PICO-Frage ist ein Skandal. Aber jede schwer erklärbare PICO-Frage ist ein Auftrag an die Fragestellenden zur Nacharbeit.
Literatur: