Metaforschung sucht blinde Flecken in der Forschung
Gegen die Ansichten von Herrn Werndli anzukommen, ist gar nicht so leicht. Um sie zu verteidigen, bezieht er sich auf hypothetische Welten, die nur er kennt. Seine Überzeugung: Wenn sich die biomedizinische Forschung auf tierversuchsfreie Methoden gestützt hätte, wäre unsere Medizin viel besser. Um diese Aussage zu testen, müssten wir den Verlauf der Wissenschaftsgeschichte ändern – was nicht geht. Ganz nach dem Liedchen «Wenn das Wörtchen ‘wenn’ nicht wär', wär ich schon längst Millionär.»
Herr Werndli stützt seine Ansichten aber auch mit Verweis auf die Metaforschung. Metaforschung heisst: Forschung über Forschung. Solche Forschungsprojekte nehmen die Vogelperspektive ein und untersuchen die wissenschaftliche Praxis selbst. Das erklärte Ziel der Metaforschung ist es, die Wissenschaft zu verbessern; sie noch verlässlicher, noch vertrauenswürdiger und effizienter zu machen. Metaforschung ist damit eine der wichtigsten Innovationen der jüngeren Wissenschaftsgeschichte.
Hat die Metaforschung gezeigt, dass Tierversuche unnütz sind? Unter den achtzig Studien, auf die Herr Werndli verweist, gibt es einige Meinungsartikel und viele Studien, die nur sehr indirekt etwas über den Nutzen von Tierversuchen aussagen. Letztere zeigen unter anderem methodische Mängel von Versuchsdesigns auf oder finden Faktoren, welche die Versuchsergebnisse beeinflussen könnten. Beispielsweise hat eine Studie von 2014 einer kanadischen Forschungsgruppe festgestellt, dass sich das Schmerzverhalten von Mäusen und Ratten anders äussert, je nachdem ob die Forschenden, die im Labor mit den Tieren arbeiten, Frauen oder Männer sind. Solche Studien liefern wichtige Erkenntnisse, worauf bei Versuchen mit Tieren zu achten ist oder wie Versuche zu verbessern sind. Sie sagen uns aber nichts über den generellen Nutzen der Methode.
Zudem sind blinde Flecken in der Forschungspraxis genau das, wonach die Metaforschung sucht. Es sollte uns nicht beunruhigen, wenn sie dabei fündig wird. Statt solche Forschungsergebnisse für Verbotspolitik zu missbrauchen, sollten wir uns dafür einsetzen, dass sie möglichst schnell in die wissenschaftliche Ausbildung und Praxis zurückfliessen. Wir riskieren sonst, dass diese wichtigen Erkenntnisse aus Furcht vor politischen Konsequenzen in der Schublade landen. Damit ist weder der Wissenschaft noch den Tieren gedient.
Eine Handvoll der Metastudien aus Herrn Werndlis Sammlung ist hingegen hochrelevant für die Debatte. Über diese Studien sollten wir reden: Sie untersuchen, ob Tierversuche gute Modelle zur Vorhersage der Wirkungen von Arzneimitteln sind. Auch diesen Studien geht es nicht um den allgemeinen Nutzen von Tierversuchen, sondern spezifisch um ihren Einsatz in der Arzneimittelentwicklung. Sie stellen realistische Erwartungen an Tierversuche, liefern empirische Beweise für ihre Behauptungen und haben auch der wissenschaftlichen Prüfung durch Peers standgehalten. Damit sind sie den gängigen Argumenten beider politischer Lager einen wichtigen Schritt voraus.
Die Politik stellt triviale oder irreale Ansprüche an Tierversuche
Die politische Debatte wird nur absolut geführt: Tierversuche sind entweder nützlich - oder sie sind es nicht. Um diesen absoluten Anspruch verteidigen zu können, werden unrealistische oder triviale Erwartungen an Tierversuche gestellt. Um jedoch zu rechtfertigen, dass Tierversuche in der Arzneimittelentwicklung international verpflichtender Standard sind, reichen Anekdoten, historische Argumente und triviale Nutzensbegriffe schlichtweg nicht aus. Auch das ist der Wissenschaft und den Versuchstieren unwürdig.
So hört man beispielsweise oft: ‘So gut wie alle heute verfügbaren Arzneimittel wurden mittels Tierversuchen hergestellt. Damit ist der Nutzen von Tierversuchen unbestritten.’ Diese Position ist höchstens «unbestritten» weil sie fast triviale Erwartungen an den Nutzen von Tierversuchen stellt. Dieselbe Argumentation würde niemanden überzeugen, würden wir beispielsweise den Nutzen eines Airbags nachweisen wollen. Damit Airbags zum internationalen Standard in der Fahrzeugentwicklung erhoben werden, wollen wir nicht bloss wissen, dass alle Überlebenden in Autos mit Airbags überlebten. Wir wollen vielmehr wissen, wie viele Unfallopfer trotz Airbag umgekommen sind. Wird von Anfang an nur auf jene Fälle geschaut, in denen Tierversuche nützlich waren, verzerren wir unseren Blick.
Statt bloss auf die erfolgreichen Tierversuche, könnten wir auf alle Tierversuche blicken und fragen: Wie viele davon waren nützlich? Dann stellt man beispielsweise Folgendes fest: Nur wenige Prozent aller Arzneimittelkandidaten, die an Tieren getestet wurden, resultieren in einer Marktzulassung. Für die Kritiker zeigt sich daran, dass sehr viele Tierversuche durchgeführt werden, ohne dass daraus ein Nutzen für den Menschen entsteht - schliesslich folgt aus dem Versuch keine Therapie. Dieses Argument stellt jedoch einen unrealistischen Anspruch an Tierversuche, welcher die Komplexität der biomedizinischen Forschung und der Arzneimittelentwicklung verkennt.
Interessanterweise nehmen Befürworter dieselben Zahlen und drehen den Spiess um. Aus ihrer Sicht spricht die hohe Rate an Arzneimittelkandidaten, die nach Tierversuchen nicht weiterverfolgt werden, gerade für Tierversuche. Unser Airbag-Vergleich zeigt warum: Wenn ein Airbag einen Qualitätstest nicht besteht und deshalb nicht auf den Markt kommt, ist nicht der Qualitätstest das Problem, sondern der mangelhafte Airbag. ‘Tierversuchen sei Dank’, argumentieren also die Befürworter, ‘kommen all diese mangelhaften Substanzen nie auf den Markt’. Doch auch die Befürworter liefern damit keine Argumente für den Nutzen von Tierversuchen. Sie ruhen sich lediglich auf ihrer eigenen Überzeugung aus, dass Tierversuche zuverlässig sind.
Was die Wissenschaft von Tiermodellen erwartet
Was die politische Debatte oft übergeht: Tiermodelle werden in der biomedizinischen Forschung zu unterschiedlichen Zwecken eingesetzt. Am prominentesten ist eine Unterscheidung zwischen Versuchen mit Tieren, mit denen Hypothesen gewonnen werden und Forschung, die Tiere nutzt, um Vorhersagen über den Menschen zu machen. Dass Tiermodelle nützlich sind, um fruchtvolle Hypothesen zu generieren, kann durch historische Fallbeispiele aufgezeigt werden, in denen Tiermodelle zu bahnbrechenden neuen Erkenntnissen geführt haben. Und diese sind zahlreich. Stellvertretend sei hier nur die Entdeckung genannt, dass die DNA unser Erbmaterial ist. Interessanterweise erfährt die Grundlagenforschung ungleich mehr politischen Rechtfertigungsdruck für die Forschung mit Tieren als die angewandte Forschung. Dabei ist es weitaus eindeutiger, dass Tiermodelle in der Grundlagenforschung ihren Zweck erfüllen: nämlich fruchtvolle Hypothesen zu generieren, die zur wissenschaftlichen Erkenntnis beitragen. Politisch kritisiert wird hier denn nicht, dass die Methode ihren Zweck nicht erfüllt, sondern dass dieser Zweck nicht in jedem Fall genügend wertvoll ist, um das Leiden von Tieren zu rechtfertigen.
Bei der Arzneimittelentwicklung ist es umgekehrt. Hier erfüllen Tiermodelle die wichtige Funktion, Wirkungen und Nebenwirkungen für den Menschen vorherzusagen. Ethiker:innen sind sich grundsätzlich einig, dass dieser Zweck das Leid von Tieren rechtfertigen kann. Hingegen ist weniger augenfällig, wie gut Tiermodelle den Zweck der Vorhersage tatsächlich erfüllen. Zur Klärung können weder positive noch negative Fallbeispiele weiterhelfen. Ein Orakel kann nicht hellsehen, weil es ab und zu richtig liegt und Wettervorhersagen sind nicht nutzlos, weil sie sich manchmal irren. Es ist unerlässlich, die Erfolgs- und Fehlerquoten von Vorhersagemodellen systematisch zu messen, umzu entscheiden, ob wir auf sie hören sollten.
Um eine Methode zu testen, vergleicht man sie gewöhnlich mit einer anderen, deren Zuverlässigkeit man gut kennt – ein «Goldstandard». Die Schwierigkeit ist, dass Tierversuche in der präklinischen Arzneimittelentwicklung selbst der Goldstandard sind. Darum werden beispielsweise alternative Methoden in der präklinischen Forschung an Tierversuchen validiert, ehe sie zum Einsatz kommen. Wer nun grundsätzlichen Zweifel an Tierversuchen sät, hebt quasi eine Tür aus der Angel, dank der die Wissenschaft sich dreht. Ein Rückgriff auf übergeordnete Theorien, wie beispielsweise die Evolutionstheorie, kann die Tür zwar wieder einrenken, doch systematisch nachweisen, wie gut Tiermodelle Wirkungen und Nebenwirkungen für den Menschen tatsächlich vorhersagen, können wir damit nicht. Und bei dieser Frage landen wir endlich bei den Metastudien.
Was nützt Metaforschung?
Einige besonders interessante Metastudien unternehmen genau solche systematischen Untersuchungen der Vorhersagekraft von Tiermodellen für den Menschen. Wo dies möglich ist, werden Resultate aus Tierversuchen systematisch mit Resultaten aus klinischen Studien mit Menschen oder aus der Marktüberwachung von Arzneimitteln verglichen. Dabei wird analysiert, wie gross die Übereinstimmung von Wirkungen und Nebenwirkungen ist. Allerdings unterscheiden sich diese Studien an wesentlichen Punkten und kommen nicht zuletzt deshalb zu unterschiedlichen Resultaten.
Eine Studie, die 2012 im Journal für Regulatory Toxicology and Pharmacology erschien, sammelte Meldungen zu Nebenwirkungen, die nach der Marktzulassung publiziert wurden und verglich diese mit Daten zu den Tierversuchen aus den entsprechenden Zulassungsdossiers. Sie fanden 43 Arzneimittel mit 93 verschiedenen Meldungen zu Nebenwirkungen und analysierten, in wie vielen Fällen die Meldung durch Daten aus Tierversuchen korrekt vorhergesagt wurde. Die Autoren kommen zum Schluss, dass dies nur in 19% der Meldungen der Fall war. Eine ähnlich aufgebaute Studie aus dem Jahr 2000, die im gleichen Journal publiziert wurde, stimmt hingegen optimistischer. Hier suchten die Autoren nach Substanzen, die bereits bei klinischen Versuchen zu relevanten Nebenwirkungen geführt hatten, aufgrund derer das Versuchsprotokoll angepasst werden musste. Beispielsweise wurde die Dosierung geändert oder die Studie gar abgebrochen. Sie untersuchten 221 solcher Nebenwirkungen von 150 verschiedenen Arzneimitteln und kommen zum Schluss, dass 71% der Nebenwirkungen auch in Tierversuchen aufgetreten sind.
Ein wichtiger Unterschied der beiden Studien liegt darin, welche Fälle als erfolgreiche Vorhersage beurteilt wurden und welche nicht. Die optimistische Schätzung der Studie von 2000 haben all jene Funde als erfolgreiche Vorhersage gewertet, bei denen dasselbe Körpersystem betroffen war, beispielsweise das zentrale Nervensystem. Hingegen zählte die pessimistische Schätzung von 2012 nur jene Funde als erfolgreiche Vorhersage, bei denen dasselbe Körpersystem betroffen war und klar war, dass die Nebenwirkung über denselben kausalen Weg verursacht wurde. Die Autoren der pessimistischen Schätzung schreiben selbst, dass es sich bei ihren Kriterien um eine strikte Wahl handelt und kritisieren explizit die «zu laschen» Kriterien der früheren Studie. Die unterschiedliche Wahl der Kriterien erklärt teilweise die unterschiedlichen Resultate.
Eine Schwierigkeit, mit der alle Metastudien umgehen müssen, ist eine grosse Datenlücke. Denn bei einer grossen Mehrheit der Substanzen ist die Vorhersage für den Menschen derart negativ, dass sie gar nie im Menschen getestet wird. Solange wir nur ein minimales Vertrauen in Tierversuche haben, ist das natürlich absolut rational. Dennoch haben wir in dem Fall keine Möglichkeit, die genaue Erfolgsquote der Vorhersagen zu messen. Diese Datenlücke können auch Metastudien unterschiedlich interpretieren, wie das letzte Beispiel zeigt. Im Journal American Medical Association (JAMA) veröffentlichten zwei Forschende im Jahr 2006 eine Studie, welche die erwünschten Wirkungen in Tierversuchen und klinischen Studien verglich. Dazu suchten die Autoren Studien, die ein Arzneimittel an Tieren testeten und verglichen, ob die Resultate in klinischen Studien mit Menschen reproduziert werden konnten. Ihre Suchkriterien lieferten ihnen 76 relevante Studien mit Tierversuchen, zu denen lediglich 42 äquivalente Studien am Menschen veröffentlicht wurden. In 28 Fällen fanden die Autoren ähnliche Resultate in Tier und Mensch und in 14 Fällen fanden sie widersprüchliche Resultate. Die Autoren schliessen daraus, dass 37% der Versuche an Tieren erfolgreich im Menschen reproduziert wurden. Das ist zwar korrekt, kann aber irreführend sein. Es ist korrekt, da die Studie die Datenlücke separat ausweist: Sie unterscheidet zwischen Studien, die «erfolgreich reproduziert» wurden (37%), Studien, die «nicht erfolgreich reproduziert» wurden (18%) und Studien, die schlicht «nicht reproduziert» wurden und dies ist mit 45% die grosse Mehrheit. Diese Rechnung ist jedoch irreführend, wenn die Datenlücke in der Weiterverwendung der Zahlen vergessen wird. Um dem Missverständnis vorzubeugen, müsste man die Erfolgsrate nur aufgrund jener Studien berechnen, bei denen überhaupt versucht wurde, die Resultate am Menschen zu reproduzieren. Der Faktencheck von Reatch macht genau das und rechnet vor, dass die Erfolgsrate dann 67% beträgt, die Misserfolgsrate hingegen 33%.
Die Lehren der Metaforschung
Aus der historischen Perspektive ist der Nutzen von Tierversuchen beinahe selbstevident - haben sie doch in der Entwicklung unserer Medizin eine zentrale Rolle gespielt. Dennoch reicht diese Perspektive nicht, um zu rechtfertigen, dass Tiermodelle ein international verpflichtender Standard in der Arzneimittelentwicklung bleiben sollen. Es müssen bessere Argumente her. Die Initiantinnen machen hier einen wichtigen Punkt, indem sie relevante empirische Forschung zu dieser Frage ins Feld führen. Diese Metaforschung zeigt zwar nicht, dass Tierversuche unnütz sind, aber sie zeigt auch nicht, dass blinder Optimismus gerechtfertigt ist.
Die richtige Metaforschung ist ein wichtiges Instrument, um unsere Erwartungen an Tierversuche zu präzisieren und empirisch zu messen, ob diese erfüllt werden. Damit sind diese Studien den gängigen politischen Argumenten einen wichtigen Schritt voraus. Dennoch ist diese Forschung nicht in der Lage, die politische Kontroverse im Alleingang zu lösen: Es gibt ganz einfach mehr als eine Möglichkeit, diese schwierige Frage wissenschaftlich zu beantworten. Die Metastudien sind nicht befreit von ihrem gesellschaftlichen Kontext und nicht immun gegen die politischen Werte der Forschenden – nicht zuletzt deshalb kommen sie zu sehr unterschiedlichen Resultaten. Zudem beantworten Metastudien immer nur ganz spezifische Fragen. Diese zu einem allgemeinen Urteil über Tierversuche zu aggregieren, geht weit über das hinaus, was die Metaforschung allein leisten kann – das ändert sich auch nicht, wenn man die Zahl der Studien addiert und in einem PDF sammelt.
Das bedeutet nicht, dass man den Nutzen von Tierversuchen überhaupt
nicht wissenschaftlich messen kann oder all diese Studien
unwissenschaftlich sind. Aber es bedeutet, dass wir uns zuerst einigen
müssen, wie wir den Nutzen von Tierversuchen messen wollen und vor allem
mit welchen Ergebnissen wir uns zufriedengeben. Dazu müssen die
politische und die wissenschaftliche Debatte in einen konstruktiven
Austausch treten.
In der Welt, die wir alle kennen, dürfen uns die Erfolge der Vergangenheit durchaus optimistisch stimmen. Doch soll uns das nicht davon abhalten, aus der Vogelperspektive auf unser Tun zu schauen und kritisch zu fragen, ob wir das, was wir heute tun, nicht morgen besser machen können. Sobald sich die Gemüter nach dem 13. Februar beruhigt haben, wäre es eine gute Gelegenheit, die kritische Auseinandersetzung mit den Erkenntnissen der Metaforschung nachzuholen - dies ist die Wissenschaft den Tieren, Menschen und auch sich selbst schuldig.
Die Beiträge auf dem Reatch-Blog geben die persönliche Meinung der Autor*innen wieder und entsprechen nicht zwingend derjenigen von Reatch oder seiner Mitglieder.
Comments (0)