17 Übersichtsstudien

Inhalte

Das Kapitel setzt voraus, dass Sie den Artikel zu den PRISMA-Kriterien (Page et al. 2021) gelesen haben und mit den PRISMA-Kriterien (ausgenommen Item 13 und 14) vertraut sind. Auf PRISMA wird in diesem Kaptiel nicht eingegangen. Stattdessen werden die folgenden Themen abgedeckt:

Überblick zu Übersichtsarbeiten
Meta-Analysen
- Forest-Plots
Guidelines

17.1 Einleitung

Die kontinuierlich wachsende Zahl wissenschaftlicher Publikationen im Gesundheitswesen stellt Fachpersonen vor die Herausforderung, relevante Evidenz zu identifizieren, zu bewerten und in den klinischen Entscheidungsprozess zu integrieren. Einzelne Primärstudien liefern wichtige Erkenntnisse, sind jedoch häufig durch begrenzte Stichprobengrössen, methodische Einschränkungen oder spezifische Kontexte geprägt. Um den Gesamtstand der Evidenz strukturiert abzubilden und die Aussagekraft einzelner Studien zu überprüfen, haben sich verschiedene Formen von Übersichtsarbeiten etabliert.

Übersichtsarbeiten dienen nicht nur der Synthese vorhandener Forschung, sondern auch der Identifikation von Wissenslücken und der Ableitung zukünftiger Forschungsfragen. Je nach methodischem Vorgehen und Erkenntnisinteresse lassen sich unterschiedliche Formate unterscheiden: Systematische Reviews stellen die methodisch strengste Form dar und beantworten eine präzise formulierte Fragestellung auf Grundlage einer umfassenden und transparenten Literatursuche. Meta-Analysen gehen darüber hinaus, indem sie die Ergebnisse mehrerer Studien quantitativ zusammenführen, um die Genauigkeit der Schätzung von Effektgrössen zu erhöhen. Scoping Reviews und Umbrella Reviews bieten eine breitere Perspektive: Während Scoping Reviews die Forschungslandschaft kartieren und Themenfelder strukturieren, fassen Umbrella Reviews die Ergebnisse mehrerer systematischer Reviews zusammen. Daneben existieren Evidence Summaries, die in komprimierter Form Kernaussagen zu einem Themengebiet bereitstellen, sowie klinische Leitlinien (Guidelines), die Evidenz in praxisorientierte Empfehlungen übersetzen und zusätzlich Aspekte wie Umsetzbarkeit und Patientenperspektiven berücksichtigen.

Vor diesem Hintergrund kommen Übersichtsarbeiten eine zentrale Rolle in der evidenzbasierten Gesundheitsversorgung zu. Sie ermöglichen eine effiziente Orientierung im Forschungsstand, fördern die Qualität klinischer Entscheidungsfindung und tragen damit wesentlich zur Optimierung der Patientenversorgung bei.

Lernziele

Die Studierenden …

können Guidelines von systematischen Reviews und Meta-Analysen unterschieden und erklären deren grundlegende Ziele.
können die Struktur systematischer Reviews unter Anwendung der PRISMA-Kriterien beschreiben.
können die Qualität systematischer Reviews kritisch mithilfe der PRISMA-Kriterien beurteilen.
können erklären, wie Publication Bias entsteht und welche Strategien in der Forschung angewendet werden, um diesem zu begegnen.
können die Ergebnisse in einem Forest-Plot, für rohe und standardisierte Mittelwertsdifferenzen sowie Risk Ratios und Odds Ratios interpretieren.
können zwischen rohen Mittelwertdifferenzen und standardisierten Mittelwertdifferenzen unterscheiden, ohne Berechnungen durchzuführen, und interpretieren diese korrekt.
können für eine Literatursynthese das angemessene «Level of Evidence» und den «Grade of Recommendation» anhand der Kriterien des Oxford Centre for Evidence-Based Medicine ableiten, z.B. für Evidence Summaries.

17.2 Übersichtsstudie \(\ne\) Übersichtsstudie

Wie Sie der Einleitung schon entnommen haben, gibt es unterschiedliche Typen von Übersichtsstudien. Ich versuche hier, etwas Ordnung zu schaffen, was die verschiedenen Typen von Übersichtstudien angeht.

Abbildung 17.1: Übersicht zu Review-Typen

Abbildung 17.1 veranschaulicht den Prozess der Evidenzaufbereitung von der Primärliteratur bis hin zu praxisorientierten Empfehlungen. Im ersten Schritt wird auf die Primärliteratur verwiesen, die aus unterschiedlichen Studiendesigns besteht, darunter RCTs, Kohorten- und Fallkontrollstudien, Querschnitts- und Fallstudien sowie qualitative Forschungsansätze. Diese Primärstudien bilden die Grundlage für die wissenschaftliche Evidenz, sind jedoch in ihrer Aussagekraft häufig durch Kontextabhängigkeit und methodische Limitationen eingeschränkt.

Im zweiten Schritt werden die verschiedenen Formen von Übersichtsarbeiten dargestellt, die vorhandene Primärliteratur systematisch oder narrativ bündeln. Dazu zählen methodisch strenge Formate wie systematische Reviews und Meta-Analysen, aber auch stärker explorative Ansätze wie Narrative Reviews, Scoping Reviews (Explorieren der Forschungslandschaft, Identifikation von Themenfelder) und Umbrella Reviews (Review von Reviews). Wenn immer möglich sind systematische Übersichten (syst. Reviews, Meta-Analysen) zu bevorzugen. Diese Arbeiten tragen wesentlich dazu bei, den Forschungsstand zu strukturieren, Wissenslücken zu identifizieren und die Robustheit der Evidenz zu erhöhen.

Der dritte Schritt zeigt die Übersetzung dieser Evidenz in konkrete Empfehlungen. Hierzu gehören insbesondere Leitlinien, die Forschungsergebnisse in praxisnahe Handlungsanweisungen überführen, sowie Evidence Summaries, die wesentliche Erkenntnisse kompakt und anwendungsorientiert zusammenfassen.

Insgesamt verdeutlicht die Abbildung die Hierarchisierung von Evidenz: Während Primärstudien die Basis wissenschaftlicher Erkenntnis darstellen, liefern Übersichtsarbeiten eine strukturierte Synthese, auf deren Grundlage evidenzbasierte Empfehlungen für die klinische Praxis entwickelt werden können.

Die folgenden Referenzen sind ein guter Startpunkt, um sich detaillierter mit den verschiedenen Typen von Übersichtsarbeiten auseinanderzusetzen:

Umbrella Review (Choi and Kang 2022)
Scoping Review (Munn et al. 2018)
Meta-Analyse (Taeymans, Schmid, and Hilfiker 2011)
Guidelines (Guerra-Farfan et al. 2023)
Evidence Summaries (Khangura et al. 2012)
Systematische Reviews (Page et al. 2021)

17.2.1 Detailgrad der Fragestellung

Welche Art von Übersichtsarbeit in welcher Situation geeignet ist, hängt zu einem grossen Teil von der Fragestellung ab.

Abbildung 17.2: Detailgrad der Fragestellung bei verschiednen Typen von Übersichtsstudien

Abbildung 17.2 verdeutlicht den Zusammenhang zwischen dem Detaillierungsgrad der Fragestellung und dem jeweils angemessenen Reviewtyp. Je spezifischer und präziser die Forschungsfrage formuliert ist, desto stärker orientiert sich die Auswahl der Methodik an klar definierten Parametern.

Am Beispiel “Exzentrisches versus konzentrisches Training bei Achilles-Tendinopathie (AT)“ zeigt sich, dass eine präzise PICO-Frage eine systematische Übersichtsarbeit rechtfertigt. Hier steht der direkte Vergleich spezifischer Interventionen im Vordergrund, was eine hohe methodische Strenge erfordert.

Eine etwas breitere Fragestellung wie “Evidenzlage bezüglich aktiver Therapieformen bei AT”, die sich zwar noch auf Population und Intervention, jedoch weniger auf ein klar abgegrenztes Vergleichsinteresse bezieht, eignet sich für ein Evidence Summary. Dieses Format bündelt und bewertet vorhandene Studienergebnisse, ohne die enge Fokussierung eines systematischen Reviews. Trotzdem kann und soll für ein Evidence Summary eine systematische Herangehensweise angestrebt werden!

Schliesslich umfasst eine weit gefasste Fragestellung wie “Management von Personen mit AT“ in erster Linie den Aspekt der Population (das P vom PICO). Hier steht die klinische Praxisorientierung im Vordergrund, sodass Leitlinien (Guidelines) das geeignete Instrument darstellen. Diese beruhen auf einer breiten Evidenzbasis, welche durch klare Kriterien in praxisrelevante Empfehlungen münden.

Insgesamt wird deutlich: Der Detaillierungsgrad der Fragestellung bestimmt massgeblich, ob die Bearbeitung in Form eines Systematic Review, eines Evidence Summary oder einer Guideline erfolgen sollte.

17.2.2 Zutaten der verschiedenen Übersichtsstudien

Nebst der Fragestellung ist für die Wahl der Reviewart natürlich ausschlaggebend, welche Evidenz bereits vorhanden ist. Gibt es mehrere aktuelle Reviews zu einem Thema, macht es wenig Sinn, ein weiteres systematisches Review zu schreiben. Hier wäre ein Evidence Summary oder ein Umbrella Review sinnvoller. Gibt es jedoch noch keine Übersicht zu einer konkreten PICO Fragestellung und es liegen mehrere passende Primärstudien vor, dann sollte ein systematisches Review angestrebt werden (Abbildung 17.3).

Abbildung 17.3: Zutaten verschiedener Typen von Übersichtsstudien

17.3 Meta-Analysen

Eine Meta-Analyse ist ein wissenschaftliches Verfahren, bei dem Ergebnisse mehrerer empirischer Studien zu einer bestimmten Fragestellung systematisch zusammengeführt und quantitativ ausgewertet werden. Ziel ist es, durch die Bündelung der Daten eine präzisere und verlässlichere Schätzung eines Effekts oder Zusammenhangs zu erhalten, als dies mit Einzelstudien möglich wäre. Eine Meta-Analyse basiert also immer auf einem systematischen Review. Wesentliche Merkmale sind:

Systematische Literaturrecherche: Studien werden nach klaren Kriterien ausgewählt, um Verzerrungen zu minimieren.
Standardisierte Auswertung: Ergebnisse der Einzelstudien werden auf eine gemeinsame Kennzahl gebracht und vergleichbar gemacht.
Gewichtung: Studien mit höherer Qualität oder grösserer Stichprobe fliessen stärker in die Gesamtanalyse ein.

17.3.1 Warum wir quantitativ lieben

Lesen Sie den folgenden Beschrieb der Resultate von vier Studien und bilden Sie sich eine Meinung.

Von vier Studien haben zwei die Effektivität bezüglich Schmerzen (0-10) gemessen. Eine davon konnte einen Effekt von 2, die andere einen Effekt von 4 Punkten zeigen. Die Studien wiesen jedoch unterschiedliche Stichprobengrössen auf. Eine dritte Studie mass die Effektivität in Bezug auf die Pain-Scale (0-70). Die Verbesserung betrug 22 Punkte bei einer grossen Stichprobe. Die vierte, kleine Studie fand bezüglich eines Schmerzfragebogens einen Effekt von 12%.

Und nun betrachten Sie diese Abbildung:

Abbildung 17.4: Forest-Plot zu vier Studien

Ich hoffe Sie gehen mit mir einig, dass wir anhand der quantitativen Synthese in der Grafik (Abbildung 17.4) viel schneller und einfacher einen Überblick zu den Effekten in den vier Studien gewinnen. Und das, obwohl wir diese Art von Grafik noch gar nicht besprochen haben!

17.3.2 Voraussetzungen für eine Meta-Analyse

Für die Durchführung einer Meta-Analyse müssen bestimmte Voraussetzungen erfüllt sein. Zunächst braucht es eine klar formulierte Forschungsfrage (PICO), die sich anhand quantitativer Daten beantworten lässt. Die einzubeziehenden Studien sollten hinsichtlich den PICO-Elementen homogen sein, damit ihre Ergebnisse sinnvoll zusammengeführt werden können. Ausserdem müssen sie quantitative Ergebnisse in Form von Effektmassen oder statistischen Kennzahlen berichten, die sich auf eine gemeinsame Basis übertragen lassen, damit z.B. standardisierte Mittelwertsdifferenzen berechnet werden können. Eine ausreichende Anzahl unabhängiger Studien ist notwendig, um belastbare Gesamtschätzungen zu ermöglichen. Ebenso wichtig ist eine systematische Vorgehensweise bei der Recherche, Auswahl und Dokumentation der Studien, damit Verzerrungen vermieden werden. Schliesslich sollten die eingeschlossenen Arbeiten methodisch solide und wissenschaftlich nachvollziehbar sein, da die Qualität der Meta-Analyse unmittelbar von der Qualität der zugrunde liegenden Studien abhängt.

17.3.3 Effektgrössen in Meta-Analyse

In Meta-Analysen dienen Effektgrössen als gemeinsame Kennzahlen, um Ergebnisse unterschiedlicher Studien vergleichbar zu machen. Wir unterschieden:

Rohe Mittelwertsdifferenz: Gibt den absoluten Unterschied zwischen zwei Gruppen in derselben Masseinheit an (z. B. Punkte auf einer Skala). Sie ist leicht interpretierbar, setzt aber identische Messinstrumente in allen Studien voraus.
Standardisierte Mittelwertsdifferenz (SMD): Drückt den Unterschied zwischen Gruppen relativ zur Streuung der Werte aus (also in Standardabweichungen). Dadurch können auch Studien mit unterschiedlichen Skalen zusammengeführt werden. Siehe Section 16.6 für mehr Informationen zur SMD.
Relatives Risiko (RR): Beschreibt das Verhältnis der Wahrscheinlichkeit eines Ereignisses zwischen zwei Gruppen.
Odds Ratio (OR): Stellt das Verhältnis der Chancen für ein Ereignis in zwei Gruppen dar und eignet sich insbesondere für dichotome Daten, etwa Auftreten vs. Nicht-Auftreten eines Outcomes.

Die Wahl der Effektgrösse hängt von Studiendesign, Datentyp und Ziel der Analyse ab. Sie bestimmt, wie Ergebnisse zusammengefasst und interpretiert werden können. Es besteht die Möglichkeit, eine Effektgrösse in eine andere zu konventieren.

17.3.4 Forest-Plots

In der Tabelle unten sehen Sie die Kraftwerte von vier Studien bei Schlaganfallpatien:tinnen nach einem Krafttraining (Interventionsgruppe), bzw. bei der Kontrollgruppe. Die Kraftwerte wurden in drei unterschiedlichen Einheiten gemessen (Ada, Dorsch, and Canning 2006). Die Effektgrössen (SMD) habe ich bereits berechnet, siehe Section 16.6.

Tabelle 17.1: Primärstudien

Study	N (Exp)	Mean (Exp)	SD (Exp)	N (Ctrl)	Mean (Ctrl)	SD (Ctrl)	SMD (Cohen’s d)	95% CI
Duncan (Nm)	44	88.40	37.40	48	80.85	32.00	0.218	[-0.20, 0.63]
Lippert-Gruner (N)	10	248.00	109.25	10	139.00	72.75	1.174	[0.23, 2.12]
Merletti (Nm)	24	9.48	3.28	25	7.17	3.62	0.668	[0.10, 1.24]
Winstein (kg/cm)	20	772.86	666.72	20	581.75	538.42	0.315	[-0.31, 0.94]

Wir gehen nun davon aus, dass die Voraussetzungen für eine Meta-Analyse erfüllt sind. Die eigentliche Meta-Analyse wird typischerweise mittels eines Forest-Plots dargestellt.

Abbildung 17.5: Forest-Plot für die 4 Studien

Abbildung 17.5 zeigt die Ergebnisse der Meta-Analyse auf Basis der vier Einzelstudien aus Tabelle 17.1. Jede Studie berichtet die rohen, deskriptiven Werten und daraus die berechnete standardisierte Mittelwertsdifferenz (Cohen’s d) mit zugehörigem 95%-Konfidenzintervall.

Inhaltlich fällt auf, dass alle Studien positive Effekte zugunsten der Interventionsgruppe berichten, wenn auch mit unterschiedlicher Effektstärke. Während die Studie von Lippert-Gruner einen grossen Effekt aufweist (d = 1.17), liegen die anderen Effekte im kleinen bis mittleren Bereich (Duncan: d = 0.22; Merletti: d = 0.67; Winstein: d = 0.32). Die Konfidenzintervalle von Duncan und Winstein schliessen die 0 mit ein, diese Studien weisen folglich keine statistisch signifikanten Effekte auf.

Die Studien fliessen mit unterschiedlichem Gewicht in das Gesamtergebnis ein (Weight). Das Gewicht jeder Studie ist eng and die Stichprobengrösse gebunden und wird mittels des grauen Quadrats grafisch repräsentiert.

Das gepoolte Ergebnis (die Raute unten) des Random-Effects-Modells ergibt eine standardisierte Mittelwertsdifferenz von d = 0.46, 95% CI = [0.13, 0.79]. Dieser Wert weist auf einen moderaten positiven Gesamteffekt hin, der statistisch signifikant von null verschieden ist. Damit legt die Analyse nahe, dass die Intervention über verschiedene Studien hinweg eine insgesamt günstige Wirkung entfaltet. Ich verzichte an dieser Stelle auf eine detaillierte Beschreibung der verschiedenen statistischen Modelle (Random-Effects-Model, Fixed-Effect-Model). Normalerweise wird in physiotherapeutischen Studien immer das Random-Effects-Model verwendet.

Unten Links finden Sie eine Angabe zur Heterogenität der Studien. Wie oben erwähnt, sollten die Studien möglichst homogen sein. Die Heterogenität wird mittels \(I^2\) quantifiziert. Vereinfacht kann man sagen, dass \(I^2\) die Heterogenität in % angibt, der Wert sollte also so tief wie möglich sein. Als Fausregel gilt:

\(I^2 < 25\)% → geringe Heterogenität
\(25 \le I^2 \le 75\)% → mässige Heterogenität
\(I^2 > 75\)% → hohe Heterogenität

Was Sie in Abbildung 17.5 sehen ist eine Meta-Analyse, welche als Effektgrösse die SMD verwendet. Natürlich kann man auch andere Effektgrössen in Forest-Plots abbilden. Schauen Sie bei Forest-Plots also immer gut auf die Beschriftung, damit Sie das Resultat korrekt interpretieren. In der Folge sehen Sie vollständigkeitshalber Beispiele für weitere Effektgrössen.

Abbildung 17.6: Beispiel für ein Forest-Plot mit rohen Mittelwertsdifferenzen

Abbildung 17.6 zeigt ein Forest-Plot mit rohen Mittelwertsdifferenzen. Alle Studien haben das Outcome auf die gleiche Art und Weise gemessen, es ist daher nicht nötig, die Effekte zu standardisieren. Wir können demnach das Ergebnis (Schmerz auf einer Skala von 0 bis 100) in der Originaleinheit interpretieren. Um zu beurteilen, ob dieser Effekt “gross” oder “klein” ist, empfiehlt sich die Hinzunahme einer Minimal Clinically Important Difference (MCID).

Abbildung 17.7: Beispiel für ein Forest-Plot mit Risk Ratios

Abbildung 17.7 zeigt einen Forest-Plot mit Risk Ratios (RR) als Effektgrösse. Die Interpretation ist grundsätzlich analog zu den Forestplots oben. Wichtig zu beachten ist, dass bei Verhältnissen, also hier RR, die Nullhypothese postuliert: \(RR = 1\) und nicht \(RR = 0\)!

Abbildung 17.8: Beispiel für ein Forest-Plot mit Odds Ratios (Zusammenhang zwischen Anxiety und Stürzen)

Abbildung 17.8 zeigt einen Forest-Plot, in welchem Odds Ratios als Effektgrösse verwendet wurden.

17.3.5 Publication Bias

Publication Bias bezeichnet im Kontext von Meta-Analysen die systematische Verzerrung, die dadurch entsteht, dass Studien mit statistisch signifikanten oder “positiven” Ergebnissen häufiger veröffentlicht werden als Studien mit null- oder negativen Befunden. Da Meta-Analysen auf den in der Literatur verfügbaren Studien beruhen, führt dieser Selektionsprozess dazu, dass der Gesamteffekt überschätzt oder in eine bestimmte Richtung verzerrt wird. Insbesondere kleine Studien mit nicht signifikanten Ergebnissen bleiben oft unpubliziert, was die Repräsentativität der Datenbasis gefährdet. Methoden wie Funnel Plots oder statistische Tests (z. B. Egger-Test) dienen dazu, Publication Bias zu erkennen. Sensitivitätsanalysen und die Berücksichtigung von Registerstudien können helfen, seine Auswirkungen zu reduzieren.

Abbildung 17.9: Beispiel eines Funnel-Plors

Die Form des Plots in Abbildung 17.9 gibt ihm seinen Namen. Auf der x-Achse ist der Effektstärkeschätzer (hier Hedges’ g) aufgetragen, auf der y-Achse der Standardfehler (je kleiner, desto grössere und präzisere Studien). Idealerweise ergibt sich bei Abwesenheit von Bias eine symmetrische, trichterförmige Verteilung der Studienpunkte um den gepoolten Effekt (vertikale Linie). In diesem Plot zeigt sich eine gewisse Asymmetrie: Es fehlen kleinere Studien mit negativen oder null-nahen Effekten (links unten im Plot). Stattdessen sind vor allem kleinere Studien mit positiven Effekten vertreten. Diese Verteilung spricht für einen möglichen Publication Bias, d. h. Studien mit nicht signifikanten oder unerwünschten Ergebnissen wurden vermutlich seltener publiziert oder nicht in die Analyse aufgenommen. Ein ähnliches Pattern tritt übrigens in Abbildung 17.6 auf - es ist also nicht selten.

17.4 Guidelines

Guidelines (Leitlinien) sind systematisch entwickelte, evidenzbasierte Aussagen und Empfehlungen zu einem klar definierten diagnostisch-therapeutischen Bereich und sollen die Qualität der Patientenversorgung optimieren (Guerra-Farfan et al. 2023). Sie beziehen sich nicht nur auf einzelne Behandlungsschritte, sondern auf das ganzheitliche Management einer Krankheit – von der Prävention über die Diagnostik bis hin zu Intervention, Nachsorge und Evaluation. Eine Guideline setzt sich aus mehreren Evidence Summaries zusammen, die den aktuellen Stand der wissenschaftlichen Evidenz bündeln und aufbereiten. Dadurch bieten Leitlinien eine praxisorientierte Orientierungshilfe für Gesundheitsfachkräfte und tragen dazu bei, eine konsistente, transparente und bestmögliche Versorgung sicherzustellen. Um das Beispiel von oben zu AT abzschliessen, können Sie die entsprechende Guideline anschauen (Chimenti et al. 2024). Es ist ein gutes und einfach nachvollziehbares Beispiel.

Abbildung 17.10: Prozess zur Entwicklung von evidenzbasierten Empfehlungen

Abbildung 17.10 zeigt schematisch den Prozess, wie aus einer systematischen Literaturübersicht über Evidenzstufen Empfehlungen für die klinische Praxis abgeleitet werden.

Links werden verschiedene Evidenzstufen (nach CEBM) beschrieben, die das Vertrauen in die Resultate ausdrücken: von sehr hohem Vertrauen (Evidenzstufe 1) bis hin zu sehr geringem Vertrauen (Evidenzstufen 4 & 5).

In der Mitte werden diese Evidenzstufen in klinische Leitlinienempfehlungen (Grades of Recommendation, nach CEBM) übersetzt. Dabei kann eine starke Evidenz zu einer starken Empfehlung führen, während niedrige oder sehr niedrige Evidenz eher zu schwachen Empfehlungen oder gar keiner Empfehlung führt. Wichtig ist, dass auch bei zugunsten oder zuungunsten einer Intervention verschiedene Abstufungen möglich sind.

Rechts erfolgt die praktische Konsequenz: Starke und moderate Empfehlungen sollen umgesetzt werden, schwache Empfehlungen nur mit Vorsicht. Massnahmen ohne Empfehlung oder mit widersprüchlicher Evidenz sollen kritisch geprüft oder nicht umgesetzt werden. Oder auf jeden Fall erst, wenn Aspekte mit starker und moderater Empfehlung bereits erfolglos umgesetzt worden sind.

Man kann sich diese Empfehlungen also wie eine Priorisierung vorstellen. Was stark empfohlene Intervention haben eine höhere Priorität als schwach empfohlene Interventionen. Man kann diese Priorisierung in Form einer Pyramide darstellen.

Stark empfohlene Massnahmen bilden die Basis, auf welche dann schrittweise aufgebaut wird. EBP heisst also nicht, dass man etwas nicht umsetzen soll, das nicht empfohlen ist. Aber EBP bedeutet, dass dies erst geschehen soll, wenn stärker empfohlene Massnahmen nicht die erwünschte Wirkung gezeigt haben. Ein konkretes Beispiel dazu sehen Sie in Abbildung 17.12.

Abbildung 17.12: Beispiel einer Empfehlungspyramide

Natürlich haben diese Empfehlungspyramiden einen Bezug zur Evidenzpyramide und somit zu den Evidenzlevels (siehe auch links in Abbildung 17.10).

Abbildung 17.13: Evidenzpyramiden. Quelle: Murad et al., 2016

Während Ihnen die Pyramide A in Abbildung 17.13 bekannt sein sollte, habe ich kürzlich (obwohl bereits 2016 veröffentlicht - shame on me 😉) eine etwas angepasste Form entdeckt (B). Man sieht dort sehr schön, dass eine gute Kohortenstudie durchaus ein höheres Evidenzlevel erreichen kann, als ein schlechtes RCT. Genau deshalb ist eine vertiefte RoB-Analyse unabdingbar.

17.4.1 Evidenzlevels und Grades of Recommendation nach CEBM

Es gibt verschiedene Ansätze, Evidenzlevels zu bestimmen und davon die GoR abzuleiten. Wir empfehlen Ihnen, der Systematik von Centre of Evidence-Based Medicine (CEBM) zu folgen. Diese wird in der Tabelle unten ausgeführt.

Tabelle 17.2: Evidenzlevels nach CEBM

Evidenzlevel	Beschreibung
1a	Systematische Reviews oder Meta-Analysen von homogenen RCTs
1b	Einzelne, qualitativ hochstehende RCTs mit schmalen 95% CIs
1c	“All or None”-Studien und nicht-randomisierte kontrollierte Studien
2a	Systematische Reviews oder Meta-Analysen von homogenen Kohorten-Studien
2b	Einzelne Kohorten-Studien oder RCTs schlechter Qualität
2c	Ökologische Studien
3a	Systematische Reviews oder Meta-Analysen von homogenen Fall-Kontroll-Studien
3b	Einzelne Fall-Kontroll-Studien
4	Fallserien (Case-Series) und Beobachtungsstudien schlechter Qualität
5	Expertenmeinungen

Tabelle 17.3: GoR nach CEBM

Empfehlungsgrad (GRADE)	Evidenzbasis
A	Konsistente Level 1 Studien
B	Konsistente Level 2- und/oder Level 3-Studien sowie Extrapolationen von Level 1 Studien
C	Level 4 Studien oder Extrapolationen von Level 2 & 3 Studien
D	Level 5 Studien oder inkonsistente Studienlage aller Levels

Ada, Louise, Simone Dorsch, and Colleen G. Canning. 2006. “Strengthening Interventions Increase Strength and Improve Activity After Stroke: A Systematic Review.” The Australian Journal of Physiotherapy 52 (4): 241–48. https://doi.org/10.1016/s0004-9514(06)70003-4.

Chimenti, Ruth L., Christopher Neville, Jeff Houck, Tyler Cuddeford, Dominic Carreira, and Robroy L. Martin. 2024. “Achilles Pain, Stiffness, and Muscle Power Deficits: Midportion Achilles Tendinopathy Revision – 2024.” Journal of Orthopaedic & Sports Physical Therapy 54 (12): CPG1–32. https://doi.org/10.2519/jospt.2024.0302.

Choi, Geun Joo, and Hyun Kang. 2022. “The Umbrella Review: A Useful Strategy in the Rain of Evidence.” The Korean Journal of Pain 35 (2): 127–28. https://doi.org/10.3344/kjp.2022.35.2.127.

Guerra-Farfan, Ernesto, Yaiza Garcia-Sanchez, Montsant Jornet-Gibert, Jorge H Nuñez, Mariano Balaguer-Castro, and Kim Madden. 2023. “Clinical Practice Guidelines: The Good, the Bad, and the Ugly.” Injury, AOTrauma Europe Supplement: Clinical Research: Lessons Learned-Looking Ahead, 54 (May): S26–29. https://doi.org/10.1016/j.injury.2022.01.047.

Khangura, Sara, Kristin Konnyu, Rob Cushman, Jeremy Grimshaw, and David Moher. 2012. “Evidence Summaries: The Evolution of a Rapid Review Approach.” Systematic Reviews 1 (1): 10. https://doi.org/10.1186/2046-4053-1-10.

Munn, Zachary, Micah D. J. Peters, Cindy Stern, Catalin Tufanaru, Alexa McArthur, and Edoardo Aromataris. 2018. “Systematic Review or Scoping Review? Guidance for Authors When Choosing Between a Systematic or Scoping Review Approach.” BMC Medical Research Methodology 18 (1): 143. https://doi.org/10.1186/s12874-018-0611-x.

Page, Matthew J., David Moher, Patrick M. Bossuyt, Isabelle Boutron, Tammy C. Hoffmann, Cynthia D. Mulrow, Larissa Shamseer, et al. 2021. “PRISMA 2020 Explanation and Elaboration: Updated Guidance and Exemplars for Reporting Systematic Reviews.” BMJ 372 (March): n160. https://doi.org/10.1136/bmj.n160.

Taeymans, J., S. Schmid, and R. Hilfiker. 2011. “Systematische Literaturstudien und Metaanalysen im physiotherapeutischen Kontext verstehen.” physioscience 7 (4): 168–74. https://doi.org/10.1055/s-0031-1281855.