<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<GmsArticle>
  <MetaData>
    <Identifier>hta000085</Identifier>
    <IdentifierDoi>10.3205/hta000085</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-hta0000855</IdentifierUrn>
    <ArticleType language="en">HTA Summary</ArticleType>
    <ArticleType language="de">HTA-Kurzfassung</ArticleType>
    <TitleGroup>
      <Title language="en">Comparison of tools for assessing the methodological quality of primary and secondary studies in health technology assessment reports in Germany</Title>
      <TitleTranslated language="de">Vergleich von Bewertungsinstrumenten f&#252;r die Studienqualit&#228;t von Prim&#228;r- und Sekund&#228;rstudien zur Verwendung f&#252;r HTA-Berichte im deutschsprachigen Raum</TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Dreier</Lastname>
          <LastnameHeading>Dreier</LastnameHeading>
          <Firstname>Maren</Firstname>
          <Initials>M</Initials>
          <AcademicTitle>Dr. med.</AcademicTitle>
          <AcademicTitleSuffix>MPH</AcademicTitleSuffix>
        </PersonNames>
        <Address language="en">Institute of Epidemiology, Social Medicine and Health System Research, Hannover Medical School, Carl-Neuberg-Str. 1, 30625 Hannover, Germany, Phone: &#43;49(0)511&#47;5322192<Affiliation>Institute of Epidemiology, Social Medicine and Health System Research, Hannover Medical School, Hannover, Germany</Affiliation></Address>
        <Address language="de">Institut f&#252;r Epidemiologie, Sozialmedizin und Gesundheitssystemforschung, Medizinische Hochschule Hannover, Carl-Neuberg-Str. 1, 30625 Hannover, Deutschland, Tel.: &#43;49(0)511&#47;5322192<Affiliation>Institut f&#252;r Epidemiologie, Sozialmedizin und Gesundheitssystemforschung, Medizinische Hochschule Hannover, Deutschland</Affiliation></Address>
        <Email>Dreier.Maren&#64;mh-hannover.de</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Borutta</Lastname>
          <LastnameHeading>Borutta</LastnameHeading>
          <Firstname>Birgit</Firstname>
          <Initials>B</Initials>
          <AcademicTitleSuffix>MPH</AcademicTitleSuffix>
        </PersonNames>
        <Address language="en">Institute of Epidemiology, Social Medicine and Health System Research, Hannover Medical School, Carl-Neuberg-Str. 1, 30625 Hannover, Germany, Phone: &#43;49(0)511&#47;5325162<Affiliation>Institute of Epidemiology, Social Medicine and Health System Research, Hannover Medical School, Hannover, Germany</Affiliation></Address>
        <Address language="de">Institut f&#252;r Epidemiologie, Sozialmedizin und Gesundheitssystemforschung, Medizinische Hochschule Hannover, Carl-Neuberg-Str. 1, 30625 Hannover, Deutschland, Tel.: &#43;49(0)511&#47;5325162<Affiliation>Institut f&#252;r Epidemiologie, Sozialmedizin und Gesundheitssystemforschung, Medizinische Hochschule Hannover, Deutschland</Affiliation></Address>
        <Email>Borutta.Birgit&#64;mh-hannover.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Stahmeyer</Lastname>
          <LastnameHeading>Stahmeyer</LastnameHeading>
          <Firstname>Jona</Firstname>
          <Initials>J</Initials>
        </PersonNames>
        <Address language="en">Institute of Epidemiology, Social Medicine and Health System Research, Hannover Medical School, Carl-Neuberg-Str. 1, 30625 Hannover, Germany, Phone: &#43;49(0)511&#47;5324449<Affiliation>Institute of Epidemiology, Social Medicine and Health System Research, Hannover Medical School, Hannover, Germany</Affiliation></Address>
        <Address language="de">Institut f&#252;r Epidemiologie, Sozialmedizin und Gesundheitssystemforschung, Medizinische Hochschule Hannover, Carl-Neuberg-Str. 1, 30625 Hannover, Deutschland, Tel.: &#43;49(0)511&#47;5324449<Affiliation>Institut f&#252;r Epidemiologie, Sozialmedizin und Gesundheitssystemforschung, Medizinische Hochschule Hannover, Deutschland</Affiliation></Address>
        <Email>Stahmeyer.Jona&#64;mh-hannover.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Krauth</Lastname>
          <LastnameHeading>Krauth</LastnameHeading>
          <Firstname>Christian</Firstname>
          <Initials>C</Initials>
          <AcademicTitle>PD Dr.</AcademicTitle>
        </PersonNames>
        <Address language="en">Institute of Epidemiology, Social Medicine and Health System Research, Hannover Medical School, Carl-Neuberg-Str. 1, 30625 Hannover, Germany, Phone: &#43;49(0)511&#47;5324426<Affiliation>Institute of Epidemiology, Social Medicine and Health System Research, Hannover Medical School, Hannover, Germany</Affiliation></Address>
        <Address language="de">Institut f&#252;r Epidemiologie, Sozialmedizin und Gesundheitssystemforschung, Medizinische Hochschule Hannover, Carl-Neuberg-Str. 1, 30625 Hannover, Deutschland, Tel.: &#43;49(0)511&#47;5324426<Affiliation>Institut f&#252;r Epidemiologie, Sozialmedizin und Gesundheitssystemforschung, Medizinische Hochschule Hannover, Deutschland</Affiliation></Address>
        <Email>Krauth.Christian&#64;mh-hannover.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Walter</Lastname>
          <LastnameHeading>Walter</LastnameHeading>
          <Firstname>Ulla</Firstname>
          <Initials>U</Initials>
          <AcademicTitle>Prof. Dr. phil.</AcademicTitle>
        </PersonNames>
        <Address language="en">Institute of Epidemiology, Social Medicine and Health System Research, Hannover Medical School, Carl-Neuberg-Str. 1, 30625 Hannover, Germany, Phone: &#43;49(0)511&#47;5324455<Affiliation>Institute of Epidemiology, Social Medicine and Health System Research, Hannover Medical School, Hannover, Germany</Affiliation></Address>
        <Address language="de">Institut f&#252;r Epidemiologie, Sozialmedizin und Gesundheitssystemforschung, Medizinische Hochschule Hannover, Carl-Neuberg-Str. 1, 30625 Hannover, Deutschland, Tel.: &#43;49(0)511&#47;5324455<Affiliation>Institut f&#252;r Epidemiologie, Sozialmedizin und Gesundheitssystemforschung, Medizinische Hochschule Hannover, Deutschland</Affiliation></Address>
        <Email>Walter.Ulla&#64;mh-hannover.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <MeshheadingList>
        <Meshheading>
          <MeshMainheading majorTopic="no">QUALITY OF HEALTH CARE</MeshMainheading>
        </Meshheading>
        <Meshheading>
          <MeshMainheading majorTopic="no">REPRODUCIBILITY OF RESULTS</MeshMainheading>
        </Meshheading>
        <Meshheading>
          <MeshMainheading majorTopic="no">BIAS (EPIDEMIOLOGY)</MeshMainheading>
        </Meshheading>
        <Meshheading>
          <MeshMainheading majorTopic="no">CONFOUNDING FACTORS (EPIDEMIOLOGY)</MeshMainheading>
        </Meshheading>
        <Meshheading>
          <MeshMainheading majorTopic="no">EPIDEMIOLOGIC STUDIES</MeshMainheading>
        </Meshheading>
        <Meshheading>
          <MeshMainheading majorTopic="no">META-ANALYSIS AS TOPIC</MeshMainheading>
        </Meshheading>
        <Meshheading>
          <MeshMainheading majorTopic="no">METHODS</MeshMainheading>
        </Meshheading>
        <Meshheading>
          <MeshMainheading majorTopic="no">TECHNOLOGY ASSESSMENT, BIOMEDICAL</MeshMainheading>
        </Meshheading>
        <Meshheading>
          <MeshMainheading majorTopic="no">ECONOMICS</MeshMainheading>
        </Meshheading>
      </MeshheadingList>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="en">quality assessment</Keyword>
      <Keyword language="en">assessment quality</Keyword>
      <Keyword language="en">quality assessment tools</Keyword>
      <Keyword language="en">assessment tools</Keyword>
      <Keyword language="en">study quality</Keyword>
      <Keyword language="en">study assessment</Keyword>
      <Keyword language="en">clinical trials</Keyword>
      <Keyword language="en">evaluation criteria</Keyword>
      <Keyword language="en">methodologic quality</Keyword>
      <Keyword language="en">validity</Keyword>
      <Keyword language="en">quality</Keyword>
      <Keyword language="en">science</Keyword>
      <Keyword language="en">risk of bias</Keyword>
      <Keyword language="en">bias</Keyword>
      <Keyword language="en">confounding</Keyword>
      <Keyword language="en">systematic reviews</Keyword>
      <Keyword language="en">health technology assessment</Keyword>
      <Keyword language="en">HTA</Keyword>
      <Keyword language="en">health economics</Keyword>
      <Keyword language="en">health economic studies</Keyword>
      <Keyword language="en">critical appraisal</Keyword>
      <Keyword language="en">quality appraisal</Keyword>
      <Keyword language="en">checklists</Keyword>
      <Keyword language="en">scales</Keyword>
      <Keyword language="en">component ratings</Keyword>
      <Keyword language="en">components</Keyword>
      <Keyword language="en">tool</Keyword>
      <Keyword language="en">studies</Keyword>
      <Keyword language="en">interventional studies</Keyword>
      <Keyword language="en">observational studies</Keyword>
      <Keyword language="en">diagnostic studies</Keyword>
      <Keyword language="en">item</Keyword>
      <Keyword language="en">meta-analysis</Keyword>
      <Keyword language="en">QAT</Keyword>
      <Keyword language="en">EBM</Keyword>
      <Keyword language="en">evidence-based medicine</Keyword>
      <Keyword language="en">standard</Keyword>
      <Keyword language="en">epidemiology</Keyword>
      <Keyword language="de">Validit&#228;t von Ergebnissen</Keyword>
      <Keyword language="de">Bias (Epidemiologie)</Keyword>
      <Keyword language="de">Verzerrung, statistische (Epidemiologie)</Keyword>
      <Keyword language="de">Verzerrung, systematische (Epidemiologie)</Keyword>
      <Keyword language="de">Methoden, epidemiologische</Keyword>
      <Keyword language="de">Methodik, Evaluations-</Keyword>
      <Keyword language="de">Studienqualit&#228;t</Keyword>
      <Keyword language="de">Studienbewertung</Keyword>
      <Keyword language="de">klinische Studien</Keyword>
      <Keyword language="de">Bewerungskriterien</Keyword>
      <Keyword language="de">Qualit&#228;tsbewertunginstrument</Keyword>
      <Keyword language="de">Qualit&#228;tsbewertung</Keyword>
      <Keyword language="de">Verzerrungspotenzial</Keyword>
      <Keyword language="de">Verzerrung</Keyword>
      <Keyword language="de">Bias</Keyword>
      <Keyword language="de">Validit&#228;t</Keyword>
      <Keyword language="de">Confounding</Keyword>
      <Keyword language="de">Health Technology Assessment</Keyword>
      <Keyword language="de">HTA</Keyword>
      <Keyword language="de">systematische &#220;bersichtsarbeiten</Keyword>
      <Keyword language="de">Gesundheits&#246;konomie</Keyword>
      <Keyword language="de">gesundheits&#246;konomische Studien</Keyword>
      <Keyword language="de">Checklisten</Keyword>
      <Keyword language="de">Skalen</Keyword>
      <Keyword language="de">Komponentenbewertung</Keyword>
      <Keyword language="de">Komponenten</Keyword>
      <Keyword language="de">Instrument</Keyword>
      <Keyword language="de">Studien</Keyword>
      <Keyword language="de">Interventionsstudien</Keyword>
      <Keyword language="de">Beobachtungsstudien</Keyword>
      <Keyword language="de">Diagnosestudien</Keyword>
      <Keyword language="de">Item</Keyword>
      <Keyword language="de">Metaanalyse-</Keyword>
      <Keyword language="de">Metaanalyse</Keyword>
      <Keyword language="de">Meta-Analyse</Keyword>
      <Keyword language="de">QBI</Keyword>
      <Keyword language="de">EBM</Keyword>
      <Keyword language="de">evidenzbasierte Medizin</Keyword>
      <Keyword language="de">Bewertungsqualit&#228;t</Keyword>
      <Keyword language="de">Bewertungsinstrumente</Keyword>
      <Keyword language="de">Standard</Keyword>
      <Keyword language="de">Qualit&#228;t</Keyword>
      <Keyword language="de">Wissenschaft</Keyword>
      <Keyword language="de">methodische Qualit&#228;t</Keyword>
      <Keyword language="de">Epidemiologie</Keyword>
    </SubjectGroup>
    <DatePublishedList>
      
    <DatePublished>20100614</DatePublished></DatePublishedList>
    <Language>engl</Language>
    <LanguageTranslation>germ</LanguageTranslation>
    <SourceGroup>
      <Journal>
        <ISSN>1861-8863</ISSN>
        <Volume>6</Volume>
        <JournalTitle>GMS Health Technology Assessment</JournalTitle>
        <JournalTitleAbbr>GMS Health Technol Assess</JournalTitleAbbr>
      </Journal>
    </SourceGroup>
    <ArticleNo>07</ArticleNo>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><SubHeadline2>Gesundheitspolitischer Hintergrund</SubHeadline2><Pgraph>Erkenntnisse aus wissenschaftlichen Studien bilden die Grundlage f&#252;r evidenzbasierte gesundheitspolitische Entscheidungen.</Pgraph><SubHeadline2>Wissenschaftlicher Hintergrund</SubHeadline2><Pgraph>Zur Einsch&#228;tzung der Glaubw&#252;rdigkeit von Studien sind Qualit&#228;tsbewertungen von Studien immanenter Bestandteil von HTA-Berichten (HTA &#61; Health Technology Assessment) und systematischen &#220;bersichtsarbeiten. Diese pr&#252;fen, inwieweit die Studienergebnisse systematisch durch Confounding oder Bias verzerrt sein k&#246;nnen (interne Validit&#228;t). Es werden Checklisten, Skalen und Komponentenbewertungen unterschieden.</Pgraph><SubHeadline2>Forschungsfragen</SubHeadline2><Pgraph>Welche Instrumente zur Qualit&#228;tsbewertung von systematischen Reviews, Interventions-, Beobachtungs-, Diagnose- und gesundheits&#246;konomischen Studien gibt es, wie unterscheiden sich diese und welche Schlussfolgerungen lassen sich daraus f&#252;r die Qualit&#228;tsbewertung ableiten&#63;</Pgraph><SubHeadline2>Methodik</SubHeadline2><Pgraph>Es wird eine systematische Recherche in einschl&#228;gigen Datenbanken ab 1988 durchgef&#252;hrt, erg&#228;nzt um eine Durchsicht der Referenzen, der HTA-Berichte der Deutschen Agentur f&#252;r Health Technology Assessment (DAHTA) sowie eine Internetrecherche. Die Literaturauswahl, die Datenextraktion und die Qualit&#228;tsbewertung werden von zwei unabh&#228;ngigen Reviewern vorgenommen. Die inhaltlichen Elemente der Qualit&#228;tsbewertungsinstrumente (QBI) werden mit modifizierten Kriterienlisten, bestehend aus Items und Dom&#228;nen spezifisch f&#252;r randomisierte, Beobachtungs-, Diagnosestudien, systematische &#220;bersichtsarbeiten und gesundheits&#246;konomische Studien extrahiert. Anhand der Anzahl abgedeckter Items und Dom&#228;nen werden umfassendere von weniger umfassenden Instrumenten unterschieden. Zwecks Erfahrungsaustausch zu Problemen bei der praktischen Anwendung von Instrumenten wird ein Workshop durchgef&#252;hrt.</Pgraph><SubHeadline2>Ergebnisse</SubHeadline2><Pgraph>Es werden insgesamt acht systematische, methodische Reviews und HTA-Berichte sowie 147 Instrumente identifiziert: 15 f&#252;r systematische &#220;bersichtsarbeiten, 80 f&#252;r randomisierte Studien, 30 f&#252;r Beobacht<TextGroup><PlainText>ungs-,</PlainText></TextGroup> 17 f&#252;r Diagnose- und 22 f&#252;r gesundheits&#246;konomische Studien. Die Instrumente variieren deutlich hinsichtlich der Inhalte, deren Auspr&#228;gung und der G&#252;te der Operationalisierung. Einige Instrumente enthalten neben Items zur internen Validit&#228;t auch Items zur Berichtsqualit&#228;t und zur externen Validit&#228;t. Kein Instrument deckt alle abgefragten Kriterien ab. Designspezifisch werden generische Instrumente dargestellt, die die meisten inhaltlichen Kriterien erf&#252;llen. </Pgraph><SubHeadline2>Diskussion</SubHeadline2><Pgraph>Die Bewertung von QBI anhand inhaltlicher Kriterien ist schwierig, da kein wissenschaftlicher Konsens &#252;ber notwendige Elemente der internen Validit&#228;t bzw. nur f&#252;r einen Teil der allgemein akzeptierten Elemente ein empirischer Nachweis besteht. Der Vergleich anhand inhaltlicher Parameter vernachl&#228;ssigt die Operationalisierung der einzelnen Items, deren G&#252;te und Pr&#228;zision wichtig f&#252;r Transparenz, Replizierbarkeit, die korrekte Bewertung sowie die Interrater-Reliabilit&#228;t ist. QBI, die Items zur Berichtsqualit&#228;t und zur internen Validit&#228;t vermischen, sind zu vermeiden.</Pgraph><SubHeadline2>Schlussfolgerungen</SubHeadline2><Pgraph>Es stehen unterschiedliche, designspezifische Instrumente zur Verf&#252;gung, die aufgrund ihrer umfassenderen inhaltlichen Abdeckung von Elementen der internen Validit&#228;t bevorzugt zur Qualit&#228;tsbewertung eingesetzt werden k&#246;nnen. Zur Minimierung der Subjektivit&#228;t der Bewertung sind Instrumente mit einer ausf&#252;hrlichen und pr&#228;zisen Operationalisierung der einzelnen Elemente anzuwenden. F&#252;r gesundheits&#246;konomische Studien sollten Instrumente mit Ausf&#252;llhinweisen entwickelt werden, die die Angemessenheit der Kriterien definieren. Weitere Forschung ist erforderlich, um Studiencharakteristika zu identifizieren, die die interne Validit&#228;t von Studien beeinflussen.</Pgraph></Abstract>
    <Abstract language="en" linked="yes"><SubHeadline2>Health care policy background</SubHeadline2><Pgraph>Findings from scientific studies form the basis for evidence-based health policy decisions.</Pgraph><SubHeadline2>Scientific background</SubHeadline2><Pgraph>Quality assessments to evaluate the credibility of study results are an essential part of health technology assessment reports and systematic reviews. Quality assessment tools (QAT) for assessing the study quality examine to what extent study results are systematically distorted by confounding or bias (internal validity). The tools can be divided into checklists, scales and component ratings.</Pgraph><SubHeadline2>Research questions</SubHeadline2><Pgraph>What QAT are available to assess the quality of interventional studies or studies in the field of health economics, how do they differ from each other and what conclusions can be drawn from these results for quality assessments&#63;</Pgraph><SubHeadline2>Methods</SubHeadline2><Pgraph>A systematic search of relevant databases from 1988 onwards is done, supplemented by screening of the references, of the HTA reports of the German Agency for Health Technology Assessment (DAHTA) and an internet search. The selection of relevant literature, the data extraction and the quality assessment are carried out by two independent reviewers. The substantive elements of the QAT are extracted using a modified criteria list consisting of items and domains specific to randomized trials, observational studies, diagnostic studies, systematic reviews and health economic studies. Based on the number of covered items and domains, more and less comprehensive QAT are distinguished. In order to exchange experiences regarding problems in the practical application of tools, a workshop is hosted.</Pgraph><SubHeadline2>Results</SubHeadline2><Pgraph>A total of eight systematic methodological reviews is identified as well as 147 QAT: 15 for systematic reviews, 80 for randomized trials, 30 for observational studies, 17 for diagnostic studies and 22 for health economic studies. The tools vary considerably with regard to the content, the performance and quality of operationalisation. Some tools do not only include the items of internal validity but also the items of quality of reporting and external validity. No tool covers all elements or domains. Design-specific generic tools are presented, which cover most of the content criteria.</Pgraph><SubHeadline2>Discussion</SubHeadline2><Pgraph>The evaluation of QAT by using content criteria is difficult, because there is no scientific consensus on the necessary elements of internal validity, and not all of the generally accepted elements are based on empirical evidence. Comparing QAT with regard to contents neglects the oper<TextGroup><PlainText>atio</PlainText></TextGroup>nalisation of the respective parameters, for which the quality and precision are important for transparency, replicability, the correct assessment and interrater reliability. QAT, which mix items on the quality of reporting and internal validity, should be avoided.</Pgraph><SubHeadline2>Conclusions</SubHeadline2><Pgraph>There are different, design-specific tools available which can be preferred for quality assessment, because of its wider coverage of substantive elements of internal validity. To minimise the subjectivity of the assessment, tools with a detailed and precise operationalisation of the individual elements should be applied. For health economic studies, tools should be developed and complemented with instructions, which define the appropriateness of the criteria. Further research is needed to identify study characteristics that influence the internal validity of studies.</Pgraph></Abstract>
    <TextBlock language="en" linked="yes" name="Summary">
      <MainHeadline>Summary</MainHeadline><SubHeadline>1. Health political background</SubHeadline><Pgraph>Healthcare policy decisions should be based on the best available scientific evidence. Scientific evidence is based on the synthesis of study results, which are if possible unbiased and thus have a high credibility.</Pgraph><SubHeadline>2. Scientific background</SubHeadline><Pgraph>Quality assessments to evaluate the credibility of studies is an inherent component of HTA reports (HTA &#61; Health Technology Assessment) and systematic reviews. There are various quality assessment tools (QAT) that rate the extent of systematic distortion in study results by confounding or bias (internal validity).</Pgraph><Pgraph>There is no gold standard for assessing the study quality, since the true associations of exposures&#47;interventions and outcomes are unknown. The existing tools for assessing study quality can be classified into scales, checklists and component ratings. In a scale, each item receives a numerical rating that will be added to a sum score. Scales are no longer recommended, because they do not reflect the correct extent of validity. A checklist consists of at least two items without a numerical rating system. The component rating includes components like &#8220;randomization&#8221; and &#8220;blinding&#8221;, which are also not evaluated numerically, but qualitatively. </Pgraph><Pgraph>In this report methodological quality that is used synonymously with the expression study quality and must be distinguished from the reporting quality, which is not part of this report.</Pgraph><Pgraph>The quality of health economic studies is determined by (a) the validity of study results, (b) the compliance with methodological standards of health economic evaluation and (c) the access to appropriate cost data. The metho<TextGroup><PlainText>dolo</PlainText></TextGroup>gical standards of health economic evaluations are described in health economic literature and international guidelines for providing health economic evaluations. Health economic evaluations are based on the theoretical concepts of welfare economics and decision analysis. The standards of economic evaluation have reached a broad consensus regarding the constitutive elements of health economic evaluation and approaches to cost analysis and outcome determination. Nevertheless, some guidelines recommend different approaches to be used. The elements of health economic evaluation contain (1<TextGroup><PlainText>) t</PlainText></TextGroup>he justification and the choice of the evaluation type, (2<TextGroup><PlainText>) t</PlainText></TextGroup>he identification and the selection of comparators, (3<TextGroup><PlainText>) th</PlainText></TextGroup>e perspective, (4) the identification of resource use and costs, (5) the identification of all relevant effects and benefits, (6) the declaration of the time horizon, (7<TextGroup><PlainText>) mo</PlainText></TextGroup>delling, (8) discounting, (9) incremental analysis, (10<TextGroup><PlainText>) u</PlainText></TextGroup>ncertainty analysis.</Pgraph><SubHeadline>3. Research questions</SubHeadline><Pgraph>What QAT are available to assess the quality of systematic reviews&#47;HTA reports, intervention studies, observational studies, diagnostic studies and health economic studies, how do they differ among each other and what conclusions can be drawn from these results for quality assessments&#63;</Pgraph><SubHeadline>4. Methods</SubHeadline><Pgraph>A systematic search of relevant electronic databases from 1988 onwards is done to identify QAT, supplemented by screening of the references of the HTA reports of the German Agency for Health Technology Assessment (DAHTA) and in addition an internet search. Formal characteristics and substantive elements of the tools are extracted. The substantive elements of the QAT are extracted specific to systematic reviews, intervention studies, observational studies, diagnostic studies, and health economic studies. The literature search, the data extraction and the quality assessment are carried out independently by two reviewers. Different ratings of the reviewers are solved by consensus.</Pgraph><Pgraph>The content of tools for the quality assessment of systematic reviews, intervention studies, observational studies, and diagnostic studies is extracted by using modified criteria lists. The elements of the lists are made up of study characteristics, which have either empirically demonstrated evidence of an effect on the level of the study results or its distorting effect on study results is generally accepted. The elements for study characteristics of systematic reviews, intervention studies, and observational studies are summarised in several domains. Out of all elements, those elements with empirical evidence as a potential source of bias or elements being classified on a theoretical basis as essential for internal validity are defined as relevant elements.</Pgraph><Pgraph>In order to provide a basis for the selection of a tool, only generic tools and their elements of internal validity are considered. Furthermore, the presence of sufficient operationalisation is required. The tools are distinguished by the total number of covered elements, covered relevant elements, and covered domains. Tabular summaries of the results are prepared for each study design and the results across the QAT are assessed qualitatively to identify more and less comprehensive tools.</Pgraph><Pgraph>For the data extraction of the basic elements of health economic studies, a form is developed, because there are no systematic reviews that can provide a basis for the data extraction. In the first step of the development process health economic literature and current national and international guidelines for creating health and pharmacoeconomic studies are screened. Literature and guidelines address mainly similar topics (elements of health economic evaluation). In the second step, the key elements are worked out to investigate the relation to study quality (internal validity) of health economic studies. Domains and items are developed based on the elements of health economic evaluations adapted from literature and guidelines. Domains and items are transferred into a form for analysing the quality assessment tools for health economic evaluation studies. This form helps to extract the various tools. In the development of domains and items, effort is made to ensure that items relate primarily to the internal validity.</Pgraph><Pgraph>In the health economic extraction form a gradation for rating the different items is made as such: &#8220;appropriate&#8221;, &#8220;justified&#8221;, &#8220;reported&#8221; and &#8220;missing&#8221;. If a quality assessment tool asks for a special item addressed in a study, a rating with &#8220;reported&#8221; is made (e. g. perspective of analysis, outcome parameter or discount rate). An item is rated with &#8220;justified&#8221;, the quality assessment tool asks for the rationale for choosing a special specification. The rating &#8220;appropriate&#8221; is assigned when the quality assessment tool asks for the adequacy of used methodology in an item.</Pgraph><Pgraph>In order to find out about problems in the practical application of tools, a workshop is conducted. Objectives of the workshop are to exchange and discuss user experiences with quality assessment tools for intervention studies, requirements, and content of tools on the quality of intervention studies. These discussions will examine practical issues that are rarely discussed in the literature. A consensus on individual aspects is not pursued. The target audience include authors of the German HTA reports and systematic reviews of the German Institute for Medical Documentation and Information (DIMDI) and the Institute for Quality and Efficiency in Health Care (IQWiG), experts in the field of methodology, researchers (from the disciplines of medicine conducting public health, epidemiology, prevention, health economics), involved in healthcare policy-relevant evaluations, as well as institutes&#47;associations conducting systematic reviews. Topics are introduced by presentations of invited experts followed by moderated discussions. Presentations and discussions are documented by audio recordings and transcriptions.</Pgraph><SubHeadline>5. Results</SubHeadline><Pgraph>The extensive literature search yields a total of 147 tools to assess the study quality: 15 for systematic reviews&#47;HTA reports&#47;meta-analysis, 80 for intervention studies, 30 for observational studies, 17 for diagnostic studies and 22 for health economic studies. Among the QAT are 16 tools that can be used both for intervention and observational studies.</Pgraph><Pgraph>An initial screening of HTA reports in the DAHTA database indicates that a quality assessment was reported in 87&#37; of the identified documents. However, in only half of these reports the chosen QAT was mentioned.</Pgraph><Pgraph>The tools show a wide variation of the formal and content characteristics. Some tools contain not only items of internal validity, but also of reporting quality and external validity. Design-specific generic tools for the assessment of systematic reviews&#47;HTA reports&#47;meta-analysis, intervention studies, observational studies and diagnostic studies are identified, which cover most elements for internal validity, most of the domains with at least one, or 50&#37; of the contained elements as well as the most relev<TextGroup><PlainText>an</PlainText></TextGroup>t elements. More and less comprehensive tools can be distinguished.</Pgraph><Pgraph>The tools that examine the quality of health economic studies also reveal significant differences both in the consideration of various topics, as well as in the assessment of quality. In addition, substantial differences exist in the operationalisation of the items. Across all study designs, none of the included tools meet all elements.</Pgraph><Pgraph>A total of 27 people from HTA and EBM-associated (EBM &#61; evidence-based medicine) institutions take part in the workshop. The following discussion points are suggested by the participants: the external validity as a part of assessment tools, the subjectivity of the assessment process, dealing with low reporting quality, endpoint versus study related quality assessment and incorporation of the results of the quality assessment. As consensus at the workshop is not intended, individual opinions are presented. External and internal validity should be assessed separately from each other. Items, which leave much room for subjective ratings, lead to a lack of interrater reliability and result in a high need for discussions. This can be avoided by a precise and detailed operationalisation of the items.</Pgraph><SubHeadline>6. Discussion</SubHeadline><Pgraph>The quality of studies can be defined in various ways. It is a dominating view that an assessment of study quality can either express the level of internal validity or the possibility of distortion. However, the inventory of the numerous identified tools shows that many of them include the assessment of reporting quality. Mixing the reporting quality and the internal validity can lead to a misinterpretation of the study quality, if the elements of the reporting quality are used as a surrogate for assessing the methodological quality.</Pgraph><Pgraph>Based on the tabular presentation of covered content items, the identified QAT can be compared. However, this approach has limitations, since there is no scientific consensus on the necessary elements of the internal validity, and not all of the generally accepted elements are based on empirical evidence. Therefore, the highest possible number of covered elements is not necessarily an indication of an appropriate tool.</Pgraph><Pgraph>For further differentiation of the QAT, the number of covered relevant elements is presented. While for relevant elements of intervention and diagnostic studies only evidence based elements affecting the internal validity are selected, this is true for only some of the relevant elements of observational studies and systematic reviews. Overall, the performance of relevant elements should be used cautiously to identify tools that are more or less comprehensive. Depending on the topic, it should be examined, whether all items of a chosen tool are relevant, and whether additional quality items should be assessed as a part of the assessment.</Pgraph><Pgraph>Some elements of QAT cannot be clearly assigned to the reporting quality, the internal or external validity. For example, the calculation of the required sample size is only associated with the precision of the results without affecting the size of the effect estimator. However, the precision of the effect estimates may affect the significance of the results.</Pgraph><Pgraph>Not all the tools ever used have been found. However, the possibility of having missed important and frequently applied tools is low, since different data sources including the internet were screened.</Pgraph><Pgraph>In general, the higher the scope for subjective assessments, the lower the agreement between the reviewers is. Therefore, every item of a tool should be operationalised as detailed and precisely as possible. Where necessary, the instructions can be adjusted to ensure that all reviewers are clear on how to score study quality. About 40&#37; of the included tools provide more detailed guidance for assessment.</Pgraph><Pgraph>The quality assessment of health economic studies is an essential part of creating HTA reports. A total of 22 health economic QAT is identified. There are considerable differences regarding:</Pgraph><Pgraph><UnorderedList><ListItem level="1">the number of included items of the health economic extraction form (elements of health economic evaluation)</ListItem><ListItem level="1">the assessment quality: appropriate &#8211; justified &#8211; r<TextGroup><PlainText>eporte</PlainText></TextGroup>d</ListItem><ListItem level="1">the diversity of quality sampling</ListItem></UnorderedList></Pgraph><Pgraph>None of the analysed QAT covers the whole range of relev<TextGroup><PlainText>an</PlainText></TextGroup>t themes (elements of health economic evaluation). Only few consider most domains of the extraction form. Only three tools check the adequacy of the metho<TextGroup><PlainText>dologic</PlainText></TextGroup>al procedures. Many tools ask for the methodol<TextGroup><PlainText>ogic</PlainText></TextGroup>al adequacy in few items. None of the QAT defines what is meant with adequacy. Most tools demand a justification for the methodological procedures or analyse, which items are reported.</Pgraph><Pgraph>Significant differences also exist in the sophistication of the quality assessment. The question how differentiated an assessment tool discusses the different elements of health economic evaluation can be answered by the number of items in a QAT. Because a tool is based only on few items, questions have to be more generally introduced. Reviewers will have a considerable scope for interpretation. For extensive tools with a great number of items, they can be operationalised to be more specific, so the scope for interpretation will be significantly reduced and more objective assessments are supported.</Pgraph><SubHeadline>7. Conclusions</SubHeadline><Pgraph>The quality assessment of studies is a mandatory part of systematic reviews, and has to be documented transparently. There are different, design-specific QAT available that can be selected according to their substantive coverage of the elements of internal validity.</Pgraph><Pgraph>There is consensus that scales should not be used for quality assessments or should be used without quantitat<TextGroup><PlainText>iv</PlainText></TextGroup>e assessment. To minimise the subjectivity of the evaluation, tools with a detailed and precise operationalisation of the items are preferable. If possible, the chosen tool should be tested in a few studies in advance to check if the operationalisation of the items needs to be supplemented or clarified to minimise the subjectivity of the evaluation and to ensure uniform scoring of all reviewers.</Pgraph><Pgraph>Further research is needed to identify study characteristics that influence the internal validity of studies, especially for observational studies. So far, there is no evidence that qualitative overall assessment of study quality is correctly associated with the internal validity.</Pgraph><Pgraph>For assessing the quality of health economic studies, tools should be developed, which (1) cover all relevant elements of health economic evaluation, (2) assess the appropriate use of methodological procedures and (3) differentiate the various topics sufficiently. The adequacy should be based on the standards of health economic evaluation (defined by standard literature and international guidelines). Advice for filling in and operationalisations should be part of the assessment tools and, in addition, adequacy should be accurately described and defined.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Kurzfassung">
      <MainHeadline>Kurzfassung</MainHeadline><SubHeadline>1. Gesundheitspolitischer Hintergrund</SubHeadline><Pgraph>Gesundheitspolitische Entscheidungen sollen evidenzbasiert auf der Grundlage von wissenschaftlichen Erkenntnissen getroffen werden. Evidenz basiert auf der Synthese von Studienergebnissen, die m&#246;glichst unverzerrt sind und damit eine hohe Glaubw&#252;rdigkeit aufweisen.</Pgraph><SubHeadline>2. Wissenschaftlicher Hintergrund</SubHeadline><Pgraph>Zur Einsch&#228;tzung der Glaubw&#252;rdigkeit von Studien sind Qualit&#228;tsbewertungen immanenter Bestandteil von HTA-Berichten (HTA &#61; Health Technology Assessment) und systematischen &#220;bersichtsarbeiten. Diese pr&#252;fen, inwieweit die Studienergebnisse systematisch durch Confounding oder Bias verzerrt sein k&#246;nnen (interne Validit&#228;t). </Pgraph><Pgraph>Es gibt keinen Goldstandard f&#252;r die Bewertung der Studienqualit&#228;t, da die wahren Zusammenh&#228;nge von Exposition&#47;Intervention und Outcome unbekannt sind. Die eingesetzten Instrumente k&#246;nnen als Skalen, Checklisten und Komponentenbewertungen klassifiziert werden. Bei einer Skala erh&#228;lt jedes Item eine numerische Bewertung, die zu einem Summenscore addiert wird. Skalen werden nicht mehr empfohlen, da sie die H&#246;he der Validit&#228;t nicht korrekt abbilden. Eine Checkliste besteht aus mindestens zwei Items ohne numerisches Bewertungssystem. Die Komponentenbewertung enth&#228;lt als Items Komponenten wie &#8222;Randomisierung&#8220; und &#8222;Verblindung&#8220;, die ebenfalls nicht numerisch, sondern qualitativ bewertet werden. Von der methodischen Qualit&#228;t, die in diesem Bericht synonym zum Begriff Studienqualit&#228;t verwendet wird, muss die Berichtsqualit&#228;t abgegrenzt werden, die nicht Bestandteil dieses Berichts ist.</Pgraph><Pgraph>Die Qualit&#228;t gesundheits&#246;konomischer Studien wird bestimmt durch (a) die Validit&#228;t der Studienergebnisse, (b<TextGroup><PlainText>) di</PlainText></TextGroup>e Einhaltung methodischer Standards der gesundheits&#246;konomischen Evaluation und (c) den Zugang zu belastbaren Kosten- und Outcomedaten. Die methodischen Standards der gesundheits&#246;konomischen Evaluation sind in Standardlehrb&#252;chern und gesundheits&#246;konomischen Leitlinien beschrieben. Gesundheits&#246;konomische Evaluation basiert auf den theoretischen Konzepten der Wohlfahrts&#246;konomik und Entscheidungsanalyse. Bei den Standards der gesundheits&#246;konomischen Evaluation hat sich ein Konsens &#252;ber konstitutive Elemente der gesundheits&#246;konomischen Evaluation und &#252;ber zul&#228;ssige Ans&#228;tze der Kostenanalyse und Outcomebestimmung herausgebildet. Teilweise wird in Leitlinien explizit gefordert, alternative Ans&#228;tze zu kalkulieren. Die Elemente der gesundheits&#246;konomischen Evaluation umfassen (1) die begr&#252;ndete Auswahl der Studienform, (2) die Identifizierung und Festlegung der Vergleichsalternativen, (3) die Perspektive der Evaluation, (4) die Bestimmung von Ressourcenkonsum und Kosten, (5) die Identifizierung und Bestimmung der relevanten Effekte und Nutzen, (6<TextGroup><PlainText>) di</PlainText></TextGroup>e Festlegung des Zeithorizonts, (7) die Modellierung, (8) die Diskontierung, (9) die Inkremental- und (10) die Unsicherheitsanalyse.</Pgraph><SubHeadline>3. Fragestellung</SubHeadline><Pgraph>Welche Instrumente zur Qualit&#228;tsbewertung von system<TextGroup><PlainText>atisc</PlainText></TextGroup>hen &#220;bersichtsarbeiten, Interventions-, Beobacht<TextGroup><PlainText>ung</PlainText></TextGroup>s-, Diagnose- und gesundheits&#246;konomischen Studien gibt es, wie unterscheiden sich diese und welche Schlussfolgerungen lassen sich daraus f&#252;r die Qualit&#228;tsbewertung ableiten&#63; </Pgraph><SubHeadline>4. Methodik</SubHeadline><Pgraph>Zur Identifikation von Instrumenten wird eine systematische Recherche in einschl&#228;gigen Datenbanken ab 1988 durchgef&#252;hrt, erg&#228;nzt um eine Durchsicht der Referenzen, der HTA-Berichte der Deutschen Agentur f&#252;r Health Technology Assessment (DAHTA) sowie eine Internetrecherche. Es werden formale Charakteristika und inhaltliche Elemente der Instrumente extrahiert. Die inhaltliche Datenextraktion wird spezifisch f&#252;r Interventions-, Beobachtungs-, Diagnosestudien, systematische &#220;bersichtsarbeiten und gesundheits&#246;konomische Studien durchgef&#252;hrt. Die Literaturauswahl, die Datenextraktion und die Qualit&#228;tsbewertung werden jeweils von zwei unabh&#228;ngigen Reviewern vorgenommen, bei Diskrepanzen erfolgt eine Konsensentscheidung.</Pgraph><Pgraph>Die Inhalte von Instrumenten zur Bewertung von randomisierten Interventions-, Beobachtungs-, Diagnosestudien und systematischen &#220;bersichtsarbeiten werden anhand von modifizierten Kriterienlisten extrahiert. Die Elemente der Listen setzen sich aus Studiencharakteristika zusammen, f&#252;r die entweder empirisch ein Einfluss auf die H&#246;he der Studienergebnisse nachgewiesen oder deren Einfluss allgemein akzeptiert bzw. theoretisch fundiert ist. Die Elemente f&#252;r Studiencharakteristika von Interventions-, Beobachtungsstudien und systematischen &#220;bersichtsarbeiten werden in mehrere Dom&#228;nen zusammengefasst. Von den Elementen werden diejenigen als relevant definiert, f&#252;r die empirische Evidenz als potenzielle Biasquelle besteht bzw. die von anderen Autoren als essenziell eingestuft werden.</Pgraph><Pgraph>Als Basis f&#252;r die Auswahl eines Instruments zur Qualit&#228;tsbewertung werden designspezifisch nur generische Instrumente und ihre Elemente der internen Validit&#228;t betrachtet. Au&#223;erdem wird das Vorhandensein von Ausf&#252;llhinw<TextGroup><PlainText>eise</PlainText></TextGroup>n ber&#252;cksichtigt. Anhand der Anzahl abgedeckter Elemente insgesamt, abgedeckter relevanter Elemente sowie abgedeckter Dom&#228;nen werden umfassendere von weniger umfassenden Instrumenten unterschieden.</Pgraph><Pgraph>F&#252;r die Datenextraktion der inhaltlichen Elemente f&#252;r gesundheits&#246;konomische Studien wird ein Formular entwickelt, da keine &#220;bersichtsarbeiten vorliegen, die als Referenz dienen k&#246;nnen. Im ersten Schritt des Entwicklungsprozesses werden Standardlehrb&#252;cher sowie aktuelle nationale und internationale Leitlinien zur Erstellung gesundheits- und pharmako&#246;konomischer Studien ges<TextGroup><PlainText>icht</PlainText></TextGroup>et. Inhaltlich sprechen die Lehrb&#252;cher und Leitlinien weitgehend identische Themenschwerpunkte an (Elemente der gesundheits&#246;konomischen Evaluation). In einem zweiten Schritt werden die herausgearbeiteten Themenschwerpunkte auf den Bezug zur Studienqualit&#228;t (interne Validit&#228;t) gesundheits&#246;konomischer Studien untersucht. Es werden Dom&#228;nen und Items entwickelt, die auf den Themenschwerpunkten der Lehrb&#252;cher und Leitlinien basieren. Sie werden in ein Formular zur Extraktion von gesundheits&#246;konomischen Qualit&#228;tsbewertungsinstrumenten (QBI) &#252;berf&#252;hrt, mit dessen Hilfe die verschiedenen Bewertungsinstrumente extrahiert werden. Bei der Entwicklung der Dom&#228;nen und Items wird darauf geachtet, dass sich diese prim&#228;r auf die interne Validit&#228;t beziehen.</Pgraph><Pgraph>Im gesundheits&#246;konomischen Extraktionsformular wird f&#252;r die Bewertung der Items der ber&#252;cksichtigten QBI eine Abstufung vorgenommen: &#8222;angemessen&#8220;, &#8222;begr&#252;ndet&#8220;, &#8222;berichtet&#8220; und &#8222;fehlend&#8220;. Eine Bewertung &#8222;berichtet&#8220; wird vergeben, wenn ein QBI lediglich abfragt, ob ein Item in einer gesundheits&#246;konomischen Studie berichtet wird (z. B. Perspektive der Analyse, einbezogene Outcomeparameter oder Diskontierungsrate). Die Beurteilung &#8222;begr&#252;ndet&#8220; bedeutet, dass das QBI explizit nach Begr&#252;ndungen f&#252;r die Auspr&#228;gung des Items fragt. Die Bewertung &#8222;angemessen&#8220; hei&#223;t, dass ein Instrument eine &#220;berpr&#252;fung der Angemessenheit des Items fordert. Die &#220;berpr&#252;fung der Angemessenheit sollte an den Standards der gesundheits&#246;konomischen Evaluation orientiert sein.</Pgraph><Pgraph>Zwecks Erfahrungsaustausch zu Problemen bei der praktischen Anwendung von Instrumenten wird ein Workshop durchgef&#252;hrt. Ziele des Workshops sind der Austausch und die Diskussion der Erfahrungen sowie des Umgangs mit Bewertungsinstrumenten zur Qualit&#228;t von randomisierten und nicht-randomisierten Interventionsstudien, Anforderungen sowie Inhalte an&#47;von Bewertungsinstrumente&#47;n zur Qualit&#228;t von Interventionsstudien. Der Austausch dient zur Erg&#228;nzung von wissenschaftlichen Untersuchungen um praktische Aspekte, deren Stellenwert in Publikationen oft nicht thematisiert wird. Eine Konsensbildung zu einzelnen Aspekten wird nicht angestrebt. Zielgruppe des Workshops sind Autoren von deutschsprachigen HTA-Berichten oder systematischen Reviews des Deutschen Instituts f&#252;r Medizinische Dokumentation und Information (DIMDI) und des Instituts f&#252;r Qualit&#228;t und Wirtschaftlichkeit im Gesundheitswesen (IQWiG), Experten auf dem Gebiet der Methodik, Wissenschaftler (aus den Disziplinen Medizin, Public Health, Epidemiologie, Pr&#228;vention, Gesundheits&#246;konomie), die mit gesundheitspolitisch relevanten Evaluationen befasst sind, sowie Institute&#47;Verb&#228;nde, die systematische Reviews mit Qualit&#228;tsbewertung durchf&#252;hren. Referenten werden mit ihren Vortr&#228;gen die entsprechenden Themen einleiten. Im Anschluss an die Vortr&#228;ge sind jeweils 20 bis 30 Minuten f&#252;r eine moderierte Diskussion vorgesehen. Zur Dokumentation wird u. a. eine Audio-Aufzeichnung mit anschlie&#223;ender Transkription durchgef&#252;hrt.</Pgraph><SubHeadline>5. Ergebnisse</SubHeadline><Pgraph>Die umfassende Recherche ergibt insgesamt 147 Instrumente zur Bewertung der Studienqualit&#228;t: 15 f&#252;r systematische Reviews&#47;HTA-Berichte&#47;Metaanalysen, 80 f&#252;r Interventions-, 30 f&#252;r Beobachtungs-, 17 f&#252;r Diagnose- und 22 f&#252;r gesundheits&#246;konomische Studien. Unter den QBI sind 16 Instrumente, die sowohl f&#252;r Interventions- als auch f&#252;r Beobachtungsstudien eingesetzt werden k&#246;nnen.</Pgraph><Pgraph>Ein initiales Screening von HTA-Berichten in der DAHTA-Datenbank zeigt, dass in 87&#37; der Berichte die Durchf&#252;hrung einer Qualit&#228;tsbewertung angegeben wird. Von diesen wird ist jedoch nur bei der H&#228;lfte das verwendete QBI dokumentiert.</Pgraph><Pgraph>Die identifizierten Instrumente weisen eine gro&#223;e Variation hinsichtlich der formalen und inhaltlichen Charakteristika auf. Einige Instrumente enthalten neben Items zur internen Validit&#228;t auch welche zur Berichtsqualit&#228;t und zur externen Validit&#228;t. Designspezifisch werden generische Instrumente f&#252;r die Bewertung von systematischen Reviews&#47;HTA-Berichten&#47;Metaanalysen, Interventions-, Beobachtungs- und Diagnosestudien ermittelt, die die meisten Elemente zur internen Validit&#228;t, die meisten Dom&#228;nen mit mindestens einem bzw. 50&#37; der enthaltenen Elemente sowie die meisten als relevant definierten Elemente abdecken. Es k&#246;nnen umfassendere von weniger umfassenden Instrumenten unterschieden werden.</Pgraph><Pgraph>Die Instrumente, die die Qualit&#228;t gesundheits&#246;konomischer Studien untersuchen, weisen ebenfalls erhebliche Unterschiede auf sowohl in der Betrachtung der verschiedenen Themenbereiche, als auch in der Bewertung der Qualit&#228;t. Zudem bestehen betr&#228;chtliche Differenzen in den Operationalisierungen. &#220;ber alle Studiendesigns hinweg erf&#252;llt keines der eingeschlossenen Instrumente alle Bereiche.</Pgraph><Pgraph>Am Workshop nehmen insgesamt 27 Personen aus HTA- und EbM-assoziierten (EbM &#61; Evidenzbasierte Medizin) Institutionen teil. Folgende Diskussionspunkte werden von den Teilnehmern vorgeschlagen: externe Validit&#228;t als Bestandteil von Bewertungsinstrumenten, Subjektivit&#228;t der Bewertung, Umgang mit geringer Berichtsqualit&#228;t, endpunkt- statt studienbezogene Qualit&#228;tsbewertung und Integration der Ergebnisse der Bewertung. Eine Konsensbildung ist im Rahmen des Workshops nicht vorgesehen, es werden daher Einzelmeinungen wiedergegeben. Externe und interne Validit&#228;t sollten getrennt voneinander bewertet werden. Items, die einen gro&#223;en Spielraum f&#252;r subjektive Bewertungen lassen, f&#252;hren zu mangelnder &#220;bereinstimmung der Bewertung und hohem Diskussionsbedarf. Dies kann durch eine pr&#228;zise Operationalisierung der Items vermieden werden. </Pgraph><SubHeadline>6. Diskussion</SubHeadline><Pgraph>Studienqualit&#228;t kann unterschiedlich operationalisiert werden. Es &#252;berwiegt die Auffassung, dass eine Bewertung der Studienqualit&#228;t die H&#246;he der internen Validit&#228;t bzw. das Verzerrungspotenzial abbilden sollte. Die Bestandsaufnahme der zahlreichen identifizierten Instrumente zeigt jedoch, dass viele Instrumente auch Items der Berichtsqualit&#228;t enthalten. Diese Vermischung von Berichtsqualit&#228;t und interner Validit&#228;t kann zu einer Fehleinsch&#228;tzung der Studienqualit&#228;t f&#252;hren, wenn Elemente der Berichtsqualit&#228;t als Surrogatparameter f&#252;r die Einsch&#228;tzung der methodischen Qualit&#228;t herangezogen werden.</Pgraph><Pgraph>Anhand der tabellarischen Darstellung abgedeckter inhaltlicher Items k&#246;nnen die identifizierten QBI verglichen werden. Dieses Vorgehen ist jedoch mit Einschr&#228;nkungen verbunden, da kein Konsens &#252;ber geeignete Kriterien existiert und nicht f&#252;r alle Elemente Evidenz vorliegt, dass sie die H&#246;he der internen Validit&#228;t einer Studie beeinflussen. Daher ist eine hohe Zahl an abgedeckten Elementen nicht notwendigerweise ein Hinweis auf ein gutes Instrument.</Pgraph><Pgraph>Zur weiteren Differenzierung der QBI wird die Anzahl der als relevant definierten Elemente dargestellt. W&#228;hrend f&#252;r die relevanten Elemente in Interventions- und Diagnosestudien nur evidenzbasierte Biasquellen ausgew&#228;hlt werden, trifft dies nur f&#252;r einige der relevanten Elemente in Beobachtungsstudien und systematischen &#220;bersichtsarbeiten zu. Insgesamt kann die Erf&#252;llung von relevanten Elementen nur als erste Einsch&#228;tzung dienen, um Instrumente zu identifizieren, die mehr oder weniger umfassend sind. Je nach Themenbereich sollte jeweils gepr&#252;ft werden, ob alle Items des Instruments relevant sind bzw. ob f&#252;r das jeweilige Thema zus&#228;tzliche Items einbezogen werden sollten.</Pgraph><Pgraph>Einige inhaltliche Elemente von QBI waren nicht eindeutig der Berichtsqualit&#228;t, der internen oder externen Validit&#228;t zuzuordnen. Beispielsweise ist die Berechnung der erforderlichen Stichprobengr&#246;&#223;e zun&#228;chst nur mit der Pr&#228;zision der Ergebnisse assoziiert ohne dass die H&#246;he des Effektsch&#228;tzers beeinflusst wird. Die Pr&#228;zision der Effektsch&#228;tzer kann jedoch Einfluss auf die Signifikanz der Ergebnisse haben.</Pgraph><Pgraph>Sicher werden nicht alle jemals eingesetzten Instrumente gefunden. Gleichwohl wird die M&#246;glichkeit, bedeutsame und h&#228;ufig eingesetzte Instrumente &#252;bersehen zu haben, als gering eingesch&#228;tzt, u. a. auch durch die Nutzung mehrerer Datenquellen einschlie&#223;lich Internet.</Pgraph><Pgraph>Generell gilt, je h&#246;her der Spielraum f&#252;r subjektive Bewertungen ist, desto geringer ist die &#220;bereinstimmung der Reviewer. Die einzelnen Items der Instrumente sollten daher m&#246;glichst pr&#228;zise und ausf&#252;hrlich operationalisiert sein. Ggf. sind die Ausf&#252;llhinweise anzupassen, um eine eindeutige Bewertungsgrundlage f&#252;r alle Reviewer sicherzustellen. Etwa 40&#37; der eingeschlossenen Instrumente geben eine ausf&#252;hrlichere Anleitung zur Durchf&#252;hrung der Qualit&#228;tsbewertung.</Pgraph><Pgraph>Die Bewertung der Qualit&#228;t gesundheits&#246;konomischer Studien ist ein zwingend erforderlicher Bestandteil bei der Erstellung von HTA-Berichten. Insgesamt werden 22 gesundheits&#246;konomische QBI identifiziert. Zwischen den untersuchten Instrumenten gibt es deutliche Unterschiede bez&#252;glich:</Pgraph><Pgraph><UnorderedList><ListItem level="1">Anzahl der untersuchten Items aus dem Extraktionsformular (Themenschwerpunkte)</ListItem><ListItem level="1">Bewertungsqualit&#228;t: angemessen &#8211; begr&#252;ndet &#8211; b<TextGroup><PlainText>erichte</PlainText></TextGroup>t</ListItem><ListItem level="1">Differenziertheit der Qualit&#228;tsabfragen.</ListItem></UnorderedList></Pgraph><Pgraph>Keines der untersuchten Bewertungsinstrumente deckt die gesamte Bandbreite der Themenschwerpunkte (Elemente der gesundheits&#246;konomischen Evaluation) ab. Nur wenige Instrumente ber&#252;cksichtigen fast alle Bereiche des Extraktionsbogens. Nur drei Instrumente &#252;berpr&#252;fen &#252;berwiegend die Angemessenheit der methodischen Verfahren. In vielen Instrumenten wird zumindest bei einigen Items nach der Angemessenheit der Verfahren gefragt. F&#252;r keines der Instrumente wird jedoch erl&#228;utert, was unter &#8222;angemessen&#8220; zu verstehen ist. Die Mehrzahl der Instrumente fordert Begr&#252;ndungen f&#252;r konkrete Auspr&#228;gungen der Items ein oder untersucht lediglich, ob und welche Items berichtet werden.</Pgraph><Pgraph>Deutliche Unterschiede bestehen auch in der Differenziertheit der Qualit&#228;tsabfragen. Wie differenziert ein Bewertungsinstrument die Themenschwerpunkte erfragt, wird &#252;ber die Anzahl der Items abgebildet. Wenn sich die Qualit&#228;tsbewertung auf wenige Items st&#252;tzt, m&#252;ssen die Fragen global gestellt werden. Reviewern bleiben dann gr&#246;&#223;ere Spielr&#228;ume bei der Interpretation von Items. Bei umfangreicheren Instrumenten mit gro&#223;er Itemanzahl lassen sich Items st&#228;rker operationalisieren, sodass die Interpretationsspielr&#228;ume deutlich eingeschr&#228;nkt werden und objektivere Bewertungen unterst&#252;tzt werden.</Pgraph><SubHeadline>7. Schlussfolgerungen</SubHeadline><Pgraph>Die Qualit&#228;tsbewertung von Studien ist ein obligatorischer Arbeitsschritt bei der Erstellung von systematischen &#220;bersichtsarbeiten, der transparent darzustellen ist. Es stehen unterschiedliche designspezifische Instrumente zur Verf&#252;gung, die entsprechend ihrer inhaltlichen Abdeckung von Elementen der internen Validit&#228;t f&#252;r die Qualit&#228;tsbewertung ausgew&#228;hlt werden k&#246;nnen.</Pgraph><Pgraph>F&#252;r die Auswahl eines QBI gilt, dass Skalen nicht bzw. ohne quantitative Gesamtbewertung eingesetzt werden sollten. Zur Minimierung der Subjektivit&#228;t der Bewertung sind Instrumente mit einer ausf&#252;hrlichen und pr&#228;zisen Operationalisierung der einzelnen Elemente vorteilhaft. Wenn m&#246;glich, sollten die ausgew&#228;hlten Instrumente zuvor an ausgew&#228;hlten Studien getestet und bei Bedarf die Operationalisierung der Items erg&#228;nzt bzw. pr&#228;zisiert werden, um die Subjektivit&#228;t der Bewertung zu minimieren und eine hohe &#220;bereinstimmung der Bewertungen sicherzustellen.</Pgraph><Pgraph>Weitere Forschung ist erforderlich, um Studiencharakteristika zu identifizieren, die die interne Validit&#228;t von Studien beeinflussen. Dies gilt insbesondere f&#252;r Beobachtungsstudien. Offen ist auch, inwieweit die Validit&#228;t von Studien durch eine qualitative Gesamtbewertung korrekt gemessen wird.</Pgraph><Pgraph>F&#252;r die gesundheits&#246;konomische Qualit&#228;tsbewertung sollten Instrumente entwickelt werden, die (1) die gesamten Themenschwerpunkte abbilden, (2) die angemessene Umsetzung von Items in gesundheits&#246;konomischen Studien &#252;berpr&#252;fen und (3) die Themenschwerpunkte hinreichend differenziert abfragen. Die Angemessenheit sollte sich an den Standards der gesundheits&#246;konomischen Evaluation orientieren (definiert durch Standardlehrb&#252;cher und internationale Guidelines). Es sollten Erl&#228;uterungen und Ausf&#252;llhinweise zu den Bewertungsinstrumenten entwickelt werden, in denen beschrieben wird, wie Angemessenheit definiert ist.</Pgraph></TextBlock>
    <Media>
      <Tables>
        <NoOfTables>0</NoOfTables>
      </Tables>
      <Figures>
        <NoOfPictures>0</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
      <AdditionalDocument>hta260&#95;bericht&#95;de.pdf</AdditionalDocument>
    </Media>
  </OrigData>
</GmsArticle>