<?xml version="1.0" encoding="iso-8859-1" standalone="no"?>
<GmsArticle>
  <MetaData>
    <Identifier>zma000727</Identifier>
    <IdentifierDoi>10.3205/zma000727</IdentifierDoi>
    <IdentifierUrn>urn:nbn:de:0183-zma0007272</IdentifierUrn>
    <ArticleType language="de">Forschungsarbeit</ArticleType>
    <ArticleType language="en">research article</ArticleType>
    <TitleGroup>
      <Title language="de">Leitsymptomvorlesungen im klinischen Studienabschnitt - Effekte evaluationsbasierter Interventionen auf eine Gro&#223;gruppen-Lehrveranstaltung</Title>
      <TitleTranslated language="en">Lectures based on cardinal symptoms in undergraduate medicine - effects of evaluation-based interventions on teaching large groups </TitleTranslated>
    </TitleGroup>
    <CreatorList>
      <Creator>
        <PersonNames>
          <Lastname>Kuhnigk</Lastname>
          <LastnameHeading>Kuhnigk</LastnameHeading>
          <Firstname>Olaf</Firstname>
          <Initials>O</Initials>
          <AcademicTitle>Dr. med.</AcademicTitle>
          <AcademicTitleSuffix>MME (Bern)</AcademicTitleSuffix>
        </PersonNames>
        <Address>Universit&#228;tsklinikum Hamburg-Eppendorf, Klinik f&#252;r Psychiatrie und Psychotherapie, Martinistra&#223;e 52, 20246 Hamburg, Deutschland, Tel.: &#43;49 (0)40&#47;7410-57675, Fax: &#43;49 (0)40&#47;7410-54702<Affiliation>Universit&#228;tsklinikum Hamburg-Eppendorf, Klinik f&#252;r Psychiatrie und Psychotherapie, Hamburg, Deutschland</Affiliation><Affiliation>Universit&#228;tsklinikum Hamburg-Eppendorf, Prodekanat f&#252;r Lehre, Hamburg, Deutschland</Affiliation></Address>
        <Email>o.kuhnigk&#64;uke.de</Email>
        <Creatorrole corresponding="yes" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Weidtmann</Lastname>
          <LastnameHeading>Weidtmann</LastnameHeading>
          <Firstname>Katja</Firstname>
          <Initials>K</Initials>
          <AcademicTitle>Dr. med.</AcademicTitle>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;tsklinikum Hamburg-Eppendorf, Prodekanat f&#252;r Lehre, Hamburg, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Anders</Lastname>
          <LastnameHeading>Anders</LastnameHeading>
          <Firstname>Sven</Firstname>
          <Initials>S</Initials>
          <AcademicTitle>Dr. med.</AcademicTitle>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;tsklinikum Hamburg-Eppendorf, Institut f&#252;r Rechtsmedizin, Hamburg, Deutschland</Affiliation>
        </Address>
        <Email>s.anders&#64;uke.uni-hamburg.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>H&#252;neke</Lastname>
          <LastnameHeading>H&#252;neke</LastnameHeading>
          <Firstname>Bernd</Firstname>
          <Initials>B</Initials>
          <AcademicTitle>Prof. Dr. med.</AcademicTitle>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;tsklinikum Hamburg-Eppendorf, Klinik und Poliklinik f&#252;r Geburtshilfe und Pr&#228;natalmedizin, Hamburg, Deutschland</Affiliation>
        </Address>
        <Email>hueneke&#64;uke.uni-hamburg.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Santer</Lastname>
          <LastnameHeading>Santer</LastnameHeading>
          <Firstname>Ren&#233;</Firstname>
          <Initials>R</Initials>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;tsklinikum Hamburg-Eppendorf, Klinik und Poliklinik f&#252;r Kinder- und Jugendmedizin, Hamburg, Deutschland</Affiliation>
        </Address>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
      <Creator>
        <PersonNames>
          <Lastname>Harendza</Lastname>
          <LastnameHeading>Harendza</LastnameHeading>
          <Firstname>Sigrid</Firstname>
          <Initials>S</Initials>
          <AcademicTitle>PD Dr. med.</AcademicTitle>
          <AcademicTitleSuffix>MME</AcademicTitleSuffix>
        </PersonNames>
        <Address>
          <Affiliation>Universit&#228;tsklinikum Hamburg-Eppendorf,      III. Medizinische Klinik, Hamburg, Deutschland</Affiliation>
        </Address>
        <Email>:harendza&#64;uke.uni-hamburg.de</Email>
        <Creatorrole corresponding="no" presenting="no">author</Creatorrole>
      </Creator>
    </CreatorList>
    <PublisherList>
      <Publisher>
        <Corporation>
          <Corporatename>German Medical Science GMS Publishing House</Corporatename>
        </Corporation>
        <Address>D&#252;sseldorf</Address>
      </Publisher>
    </PublisherList>
    <SubjectGroup>
      <SubjectheadingDDB>610</SubjectheadingDDB>
      <Keyword language="en">Lecture</Keyword>
      <Keyword language="en">evaluation</Keyword>
      <Keyword language="en">audit</Keyword>
      <Keyword language="en">intervention</Keyword>
      <Keyword language="en">guideline</Keyword>
      <Keyword language="en">didactic skills</Keyword>
      <Keyword language="en">faculty development</Keyword>
      <Keyword language="en">quality assurance</Keyword>
      <Keyword language="de">Vorlesung</Keyword>
      <Keyword language="de">Evaluation</Keyword>
      <Keyword language="de">Audit</Keyword>
      <Keyword language="de">Intervention</Keyword>
      <Keyword language="de">Leitfaden</Keyword>
      <Keyword language="de">didaktische Fertigkeiten</Keyword>
      <Keyword language="de">Dozententraining</Keyword>
      <Keyword language="de">Qualit&#228;tssicherung</Keyword>
      <SectionHeading language="en">medicine</SectionHeading>
      <SectionHeading language="de">Humanmedizin</SectionHeading>
    </SubjectGroup>
    <DateReceived>20100115</DateReceived>
    <DateRevised>20100802</DateRevised>
    <DateAccepted>20100923</DateAccepted>
    <DatePublishedList>
      
    <DatePublished>20110204</DatePublished></DatePublishedList>
    <Language>germ</Language>
    <LanguageTranslation>engl</LanguageTranslation>
    <SourceGroup>
      <Journal>
        <ISSN>1860-3572</ISSN>
        <Volume>28</Volume>
        <Issue>1</Issue>
        <JournalTitle>GMS Zeitschrift f&#252;r Medizinische Ausbildung</JournalTitle>
        <JournalTitleAbbr>GMS Z Med Ausbild</JournalTitleAbbr>
      </Journal>
    </SourceGroup>
    <ArticleNo>15</ArticleNo>
  </MetaData>
  <OrigData>
    <Abstract language="de" linked="yes"><Pgraph>In der medizinischen Hochschulausbildung ist das Veranstaltungsformat &#8222;Vorlesung&#8220; trotz vielfacher Kritik  weiterhin ein wesentliches Element bestehender Curricula. Im Rahmen der Studienreform an der Medizinischen Fakult&#228;t der Universit&#228;t Hamburg im Jahr 2004 wurden im reformierten klinischen Curriculum die fachspezifischen Vorlesungen durch Leitsymptomvorlesungen (LSV) ersetzt, die sich durch alle sechs Themenbl&#246;cke der Studienjahre drei bis f&#252;nf ziehen. Da die regelm&#228;&#223;igen Trimesterabschlussevaluationen der Studierenden auf einen Verbesserungsbedarf der LSV hindeuteten, wurde in dieser Studie die LSV mit Terminevaluationen durch anwesende Studierende und durch geschulte Auditoren (PJ-Studierende und wissenschaftliche Mitarbeiter) untersucht. Auf der Basis dieser Ergebnisse erfolgte ein schriftliches Feedback der Evaluationsdaten an die Lehrenden in Kombination mit Informationsmaterial &#252;ber eine optimale Gestaltung der LSV nach modernen didaktischen Gesichtspunkten. In einer zweiten Erhebung wurden die Effekte der Intervention untersucht. Es zeigte sich, dass auf der Ebene von Schulnoten nach der Intervention nur geringe Verbesserungen der Qualit&#228;t der LSV bemerkbar waren. In der Bewertung der Einzelmerkmale, insbesondere zur didaktischen Qualit&#228;t, lie&#223;en sich hingegen signifikante Verbesserungen aufzeigen. Insgesamt bewerteten Studierende die LSV in der ersten Erhebungsphase bezogen auf die Einzelmerkmale signifikant positiver als die geschulten Auditoren. Dieser Effekt war in der zweiten Erhebungsphase nicht mehr nachweisbar. Unter den Auditoren bestand eine gute Inter-Rater-Reliabilit&#228;t. Durch diese Untersuchung wurde insbesondere deutlich, dass die Einbettung von Lehrveranstaltungen auf struktureller und personeller Ebene in curriculare Gesamtkonzepte regelm&#228;&#223;ig durch Qualit&#228;tssicherungsma&#223;nahmen zu begleiten ist. Wie h&#228;ufig und in welcher Form strukturierte R&#252;ckmeldungen nach Evaluationen erfolgen m&#252;ssen, um nachhaltige Effekte auf die didaktische Qualit&#228;t der Lehrveranstaltungen zu haben, m&#252;ssen zuk&#252;nftige Studien zeigen.</Pgraph></Abstract>
    <Abstract language="en" linked="yes"><Pgraph>Despite critical voices lectures are still an important teaching format in current medical curricula. With the curricular reform at Hamburg Medical Faculty in the year 2004, all subject specific lectures were replaced by cardinal symptom oriented lectures (LSV) in the new clinical curriculum. LSVs are taught throughout all six thematic blocks in years three to five. Since regular student evaluations after each thematic block seemed to demand improvement of the LSVs, this study was carried out using evaluations of individual LSVs by the participating students and by trained auditors (final year students and academic staff). Based on these evaluations feedback containing the individual evaluation data was given in written form to the lecturers combined with information material on planning an LSV using modern didactic techniques. In a second evaluation period, the effects of this intervention were studied. Only small improvements in the LSVs&#8217; quality were noted regarding the level of marks achieved. When individual items were evaluated, especially the didactic quality, significant improvements were noticeable. Overall, on the basis of individual items students ranked the quality of the LSVs significantly higher than trained auditors during the first evaluation period. This effect was no longer seen after the second evaluation period. The inter rater reliability among the auditors was very good. This study shows that regular quality assurance is needed on the structural levels and for staff to accompany the process of embedding teaching formats into curricular concepts. Further investigation is needed to determine the adequate frequency of evaluation and the format of feedback to guarantee sustainable effects of the didactic quality of lectures. </Pgraph></Abstract>
    <TextBlock language="de" linked="yes" name="Einleitung">
      <MainHeadline>Einleitung</MainHeadline><SubHeadline>Vorlesungen als Lernformat</SubHeadline><Pgraph>Das Veranstaltungsformat  &#8222;Vorlesung&#8220; ist trotz Kritik und sich daraus ergebender Studienreformen weiterhin ein f&#252;r die medizinische Ausbildung wichtiges didaktisches Element <TextLink reference="6"></TextLink>. Einerseits wird am traditionell-systematischen Frontalvortrag kritisiert, dass er f&#252;r die Entwicklung von eigenst&#228;ndigem Denken nicht f&#246;rderlich sei. Andererseits bieten Vorlesungen die M&#246;glichkeit, Gruppen von Lernenden Informationen &#246;konomisch und ressourceneffizient zu vermitteln, einen Einstieg in komplexere Themen zu liefern, sowie aktuelle Forschungsergebnisse und pers&#246;nliche, klinische oder wissenschaftliche Erfahrungen darzustellen <TextLink reference="5"></TextLink>. Damit diese potentiellen Vorteile der Vorlesung genutzt werden k&#246;nnen, sollte das Veranstaltungsformat &#8222;Vorlesung&#8220; in die an Lernzielen orientierten curricularen Rahmenbedingungen eingef&#252;gt <TextLink reference="15"></TextLink> und zur Stimulation des eigenverantwortlichen Lernens der Studierenden mit anderen Lernformaten verkn&#252;pft werden <TextLink reference="13"></TextLink>. Inhaltlich hat sich hierbei vor allem das fallbezogene Unterrichtsformat bew&#228;hrt <TextLink reference="10"></TextLink>.</Pgraph><SubHeadline>Leitsymptomvorlesungen im Hamburger Curriculum</SubHeadline><Pgraph>An der Medizinischen Fakult&#228;t der Universit&#228;t Hamburg erfolgte im Jahr 2004 eine umfassende Reform des klinischen Studienabschnitts, wobei das reformierte Klinische Curriculum Medizin (KliniCuM) auf eine f&#228;cher&#252;bergreifende und praxisbezogene Ausbildung abzielt <TextLink reference="30"></TextLink>. Der Unterricht der Studienjahre drei bis f&#252;nf ist in sechs Themenbl&#246;cke und ein Wahlfach aufgeteilt und am Hamburger Lernzielkatalog <TextLink reference="29"></TextLink> orientiert, der die verschiedenen Lerndimensionen und Kompetenzebenen abbildet. Systematische, fachspezifische Vorlesungen wurden im Zuge dieses Reformprozesses abgeschafft und durch Vorlesungen ersetzt, die sich fallbezogen an f&#252;hrenden Symptomen verschiedener Krankheiten orientieren. Das Konzept der  Leitsymptomvorlesung (LSV) ist ein zentraler Bestandteil des KliniCuM, der sich als roter Faden durch alle Themenbl&#246;cke zieht und Zusammenh&#228;nge zwischen Inhalten anderer Veranstaltungen (z.B. problemorientierte Tutorien, Unterricht am Krankenbett) erkennbar macht. Erste Ergebnisse der Besuchsquoten und der Evaluationen deuteten auf eine gr&#246;&#223;ere Studierendenzufriedenheit mit dem neuen Format im Vergleich zu Vorlesungen vor der Studienreform hin. Allerdings zeigte sich auch fr&#252;h Verbesserungsbedarf, wobei jedoch die konkreten Kritikpunkte der Studierenden an der LSV in eher allgemein gehaltenen Kommentaren der nach dem jeweiligen Trimester durchgef&#252;hrten  Abschlussevaluation weitgehend unklar blieben <TextLink reference="32"></TextLink>.</Pgraph><SubHeadline>Evaluation als Interventionsbasis</SubHeadline><Pgraph>Studierende sind in der Lage, die didaktische Qualit&#228;t von Lehrveranstaltungen reliabel und valide zu bewerten <TextLink reference="12"></TextLink>, <TextLink reference="22"></TextLink>. Gleichzeitig wird jedoch gefordert, Lehrevaluationen nicht allein auf studentische Beurteilungen zu st&#252;tzen <TextLink reference="11"></TextLink>, <TextLink reference="21"></TextLink>. Da die LSV nach den oben genannten Kriterien <TextLink reference="10"></TextLink>, <TextLink reference="13"></TextLink> f&#252;r eine inhaltlich sinnvolle Nutzung dieses Lernformats konzipiert worden war, f&#252;hrten wir zur Qualit&#228;tskontrolle die hier vorliegende Studie durch. Diese beinhaltet eine detaillierte Untersuchung der an der LSV empfundenen M&#228;ngel und die Beobachtung der Auswirkungen einer auf dieser M&#228;ngelanalyse basierenden Intervention zur Optimierung dieser Veranstaltungsform.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Introduction">
      <MainHeadline>Introduction</MainHeadline><SubHeadline>Lectures as a learning format</SubHeadline><Pgraph>The teaching format &#8222;lecture&#8220; is, despite criticism and subsequent curricular reforms, still an important didactic element in undergraduate medical education <TextLink reference="6"></TextLink>. On the one hand, traditional systematic lectures are criticised for not promoting the development of independent thinking. On the other hand, they provide an opportunity to impart information to groups of learners in an economical and resource-efficient way, to deliver an introduction to complex topics, and to describe current research results and personal, clinical or scientific experiences <TextLink reference="5"></TextLink>. To benefit form the potential advantages of lectures as a teaching format they should be blended into a curricular framework <TextLink reference="15"></TextLink> and linked with other teaching formats to stimulate students&#8217; learning on their own accord <TextLink reference="13"></TextLink>. In this respect, a case based format has proved its value <TextLink reference="10"></TextLink>.</Pgraph><SubHeadline>Cardinal symptom-based lectures in the Hamburg curriculum</SubHeadline><Pgraph>A comprehensive reform of the clinical part of the undergraduate medical curriculum at the medical faculty of the University of Hamburg was carried out in 2004 with the main focus of the reformed clinical curriculum in medicine (KliniCuM) being on better integration of the subjects and greater practical educational components <TextLink reference="30"></TextLink>. Lessons of curricular years three to five are distributed in six thematic blocks and one elective block and content is organized according to the Hamburg catalogue of learning objectives <TextLink reference="29"></TextLink> which depicts the different dimensions of learning and levels of competencies. Systematic and subject-specific lectures were abolished during the reform process and replaced by lectures which are case-based, with their contents geared to the cardinal symptoms of different diseases. The concept of these cardinal symptom-oriented lectures (LSV) is an integral part of KliniCuM which runs through all thematic blocks as a thread and reveals the content links to the other learning sessions (problem based tutorials, bedside teaching). First measurements of participant numbers and evaluation data promise greater student satisfaction with this new lecture format as compared with the lecture format prior to the reform. A need for further improvement was still visible shortly after the reform, yet concrete points of critique were formulated by the students in mostly global commentaries in the evaluations held at the end of every thematic block and remained somewhat unclear <TextLink reference="32"></TextLink>.</Pgraph><SubHeadline>Evaluation as basis for intervention</SubHeadline><Pgraph>Students have the ability to evaluate the didactic quality of courses in a valid and reliable way <TextLink reference="12"></TextLink>, <TextLink reference="22"></TextLink>. At the same time there is a high demand to base the evaluation of teaching not only on student judgement <TextLink reference="11"></TextLink>, <TextLink reference="21"></TextLink>. Since the LSV was designed to use the value of the teaching format &#8220;lecture&#8221; according to the above mentioned criteria <TextLink reference="10"></TextLink>, <TextLink reference="13"></TextLink>, we performed this study for quality control. This included a detailed investigation of the critiques and shortcomings mentioned in the evaluations and the observations of the impact of intervention based on this analysis regarding the improvement of this teaching format. </Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Methoden">
      <MainHeadline>Methoden</MainHeadline><SubHeadline>Fragestellung und Hypothesen</SubHeadline><Pgraph>In der vorliegenden Studie wurden zwei Fragen untersucht. Erstens: Lassen sich bei Terminevaluationen durch Vorlesungsteilnehmende und Audits durch geschulte Auditoren nach einer Intervention, die auf dem Boden der erhobenen Ergebnisse durchgef&#252;hrt wird, Ver&#228;nderungen in der Bewertung der LSV feststellen&#63; Zweitens: Unterscheiden sich die Bewertungen der anwesenden Studierenden von den Urteilen geschulter Auditoren&#63;</Pgraph><Pgraph>Die zentralen Hypothesen der Studie lauteten:</Pgraph><Pgraph><OrderedList><ListItem level="1" levelPosition="1" numString="1.">Die LSV wird nach einer Intervention, insbesondere in den didaktischen Bewertungen, positiver beurteilt als vor der Intervention.</ListItem><ListItem level="1" levelPosition="2" numString="2.">Die Bewertungen geschulter Auditoren sind einheitlicher und insgesamt kritischer als die der Studierenden.</ListItem></OrderedList></Pgraph><SubHeadline>Erhebungsinstrumente</SubHeadline><Pgraph>Eine &#220;bersicht &#252;ber den Ablauf der Studie, die sich in zwei Erhebungsphasen und eine dazwischen liegende Interventionsphase gliedert, ist in Abbildung 1 <ImgLink imgNo="1" imgType="figure"/> dargestellt. In einer Pilotphase war eine Checkliste f&#252;r Audits der Leitsymptomvorlesung konzipiert und validiert worden <TextLink reference="32"></TextLink>. Sie beinhaltete sieben Merkmale zu Struktur und Inhalt der Vorlesung sowie neun Merkmale zu didaktischen Fertigkeiten der Dozierenden. Die Gruppe der Auditoren setzte sich aus acht wissenschaftlichen Mitarbeitern und 14 Studierenden im Praktischen Jahr zusammen. Es wurden jeweils Auditorenpaare aus einem wissenschaftlichen Mitarbeiter und einem Studierenden ausgelost, um eventuelle systematische Unterschiede, z.B. durch den Status (Nicht-Studierender&#47;Studierender) begr&#252;ndete divergierende Perspektiven, zu kontrollieren. Vor der Pilotphase erfolgte eine dreist&#252;ndige Schulung aller Auditoren, in der das Testinstrument erkl&#228;rt und ein f&#252;r die Evaluation standardisiertes methodisches Vorgehen einge&#252;bt wurden. </Pgraph><Pgraph>Au&#223;erdem wurde ein Fragebogen zur Terminevaluation f&#252;r die in der LSV anwesenden Studierenden entworfen. Dieser enthielt sowohl zentrale Aspekte der Vorlesung wie Orientierung an Leitsymptomen, Praxisbezug oder strukturierter Aufbau, als auch Merkmale der Lehrperson, z.B. Art des Umgangs mit den Studierenden, Verst&#228;ndlichkeit und Anschaulichkeit des Vortrags. Die Terminevaluation dokumentierte zudem Charakteristika der Studierenden, z.B. Geschlecht und Regelm&#228;&#223;igkeit des Vorlesungsbesuchs.  Merkmale der Frageb&#246;gen und Checklisten waren auf einer 6-stufigen Likert-Skala zu bewerten (1: &#8222;trifft gar nicht zu&#8220; bis 6: &#8222;trifft sehr zu&#8220;). Freitextkommentare waren dar&#252;ber hinaus m&#246;glich und die Gesamtbewertung der Veranstaltung erfolgte in Form einer Schulnote (1&#61;sehr gut, 2&#61;gut, 3&#61;befriedigend, 4&#61;ausreichend, 5&#61;mangelhaft, 6&#61;ungen&#252;gend). Die Datenerhebungsinstrumente erwiesen sich in den Pilottestungen als praktikabel und verst&#228;ndlich. Sie wurden f&#252;r die Erhebungen nur noch geringf&#252;gig modifiziert, zum Beispiel durch Umstellung der Fragenreihenfolge oder durch Verdeutlichung von Merkmalen durch Nennung von Beispielen in Klammern.</Pgraph><Pgraph>Da sich in den Pilottestungen in einigen Bereichen deutliche Unterschiede zwischen den beiden Auditorengruppen (wissenschaftliche Mitarbeiter &#47; PJ-Studierende) ergaben, wurde vermutet, dass die initiale Schulung der Auditoren nicht alle wesentlichen Aspekte ausreichend hatte vermitteln k&#246;nnen. Es erfolgte daher eine zweite Schulung vor Beginn der ersten Erhebungsphase mit einer erl&#228;uternden Zusammenfassung des Konzepts der LSV im KliniCuM, einer Illustration der Orientierung an Leitsymptomen und von Bez&#252;gen zwischen den F&#228;chern des Themenblocks sowie der Vermittlung von leitsymptom-orientiertem Fachwissen anhand von konkreten Beispielen. Die &#220;bereinstimmung der Bewertungen zwischen den beiden Auditorengruppen wurde mittels Berechnung des Intraklassenkoeffizienten ermittelt <TextLink reference="34"></TextLink>.</Pgraph><SubHeadline>Design und Stichprobe</SubHeadline><Pgraph>Alle an der LSV teilnehmenden Dozierenden wurden &#252;ber die Durchf&#252;hrung dieser Evaluationsstudie informiert. Die Dozierenden wurden nicht dar&#252;ber in Kenntnis gesetzt, ob ihre Vorlesung f&#252;r eine Evaluation ausgelost wurde bzw. welcher der von ihnen unterrichteten Termine ausgelost wurde. F&#252;r die erste Erhebungsphase wurde aus den insgesamt 247 Einzelterminen der LSV aller sechs Themenbl&#246;cke im Trimester April bis Juli 2006 randomisiert eine repr&#228;sentative Stichprobe ausgew&#228;hlt, die ca. ein Drittel der LSV pro Themenblock umfasste (insgesamt &#252;ber alle Themenbl&#246;cke n&#61;85). Dieses Vorgehen ist als Ziehung geschichteter Stichproben zu charakterisieren und wurde gew&#228;hlt, da die Grundgesamtheit (s&#228;mtliche LSV aller Themenbl&#246;cke) als sehr heterogen einzusch&#228;tzen ist, also die Merkmalsauspr&#228;gungen der Grundgesamtheit gro&#223;e Unterschiede aufweisen k&#246;nnten. Um die bestehenden Schattierungen der Grundgesamtheit in einer Stichprobe ausreichend abzubilden, m&#252;sste nach dem Prinzip der reinen Zufallsauswahl die Stichprobe sehr gro&#223; sein, um die Repr&#228;sentativit&#228;t zu gew&#228;hrleisten. Zur L&#246;sung dieser Problematik wurde die Grundgesamtheit in disjunkte Klassen (Schichten) aufgeteilt. Dabei wurde angenommen, dass sich die Elemente einer jeden Schicht bez&#252;glich der untersuchten Frage &#228;hnlich verhalten und dass sich dementsprechend Elemente aus unterschiedlichen Schichten durch die als relevant definierten verschiedenen Eigenschaften auszeichnen &#91;8&#93;. In dieser Untersuchung bildeten die sechs Themenbl&#246;cke die Schichten. Von proportional geschichteten Stichproben wurde aus jeder Klasse eine reine Zufallsstichprobe durch Auslosung der einzelnen Vorlesungstermine gezogen. Die Auswertung der Daten erfolgte mit dem statistischen Auswertungsprogramm SPSS 16.0. Mittelwertvergleiche wurden anhand des t-Tests f&#252;r unabh&#228;ngige Stichproben durchgef&#252;hrt (Signifikanzniveau p&#60;0,05). Die statistischen Tests wurden deskriptiv verwendet.</Pgraph><Pgraph>Basierend auf den Daten der ersten Erhebungsphase wurde folgende Intervention durchgef&#252;hrt. Es wurden drei Gruppen ermittelt, die eine Intervention erhalten sollten: die in der Stichprobe evaluierten Lehrenden (Gruppe 1), alle an der LSV beteiligten Lehrenden und Abteilungsdirektoren, die bisher nicht evaluiert wurden (Gruppe 2), Studierende und die interessierte &#214;ffentlichkeit (Gruppe 3). Komponenten der Intervention und ihre Zuordnung waren: </Pgraph><Pgraph><UnorderedList><ListItem level="1">Anschreiben: Alle Personen der Gruppen 1 und 2 erhielten ein pers&#246;nliches Anschreiben, das &#252;ber Hintergrund, Vorgehen und Ziele des Projekts sowie &#252;ber die jeweiligen Feedback-Komponenten und die Ansprechpartner bei R&#252;ckfragen informierte.</ListItem><ListItem level="1">Allgemeines Feedback: Alle drei Gruppen erhielten eine Auswertung der Ergebnisse der ersten Erhebungsphase mit nicht personenbezogenen, allgemeinen Statistiken.</ListItem><ListItem level="1">Individuelles Feedback: Alle Personen der Gruppe 1 erhielten ihr personenbezogenes Feedback mit den Bewertungen und Freitextkommentaren der Auditoren und Studierenden.</ListItem><ListItem level="1">LSV-Leitfaden: Alle Gruppen erhielten einen auf den Daten der ersten Erhebung zusammengestellten Leitfaden als &#8222;Gold-Standard&#8220; f&#252;r die Ausgestaltung von LSV mit konkreten Tipps zu Inhalt und Form.</ListItem><ListItem level="1">Publikation: Gruppe 1 und 2 erhielten die Ver&#246;ffentlichung &#8222;Teaching large groups&#8220; <TextLink reference="7"></TextLink>, eine Publikation zur Ausgestaltung von Gro&#223;gruppen-Lehrveranstaltungen in der medizinischen Ausbildung, die in sehr kompakter Darstellung einfach umzusetzende Anregungen f&#252;r die Ausgestaltung von Vorlesungen nach modernen didaktischen Prinzipien enth&#228;lt.</ListItem><ListItem level="1">F&#252;r alle Personen der Gruppe 3 wurden Informationen zur LSV und der LSV-Leitfaden auf die Homepage des Prodekanats f&#252;r Lehre ins Internet gestellt.</ListItem></UnorderedList></Pgraph><Pgraph>F&#252;r die zweite Erhebungsphase wurden die in Erhebungsphase 1 evaluierten Vorlesungen (n&#61;78, die geringere Zahl erkl&#228;rt sich durch drei Ausf&#228;lle von Audits und vier Ausf&#228;lle von Vorlesungen) auf der Basis ihrer Bewertung nach deutschen Schulnoten in drei Ligen eingeteilt (siehe Tabelle 1 <ImgLink imgNo="1" imgType="table"/>). Die Auswahl der zu evaluierenden LSV erfolgte als Ziehung von Quotenstichproben <TextLink reference="4"></TextLink>, also als bewusste Auswahl, die f&#252;r die zu ziehenden Stichproben anstrebt, in der Grundgesamtheit vorliegende Strukturen nachzuahmen. Die Grundgesamtheit ist hier durch die sechs Themenbl&#246;cke und die drei Ligen definiert, wobei die Termine entsprechend repr&#228;sentativ ausgew&#228;hlt wurden. Da in der Untersuchung insbesondere die Frage beantwortet werden sollte, ob sich die didaktische Qualit&#228;t der LSV nach Durchf&#252;hrung der oben beschriebenen Intervention verbessert, wurde dies durch die studentische Evaluation der Termine per Schulnote kriterienbasiert operationalisiert. Unter Heranziehung von &#220;berlegungen zum angestrebten minimalen Unterschied bei der studentischen Bewertung sowie zur Testpower wurde eine erforderliche Stichprobengr&#246;&#223;e von studentischen Bewertungen von n&#61;633 ermittelt <TextLink reference="20"></TextLink>. In diesem Fall waren folgende relevante Kriterien bestm&#246;glich erf&#252;llt: Effektst&#228;rke d&#61;0,3 (d&#61;0.1: kleiner Effekt, d&#61;0,3: mittlerer Effekt, d&#61;0,5: gro&#223;er Effekt), minimaler Mittelwertsunterschied &#916;&#61;&#43;0,255, Testst&#228;rke 1-&#223;&#61;0,8 und &#945;&#61;0,05. Da in der ersten Erhebungsphase pro Vorlesungstermin durchschnittlich etwa n&#61;35 studentische Bewertungen erhoben werden konnten, ergaben sich damit n&#61;18 notwendige Terminevaluationen im Rahmen der zweiten Erhebungsphase. Hierbei handelte es sich in 14 F&#228;llen um dieselben Lehrpersonen wie in Erhebungsphase 1. Die Themen der 18 Vorlesungen waren in allen F&#228;llen dieselben wie in der ersten Erhebungsphase. F&#252;r eine gleichm&#228;&#223;ige Verteilung dieser Messungen auf die Struktur der Grundgesamtheit ergab sich die Auswahl je eines Vorlesungstermins aus jedem der sechs Themenbl&#246;cke und jeder der drei Ligen.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Methods">
      <MainHeadline>Methods</MainHeadline><SubHeadline>Question and hypotheses</SubHeadline><Pgraph>Two questions were investigated in our study. One: Are there noticeable differences in the evaluation of the LSV after an intervention based on previous evaluation results, when the new LSV is evaluated by participating students and trained auditors&#63; Two: Is there a difference between the assessment values of participating students and trained auditors&#63;</Pgraph><Pgraph>The main hypotheses are:</Pgraph><Pgraph><OrderedList><ListItem level="1" levelPosition="1" numString="1.">The LSV will receive more positive ratings after the intervention, especially regarding its didactic values.</ListItem><ListItem level="1" levelPosition="2" numString="2.">The evaluation of trained auditors will be more consistent and all in all more critical than the evaluation of the participating students.</ListItem></OrderedList></Pgraph><SubHeadline>Instruments</SubHeadline><Pgraph>Figure 1 <ImgLink imgNo="1" imgType="figure"/> shows an overview of the study and includes two evaluation phases and one intervention phase. A checklist for the audits of the LSV was designed and validated in a pilot phase <TextLink reference="32"></TextLink>. This checklist includes seven items regarding structure and content of the lecture as well as nine items regarding the didactic qualities of the lecturers. The group of auditors comprises eight physicians and scientists and 14 students in the final year of their undergraduate studies. Pairs of auditors (one physician and one student) were allotted to control for possible systemic differences, e.g. diverging perspectives because of status (non-student&#47;student). Prior to the pilot phase, all auditors underwent a three hour training session, including explanation of the instruments and rehearsal of standardised methodical means for the evaluation. </Pgraph><Pgraph>In addition, a questionnaire was developed for the students who participated in the audited LSV. This questionnaire included central aspects of the LSV such as focus on cardinal symptoms, practical applications, and structural design of the lecture as well as items regarding the lecturer, e.g. manner of contact with the students, comprehensibility and clarity of the lecture. Furthermore, characteristics of the students, e.g. gender and continuity of visiting the LSV were also documented. The items in the questionnaires and checklists were rated on a 6-point Likert-scale (1: &#8220;I strongly agree&#8221; to 6: &#8220;I strongly disagree&#8221;). In addition, free commentaries were also possible and an overall rating of the lecture following the school grade system was given (1&#61;very good, 2&#61;good, 3&#61;satisfactory, 4&#61;sufficient, 5&#61;poor, 6&#61;deficient). In the pilot, the instruments were found to be feasible and comprehensible. The only minor modifications required for the final study such as readjusting the question sequence and clarification of some items by giving an example in brackets. </Pgraph><Pgraph>Since the pilot phase revealed considerable differences between the two groups of auditors (physicians&#47;students), it was assumed that the initial training of the auditors had not covered all main aspects of the study sufficiently. Therefore, a second training session took place before the first evaluation phase, including a summary of the LSV concept within KliniCuM, a delineation of the orientation along cardinal symptoms and connections between the subjects of a thematic block as well as cardinal symptom-oriented teaching of expert knowledge based upon concrete examples. The concordance of the ratings between the two groups of auditors was determined using the intra-class correlation coefficient (ICC) <TextLink reference="34"></TextLink>.</Pgraph><SubHeadline>Design and sampling</SubHeadline><Pgraph>All lecturers participating in the LSV were informed about this study. They were not notified though whether or which of their lectures had been randomly selected for an evaluation. For the first evaluation phase, a randomised representative sample of about one third of the LSVs per thematic block (altogether n&#61;85 from all thematic blocks) was chosen from a total of 247 individual LSVs from all six thematic blocks during the trimester April to July 2006. This approach is classified as &#8220;drawing of stratified lots&#8221; and was chosen because the population parameters (all LSVs from all thematic blocks) were considered to be very heterogeneous, meaning that the feature characteristics of the basic population could exhibit major differences.</Pgraph><Pgraph>To reproduce all shades of the basic population sufficiently in a random sample, this sample needs to be very large according to the principle of a mere random selection to ensure representativeness. To address this problem, the basic population was divided into disjunctive classes (layers). It was assumed that the elements of each class will behave similarly regarding the research question and elements from different classes would be defined by their different characteristics &#91;8&#93;. In our study the classes are defined by the six thematic blocks. From proportionally layered samples, a random sample was drawn from each class by drawing individual lectures. SPSS 16.0 was used for the statistical evaluation of the data. Means were calculated by t-test for independent samples (level of significance p&#60;0.05). The statistical tests were used descriptively. </Pgraph><Pgraph>Based on the data from the first evaluation phase the following intervention took place. Three groups were identified to receive an intervention: the teachers who were evaluated in the random sample (group 1), all teachers and all heads of departments participating in the LSV who had not yet been evaluated (group 2), students and the general public (group 3). Components of the intervention were:</Pgraph><Pgraph><UnorderedList><ListItem level="1">Letters: all members of groups 1 and 2 were sent a personal letter describing background, approach and goals of the project as well as the respective feedback components and a contact person for questions.</ListItem><ListItem level="1">General feedback: all three groups received the analysis of the data of the first evaluation phase with the non-personal, general statistics.</ListItem><ListItem level="1">Individual feedback: all members of group 1 received their personal feedback with the rating and the free commentaries of auditors and students.</ListItem><ListItem level="1">LSV manual: all groups received a manual based on the data of the first evaluation phase as a gold standard for the design of an LSV including concrete hints regarding content and form.</ListItem><ListItem level="1">Publication: groups 1 and 2 received the paper &#8220;Teaching large groups&#8220; <TextLink reference="7"></TextLink>, a publication about the design of teaching formats for large groups in medical education which contains easy-to-accomplish suggestions for the design of lectures following modern didactic concepts in a very consolidated description.</ListItem><ListItem level="1">For group 3 information regarding the LSV and the LSV manual were displayed on the homepage of the dean of education&#8217;s office in the internet.</ListItem></UnorderedList></Pgraph><Pgraph>All evaluated lectures form the first evaluation phase (n&#61;78, the smaller number is explained by three cancelled audits and four missing lectures) were subdivided in three leagues on the basis of their marks according to German school grades for the second evaluation phase (see table 1 <ImgLink imgNo="1" imgType="table"/>). Selection of the LSVs which were to be evaluated was realized by drawing quota-samples <TextLink reference="4"></TextLink>, meaning a deliberate selection which aspires for the sample to be drawn to simulate conditions of the basic population. In our case the basic population is defined by the six thematic blocks and the three leagues in which the lectures were selected representatively. Since our study particularly focused on the question whether the didactic quality of the LSV improved with the above mentioned intervention, this was operationalized by certain criteria like the students&#8217; evaluation of the LSV by school grades at the respective points in time. Considerations regarding the smallest difference desired in the students&#8217; ratings as well as the power analysis a required sample size of n&#61;633 was identified <TextLink reference="20"></TextLink>. In this case the following relevant criteria were achieved: effect size d&#61;0.3 (d&#61;0.1: small effect, d&#61;0.3: medium effect, d&#61;0.5 large effect), minimal difference of the means &#916;&#61;&#43;0,255, test power 1-&#223;&#61;0.8 and &#945; &#945;&#61;0.05. Since on average n&#61;35 student ratings were collected during the first evaluation phase per LSV, n&#61;18 lectures were required for the second evaluation phase. Fourteen lectures of the second evaluation phase were held by the same teachers as in the first evaluation phase. The topics of all 18 LSVs were exactly the same as in evaluation phase 1. To guarantee an even distribution of the measurements on the structure of the basic population one lecture from each of the six thematic blocks and every league was chosen.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Ergebnisse">
      <MainHeadline>Ergebnisse</MainHeadline><SubHeadline>Ver&#228;nderungen in der Bewertung der LSV nach Schulnoten</SubHeadline><Pgraph>Auf Basis der Schulnoten zeigen bei der studentischen Terminevaluation von 18 erfassten LSV-Mittelwertvergleichen derselben Veranstaltungen in Erhebungsphase 1 und 2 f&#252;nf signifikante Verbesserungen (28&#37;), drei signifikante Verschlechterungen (17&#37;) und zehn unver&#228;nderte Beurteilungen (55&#37;) (siehe Tabelle 2 <ImgLink imgNo="2" imgType="table"/>). Damit zeigen die studentischen Evaluationen f&#252;r die Mehrheit der in der zweiten Erhebung erfassten LSV Termine keine Ver&#228;nderung. Das oben beschriebene Kriterium eines minimalen Mittelwertunterschieds bei der Schulnote von &#916;&#61;&#43;0,255 wird bei acht Vorlesungen erf&#252;llt (44&#37;). </Pgraph><Pgraph>Die Bewertung der LSV anhand der Schulnotenskala durch die Auditoren ergibt ebenfalls kein einheitliches Bild bez&#252;glich eines Effekts der Intervention (siehe Tabelle 3 <ImgLink imgNo="3" imgType="table"/>). Das prozentuale Verh&#228;ltnis der Ver&#228;nderungen entspricht dem oben dargestellten der studentischen Terminevaluation, wobei vier der f&#252;nf als verbessert bewerteten LSV &#252;bereinstimmen. In der ersten Erhebungsphase beurteilten in der Gruppe der Auditoren die wissenschaftlichen Mitarbeiter sechs, in der zweiten Erhebungsphase sieben von 18 Vorlesungen um eine Schulnote schlechter als die PJ-Studierenden.</Pgraph><SubHeadline>Didaktische Bewertung nach Einzelmerkmalen</SubHeadline><Pgraph>Ein differenzierteres Bild als die Schulnoten liefert die Gegen&#252;berstellung der Bewertungen durch die Auditoren auf Ebene der Einzelmerkmale aus beiden Erhebungen (siehe Tabelle 4 <ImgLink imgNo="4" imgType="table"/>). Es ergeben sich sechs signifikant bessere Beurteilungen nach der Intervention in der zweiten Erhebungsphase und alle anderen zeigen bis auf drei einen positiven Trend. Insgesamt weisen die Verbesserungen bei den Merkmalen &#8222;Orientierung an Leitsymptomen&#8220;, &#8222;Anregung zum Mitdenken&#8220;, &#8222;Entsprechung des Konzepts LSV&#8220;, &#8222;interaktive Gestaltung&#8220;, &#8222;anschauliche Darstellung&#8220; und &#8222;Bem&#252;hung um Lernerfolg&#8220; hohe Effektst&#228;rken auf.</Pgraph><Pgraph>Im Vergleich der Bewertungen der Einzelmerkmale durch die Studierenden und Auditoren (siehe Tabelle 5 <ImgLink imgNo="5" imgType="table"/>) ergeben sich f&#252;r die erste Erhebungsphase f&#252;r fast alle Merkmale durchweg statistisch signifikante Mittelwertunterschiede zwischen den beiden Gruppen, wobei die Auditoren die Vorlesungen insgesamt kritischer bewerten als die Studierenden. In der zweiten Erhebungsphase findet sich nur noch bei einem Merkmal ein signifikanter Unterschied zwischen den Bewertungen von Auditoren und Studierenden. </Pgraph><SubHeadline>&#220;bereinstimmung der Auditorenbewertungen</SubHeadline><Pgraph>Wie die Berechnungen des Intraklassenkoeffizienten und der Signifikanzen ergaben, liegt die &#220;bereinstimmung der Gruppe der Auditoren zwischen PJ-Studierenden und wissenschaftlichen Mitarbeitern auf Basis der Einzelmerkmale in der Erhebungsphase zwischen i<Subscript>CCmin</Subscript>&#61;-0,030 und i<Subscript>CCmax</Subscript>&#61;0,605 (siehe Tabelle 6 <ImgLink imgNo="6" imgType="table"/>). Beim &#252;berwiegenden Teil der erfassten Merkmale ist der Zusammenhang positiv signifikant. Im Gegensatz zu den Pilottestungen <TextLink reference="32"></TextLink>, bei denen v.a. bei den konzeptbezogenen Merkmalen gro&#223;e Differenzen zwischen den beiden Auditorengruppen bestanden, f&#228;llt die &#220;bereinstimmung in der ersten Erhebungsphase sehr zufriedenstellend aus. In der zweiten Erhebungsphase liegt die &#220;bereinstimmung der Auditoren zwischen i<Subscript>CCmin</Subscript>&#61;-0,022 und i<Subscript>CCmax</Subscript>&#61;0,771 und ist ebenfalls &#252;berwiegend positiv signifikant. Die &#220;bereinstimmung zwischen den Auditorengruppen ist als mittelm&#228;&#223;ig hoch zu bewerten, die Korrelationskoeffizienten weisen insgesamt eine recht breite Streuung auf. </Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Results">
      <MainHeadline>Results</MainHeadline><SubHeadline>Changes in the rating of LSV as per school grades</SubHeadline><Pgraph>On the basis of school grades comparisons of the means of the student ratings of the same 18 LSV rated in evaluation phases 1 and 2 five show significant improvements (28&#37;), three significant deteriorations (17&#37;), and ten ratings are found unchanged (55&#37;) (see table 2 <ImgLink imgNo="2" imgType="table"/>). Hence, the majority of student evaluations of the LSVs in the second evaluation phase do not reveal changes. The above mentioned criterion of the minimal difference of the means in school grade of &#916;&#61;&#43;0,255 is achieved by eight lectures (44&#37;).</Pgraph><Pgraph>The evaluation of the LSV by school grade performed by the auditors does also not reveal an even picture regarding the effect of the intervention (see table 3 <ImgLink imgNo="3" imgType="table"/>). The percentage of the improvements matches the above mentioned student ratings of the individual lectures with four of five same LSVs rated as improved. In the first evaluation phase the physician and scientist auditors rated six lectures of 18 by one school grade lower than the student auditors, in the second evaluation phase seven.</Pgraph><SubHeadline>Rating of didactics on the basis of individual items</SubHeadline><Pgraph>A more differentiated picture compared to the one drawn by the school grades is shown by the comparison of individual items by the auditors from both evaluation phases (see table 4 <ImgLink imgNo="4" imgType="table"/>). The second evaluation phase reveals six significant improvements in ratings after the intervention and all other items except for three show a positive trend. In total, the improvements regarding the items &#8220;orientation to cardinal symptoms&#8221;, &#8220;encouragement to follow the general train of thought&#8221;, &#8220;use of LSV concept&#8221;, &#8220;interactive design&#8221;, &#8220;depictive presentation&#8221;, and &#8220;effort to support successful learning&#8221; display large effect sizes. In the first evaluation phase the comparison between student and auditor ratings (see table 5 <ImgLink imgNo="5" imgType="table"/>) on the basis of individual items shows statistically significant differences between both groups for almost all items with the auditors rating the lectures more critically than the students. Ratings from the second evaluation phase reveal a significant difference between student and auditor ratings for only one item.</Pgraph><SubHeadline>Conformity of auditor ratings</SubHeadline><Pgraph>As the calculation of the intra-class correlation coefficient and of the significances show the conformity of the ratings on the basis of individual items within the auditors between group of students in the final year and the group of physicians and scientists lies between i<Subscript>CCmin</Subscript>&#61;-0,030 und i<Subscript>CCmax</Subscript>&#61;0,605 (see table 6 <ImgLink imgNo="6" imgType="table"/>). The majority of included items show a significant positive correlation. Compared to the pilot tests <TextLink reference="32"></TextLink>, which revealed great differences between both groups of auditors especially regarding items referring to the LSV concept, conformity between both groups is very satisfying in the first evaluation phase. In the second evaluation phase the conformity between the two auditors groups lies between i<Subscript>CCmin</Subscript>&#61;-0,022 and i<Subscript>CCmax</Subscript>&#61;0,771 and is also mostly positive significant. The conformity between the two groups of auditors can be assessed as moderately high, the intra-class correlation coefficients display a quite broad spreading.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Diskussion">
      <MainHeadline>Diskussion</MainHeadline><Pgraph>Die Ergebnisse der Audits und Terminevaluationen in der ersten Erhebungsphase zeichnen ein insgesamt positiveres Bild der LSV als die im Vorfeld erhobenen studentischen Beurteilungen in der Trimesterabschlussevaluation hatten erwarten lassen. Hierbei k&#246;nnte es sich um eine tats&#228;chliche Verbesserung handeln. Es ist jedoch zu ber&#252;cksichtigen, dass retrospektive, zusammenfassende Evaluationen tendenziell schlechter ausfallen als Evaluationen, die direkt im Anschluss an eine Veranstaltung erhoben werden <TextLink reference="31"></TextLink>, so dass diese Beobachtung auch durch einen methodischen Effekt erkl&#228;rt werden k&#246;nnte. Auf Basis der Schulnoten konnte die hypothetische Verbesserung der LSV-Gesamtbewertung in der zweiten Erhebungsphase nach der Intervention nur in m&#228;&#223;igem Ausma&#223; festgestellt werden. Das geforderte Verbesserungskriterium wurde in der Terminevaluation nur bei 44&#37; der LSV erreicht. Bei den Auditoren fanden sich sogar nur in 28&#37; der Evaluationen verbesserte LSV. Diesem Ergebnis steht jedoch die Bewertung der Auditoren auf Ebene der Einzelmerkmale gegen&#252;ber, die ganz &#252;berwiegend positivere Beurteilungen, vor allem der didaktischen Eigenschaften der Lehrpersonen in der zweiten Erhebungsphase zeigt. Eine Schw&#228;che liegt hier in der geringen Gesamtfallzahl, die durch die initiale Ziehung der Stichproben zu einem Teil ausgeglichen wird.</Pgraph><Pgraph>Bei dem gew&#228;hlten Ver&#228;nderungskriterium der zu vergebenden Schulnote handelt es sich um ein relativ abstraktes Ma&#223;. Es l&#228;sst sich daher vermuten, dass diese Gr&#246;&#223;e zu wenig differenziert ist, um eventuell bestehende Unterschiede der LSV nach der Intervention abzubilden, da es sich bei dem Konstrukt &#8222;Lehrqualit&#228;t&#8220; um ein komplexes Merkmal handelt <TextLink reference="14"></TextLink>. F&#252;r den Verlust von Information durch den Einsatz von Schulnoten spricht au&#223;erdem die Diskrepanz bei der Gruppe der Auditoren zwischen der summativen Kenngr&#246;&#223;e der Note und den parallel bewerteten Einzelmerkmalen, die deutliche Verbesserungen zeigen. In der ersten Erhebungsphase bewerten die geschulten Auditoren die LSV in fast allen Merkmalen signifikant kritischer als die teilnehmenden Studierenden, wie in Hypothese 2 vermutet. Die Bewertungen der Auditoren nach Einzelmerkmalen fallen in der zweiten Erhebungsphase im Gegensatz zu den studentischen Erhebungen wesentlich besser aus. Es k&#246;nnte sich dabei einerseits um eine tats&#228;chliche qualitativ-didaktische Verbesserung der LSV handeln, die von geschulten Auditoren differenzierter wahrgenommen und bewertet wurde. Andererseits muss auch ein m&#246;glicher Einfluss des Rosenthal-Effekts ber&#252;cksichtigt werden <TextLink reference="24"></TextLink>, wodurch die blo&#223;e Erwartung einer Verbesserung der LSV nach der Intervention bei den Auditoren zu einer besseren Bewertung gef&#252;hrt haben k&#246;nnte. Jedoch wird der Einsatz von geschulten Auditoren als f&#252;r eine valide und forschungspraktikable Beurteilung von Lehrqualit&#228;t beschrieben <TextLink reference="1"></TextLink>, <TextLink reference="17"></TextLink>. Auch in anderen Arbeiten finden sich teilweise nur moderate &#220;bereinstimmungen von studentischen und &#8222;peer-Bewertungen&#8220; &#91;16&#93;. In der zweiten Erhebungsphase fallen die Unterschiede in der Bewertung weniger deutlich aus, was insbesondere innerhalb der Gruppe der Auditoren f&#252;r eine homogenere Bewertungsgrundlage nach der erfolgten Schulung sprechen k&#246;nnte. Die so nachgewiesene hohe Inter-Rater-Reliabilit&#228;t st&#252;tzt die Validit&#228;t der Daten <TextLink reference="34"></TextLink>.</Pgraph><Pgraph>Weiterhin muss analysiert werden, ob die f&#252;r das Projekt gew&#228;hlte Intervention zur Verbesserung der LSV stark genug war. Da die Literatur keine Evidenz daf&#252;r liefert, dass studentische Evaluation allein die Lehre an Hochschulen verbessert <TextLink reference="23"></TextLink>, <TextLink reference="28"></TextLink>, wurde in dieser Studie eine &#252;ber blo&#223;es Ergebnisfeedback hinausgehende Intervention gew&#228;hlt. Das Feedback an die Zielgruppe erfolgte jedoch nur in schriftlicher Form. Andere Untersuchungen zeigen, dass schriftliche R&#252;ckmeldungen von Lehrenden nur selten gelesen werden und damit kaum Auswirkungen haben k&#246;nnen <TextLink reference="9"></TextLink>. Weitere Bem&#252;hungen wie z.B. die Durchf&#252;hrung von hochschuldidaktischen Beratungen <TextLink reference="23"></TextLink>, <TextLink reference="33"></TextLink> oder direkte Diskussionen mit den Lehrenden &#252;ber die Ergebnisse <TextLink reference="2"></TextLink> ziehen hingegen wirkungsvollere Verbesserungen nach sich. Au&#223;erdem erh&#246;ht ein m&#246;glichst fr&#252;her Zeitpunkt des Feedbacks die Wahrscheinlichkeit eines positiven Effekts bei den Lehrenden <TextLink reference="26"></TextLink>. In der vorliegenden Untersuchung war der Zeitraum zwischen Erhebung und R&#252;ckmeldung mit bis zu vier Monaten vergleichsweise lang. Allerdings wurden die personenbezogenen schriftlichen R&#252;ckmeldungen, wie im Methodenteil beschrieben, anschaulich aufbereitet und eingehend erl&#228;utert. Bekannt ist n&#228;mlich, dass schriftliche R&#252;ckmeldungen von Evaluationen ohne Erl&#228;uterungen h&#228;ufig von Lehrenden nicht korrekt interpretiert und somit nicht richtig verstanden werden und daher meist wirkungslos bleiben <TextLink reference="2"></TextLink>. Ein weiterer Einflussfaktor f&#252;r den eher schwachen Effekt der Intervention k&#246;nnte in der Tatsache begr&#252;ndet liegen, dass es sich bei der LSV um eine &#8222;multi-instructor-Veranstaltung&#8220; mit insgesamt ca. 150 Lehrpersonen in sechs Themenbl&#246;cken handelt. Ein solches Format birgt bei der Umsetzung von Ver&#228;nderungen oder Verbesserungen im Vergleich mit Kursen, bei denen lediglich wenige oder gar nur einzelne Personen beteiligt sind, besondere Schwierigkeiten <TextLink reference="26"></TextLink>. Weiterhin ist bekannt, dass die in Evaluationsprojekten angebotenen Informationen und Beratungen von Lehrenden weniger genutzt werden, wenn diese nicht daran interessiert oder gewillt sind, ihre didaktischen Fertigkeiten zu verbessern <TextLink reference="18"></TextLink>.</Pgraph><Pgraph>Ein weiterer Aspekt f&#252;r den nicht sehr durchgreifenden Effekt der Intervention ist in der systemimmanenten Tr&#228;gheit von Fakult&#228;ten bei der Umsetzung von curricularen Innovationen zu vermuten <TextLink reference="27"></TextLink>. Hinzu kommt, dass das Konzept f&#252;r die LSV bis zur Intervention im Rahmen dieser Studie nicht w&#228;hrend der curricularen Planungen schriftlich fixiert und an die Lehrenden &#252;bermittelt wurde. Damit wurde der Faktor &#8222;Kommunikation innerhalb der Fakult&#228;t&#8220;, der in Planungsprozessen von wesentlicher Bedeutung ist <TextLink reference="3"></TextLink>, bei der Einf&#252;hrung des neuen Curriculums nicht ausreichend beachtet. Idealer w&#228;re es, eine Schulungsma&#223;nahme anzustreben, die alle an der LSV beteiligten Lehrpersonen mit dem Konzept vertraut macht <TextLink reference="3"></TextLink>. In die anschlie&#223;enden Ma&#223;nahmen zur &#220;berpr&#252;fung der Qualit&#228;t der LSV sind, wie in dieser Studie erfolgt, Lehrende und Studierende einzubinden, um in der Fakult&#228;t eine m&#246;glichst hohe Akzeptanz zu erzielen <TextLink reference="19"></TextLink>. Um insgesamt die Effektivit&#228;t von Lehr- und Lehrveranstaltungsevaluationen zu steigern, sind diese in ein allgemeines Verfahren zur Bestimmung und F&#246;rderung von Lehr-, Ausbildungs- und Forschungsqualit&#228;t zu integrieren, da eine alleinige Einsch&#228;tzung von Lehrqualit&#228;t f&#252;r eine Verbesserung nicht ausreichend ist <TextLink reference="25"></TextLink>.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Discussion">
      <MainHeadline>Discussion</MainHeadline><Pgraph>The results of the audits and the student evaluations during the first evaluation phase reveal a picture of the LSV that overall is more positive, as expected from the results of the previous student evaluations at the end of the thematic blocks. This could indicate actual improvement. Yet it has to be taken into account that retrospective and integrated evaluations have a tendency towards worse results compared with evaluations which are performed directly after a course <TextLink reference="31"></TextLink>. Hence, the observation of improvement could have been caused by a methodological effect. On the basis of school grades, the hypothetical improvement of the overall LSV rating could only be noted to a moderate degree in the second evaluation phase. The postulated criterion for improvement was only achieved in 44&#37; of the LSVs rated by the students while an improvement in the auditor ratings was found in only 28&#37; of the LSVs. In contrast, the auditors&#8217; ratings on the basis of individual items show mostly more positive evaluations, especially with regard to the didactic skills of the teachers in the second evaluation phase. A weakness can be seen in the small total number of lectures which is counterbalanced partly by the initial drawing of the random sample.</Pgraph><Pgraph>The chosen criterion for change &#8211; the school grade given &#8211; represents a relatively abstract measure. It can be assumed that this measure contains too little differentiation to reveal potential differences in the LSV after the intervention, since the construct &#8220;teaching quality&#8221; is a complex item <TextLink reference="14"></TextLink>. The loss of information by using school grades could also be confirmed by the discrepancy within the group of assessors as far as the summative parameter of the school grade and the simultaneously rated individual items are concerned, which showed a clear improvement. During the first evaluation phase the trained assessors rated the LSV in almost all items significantly more critically compared to the participating students as was assumed in hypothesis 2. In the second evaluation phase the auditors&#8217; assessment concerning the single items turned out to be considerably better compared to the students&#8217; ratings. On one hand this could mean that an improvement of the didactic quality of the LSV had indeed taken place which was then observed and rated by the trained auditors in a more differentiated way. On the other hand the possible influence of the Rosenthal-effect must be taken into account <TextLink reference="24"></TextLink>, where the mere expectation of an improvement of the LSV after the intervention by the auditors could have led to a better rating. However, the assignment of trained auditors has been described as being a valid and research-oriented instrument for the rating of teaching quality <TextLink reference="1"></TextLink>, <TextLink reference="17"></TextLink>. Others also found only moderate accordance of student and &#8220;peer-ratings&#8220; <TextLink reference="16"></TextLink>. In the second evaluation phase the rating differences are less prominent which could be suggestive of a more homogenous base for the ratings according to school grade. The high inter-rater reliability hereby verified supports the validity of the data <TextLink reference="34"></TextLink>.</Pgraph><Pgraph>Furthermore, there is a need to analyse whether the intervention chosen for this project was potent enough to improve the LSV. Since there is no evidence in the literature that student evaluation alone improves university teaching <TextLink reference="23"></TextLink>, <TextLink reference="28"></TextLink>, an intervention beyond the mere feedback of the evaluation data was chosen for this study. Yet the feedback to the targeted group was only given in written format. Other studies show that written feedback is rarely read by the teachers and therefore may have hardly any effect <TextLink reference="9"></TextLink>. More effective improvements could be reached by other interventions, e.g. didactic skill enhancing counselling <TextLink reference="23"></TextLink>, <TextLink reference="33"></TextLink> or direct discussions with teachers about the evaluation results <TextLink reference="2"></TextLink>. Feedback given as early as possible can improve the possibility of a positive effect on the teachers <TextLink reference="26"></TextLink>. In our study the time between data collection and feedback was comparatively long with up to four months. On the other hand the written personal feedback was, as described in the methods section, clearly edited and illustrated in detail. It is known that written feedback of evaluations without explanations is often not correctly interpreted by the teachers and hence not understood and without effect <TextLink reference="2"></TextLink>. Another influencing factor for the rather weak effect of the intervention could be down to the fact that the LSV is a multi-instructor-event with a total of approximately 150 teachers in six thematic blocks. Such a format hosts special difficulties for the realization of changes or improvements compared with courses which are taught be only a few or even a single person <TextLink reference="26"></TextLink>. Furthermore it is known, that provided information or counselling of teachers in evaluation projects is less called upon if teachers are not interested or unwilling to improve their didactic skills <TextLink reference="18"></TextLink>.</Pgraph><Pgraph>Another important aspect for the less than dramatic effect of the intervention could be assumed to lie in the inactivity inherent to the system of faculties when it comes to the realization of curricular innovations <TextLink reference="27"></TextLink>. Additionally, until the intervention during this study the concept for the LSV did not exist in a written format and was sent to the teachers during the curricular planning. With that the factor &#8220;communication within the faculty&#8221;, which has a major impact during planning processes <TextLink reference="3"></TextLink>, was not regarded with enough attention when the new curriculum was implemented. It would be better to introduce a training procedure that acquaints all teaching personnel involved in the LSV with its concept <TextLink reference="3"></TextLink>. In a subsequent survey of the quality of the LSV teachers and students should be involved to gain an acceptance as high as possible within the faculty &#91;20&#93;. To improve the overall effectiveness of courses the have to be integrated in a general procedure to measure and support the quality of teaching and research, since the evaluation of teaching quality alone is not sufficient for its improvement <TextLink reference="25"></TextLink>.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Zusammenfassung und Ausblick">
      <MainHeadline>Zusammenfassung und Ausblick</MainHeadline><Pgraph>Die vorliegende Untersuchung konnte zeigen, dass sich in der Evaluation eines neu etablierten Konzepts der LSV sowohl in der Terminevaluation durch Studierende als auch durch geschulte Auditoren nach einer Intervention didaktische Verbesserungen nachweisen lie&#223;en, die sich st&#228;rker auf der Basis differenzierter Einzelmerkmale zu lehrpersonen- und konzeptbezogenen Merkmalen als durch Schulnoten abbilden lie&#223;en. Die Studierenden bewerteten die LSV insgesamt positiver als die Auditoren, wobei eine gute Inter-Rater-Reliabilit&#228;t bestand. Eine dreist&#252;ndige Vorbereitung der Auditoren reicht offenbar jedoch nicht aus, um die Personen ad&#228;quat auf ihre Rolle als analysierende Feedbackgeber vorzubereiten. Au&#223;erdem ist zu ber&#252;cksichtigen, dass die Generalisierbarkeit der Ergebnisse aufgrund der methodisch bedingten Stichprobenwahl mit nur 18 Vorlesungen in der zweiten Erhebungsphase eingeschr&#228;nkt ist. Die Notwendigkeit der besseren inhaltlichen und strukturellen Einbettung der LSV in das curriculare Gesamtkonzept auch im Sinne einer Begleitung durch eine regelm&#228;&#223;ige Qualit&#228;tskontrolle wurde in dieser Studie dennoch deutlich. Wie lange Wirkungen, die aufgrund des Feedbacks nach einer Evaluation eintreten, bei der Zielgruppe bestehen bleiben, sollten zuk&#252;nftige Studien untersuchen. Eine rein schriftliche Information zum Design von Vorlesungen nach modernen didaktischen Kriterien scheint als Intervention f&#252;r viele Dozierende kein ausreichender Stimulus zur Verbesserung oder &#220;berarbeitung ihrer Vorlesungen zu sein. Weiterhin ist auch zu pr&#252;fen, welche Effekte bei der indirekt betroffenen Gruppe der Studierenden eintreten, z.B. Auswirkungen auf ihre Motivation und ihren Lernerfolg.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Summary and outlook">
      <MainHeadline>Summary and outlook</MainHeadline><Pgraph>Our study demonstrated that the evaluation of the newly established LSV concept revealed didactic improvements after an intervention as well in the student ratings as in the ratings of trained auditors. These improvements were more notable on the basis of individual items regarding the teachers or the concept rather than on the basis of school grades awarded. Students rated the LSV altogether more positive than auditors who showed a good inter-rater reliability. Apparently, a three hour training session for the auditors is not sufficient to prepare them adequately for their role as givers of analysing feedback. Furthermore, it has to be taken into account, that the generalisability of our results is somewhat reduced because of the choice of a random sample with only 18 lectures in the second evaluation phase due to the methodology chosen. The necessity of a better integration of the LSV in the global concept of the curriculum regarding content and structure with regular quality control is visible in this study. How long the effects of feedback after an evaluation last within the target group needs to be studied in further projects. Mere written information about the lecture design according to modern didactic criteria seems to be an insufficient stimulus for intervention to many teachers to improve or change their lectures. Furthermore, it needs to be checked which effects occur in the indirectly affected group of students, e.g. effects on their motivation or learning success.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Danksagung">
      <MainHeadline>Danksagung</MainHeadline><Pgraph>Wir danken der Medizinischen Fakult&#228;t der Universit&#228;t Hamburg f&#252;r die F&#246;rderung dieses Projekts (L-107&#47;2006) aus dem F&#246;rderfonds Lehre.</Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Acknowledgement">
      <MainHeadline>Acknowledgement</MainHeadline><Pgraph>We thank the Medical Faculty of Hamburg University for supporting this project (L-107&#47;2006) from their teaching funds.</Pgraph></TextBlock>
    <TextBlock language="de" linked="yes" name="Interessenkonflikt">
      <MainHeadline>Interessenkonflikt</MainHeadline><Pgraph>Die Autoren erkl&#228;ren, dass sie keine Interessenskonflikte in Zusammenhang mit diesem Artikel haben. </Pgraph></TextBlock>
    <TextBlock language="en" linked="yes" name="Competing interests">
      <MainHeadline>Competing interests</MainHeadline><Pgraph>The authors declare that they have no competing interests.</Pgraph></TextBlock>
    <References linked="yes">
      <Reference refNo="1">
        <RefAuthor>Albanese MA</RefAuthor>
        <RefAuthor>Schuldt SS</RefAuthor>
        <RefAuthor>Case D</RefAuthor>
        <RefAuthor>Brown D</RefAuthor>
        <RefTitle>The validity of lecturer ratings by students and trained observers</RefTitle>
        <RefYear>1991</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>26-28</RefPage>
        <RefTotal>Albanese MA, Schuldt SS, Case D, Brown D. The validity of lecturer ratings by students and trained observers. Acad Med. 1991;66(5):26-28. DOI: 10.1097&#47;00001888-199101000-00008</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1097&#47;00001888-199101000-00008</RefLink>
      </Reference>
      <Reference refNo="2">
        <RefAuthor>Baggott J</RefAuthor>
        <RefTitle>Reaction of lecturers to analysis results of student ratings of their lecture skills</RefTitle>
        <RefYear>1987</RefYear>
        <RefJournal>J Med Educ</RefJournal>
        <RefPage>491-496</RefPage>
        <RefTotal>Baggott J. Reaction of lecturers to analysis results of student ratings of their lecture skills. J Med Educ. 1987;62:491-496.</RefTotal>
      </Reference>
      <Reference refNo="3">
        <RefAuthor>Bland CJ</RefAuthor>
        <RefAuthor>Starnaman S</RefAuthor>
        <RefAuthor>Wersal L</RefAuthor>
        <RefAuthor>Moorhead-Rosenberg L</RefAuthor>
        <RefAuthor>Zonia S</RefAuthor>
        <RefAuthor>Henry R</RefAuthor>
        <RefTitle>Curricular change in medical schools: how to succeed</RefTitle>
        <RefYear>2000</RefYear>
        <RefJournal>Acad Med</RefJournal>
        <RefPage>575-594</RefPage>
        <RefTotal>Bland CJ, Starnaman S, Wersal L, Moorhead-Rosenberg L, Zonia S, Henry R. Curricular change in medical schools: how to succeed. Acad Med. 2000;75(6):575-594. DOI: 10.1097&#47;00001888-200006000-00006</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1097&#47;00001888-200006000-00006</RefLink>
      </Reference>
      <Reference refNo="4">
        <RefAuthor>Bortz J</RefAuthor>
        <RefAuthor>D&#246;ring N</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2006</RefYear>
        <RefBookTitle>Forschungsmethoden und Evaluation</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Bortz J, D&#246;ring N. Forschungsmethoden und Evaluation. Berlin: Springer; 2006.</RefTotal>
      </Reference>
      <Reference refNo="5">
        <RefAuthor>Brown G</RefAuthor>
        <RefAuthor>Manogue M</RefAuthor>
        <RefTitle>AMEE Medical Education Guide No. 22: Refreshing lecturing: a guide for lecturers</RefTitle>
        <RefYear>2001</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>231-244</RefPage>
        <RefTotal>Brown G, Manogue M. AMEE Medical Education Guide No. 22: Refreshing lecturing: a guide for lecturers. Med Teach. 2001;23(3):231-244. DOI: 10.1080&#47;01421590120043000</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1080&#47;01421590120043000</RefLink>
      </Reference>
      <Reference refNo="6">
        <RefAuthor>Butler JA</RefAuthor>
        <RefTitle>Use of teaching methods within the lecture format</RefTitle>
        <RefYear>1992</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>11-23</RefPage>
        <RefTotal>Butler JA. Use of teaching methods within the lecture format. Med Teach. 1992;14(1):11-23. DOI: 10.3109&#47;01421599209044010</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.3109&#47;01421599209044010</RefLink>
      </Reference>
      <Reference refNo="7">
        <RefAuthor>Cantillon P</RefAuthor>
        <RefTitle>Teaching large groups</RefTitle>
        <RefYear>2003</RefYear>
        <RefJournal>BMJ</RefJournal>
        <RefPage>437-440</RefPage>
        <RefTotal>Cantillon P. Teaching large groups. BMJ. 2003;326:437-440.</RefTotal>
      </Reference>
      <Reference refNo="8">
        <RefAuthor>Clau&#223; G</RefAuthor>
        <RefAuthor>Ebner H</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>1977</RefYear>
        <RefBookTitle>Grundlagen der Statistik f&#252;r Psychologen, P&#228;dagogen und Soziologen</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Clau&#223; G, Ebner H. Grundlagen der Statistik f&#252;r Psychologen, P&#228;dagogen und Soziologen. Thun&#47;Frankfurt a. M.: Harri Deutsch; 1977.</RefTotal>
      </Reference>
      <Reference refNo="9">
        <RefAuthor>Cohen PA</RefAuthor>
        <RefTitle>Effectiveness of student-rating feedback for improving college instruction: a meta-analysis of findings</RefTitle>
        <RefYear>1980</RefYear>
        <RefJournal>Res High Educ</RefJournal>
        <RefPage>321-341</RefPage>
        <RefTotal>Cohen PA. Effectiveness of student-rating feedback for improving college instruction: a meta-analysis of findings. Res High Educ. 1980;13(4):321-341. DOI: 10.1007&#47;BF00976252</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1007&#47;BF00976252</RefLink>
      </Reference>
      <Reference refNo="10">
        <RefAuthor>Copeland H</RefAuthor>
        <RefAuthor>Longworth D</RefAuthor>
        <RefAuthor>Hewson M</RefAuthor>
        <RefAuthor>Stoller J</RefAuthor>
        <RefTitle>Successful lecturing. A prospective study to validate attributes of the effective medical lecture</RefTitle>
        <RefYear>2000</RefYear>
        <RefJournal>J Gen Intern Med</RefJournal>
        <RefPage>366&#8211;371</RefPage>
        <RefTotal>Copeland H, Longworth D, Hewson M, Stoller J. Successful lecturing. A prospective study to validate attributes of the effective medical lecture. J Gen Intern Med. 2000;15(6):366&#8211;371. DOI: 10.1046&#47;j.1525-1497.2000.06439.x</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1046&#47;j.1525-1497.2000.06439.x</RefLink>
      </Reference>
      <Reference refNo="11">
        <RefAuthor>Craig M</RefAuthor>
        <RefTitle>Facilitated student discussions for evaluating teaching</RefTitle>
        <RefYear>2007</RefYear>
        <RefJournal>SIGCSE Bulletin</RefJournal>
        <RefPage>190-194</RefPage>
        <RefTotal>Craig M. Facilitated student discussions for evaluating teaching. SIGCSE Bulletin. 2007;39(1):190-194. DOI: 10.1145&#47;1227504.1227376</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1145&#47;1227504.1227376</RefLink>
      </Reference>
      <Reference refNo="12">
        <RefAuthor>Diehl JM</RefAuthor>
        <RefTitle>Normierung zweier Frageb&#246;gen zur studentischen Beurteilung von Vorlesungen und Seminaren</RefTitle>
        <RefYear>2003</RefYear>
        <RefJournal>Psychol Erz Unterr</RefJournal>
        <RefPage>27-42</RefPage>
        <RefTotal>Diehl JM. Normierung zweier Frageb&#246;gen zur studentischen Beurteilung von Vorlesungen und Seminaren. Psychol Erz Unterr. 2003;50:27-42.</RefTotal>
      </Reference>
      <Reference refNo="13">
        <RefAuthor>Fyrenius A</RefAuthor>
        <RefAuthor>Bergdahl B</RefAuthor>
        <RefAuthor>Sil&#233;n C</RefAuthor>
        <RefTitle>Lectures in problem-based learning - why, when and how&#63; An example of interactive lecturing that stimulates meaningful learning</RefTitle>
        <RefYear>2005</RefYear>
        <RefJournal>Med Teach</RefJournal>
        <RefPage>61-65</RefPage>
        <RefTotal>Fyrenius A, Bergdahl B, Sil&#233;n C. Lectures in problem-based learning - why, when and how&#63; An example of interactive lecturing that stimulates meaningful learning. Med Teach. 2005;27(1):61-65. DOI: 10.1080&#47;01421590400016365</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1080&#47;01421590400016365</RefLink>
      </Reference>
      <Reference refNo="14">
        <RefAuthor>Gordon PA</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>1997</RefYear>
        <RefBookTitle>Student evaluation of college instructors: an overview</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Gordon PA. Student evaluation of college instructors: an overview. Valdosta: Valdosta State University; 1997. Zug&#228;nglich unter&#47;available under: http:&#47;&#47;teach.valdosta.edu&#47;WHuitt&#47;files&#47;tcheval.pdf</RefTotal>
        <RefLink>http:&#47;&#47;teach.valdosta.edu&#47;WHuitt&#47;files&#47;tcheval.pdf</RefLink>
      </Reference>
      <Reference refNo="15">
        <RefAuthor>Grass G</RefAuthor>
        <RefAuthor>Stosch C</RefAuthor>
        <RefAuthor>Griebenow R</RefAuthor>
        <RefTitle>Renaissance der Vorlesung</RefTitle>
        <RefYear>2005</RefYear>
        <RefJournal>Dtsch &#196;rztebl</RefJournal>
        <RefPage>A1642</RefPage>
        <RefTotal>Grass G, Stosch C, Griebenow R. Renaissance der Vorlesung. Dtsch &#196;rztebl. 2005;102(23):A1642.</RefTotal>
      </Reference>
      <Reference refNo="16">
        <RefAuthor>Greenwood GE</RefAuthor>
        <RefAuthor>Ramagli HJ</RefAuthor>
        <RefTitle>Alternatives to student ratings of college teaching</RefTitle>
        <RefYear>1980</RefYear>
        <RefJournal>J High Educ</RefJournal>
        <RefPage>673-684</RefPage>
        <RefTotal>Greenwood GE, Ramagli HJ. Alternatives to student ratings of college teaching. J High Educ. 1980;51(6):673-684. DOI: 10.2307&#47;1981172</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.2307&#47;1981172</RefLink>
      </Reference>
      <Reference refNo="29">
        <RefAuthor>Universit&#228;t Hamburg</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2009</RefYear>
        <RefBookTitle>Hamburger Lernzielkatalog</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Universit&#228;t Hamburg. Hamburger Lernzielkatalog. Hamburg: Universit&#228;t Hamburg; 2009. Zug&#228;nglich unter&#47;available under: http:&#47;&#47;www.uke.de&#47;studierende&#47;downloads&#47;zg-studierende&#47;Lernzielkatalog&#95;091104&#95;mat.pdf</RefTotal>
        <RefLink>http:&#47;&#47;www.uke.de&#47;studierende&#47;downloads&#47;zg-studierende&#47;Lernzielkatalog&#95;091104&#95;mat.pdf</RefLink>
      </Reference>
      <Reference refNo="17">
        <RefAuthor>Imseis HM</RefAuthor>
        <RefAuthor>Galvin SL</RefAuthor>
        <RefTitle>Faculty and resident preference for two different forms of lecture evaluation</RefTitle>
        <RefYear>2004</RefYear>
        <RefJournal>Am J Obstet Gynecol</RefJournal>
        <RefPage>1815-1821</RefPage>
        <RefTotal>Imseis HM, Galvin SL. Faculty and resident preference for two different forms of lecture evaluation. Am J Obstet Gynecol. 2004;191(5):1815-1821. DOI: 10.1016&#47;j.ajog.2004.07.068</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1016&#47;j.ajog.2004.07.068</RefLink>
      </Reference>
      <Reference refNo="18">
        <RefAuthor>Irby D</RefAuthor>
        <RefAuthor>DeMers J</RefAuthor>
        <RefAuthor>Scher M</RefAuthor>
        <RefAuthor>Matthews D</RefAuthor>
        <RefTitle>A model for the improvement of medical faculty lecturing</RefTitle>
        <RefYear>1976</RefYear>
        <RefJournal>J Med Educ</RefJournal>
        <RefPage>403-409</RefPage>
        <RefTotal>Irby D, DeMers J, Scher M, Matthews D.A model for the improvement of medical faculty lecturing. J Med Educ. 1976;51(5):403-409.</RefTotal>
      </Reference>
      <Reference refNo="19">
        <RefAuthor>Leppek R</RefAuthor>
        <RefAuthor>Ju&#223;en M</RefAuthor>
        <RefAuthor>Berthold D</RefAuthor>
        <RefAuthor>Sulzer J</RefAuthor>
        <RefAuthor>Klose KJ</RefAuthor>
        <RefTitle>Windm&#252;hlenprinzip versus Uhrwerkprinzip - Tradition und Interaktion in der akademischen Vorlesung</RefTitle>
        <RefYear>1996</RefYear>
        <RefJournal>Z &#196;rztl Fortbild</RefJournal>
        <RefPage>406-413</RefPage>
        <RefTotal>Leppek R, Ju&#223;en M, Berthold D, Sulzer J, Klose KJ. Windm&#252;hlenprinzip versus Uhrwerkprinzip - Tradition und Interaktion in der akademischen Vorlesung. Z &#196;rztl Fortbild. 1996;90:406-413.</RefTotal>
      </Reference>
      <Reference refNo="20">
        <RefAuthor>Mo&#223;ig I</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>1996</RefYear>
        <RefBookTitle>Stichproben, Stichprobenauswahlverfahren und Berechnung des minimal erforderlichen Stichprobenumfangs</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Mo&#223;ig I. Stichproben, Stichprobenauswahlverfahren und Berechnung des minimal erforderlichen Stichprobenumfangs. Gie&#223;en: Universit&#228;t Gie&#223;en;1996.</RefTotal>
      </Reference>
      <Reference refNo="21">
        <RefAuthor>Reed M</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2004</RefYear>
        <RefBookTitle>Electronic module evaluation: combining quality with quantity</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Reed M. Electronic module evaluation: combining quality with quantity. Kongressbeitrag University of Leeds Inaugural Learning and Teaching Conference. Leeds: University of Leeds; 2004. Zug&#228;nglich unter&#47;available under: http:&#47;&#47;homepages.see.leeds.ac.uk&#47;&#126;lecmsr&#47;Reed&#37;202004.doc</RefTotal>
        <RefLink>http:&#47;&#47;homepages.see.leeds.ac.uk&#47;&#126;lecmsr&#47;Reed&#37;202004.doc</RefLink>
      </Reference>
      <Reference refNo="24">
        <RefAuthor>Rost DH</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2001</RefYear>
        <RefBookTitle>Handw&#246;rterbuch der P&#228;dagogischen Psychologie</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Rost DH. Handw&#246;rterbuch der P&#228;dagogischen Psychologie. Weinheim: Beltz; 2001.</RefTotal>
      </Reference>
      <Reference refNo="22">
        <RefAuthor>Rindermann H</RefAuthor>
        <RefTitle>Methodik und Anwendung der Lehrveranstaltungsevaluation f&#252;r die Qualit&#228;tsentwicklung an Hochschulen</RefTitle>
        <RefYear>2003</RefYear>
        <RefJournal>Sozialwis Berufspraxis</RefJournal>
        <RefPage>401-413</RefPage>
        <RefTotal>Rindermann H. Methodik und Anwendung der Lehrveranstaltungsevaluation f&#252;r die Qualit&#228;tsentwicklung an Hochschulen. Sozialwis Berufspraxis. 2003;26(4):401-413.</RefTotal>
      </Reference>
      <Reference refNo="23">
        <RefAuthor>Rindermann H</RefAuthor>
        <RefTitle>Quality of instruction improved by evaluation and consultation of instructors</RefTitle>
        <RefYear>2007</RefYear>
        <RefJournal>Int J for Acad Develop</RefJournal>
        <RefPage>73-85</RefPage>
        <RefTotal>Rindermann H. Quality of instruction improved by evaluation and consultation of instructors. Int J for Acad Develop. 2007;12(2):73-85. DOI: 10.1080&#47;13601440701604849</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1080&#47;13601440701604849</RefLink>
      </Reference>
      <Reference refNo="25">
        <RefAuthor>Schmidt B</RefAuthor>
        <RefTitle>Warum oft wirksam&#63; Und warum manchmal wirkungslos&#63; &#8211; Subjektive Erkl&#228;rungen zur Wirkung von Lehrveranstaltungsevaluation aus der Sicht von Nutzern und Anbietern</RefTitle>
        <RefYear>2008</RefYear>
        <RefJournal>Z Eval</RefJournal>
        <RefPage>7-33</RefPage>
        <RefTotal>Schmidt B. Warum oft wirksam&#63; Und warum manchmal wirkungslos&#63; &#8211; Subjektive Erkl&#228;rungen zur Wirkung von Lehrveranstaltungsevaluation aus der Sicht von Nutzern und Anbietern. Z Eval. 2008;7(1):7-33.</RefTotal>
      </Reference>
      <Reference refNo="26">
        <RefAuthor>Stillman PL</RefAuthor>
        <RefAuthor>Gillers MA</RefAuthor>
        <RefAuthor>Heins M</RefAuthor>
        <RefAuthor>Nicholson G</RefAuthor>
        <RefAuthor>Sabers D</RefAuthor>
        <RefTitle>Effect of immediate student evaluations on a multi-instructor course</RefTitle>
        <RefYear>1983</RefYear>
        <RefJournal>J Med Educ</RefJournal>
        <RefPage>172-178</RefPage>
        <RefTotal>Stillman PL, Gillers MA, Heins M, Nicholson G, Sabers D. Effect of immediate student evaluations on a multi-instructor course. J Med Educ. 1983;58:172-178.</RefTotal>
      </Reference>
      <Reference refNo="27">
        <RefAuthor>Sukkar MY</RefAuthor>
        <RefTitle>Curriculum development: a strategy for change</RefTitle>
        <RefYear>1986</RefYear>
        <RefJournal>Med Educ</RefJournal>
        <RefPage>301-306</RefPage>
        <RefTotal>Sukkar MY. Curriculum development: a strategy for change. Med Educ. 1986;20:301-306. DOI: 10.1111&#47;j.1365-2923.1986.tb01369.x</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1111&#47;j.1365-2923.1986.tb01369.x</RefLink>
      </Reference>
      <Reference refNo="28">
        <RefAuthor>Turhan K</RefAuthor>
        <RefAuthor>Yaris F</RefAuthor>
        <RefAuthor>Nural E</RefAuthor>
        <RefTitle>Does instructor evaluation by students using a web-based questionnaire impact instructor performance&#63; Adv Health Sci Educ</RefTitle>
        <RefYear>2005</RefYear>
        <RefTotal>Turhan K, Yaris F, Nural E. Does instructor evaluation by students using a web-based questionnaire impact instructor performance&#63; Adv Health Sci Educ. 2005;10(1):5-13. DOI: 10.1007&#47;s10459-004-0943-7</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1007&#47;s10459-004-0943-7</RefLink>
      </Reference>
      <Reference refNo="30">
        <RefAuthor>van den Bussche H</RefAuthor>
        <RefAuthor>Anders S</RefAuthor>
        <RefAuthor>Ehrhardt M</RefAuthor>
        <RefAuthor>G&#246;ttsche T</RefAuthor>
        <RefAuthor>H&#252;neke B</RefAuthor>
        <RefAuthor>Kohlsch&#252;tter A</RefAuthor>
        <RefAuthor>Kothe R</RefAuthor>
        <RefAuthor>Kuhnigk O</RefAuthor>
        <RefAuthor>Neuber K</RefAuthor>
        <RefAuthor>Rijntjes M</RefAuthor>
        <RefAuthor>Quellmann C</RefAuthor>
        <RefAuthor>Harendza S</RefAuthor>
        <RefTitle>Lohnt sich eine Reform der klinischen Ausbildung&#63; - Die Qualit&#228;t des Hamburger Curriculums unter der alten und der neuen Approbationsordnung im Vergleich</RefTitle>
        <RefYear>2005</RefYear>
        <RefJournal>Z &#196;rztl Fortbild Qualit&#228;tssich</RefJournal>
        <RefPage>419-423</RefPage>
        <RefTotal>van den Bussche H, Anders S, Ehrhardt M, G&#246;ttsche T, H&#252;neke B, Kohlsch&#252;tter A, Kothe R, Kuhnigk O, Neuber K, Rijntjes M, Quellmann C, Harendza S. Lohnt sich eine Reform der klinischen Ausbildung&#63; - Die Qualit&#228;t des Hamburger Curriculums unter der alten und der neuen Approbationsordnung im Vergleich. Z &#196;rztl Fortbild Qualit&#228;tssich. 2005;99:419-423.</RefTotal>
      </Reference>
      <Reference refNo="31">
        <RefAuthor>van den Bussche H</RefAuthor>
        <RefAuthor>Weidtmann K</RefAuthor>
        <RefAuthor>Kohler N</RefAuthor>
        <RefAuthor>Frost M</RefAuthor>
        <RefAuthor>Kaduskiewicz H</RefAuthor>
        <RefTitle>Evaluation der &#228;rztlichen Ausbildung: Methodische Probleme der Durchf&#252;hrung und der Interpretation von Ergebnissen</RefTitle>
        <RefYear>2006</RefYear>
        <RefJournal>GMS Z Med Ausbild</RefJournal>
        <RefArticleNo>Doc37</RefArticleNo>
        <RefTotal>van den Bussche H, Weidtmann K, Kohler N, Frost M, Kaduskiewicz H. Evaluation der &#228;rztlichen Ausbildung: Methodische Probleme der Durchf&#252;hrung und der Interpretation von Ergebnissen. GMS Z Med Ausbild. 2006;23(2):Doc37. Zug&#228;nglich unter&#47;available under: http:&#47;&#47;www.egms.de&#47;de&#47;journals&#47;zma&#47;2006-23&#47;zma000256.shtml</RefTotal>
        <RefLink>http:&#47;&#47;www.egms.de&#47;de&#47;journals&#47;zma&#47;2006-23&#47;zma000256.shtml</RefLink>
      </Reference>
      <Reference refNo="32">
        <RefAuthor>Weidtmann K</RefAuthor>
        <RefTitle></RefTitle>
        <RefYear>2007</RefYear>
        <RefBookTitle>Analyse des Status quo der Leitsymptom-Vorlesung und Planung einer evaluationsbasierten Intervention an der Medizinischen Fakult&#228;t Hamburg</RefBookTitle>
        <RefPage></RefPage>
        <RefTotal>Weidtmann K. Analyse des Status quo der Leitsymptom-Vorlesung und Planung einer evaluationsbasierten Intervention an der Medizinischen Fakult&#228;t Hamburg. Unver&#246;ffentlichte Projektarbeit im Studiengang Master of Medical Education. Heidelberg: Medizinische Fakult&#228;t Heidelberg; 2007.</RefTotal>
      </Reference>
      <Reference refNo="33">
        <RefAuthor>Wilson RC</RefAuthor>
        <RefTitle>Improving faculty teaching: Effective use of student evaluations and consultants</RefTitle>
        <RefYear>1986</RefYear>
        <RefJournal>J High Educ</RefJournal>
        <RefPage>196-211</RefPage>
        <RefTotal>Wilson RC. Improving faculty teaching: Effective use of student evaluations and consultants. J High Educ. 1986;57(2):196-211. DOI: 10.2307&#47;1981481</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.2307&#47;1981481</RefLink>
      </Reference>
      <Reference refNo="34">
        <RefAuthor>Wirtz M</RefAuthor>
        <RefTitle>Bestimmung der G&#252;te von Beurteilereinsch&#228;tzungen mittels der Intraklassenkorrelation und Verbesserung von Beurteilereinsch&#228;tzungen</RefTitle>
        <RefYear>2004</RefYear>
        <RefJournal>Rehabilitation</RefJournal>
        <RefPage>384-389</RefPage>
        <RefTotal>Wirtz M. Bestimmung der G&#252;te von Beurteilereinsch&#228;tzungen mittels der Intraklassenkorrelation und Verbesserung von Beurteilereinsch&#228;tzungen. Rehabilitation. 2004;43:384-389. DOI: 10.1055&#47;s-2003-814935</RefTotal>
        <RefLink>http:&#47;&#47;dx.doi.org&#47;10.1055&#47;s-2003-814935</RefLink>
      </Reference>
    </References>
    <Media>
      <Tables>
        <Table format="png">
          <MediaNo>1</MediaNo>
          <MediaID language="de">1de</MediaID>
          <MediaID language="en">1en</MediaID>
          <Caption language="de"><Pgraph><Mark1>Tabelle 1: Verteilung der Ergebnisse der LSV der Erhebungsphase 1 auf die drei Ligen f&#252;r die Auswahl der Termine der Erhebungsphase 2. (F&#252;r die zweite Erhebungsphase wurden die in der ersten Erhebungsphase evaluierten Vorlesungen (n&#61;78) auf der Basis ihrer Bewertung nach deutschen Schulnoten in drei Ligen eingeteilt).</Mark1></Pgraph></Caption>
          <Caption language="en"><Pgraph><Mark1>Table 1: Distribution of the results of the LSV of evaluation phase 1 on the three leagues for the selection of lectures for evaluation phase 2</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>2</MediaNo>
          <MediaID language="de">2de</MediaID>
          <MediaID language="en">2en</MediaID>
          <Caption language="de"><Pgraph><Mark1>Tabelle 2: Vergleich der Schulnoten der Terminevaluationen aus den Erhebungsphasen 1 und 2 </Mark1></Pgraph></Caption>
          <Caption language="en"><Pgraph><Mark1>Table 2: Comparison of the school grades given by the students in evaluation phase 1 und 2</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>3</MediaNo>
          <MediaID language="de">3de</MediaID>
          <MediaID language="en">3en</MediaID>
          <Caption language="de"><Pgraph><Mark1>Tabelle 3: Gegen&#252;berstellung der von den Auditoren vergebenen Schulnoten aus den Erhebungsphasen 1 und 2 f&#252;r die 18 erfassten Termine</Mark1></Pgraph></Caption>
          <Caption language="en"><Pgraph><Mark1>Table 3: Comparison of school grades given by the auditors for the 18 lectures from evaluation phases 1 and 2</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>4</MediaNo>
          <MediaID language="de">4de</MediaID>
          <MediaID language="en">4en</MediaID>
          <Caption language="de"><Pgraph><Mark1>Tabelle 4: Gegen&#252;berstellung der Auditoren-Bewertungen auf der Ebene der Einzelmerkmale aus den Erhebungsphasen 1 und 2 f&#252;r die 18 erfassten Termine</Mark1></Pgraph></Caption>
          <Caption language="en"><Pgraph><Mark1>Table 4: Comparison of the auditor evaluations on the basis of individual items from the evaluation phases 1 and 2 for the 18 included lectures</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>5</MediaNo>
          <MediaID language="de">5de</MediaID>
          <MediaID language="en">5en</MediaID>
          <Caption language="de"><Pgraph><Mark1>Tabelle 5: Mittelwertvergleiche zwischen den Bewertungen der Studierenden und Auditoren nach Einzelmerkmalen &#252;ber alle LSV-Termine, Ligen und Themenbl&#246;cke hinweg f&#252;r die Erhebungsphasen 1 und 2</Mark1></Pgraph></Caption>
          <Caption language="en"><Pgraph><Mark1>Table 5: Comparison of the means between the rating of the students and the auditors regarding individual items across all LSVs, leagues, and thematic blocks for the evaluation phases 1 and 2</Mark1></Pgraph></Caption>
        </Table>
        <Table format="png">
          <MediaNo>6</MediaNo>
          <MediaID language="de">6de</MediaID>
          <MediaID language="en">6en</MediaID>
          <Caption language="de"><Pgraph><Mark1>Tabelle 6: Interklassenkorrelationskoeffizienten (mit Signifikanzen) f&#252;r die Gruppe der Auditoren - Vergleich der PJ-Studierenden mit den wissenschaftlichen Mitarbeitern in den Erhebungsphasen 1 und 2</Mark1></Pgraph></Caption>
          <Caption language="en"><Pgraph><Mark1>Table 6: Intra-class correlation coefficient (with significances) for the group of the auditors &#8211; comparing students with physicians in the evaluation phases 1 and 2</Mark1></Pgraph></Caption>
        </Table>
        <NoOfTables>6</NoOfTables>
      </Tables>
      <Figures>
        <Figure format="png" height="121" width="593">
          <MediaNo>1</MediaNo>
          <MediaID language="de">1de</MediaID>
          <MediaID language="en">1en</MediaID>
          <Caption language="de"><Pgraph><Mark1>Abbildung 1: Zeitlicher Ablauf der Studie mit &#220;bersicht &#252;ber die einzelnen Arbeitsschritte</Mark1></Pgraph></Caption>
          <Caption language="en"><Pgraph><Mark1>Figure 1: Timeline of the study with an overview of the individual steps</Mark1></Pgraph></Caption>
        </Figure>
        <NoOfPictures>1</NoOfPictures>
      </Figures>
      <InlineFigures>
        <NoOfPictures>0</NoOfPictures>
      </InlineFigures>
      <Attachments>
        <NoOfAttachments>0</NoOfAttachments>
      </Attachments>
    </Media>
  </OrigData>
</GmsArticle>