Jahrgang 30 / Heft 1 / 2016
Zeitschrift für
Pädagogische Psychologie German Journal of Educational Psychology
Herausgeber Andreas Knapp Detlef H. Rost Assoziierte Herausgeber Tina Hascher Jörn Sparfeldt Beirat Roland Brünken, Martin Brunner, Joachim C. Brunstein, Susanne R. Buch, Oliver Dickhäuser, Roland Grabner, Samuel Greiff, Michael Grosche, Hans Gruber, Regina Jucks, Detlev Leutner, Jens Möller, Jan Retelsdorf, Tina Seufert, Birgit Spinath, Nadine Spörer, Robin Stark, Ricarda Steinmayr, Elsbeth Stern, Ulrich Trautwein
Ein wichtiger Ratgeber – nicht nur für Fachpersonen
James T. Webb et al.
Doppeldiagnosen und Fehldiagnosen bei Hochbegabung Ein Ratgeber für Fachpersonen und Betroffene 2015. 360 S., 15 Tab., Gb € 34.95 / CHF 45.50 ISBN 978-3-456-85365-9 AUCH ALS E-BOOK
Intellektuell und kreativ hochbegabte
Psychiatern und Pädiatern zeigen in die-
Menschen unterscheiden sich in ihrem
sem Ratgeber für Fachpersonen und Be-
Verhalten oft signifikant von ihren Mit-
troffene oder deren Eltern erstmals auf:
menschen. Immer wieder werden bei
• was für hochbegabte Kinder und Er-
ihnen deshalb fälschlicherweise ADHS, Zwangsstörung,
www.hogrefe.com
Asperger,
wachsenen charakteristisch ist
Autismus
• welche Störungen am häufigsten bei
oder andere Verhaltens- und affektive
Hochbegabung auftreten (Doppeldiag-
Störungen diagnostiziert. Gerade für
nosen)
Ärzte, Psychologen oder Betreuer dieser
• welche
Störungen
am
häufigsten
Kinder und Erwachsenen ist es deshalb
fälschlicherweise diagnostiziert wer-
essenziell zu wissen, welche Verhal-
den (Fehldiagnosen)
tensweisen für diese Menschen normal
• welche Maßnahmen davor schützen
sind und welche tatsächlich auf eine
können, dass hochbegabte Menschen
psychische Störung hinweisen. James T.
falsche Diagnosen und Therapien er-
Webb und seine Team aus Psychologen,
halten.
Zeitschrift für
Pädagogische Psychologie German Journal of Educational Psychology
Jahrgang 30/Heft 1/2016
Herausgeber Andreas Knapp Detlef H. Rost Assoziierte Herausgeber Tina Hascher Jörn Sparfeldt
Herausgeber
Prof. Dr. Andreas Knapp, Santa Rosa, California Prof. Dr. Detlef H. Rost, Faculty of Psychology, South West University, Chongqing (CN) & Fachbereich Psychologie, Philipps-Universität Marburg
Assoziierte Herausgeber
Prof. Dr. Tina Hascher (geschäftsführend), Institut für Erziehungswissenschaft, Universität Bern Prof. Dr. Jörn Sparfeldt, FR Bildungswissenschaften, Universität des Saarlandes
Redaktionsassistent
Dr. Gerda Hagenauer, Institut für Erziehungswissenschaft, Universität Bern, gerda.hagenauer@edu.unibe.ch
Beirat
R. Brünken, Saarbrücken
D. Leutner, Essen
M. Brunner, Berlin
J. Möller, Kiel
J. C. Brunstein, Gießen
J. Retelsdorf, Kiel
S. R. Buch, Wuppertal
T. Seufert, Ulm
O. Dickhäuser, Mannheim
B. Spinath, Heidelberg
R. Grabner, Graz
N. Spörer, Potsdam
S. Greiff, Luxemburg
R. Stark, Saarbrücken
M. Grosche, Wuppertal
R. Steinmayr, Dortmund
H. Gruber, Regensburg
E. Stern, Zürich
R. Jucks, Münster
U. Trautwein, Tübingen
Verlag
Hogrefe AG, Länggass-Str. 76, 3000 Bern 9, Tel. +41 (0) 31 300 45 00, verlag@hogrefe.ch, www.hogrefe.ch
Anzeigenleitung
Josef Nietlispach, Hogrefe AG, Länggass-Str. 76, Postfach, 3000 Bern 9, Tel. +41 (0) 31 300 45 69, inserate@hogrefe.ch
Satz & Druck
AZ Druck und Datentechnik GmbH, Kempten (Allgäu)
Erscheinungsweise
vierteljährlich
Indexierung
Social Sciences Citation Index, Social Scisearch, Current Contents/Social and Behavioral Sciences, PSYNDEX, PsycLIT, Contents Pages in Education, Sociological Abstracts, Linguistics and Language Behavior Abstracts, Child Development Abstracts and Bibliography, Psyc INFO, PsyJOURNALS, IBZ, IBR, Europ. Reference List for the Humanities (ERIH) und Scopus Impact Factor: 0.585 2014 Journal Citation Reports® Social Sciences Edition (Thomson Reuters, 2015)
Bezugsbedingungen
Jahresabonnement Institute: CHF 374.– / € 291.– Private: CHF 158.– / € 117.– Einzelheft: CHF 72.50 / € 53.50 Porto und Versandgebühren Schweiz: CHF 14.– Europa: € 13.– übrige Länder: CHF 26.– Unverbindliche Preisempfehlung Abbestellungen spätestens zwölf Wochen vor Ablauf des Abonnements.
Elektronischer Volltext
www.psyjournals.com
ISSN-L 1010-0652 ISSN 1010-0652 (Print) ISSN 1664-2910 (online)
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 2–2
Inhalt Editorial
5
Editorial Jörn R. Sparfeldt, Johannes Schult
Übersichtsartikel
9
Metaanalyse zur Wirksamkeit einer Förderung der phonologischen Bewusstheit in der deutschen Sprache Promoting Phonological Awareness in German: A Meta-Analysis Katrin M. Wolf, Ulrich Schroeders, Katharina Kriegbaum
Originalartikel
35
Erstes Vorlesen: Der frühe Vogel fängt den Wurm Early Reading to Children: The Early Bird Catches the Worm Frank Niklas, Caroline Cohrssen, Collette Tayler, Wolfgang Schneider
45
Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter Qualitative Differences in Vocabulary Between Boys and Girls in Elementary School Age Nele McElvany, Wahiba El-Khechen, Franziska Schwabe, Ursula Kessels Unterrichtsbezogene Fehlerorientierung von Lehrkräften – Adaption und Validierung eines Fragebogens
57
Teaching-related Error Orientation. Adaptation and Validation of a Teacher Questionnaire Anja Böhnke, Felicitas Thiel Danksagung
Danksagung Gutachterinnen und Gutachter 2015
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 3–3
69
© 2016 Hogrefe
SLS 2–9
Salzburger Lese-Screening für die Schulstufen 2–9 H. Wimmer / H. Mayringer
SLS 2–9 komplett bestehend aus: Manual, je 10 Testheften Form A1, A2, B1 und B2, Schablonensatz und Box Bestellnummer 03 225 01 € 101.00/CHF 121.00
Das SLS 2–9 ist ein ökonomisches Verfahren zur Identifikation von Schülerinnen und Schülern mit Schwächen in basaler Lesefertigkeit. Es kann als Einzel- oder Klassentest von der 2. bis zur 9. Schulstufe verwendet werden.
Zuverlässigkeit: Die Zuverlässigkeit des SLS 2–9 (Paralleltest-Reliabilität) beträgt für die 2. Schulstufe .95 und für die 8. Schulstufe .87, mit einem höheren Wert (.93) für die langsamer lesenden Schüler/-innen der Hauptschule.
Eine Schwäche der basalen Lesefertigkeit zeigt sich in diesem Altersbereich vor allem in einer deutlich verlangsamten Lesegeschwindigkeit. Das SLS 2–9 erfasst die Lesegeschwindigkeit über das Lesen und Beurteilen von sinnvollen Sätzen. Ausgehend von der Anzahl der korrekt beurteilten Sätze kann ein Lesequotient ermittelt werden. Über das Zusammenfassen der Testwerte können auch Aussagen über den Leistungsstand von ganzen Schulklassen gemacht werden. Aufgrund der vorliegenden Parallelformen kann der Test in relativ kurzen Abständen wiederholt werden. Dies ermöglicht die Absicherung von Testergebnissen oder die Überprüfung von Fördermaßnahmen.
Gültigkeit: Es konnte gezeigt werden, dass die Testwerte des SLS 2–9 in engem Zusammenhang stehen mit der Geschwindigkeit beim lauten Lesen von Wortlisten, in der 2. Schulstufe mit Korrelationen zwischen .80 und .90. In Studien mit spezifisch leseschwachen Jugendlichen wurde gefunden, dass niedrige Testwerte im SLS 2–9 einhergingen mit massiv reduzierter Geschwindigkeit beim lauten Lesen und mit erhöhter Anzahl von Fixationen pro Wort und erhöhter Blickdauer pro Wort beim leisen Lesen.
Das SLS 2–9 basiert auf den Vorgängerversionen SLS 1–4 und SLS 5–8, beinhaltet jedoch vollständig neue Items, neue Normen sowie eine zusätzliche Übungsphase vor dem Test.
Hogrefe Verlag GmbH & Co. KG Testzentrale Tel. +49 551 999 50 99-9 / Fax -8 testzentrale@hogrefe.de www.testzentrale.de
Testzentrale der Schweizer Psychologen AG Tel. +41 31 300 45-45 / Fax -90 testzentrale@hogrefe.ch www.testzentrale.ch
Normen: Für das SLS 2–9 liegen Normen (Lesequotienten) von 11.900 Schülerinnen und Schülern vor. Bearbeitungsdauer: Durchführung einschließlich Instruktion, Austeilen und Einsammeln der Testhefte rund 15 min (reine Bearbeitungsdauer 3 min); Auswertung ca. 1–2 min pro Kind.
Editorial Jörn R. Sparfeldt und Johannes Schult Bildungswissenschaften, Universität des Saarlandes
Mit der Übernahme der geschäftsführenden Herausgeberschaft von Oliver Dickhäuser und seinem Mannheimer Team am 1. Januar 2013 war die interessante, aber auch herausfordernde Aufgabe verbunden, die Geschicke der Zeitschrift für Pädagogische Psychologie (ZfPP) herausgeberisch mitzugestalten. Für die damit in den letzten rund 2¾ Jahren verbundene Möglichkeit, viele sehr gute und wissenschaftlich interessante Manuskripte zu unterschiedlichsten pädagogisch-psychologischen Themen zu lesen und (anschließend) zu beurteilen, sind wir dankbar. In diesem Editorial anlässlich des Erscheinens des ersten Hefts des 30. Jahrgangs der ZfPP (in der Entwicklungspsychologie bezeichnet man diesen Abschnitt als «mittleres Erwachsenenalter») als letztes aus Saarbrücken herausgeberisch betreutes Heft und der Weitergabe des geschäftsführenden Herausgeber-Staffelstabs geben wir einen Rückblick auf unsere herausgeberischen Erfahrungen und wagen einen Ausblick. Hierbei skizzieren wir unsere persönliche Einschätzung zur aktuellen Lage der – nach unserem Eindruck – sehr gut aufgestellten ZfPP als hochrangige und (zumindest derzeit: primär) deutschsprachige Fachzeitschrift und ergänzen dies um aktuelle statistische Kennzahlen.
ZfPP: deutsch und/oder englisch? Zweifellos kann die englische Sprache im Jahre 2016 als lingua franca des internationalen Wissenschaftsbetriebs u. a. der (Pädagogischen) Psychologie bezeichnet werden. Eine zunehmende Anglisierung begann im deutschsprachigen Raum schon vor Jahrzehnten (vgl. z. B. Zimmer, 1996). Für die Naturwissenschaften formulierte der damalige DFG-Präsident – zeitlich parallel mit der ersten Ausgabe der ZfPP: «Die Spitzenforschung spricht englisch» (Markl, 1986). Einerseits wurde die Zukunft grundlagenwissenschaftlicher psychologischer Fachzeitschriften in deutscher Sprache in entsprechend pessimistischen Farben gemalt (vgl. Gigerenzer et al., 1999); ausgewählte psychologische Zeitschriften haben die Publikationssprache zum Englischen gewechselt (vgl. Krampen, Huckert & Schui, 2012). Andererseits wurde jedoch u. a. aus der Perspektive der angewandten psychologischen Forschung auf die enge Zeitschrift für Pädagogische Psychologie (2016), 30(1), 5–8 DOI 10.1024/1010-0652/a000164
Verbindung zur jeweiligen Sprache und Kultur hingewiesen (z. B. Weber, 1999; Wottawa, 1999); dies betrifft insbesondere die Pädagogische Psychologie – beispielsweise bei sprach- und kulturgebundenen diagnostischen Forschungsfragen (vgl. zu einer ähnlichen Einschätzung für die Diagnostica: Leutner, 1999, 2004) sowie (trivialerweise) sämtlichen Arbeiten, die mehr oder weniger spezifisch das hiesige Schul- und Bildungssystem und dessen Relevanz für psychisches Erleben und Verhalten genauer in den Blick nehmen. Erfreulicherweise existiert – Unkenrufen zum Trotz – eine ganze Reihe an psychologischen Fachzeitschriften mit peer-review und unterschiedlichen inhaltlich-thematischen und qualitativen Schwerpunktsetzungen, die deutschsprachige pädagogisch-psychologische Forschungsarbeiten publizieren (z. B. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie; Psychologie in Erziehung und Unterricht; Unterrichtswissenschaft). Die – verglichen mit beispielsweise psychologischen Grundlagenfächern – eher niedrige Anglisierungsquote in der Pädagogischen Psychologie von 17 % (Schui & Krampen, 2015) ist entsprechend nicht als Hinweis auf Trägheit oder gar Forschungsschwäche der deutschsprachigen Pädagogischen Psychologie zu deuten, sondern spiegelt die schon erwähnte engere Verbindung der Pädagogischen Psychologie zu bildungsstrukturellen und sprachlich-kulturellen Besonderheiten wider. Grundsätzlich sind Steigerungen der Forschungsqualität und der internationalen Sichtbarkeit auch für die deutschsprachige Pädagogische Psychologie zu begrüßen. Dass in den englischsprachigen Spitzen-Zeitschriften des Fachs zunehmend Arbeiten von Autorinnen und Autoren aus dem deutschen Sprachraum vertreten sind, ist ebenfalls zu begrüßen (und sollte weiter gesteigert werden). Entsprechend scheint – so unsystematische und informelle Befragungen im Kollegenkreis – bei Kolleginnen und Kollegen ein zunehmender Druck hin zu englischsprachigem Publizieren wahrgenommen zu werden. So berichteten diese Kolleginnen und Kollegen, ihre individuell besten Arbeiten zunehmend bei einer hochkarätigen englischsprachigen Zeitschrift einzureichen. Doch korrespondiert dieses individuelle, strategische Publikationsverhalten (für die Pädagogische Psychologie) mit einer substantiellen Korrelation zwischen der Qualität einer © 2016 Hogrefe
6
psychologischen Fachzeitschrift und der Publikationssprache? Denn neben den englischsprachigen Flaggschiff-Zeitschriften existieren einige (ebenfalls englischsprachige) Zeitschriften, in denen häufiger eher mäßige Arbeiten erscheinen – jedenfalls im Durchschnitt qualitativ unter denen liegend, die die ZfPP publiziert. Im Übrigen liegen deren Impact-Faktoren oftmals nicht höher (und manchmal sogar niedriger) als die der einschlägigen deutschsprachigen Zeitschriften, obgleich die potenzielle Leserschaft um ein Vielfaches höher anzusetzen ist. Wir halten die angedeutete relative Vielfalt auch deutschsprachiger pädagogisch-psychologischer Fachzeitschriften für sehr positiv und erhaltenswert. Und aus unserer Sicht ist die ZfPP im Kreise dieser Zeitschriften sehr gut aufgestellt. Der – verglichen mit Grundlagenfächern – deutlichere Erfolg auch deutschsprachiger psychologischer Fachzeitschriften ist nicht nur der thematischen Besonderheit eines Anwendungsfachs mit engen Bezügen zum hiesigen Bildungssystem und der deutschen Sprache geschuldet. Auch erleichtert das Fehlen einer Sprachbarriere, dass wissenschaftliche Erkenntnisse von einer nicht primär wissenschaftlichen Leserschaft rezipiert werden und dass dann praktisches pädagogisch-psychologisches Handeln im günstigen Fall positiv beeinflusst wird. Wir wollen jedoch in keinster Weise gegen englischsprachige Publikationen argumentieren. Doch sehen wir die Zukunft der ZfPP insbesondere darin, erstklassige Forschungsarbeiten mit stärkerem Schwerpunkt in denjenigen Bereichen unseres Fachs zu veröffentlichen, die eine engere inhaltlich-thematische Bindung an die deutsche Sprache und die Bezüge zu den Spezifika der deutschsprachigen Bildungssysteme aufweisen. Um keine Missverständnisse aufkommen zu lassen: Traditionell sind bei der ZfPP deutsch- und englischsprachige Manuskripte gleichermaßen sehr willkommen, wenn auch in der Vergangenheit eher wenige englischsprachige Manuskripte eingereicht wurden und erschienen sind. Während der Saarbrücker geschäftsführenden Herausgeberschaft stand bei der herausgeberischen Entscheidung stets die inhaltliche Qualität eines Beitrags im Vordergrund; die Manuskriptsprache (deutsch oder englisch) war hierbei stets kein Argument. Es wäre der ZfPP aus unserer Sicht zu wünschen, wenn es in den nächsten Jahren gelänge, vermehrt auch erstklassige englischsprachige Manuskripte abzudrucken.
Einreichungsvolumen und Prozesszeiten Unabhängig von entsprechenden Überlegungen ist die Anzahl der bei der ZfPP eingereichten Beiträge nach wie © 2016 Hogrefe
Editorial
vor erfreulich hoch: Zwischen dem 1. Januar 2013 und dem 30. September 2015 wurden 155 neue Manuskripte eingereicht (dies entspricht rund 56 Manuskripten pro Jahr; zum Vergleich ergänzen wir hier und im Folgenden in Klammern die von Dickhäuser, Dinger & Nitsche, 2013, berichteten Kennzahlen für den Zeitraum «2011–2012» der Mannheimer geschäftsführenden Herausgeberschaft: damals rund 63 Manuskripte pro Jahr). Eine abschließende herausgeberische Entscheidung lag bei Redaktionsschluss für 129 dieser Einreichungen vor. In 37 Fällen, also 24 % der eingereichten Manuskripte bzw. 29 % der Manuskripte mit abschließender Entscheidung (2011– 2012: 15 %), erfolgte eine desk rejection durch den geschäftsführenden Herausgeber, also eine Ablehnung vor der Aufnahme in den Begutachtungsprozess aufgrund mangelnder inhaltlicher Passung bzw. wegen erheblicher qualitativer (häufig forschungsmethodischer) Mängel und einer sehr geringen Publikationschance. Insgesamt 53 Manuskripte – also 41 % – wurden nach der Begutachtung abgelehnt (oder von den Autorinnen und Autoren zurückgezogen). Zur Publikation angenommen wurden 39 Manuskripte. Entsprechend betrug die Ablehnungsquote 69.8 % (2011–2012: 70.1 %). Zudem erschienen – neben (Gast-)Editorials – einige evaluative Buch- bzw. Testbesprechungen. Zweifellos sind Ablehnungen für Autorinnen und Autoren wenig erfreulich. In aller Regel haben sich gutachtende Personen und geschäftsführender Herausgeber bemüht, die Gründe für Ablehnungsentscheidungen in Gutachten und Herausgeberbrief differenziert offen zu legen. Häufiger meldeten sich Autorinnen und Autoren (nachdem sich die erste Enttäuschung gelegt hatte) und dankten für die ausführlichen Begründungen, was wir als Bestätigung dieses Vorgehens werten. Vor dem Hintergrund unserer herausgeberischen Erfahrungen möchten wir einige Empfehlungen ableiten: • Bereits vor einer eventuellen Einreichung sollte sorgfältig geprüft werden, ob ein Beitrag in die ZfPP passt. Da die ZfPP nur Originalbeiträge publiziert, sind Überschneidungen mit früheren Publikationen bereits bei der Einreichung offen zu legen; ärgerlich für alle Beteiligten ist, wenn Gutachterinnen oder Gutachter auf eine entsprechende Doppelpublikation hinweisen – mit (im Falle nicht ausreichenden Erkenntnismehrwerts) der Konsequenz einer sofortigen Ablehnung bei der ZfPP. • Für Personen mit geringer pädagogisch-psychologischer Publikationserfahrung kann es hilfreich sein, im Vorfeld einer Einreichung eine Person mit ZfPP-Publikationserfahrung zu konsultieren. • Gelegentlich haben wir bei eingereichten Manuskripten den Eindruck gewonnen (was uns von verärgerten Gutachterinnen und Gutachtern in entsprechenden KomZeitschrift für Pädagogische Psychologie (2016), 30(1), 5–8
Editorial 7
mentaren an die Redaktion mitgeteilt wurde), dass Manuskripte zum Teil eher «halbfertig» eingereicht wurden – also beispielsweise erhebliche formale Schwä chen aufwiesen (was in Einzelfällen auch zu einer Rück sendung mit der Bitte um eine entsprechende Überar beitung vor der Aufnahme in den Begutachtungsprozess geführt hat) oder versucht wurde, einen Teil des er forderlichen «wissenschaftlichen Hirnschmalzes» vom Autorenteam an die gutachtenden Personen auszula gern. Hier möchten wir insbesondere die arrivierteren Koautorinnen und Koautoren um ein erhöhtes Engage ment bitten. • Wurden zu einem Manuskript gutachterliche Stellung nahmen erbeten, erfolgte in aller Regel eine Einord nung und Erläuterung zentraler Argumente der gutach terlichen Stellungnahmen in einem Begleitschreiben des geschäftsführenden Herausgebers. In diesem Zu sammenhang möchten wir alle Autorinnen und Auto ren zu einer sehr sorgfältigen Lektüre entsprechender Schreiben ermutigen. Entsprechend bedauerlich ist, wenn in Herausgeberschreiben erläuterte Zweifel an der Publikationsfähigkeit eines Manuskripts (bzw. ent sprechende Fragen aufgrund fehlender Angaben im Manuskript) übergangen werden, Autorinnen und Au toren die Bemühungen von Revisionen auf sich neh men und entsprechend späte Ablehnungen ausgespro chen werden müssen. Des Weiteren bleibt selbstkritisch festzuhalten, dass – trotz aller Bemühungen und exzellenter Unterstützung durch gutachterliche Einschätzungen – das Diagnoseinst rument «geschäftsführender Herausgeber» nicht immer perfekt gewesen sein dürfte, mithin (in Einzelfällen) so wohl alpha- als auch beta-Fehler bei der herausgeberi schen Entscheidung vorgekommen sein dürften. Im Falle entsprechender Fehlentscheidungen bitten wir Autorin nen und Autoren um Nachsicht. Der (ehemalige) ge schäftsführende Herausgeber steht zu seiner jeweiligen Entscheidung. Nichtsdestotrotz existieren – für Autorin nen und Autoren erfreulicherweise – Alternativzeitschrif ten; so kam es immer wieder vor, dass bei der ZfPP be gründet abgelehnte Beiträge an anderer Stelle erschienen sind. Für potenzielle Autorinnen und Autoren dürfte die fol gende Zeitangabe noch interessant sein: Die Dauer zwi schen Einreichung und erster herausgeberischer Entschei dung betrug im Schnitt 53 Tage – Median: 52 Tage – bei einer Standardabweichung von 34 Tagen; in Einzelfällen kam es allerdings bedauerlicherweise – beispielsweise auf grund mehrfacher und negativ beschiedener Gutachteran fragen oder aus anderen nachvollziehbaren Gründen (wie Erkrankung einer Gutachterin oder eines Gutachters) – auch zu längeren Zeiten. Zeitschrift für Pädagogische Psychologie (2016), 30(1), 5–8
Beitrag der Gutachterinnen und Gutachter Ein ganz besonderer Dank gilt den zahlreichen Kolleginnen und Kollegen, die die ZfPP durch ihre Gutachtertätigkeit unterstützten – und hoffentlich weiterhin unterstützen wer den. Dies war uns eine große Hilfe und leistete einen essen ziellen Beitrag zur Qualitätssicherung der ZfPP. Insgesamt gesehen war die Bereitschaft zur Übernahme von Gutach ten erfreulich hoch. Allerdings waren wir in Einzelfällen überrascht, wenn Personen einerseits als Autorin oder Au tor ein Manuskript bei der ZfPP einreichten und publizier ten, aber andererseits später die Übernahme von Begutach tungsanfragen ablehnten. Vor dem Hintergrund vielfacher Bitten um Gutachten ist eine Absage im Einzelfall nachvoll ziehbar; wir waren jedoch dankbar, wenn die Absage zeit nah und begründet erfolgte (was meist der Fall war) und um Vorschläge für Alternativen ergänzt wurde. Vor dem Hinter grund, dass für jedes in den Begutachtungsprozess aufge nommene Manuskript zwei bis drei Gutachten eingeholt wurden, möchten wir auch für die Zukunft an alle Kollegin nen und Kollegen appellieren: Bei jedem eingereichten Ma nuskript profitiert man nicht unerheblich von «fremder» gutachterlicher Tätigkeit; das g esamte peer-review-System wissenschaftlicher Qualitäts sicherung funktioniert aller dings nur, wenn eine ausreichende Zahl an kompetenten Gutachterinnen und Gutachtern mitwirkt. Eine Untergren ze anzufertigender Gutachten könnte entsprechend die mit mindestens dem Faktor «2» multiplizierte Anzahl eigener Manuskripte (bzw. der eigenen Abteilung) sein.
Zitationskennwerte Bekanntermaßen wird der wissenschaftliche impact einer Zeitschrift auch anhand des impact factors (IF) beurteilt. Thomson Reuters hatte im Jahre 2012 unter anderem für die ZfPP keinen IF berichtet. Dies wurde von Thomson Reuters u. a. mit der hohen Zahl an Zitationen von in der ZfPP publizierten Beiträgen durch in der ZfPP publizierte andere Arbeiten (sog. Selbstzitationen) begründet (vgl. Dickhäuser et al., 2013). Entsprechend wurde u. a. von der Praxis Abstand genommen, dass scheidende geschäftsfüh rende ZfPP-Herausgeber einen Überblick über Beiträge der letzten Jahre gaben und auf entsprechende Trends hinwie sen (und dabei notwendigerweise entsprechende Arbeiten zitierten). Ohne näher darauf einzugehen, waren wir von der Breite und Qualität pädagogisch-psychologischer Ar beiten, zu deren Lektüre wir Gelegenheit hatten, positiv überrascht; ein Blick über Inhaltsverzeichnisse verdeutlicht diese Breite eindrucksvoll. Inzwischen ist die ZfPP wieder © 2016 Hogrefe
8
Editorial
in den jährlichen journal citation reports (JCR, Social Science Edition) von Thomson Reuters gelistet – für das Jahr 2014 mit einem Impact Faktor von 0.585. Bei Google Scholar1 liegt die ZfPP aktuell auf Rang 15 aller deutschsprachigen wissenschaftlichen Zeitschriften. Für die Interpretation relevant erscheint, dass die Artikel in Google Scholar breiter als beim JCR erfasst werden (also auch Dissertationen, Forschungsberichte u. ä.). Insgesamt gesehen verweisen diese Zahlen auf die substanzielle Rezeption von in der ZfPP publizierten Forschungsarbeiten.
ken aller Beteiligten gelang es, die ZfPP auf Erfolgskurs zu halten. Möge die ZfPP auch im mittleren Erwachsenenalter die Lektüre vieler wissenschaftlicher Befunde ermöglichen. Zum 1. Oktober 2015 hat die Kollegin Tina Hascher von der Universität Bern die geschäftsführende Herausgeberschaft der ZfPP übernommen. Wir wünschen ihr und ihrem Redaktionsteam mit insbesondere Gerda Hagenauer viel Erfolg und Freude bei dieser spannenden und interessanten Tätigkeit sowie die gleiche nachhaltige Unterstützung, die wir erfahren durften.
Schlussbemerkungen
Literatur
Zum Erfolg einer Zeitschrift wie der ZfPP tragen viele bei: Dies sind zunächst diejenigen Forscherinnen und Forscher, die exzellente Manuskripte verfassen. Wir wünschen der ZfPP, dass auch in Zukunft Kolleginnen und Kollegen aus dem weiten und spannenden Feld der Pädagogischen Psychologie und Nachbardisziplinen erstklassige pädagogischpsychologische Arbeiten bevorzugt bei der ZfPP einreichen. Auf die außerordentliche Bedeutung gutachterlicher Stellungnahmen hatten wir schon hingewiesen. Darüber hinaus hängt der Erfolg einer Zeitschrift aber auch davon ab, dass die Beiträge gelesen und rezipiert werden. Auch wenn derzeit erhebliche Umbrüche im Publikationswesen stattfinden (u. a. vermehrter elektronischer Zugriff am Bildschirm statt Lektüre des Papierhefts, massive Einsparungen in universitären Bibliotheksetats und Abbestellungen von Zeitschriften, vermehrte sog. open access Publikationen), ist die Zufriedenheit der Leserschaft bei der und im Anschluss an die Lektüre nicht zu unterschätzen (für das Fach «Pädagogische Psychologie» dürften entsprechende Zeitschriften zudem auch eine identitätsstiftende Funktion haben). Häufig bleibt man beim Durchblättern eines Heftes eben auch an interessanten Beiträgen hängen, die keinen Bezug zu den unmittelbaren eigenen Forschungsthemen aufweisen. Wir danken weiterhin insbesondere den Mitgliedern des ZfPP-Herausgeberteams (insbesondere Oliver Dickhäuser und seinen Redaktionsassistenten für die äußerst kompetente und hilfreiche Unterstützung nicht nur im Zuge der reibungslosen Übergabe zu Beginn unserer Herausgeberschaft sowie Detlef H. Rost für vielfältige Hinweise) und dem wissenschaftlichen Beirat der ZfPP für verstärkte gutachterliche Tätigkeit. In Frau Karolina Andonovska vom Huber Verlag (jetzt: Hogrefe) fanden wir eine äußerst unterstützende und kompetente Ansprechpartnerin. Unser Dank gilt auch Frau Nicole Brunnemann, die 2013 in der Redaktionsassistenz mitwirkte. Nur durch das gute Zusammenwir-
Dickhäuser, O., Dinger, F. & Nitsche, S. (2013). Editorial. Zeitschrift für Pädagogische Psychologie, 27, 5–7. Gigerenzer, G., Rösler, F., Spada, H., Amelang, M., Bierhoff, H. W., Ferstl, R. et al. (1999). Internationalisierung der psychologischen Forschung in Deutschland, Österreich und der Schweiz: Sieben Empfehlungen. Psychologische Rundschau, 50, 101–105. Krampen, G., Huckert, T. & Schui, G. (2012). The impact of anglicizing former German-language psychology journals on authorship and citation frequencies. European Psychologist, 17, 190–198. Leutner, D. (1999). Bedarf es deutschsprachiger Zeitschriften für Psychologische Diagnostik und Differentielle Psychologie? Diagnostica, 45, 1–6. Leutner, D. (2004). Konstanz im Wandel? Die Diagnostica als deutschsprachige psychologische Zeitschrift auf dem Weg ins dritte Jahrtausend. Diagnostica, 50, 18–21. Markl, H. (1986). Die Spitzenforschung spricht englisch. In H. Kalvenkämper & H. Weinrich (Hrsg.), Deutsch als Wissenschaftssprache. 25. Konstanzer Literaturgespräch des Buchhandels, 1985 (S. 20–25). Tübingen: Gunter Narr Verlag. Schui, G. & Krampen, G. (2015). ZPID-Monitor 2012 zur Internationalität der Psychologie aus dem deutschsprachigen Bereich: Der Kurzbericht. Psychologische Rundschau, 66, 124–127. Weber, H. (1999). Stellungnahme zu «Internationalisierung der psychologischen Forschung in Deutschland, Österreich und Schweiz». Psychologische Rundschau, 50, 105–107. Wottawa, H. (1999). Stellungnahme der Leitung Fachgruppe «Differentielle Psychologie, Persönlichkeitspsychologie und Psychologische Diagnostik» zum Problembereich «Internationalisierung der psychologischen Forschung». Psychologische Rundschau, 50, 109–111. Zimmer, D. E. (1996, 19. Juli). Warum Deutsch als Wissenschaftssprache ausstirbt. Die Zeit, (30). Zugriff am 11.11.2015. Verfügbar unter http://www.zeit.de/1996/30/deutsch.txt.19960719. xml/komplettansicht
1
Prof. Dr. Jörn R. Sparfeldt Bildungswissenschaften Universität des Saarlandes Campus A5 4 66123 Saarbrücken Deutschland j.sparfeldt@mx.uni-saarland.de
https://scholar.google.com/citations?view_op=top_venues&vq=de
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 5–8
Übersichtsartikel
Metaanalyse zur Wirksamkeit einer Förderung der phonologischen Bewusstheit in der deutschen Sprache Katrin M. Wolf1, Ulrich Schroeders2 und Katharina Kriegbaum3 1
Humboldt-Universität zu Berlin Universität Bamberg 3 Ruprecht-Karls-Universität Heidelberg 2
Zusammenfassung: Internationale Metaanalysen belegen bedeutsame Effekte einer Förderung der phonologischen Bewusstheit auf den Schriftspracherwerb. In der vorliegenden Metaanalyse mit 27 Primärstudien wurden die Effekte phonologischer Fördermaßnahmen auf die frühen schriftsprachlichen Kompetenzen im Deutschen quantifiziert. Die Analysen belegten generell höhere Effekte für Fördermaßnahmen, die vor der Einschulung stattfanden. Eine vorschulische Förderung besaß zwar keine signifikanten Effekte auf die Dekodierfähigkeit; jedoch konnten geringe Effekte auf die Rechtschreibkompetenz nachgewiesen werden, was auf die unterschiedliche Konsistenz der Graphem-Phonemund Phonem-Graphem-Zuordnungen zurückzuführen sein könnte. Analysen zum Einfluss von Moderatoren ergaben, dass Kinder mit schwachen und guten Ausgangskompetenzen gleichermaßen von der Förderung profitieren, und dass die Kombination mit einem Buchstaben-Laut-Training keine inkrementellen Effekte im Vergleich zu rein phonologischen Fördermaßnahmen hat. Insgesamt fielen die metaanalytischen Trainingseffekte der deutschsprachigen Förderprogramme deutlich niedriger aus als in den internationalen Metaanalysen. Für diesen Befund werden sprachliche und methodische Erklärungen gegeben. Schlüsselwörter: Metaanalyse, phonologische Bewusstheit, Sprachförderung, Schriftspracherwerb, Trainingsevaluation
Promoting Phonological Awareness in German: A Meta-Analysis Abstract: International meta-analyses show significant effects of phonological awareness training on the acquisition of written language. In the present meta-analysis of 27 primary studies the effects of phonological awareness on the early reading and writing skills are assessed in German. In general, we found higher effects for preschool training programs. However, preschool training did not have significant effects on decoding, but small effects on spelling skills. This pattern could be attributed to differences in the consistency of phoneme-grapheme vs. grapheme-phoneme correspondences. Moderator analyses indicated that children with weak vs. good initial competencies equally benefit from the training. Furthermore, combining the training with a phonic-letter training yielded no additional effects in comparison to a purely phonological awareness training. Overall, the meta-analytical training effects of the German programs were lower than in the international metaanalyses. For these findings linguistic and methodological explanations are given. Keywords: meta-analysis, phonological awareness, special language support, acquisition of reading and spelling, program evaluation
Hintergrund Unter phonologischer Bewusstheit wird die Einsicht in die Lautstruktur einer Sprache verstanden, wobei sich zwei Dimensionen voneinander abgrenzen lassen: Phonologische Bewusstheit im weiteren Sinne bezieht sich auf die Wahrnehmung und Analyse von größeren sprachlichen Einheiten wie Wörter, Silben und Reime; unter phonologischer Bewusstheit im engeren Sinne wird die Wahrnehmung und Analyse der kleinsten sprachlichen Einheiten einer Sprache, den Phonemen, verstanden (vgl. Skowronek & Marx, 1989). Die Bedeutung der phonologischen Bewusstheit als spezifische Vorläuferfähigkeit des SchriftZeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33 DOI 10.1024/1010-0652/a000165
spracherwerbs wurde umfassend untersucht und metaanalytisch bestätigt (Pfost, 2015; Schneider & Näslund, 1993). Lundberg, Frost und Petersen (1988) zeigten in einer viel beachteten Studie, dass eine Förderung der phonologischen Bewusstheit in der dänischen Sprache vor Schuleintritt nachhaltige positive Effekte auf das Lesen und Schreiben hatte, die sich bis zum Ende der Grundschulzeit nachweisen ließen. Seitdem wurden vergleichbare Förderprogramme in vielen Ländern und Sprachen entwickelt und die initialen Befunde vielfach repliziert. In zwei internationalen Metaanalysen wurde die Wirksamkeit dieser Programme wie folgt beschrieben: Für die Lesekompetenz wurde eine durchschnittliche Effektstärke © 2016 Hogrefe
10
von d = 0.70 (Bus & van Ijzendoorn, 1999) bzw. d = 0.53 (Ehri et al., 2001) berichtet, die jedoch in einem Zeitraum von bis zu drei Jahren nach dem Training mit d = 0.16 bzw. d = 0.23 deutlich geringer ausfiel. Auch in Deutschland wurde eine Reihe von Programmen zur Förderung der phonologischen Bewusstheit entwickelt, um günstigere Voraussetzungen für den Schriftspracherwerb zu schaffen (z. B. Küspert & Schneider, 2006). Eine aktuelle Metaanalyse zur Wirksamkeit von Fördermaßnahmen der phonologischen Bewusstheit in der deutschen Sprache mit 19 Primärstudien deutet im Vergleich zu den Ergebnissen der internationalen Metaanalysen auf eine geringere Wirksamkeit hin (Fischer & Pfost, 2015). Mit der vorliegenden Metaanalyse soll geprüft werden, ob sich diese Befunde mit einer umfangreicheren Datenbasis replizieren und mittels einer anderen methodischen und inhaltlichen Ausrichtung erweitern lassen.
Phonologische Bewusstheit und Schriftspracherwerb In der Forschung geht man heute davon aus, dass zwischen phonologischer Bewusstheit und Schriftspracherwerb eine wechselseitige Beziehung besteht (Ehri, 1992): Die phonologische Bewusstheit im weiteren Sinne bildet sich im Zuge der natürlichen Entwicklung heraus, ist bereits bei Vorschulkindern nachweisbar und erleichtert den Erwerb von Schriftsprachkenntnissen. Der Unterricht im Lesen und Schreiben beziehungsweise Buchstabenwissen ermöglicht dann in einem weiterführenden Schritt die Ausbildung der phonologischen Bewusstheit im engeren Sinne, die wiederum zu besseren schriftsprachlichen Kompetenzen führt (Burgess & Lonigan, 1998; Goswami & Bryant, 1990). Der Verlauf des Schriftspracherwerbs wird unter anderem durch die Transparenz der Orthografie beeinflusst. Darunter wird die Konsistenz der Korrespondenz von gesprochener und geschriebener Sprache verstanden, also die Konsistenz der Graphem-Phonem-Korrespondenzen sowie der Phonem-Graphem-Korrespondenzen1. In transparenten Orthografien wie dem Finnischen werden die einzelnen Grapheme immer identisch ausgesprochen und einem Phonem wird immer dasselbe Graphem zugeordnet. In intransparenten Orthografien wie dem Englischen besteht hingegen eine hohe Inkonsistenz bei der Zuordnung von Phonemen und Graphemen. Übereinstimmend konnte belegt werden, dass in transparenten Orthografien
1
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
die kompetente Zuordnung von Graphemen und Phonemen und damit die basalen schriftsprachlichen Fähigkeiten schneller erworben werden als in intransparenten Orthografien (z. B. Seymour, Aro & Erskine, 2003). Erste Dekodierleistungen sind dann wenig mehr als das Zusammenführen von Phonemen, die den Graphemen eindeutig zugeordnet werden können. In jüngster Zeit wurde die Transparenz der Orthografie auch als Moderator des Zusammenhangs von vorschulischer phonologischer Bewusstheit und den ersten schriftsprachlichen Fähigkeiten kontrovers diskutiert. Gestützt wurde diese Diskussion durch mehrere quer- und längsschnittliche Studien, die den Zusammenhang in verschiedenen Orthografien verglichen und widersprüchliche Befunde ermittelt haben. Einerseits gibt es empirische Hinweise darauf, dass die phonologische Bewusstheit in intransparenten Orthografien eine größere prädiktive Bedeutung für den Schriftspracherwerb hat als in transparenten Orthografien (Georgiou, Parrila & Papadopoulos, 2008; Landerl et al., 2013; Mann & Wimmer, 2002; Ziegler et al., 2010), andererseits sprechen andere Studien dafür, dass die frühe phonologische Bewusstheit in Orthografien mit unterschiedlicher Transparenz die gleiche Bedeutung für den Schriftspracherwerb hat (Caravolas et al., 2012; Furnes & Samuelsson, 2011; Moll et al., 2014; Patel, Snowling & de Jong, 2004; Vaessen et al., 2010). Wenngleich diese Frage nicht abschließend geklärt ist, kann festgehalten werden, dass auch in transparenten Orthografien die phonologische Bewusstheit ein signifikanter Prädiktor des frühen Schriftspracherwerbs ist (z. B. Ziegler et al., 2010). Im deutschen Schriftsystem liegt eine Asymmetrie bezüglich der orthografischen Transparenz aus Leser- und Schreibersicht vor (Costard, 2011). Einerseits sind die für das Lesen wichtigen Graphem-Phonem-Korrespondenzen konsistent. Das bedeutet, es existieren kaum identische Wortschreibungen, die unterschiedlich ausgesprochen werden, was den Erwerb der Lesefähigkeiten vereinfacht. Andererseits bestehen jedoch diverse lautgleiche Wörter, die unterschiedlich geschrieben werden (inkonsistente Phonem-Graphem-Korrespondenzen, z. B. Wahl/Wal oder fiel/viel, vgl. Neef, 2005). Im Kontext der deutschen Orthografie dürfte der phonologischen Bewusstheit folglich für das Schreibenlernen eine größere Bedeutung zukommen als für das Lesenlernen. Insgesamt wird der deutschen Orthografie im Vergleich zu anderen Sprachen damit eine moderate Transparenz zugeschrieben (Landerl et al., 2013; Moll et al., 2014). Für die deutsche Sprache
Ein Phonem ist die kleinste bedeutungsunterscheidende akustische Einheit des Lautsystems einer Sprache. Ein Graphem ist als kleinste bedeutungsunterscheidende graphische Einheit des Schriftsystems einer Sprache definiert. Grapheme sind folglich Buchstaben oder Buchstabengruppen, die mit einem Phonem korrespondieren (Schründer-Lenzen, 2007).
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
wurde die Bedeutung der vorschulischen phonologischen Bewusstheit für das Lesen- und Schreibenlernen in einer aktuellen Metaanalyse untersucht (Pfost, 2015). Die Ergebnisse belegen einen Zusammenhang mit den basalen Lesekompetenzen in Höhe von r = .27 und mit den Schreibkompetenzen in Höhe von r = .35. In internationalen Metaanalysen wurden Zusammenhänge der frühen phonologischen Bewusstheit mit den Lesefertigkeiten in Höhe von r = .40–.57 (Melby-Lervåg, Lyster & Hulme, 2012; NELP, 2008; Scarborough, 1998), mit dem Leseverständnis in Höhe von r = .44 (NELP, 2008) und mit den Rechtschreibfertigkeiten in Höhe von r = .40 (NELP, 2008) gefunden. Die in der deutschen Metaanalyse berichteten Korrelationen sind damit geringer als die der internationalen Metaanalysen.
Förderung der phonologischen Bewusstheit in der deutschen Sprache Aufbauend auf den vielversprechenden Ergebnissen von Lundberg und Kollegen (1988) zur Förderung der phonologischen Bewusstheit in der dänischen Sprache und den positiven Transfereffekten auf den Schriftspracherwerb hat in Deutschland insbesondere die Würzburger Arbeitsgruppe um Wolfgang Schneider Untersuchungen zu den Effekten von phonologischen Fördermaßnahmen durchgeführt. In der Folge wurden weitere Programme zur Förderung der phonologischen Bewusstheit entwickelt, die sich teilweise in Bezug auf die Zielgruppe, den Zeitpunkt und die Dauer der Förderung oder auch die Förderinhalte vom Würzburger Trainingsprogramm «Hören, lauschen, lernen» (Küspert & Schneider, 2006) unterscheiden. Evaluationen der Programme erbrachten inkonsistente Befunde. Sowohl hinsichtlich der Effekte auf die phonologische Bewusstheit als auch auf den Schriftspracherwerb lag eine hohe Streubreite der Effektstärken vor, die sich vom leicht negativen bis zum deutlich positiven Bereich erstreckte (z. B. Hartmann, 2002; Mannhaupt, Hüttinger, Schöttler & Völzke, 1999; Rothe, 2007; Schneider, Visé, Reimers & Blaesser, 1994). Eine aktuelle Metaanalyse (Fischer & Pfost, 2015) mit insgesamt 19 untersuchten Studien hat Hinweise darauf erbracht, dass eine phonologische Förderung im Kontext der deutschen Sprache mit geringeren Effekten verbunden ist als in den internationalen Metaanalysen berichtet. Demnach wurden durchschnittlich kurzfristige Effekte auf die phonologische Bewusstheit von d = 0.36 erzielt. Auch für den Schriftspracherwerb wurden geringe signifikante Effekte verzeichnet: Für die Dekodierfähigkeit ließ sich ein durchschnittlicher Effekt von d = 0.18 feststellen und für das Leseverständnis sowie die Rechtschreibkompetenz ein durchschnittlicher Effekt von jeweils d = 0.26. Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
11
Die Effekte der phonologischen Förderung in der deutschen Sprache lagen damit für alle untersuchten Kompetenzbereiche deutlich unter denen der internationalen Metaanalysen. Die Autoren erklären die divergierenden Ergebnisse mit Unterschieden hinsichtlich der Transparenz der Orthografie zwischen der deutschen und der englischen Sprache. Fischer und Pfost argumentieren, dass die phonologische Bewusstheit in Sprachen mit einer inkonsistenten Korrespondenz von Graphem und Phonemen (wie z. B. der englischen Sprache) eine größere Bedeutung für den Schriftspracherwerb aufweisen sollte als in Sprachen mit einer transparenten Orthografie, da die orthografische Komplexität höhere Anforderungen an die Einsicht in die lautsprachliche Struktur einer Sprache stellt (2015, S. 46 f). Die Ursache für diese Diskrepanz kann jedoch nicht allein in der moderaten Transparenz der deutschen Orthografie und dem mutmaßlich damit korrespondierenden leicht geringeren Einfluss der vorschulischen phonologischen Bewusstheit auf den frühen Schriftspracherwerb liegen. Eine weitere mögliche Erklärung ist die Gestaltung des Erstleseunterrichts. In den deutschsprachigen Ländern sind phonetische bzw. synthetische Methoden verbreitet, die auf einzelne Laute fokussieren und Lesen durch aufeinander aufbauende Schritte – Lautgewinnung, Lautverschmelzung und Zusammenfassendes Lesen – vermitteln. Diese Methode wird durch die hohe Konsistenz der Graphem-Phonem-Korrespondenzen ermöglicht. Damit stellt diese Unterrichtsmethode, die durch die Einführung der Buchstaben mit ihren Lauten und viele Übungen zur Lautanalyse und -synthese charakterisiert ist, eine systematische Förderung der phonologischen Bewusstheit dar (vgl. Einsiedler, Frank, Kirschhock, Martschinke & Treinies, 2002). Für den deutschsprachigen Forschungskontext bedeutet dies, dass die in den Evaluationsstudien untersuchten Kontrollgruppen im schulischen Kontext ebenfalls eine phonologische Förderung erhalten. In der englischen Sprache sind rein phonetische Methoden aufgrund der inkonsistenten Graphem-Phonem-Korrespondenzen dagegen nur mit Einschränkungen möglich. Daher wird im Schriftsprachunterricht häufig mit Anlaut- und Reimanalogien («could», «should», «would») und Ableitungen vom Wortstamm gearbeitet (Goswami, 1988; Goswami, Gombert & de Barrera, 1998). Im Vergleich mit den internationalen Studien könnte also der in Deutschland verbreitete synthetische Erstleseunterricht die in den entsprechenden Studien gefundenen Effekte verringern. Eine systematische Förderung der phonologischen Bewusstheit der Kontrollgruppen kann in Deutschland auch für das letzte Jahr vor der Einschulung nicht mehr ausgeschlossen werden. Aufgrund der vergleichsweise schwachen Leseleistungen der deutschen Jugendlichen in der ersten PISA-Studie wurde der Bildungsauftrag im Ele© 2016 Hogrefe
12
mentarbereich deutlich gestärkt (Stamm & Edelmann, 2013). Nach der Forderung der Kultusministerkonferenz, «Maßnahmen zur Verbesserung der Sprachkompetenz bereits im vorschulischen Bereich» zu implementieren (Kultusministerkonferenz [KMK], 2001), wurden in allen Bundesländern Bildungs- oder Orientierungspläne für den Elementarbereich eingeführt und zunehmend Konzepte zur kompensatorischen und universellen Sprachförderung und Sprachbildung umgesetzt. Zu einem großen Teil enthalten diese Konzepte phonologische Übungseinheiten (Lisker, 2011). Dies könnte dazu geführt haben, dass die Effekte aus Wirksamkeitsüberprüfungen von phonologischen Fördermaßnahmen seit der Einführung dieser Bildungsreformen in Deutschland abgenommen haben.
Potenzielle Moderatoren der Wirksamkeit Die Wirksamkeit einer phonologischen Förderung dürfte daneben auch durch Merkmale der Förderung selbst beeinflusst werden: Zeitpunkt der Förderung: Phonologische Trainingsprogramme werden meist im letzten Kitajahr oder im ersten Schuljahr eingesetzt. Nach Ziegler und Goswami (2005) entwickeln sich die Wahrnehmung von Silben in Wörtern im Alter von drei bis vier Jahren und das Erkennen von Anlaut und Reim (onset und rime) zwischen dem vierten und fünften Lebensjahr bei normaler kindlicher Entwicklung. Die phonologische Bewusstheit im engeren Sinne bildet sich dagegen erst mit Beginn des Schriftspracherwerbs als Folge der alphabetischen Literalisierung heraus. Der Kontakt mit Buchstaben im Unterricht beschleunigt die Entwicklung der phonologischen Bewusstheit beachtlich, was besonders auf Sprachen mit einer transparenten Orthografie zutrifft (Anthony & Francis, 2005). Da deutschsprachige Kinder im Verlauf des ersten Schuljahres rasante Zuwächse in der phonologischen Bewusstheit im engeren Sinne aufweisen, sind am Ende der ersten Klasse bei entsprechenden Testverfahren bereits Deckeneffekte zu verzeichnen (Mann & Wimmer, 2002). Aufgrund der schnellen Lernfortschritte nach dem Einstieg in die Literalisierung ist zu erwarten, dass eine phonologische Förderung während der Kita-Zeit größere Effekte auf die Entwicklung der phonologischen Bewusstheit und damit auch auf den Schriftspracherwerb hat als eine Förderung während der Schulzeit. Dies steht in Einklang mit Befunden, die darauf hindeuten, dass der Einfluss der phonologischen Bewusstheit auf das Lesen vor dem eigentlichen Leseerwerb größer ist als zu einem späteren Zeitpunkt (de Jong & van der Leij, 2003; Landerl & Wimmer, 2000; Ziegler et al., 2010). Die Metaanalyse von Fischer und Pfost (2015) berichtet hinsicht© 2016 Hogrefe
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
lich der kurzfristigen Effekte auf die phonologische Bewusstheit eine signifikant größere Wirksamkeit bei vorschulisch durchgeführten Fördermaßnahmen im Vergleich zu Interventionen nach dem Schuleintritt (vor Schuleintritt: d = 0.51, erste Klasse: d = 0.08, zweite Klasse: d = –0.20). Für den Schriftspracherwerb ließen sich dagegen keine statistisch bedeutsamen Unterschiede in den Effekten von Fördermaßnahmen vor und nach der Einschulung feststellen (kurzfristige Effekte: vor Schuleintritt: d = 0.27, erste Klasse: d = 0.11, zweite Klasse: d = 0.23; langfristige Effekte: vor Schuleintritt: d = 0.13, erste Klasse: d = 0.15). Zielgruppe der Förderung. Infolge des PISA-Schocks forderten Expertinnen und Experten der Bildungsforschung, Schulpraxis und Bildungsadministration die Implementation von Maßnahmen zur wirksamen Förderung bildungsbenachteiligter Kinder, insbesondere für Kinder und Jugendliche mit Zuwanderungshintergrund (KMK, 2001). Die Sprachförderung in Deutschland konzentrierte sich in der Folgezeit entsprechend auf die Frage, inwieweit sprachliche Förderprogramme auch bei Kindern mit geringen Ausgangskompetenzen und bei Kindern nicht-deutscher Herkunft wirksam sind. Hinsichtlich der Effekte einer phonologischen Förderung bei so genannten Risikokindern, also Kindern mit einem Risiko zur Entwicklung von Problemen beim Schriftspracherwerb aufgrund unzureichender Sprachkompetenzen, ergaben die internationalen Metaanalysen inkonsistente Befunde. Die Analysen von Bus und van Ijzendoorn (1999) belegten, dass bezüglich der phonologischen Bewusstheit Risikokinder deutlich weniger von einem phonologischen Förderprogramm profitieren als Nicht-Risikokinder (d = 0.54 vs. d = 1.16), hinsichtlich der späteren Lesekompetenz ergaben sich jedoch keine signifikanten differenziellen Förderunterschiede (d = 0.60 vs. d = 0.40). Ehri et al. (2001) identifizierten vergleichbare Effektstärken in Bezug auf die phonologische Bewusstheit (d = 0.95 vs. d = 0.93) und das Rechtschreiben (d = 0.76 vs. d = 0.88), hinsichtlich der Lesekompetenz war die Förderung bei den Risikokindern aber signifikant wirksamer (d = 0.86 vs. d = 0.47). Auch in deutschen Studien waren die Befunde inkonsistent: Einige Studien deuten darauf hin, dass Kinder mit schwachen Ausgangskompetenzen stärker von einer phonologischen Förderung profitieren (z. B. Einsiedler et al., 2002; Jäger et al., 2012; Schneider, Roth, Küspert & Ennemoser, 1998), wohingegen der Metaanalyse von Fischer und Pfost (2015) zufolge die Effekte auf die phonologische Bewusstheit sowie die langfristigen Effekte auf den Schriftspracherwerb bei Risikokindern signifikant geringer als bei unausgelesenen Stichproben waren (z. B. für den Schriftspracherwerb: Risikostichprobe d = –0.11, unausgelesene Stichprobe d = 0.19).
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
Hinsichtlich der Herkunft der Kinder deuten die wenigen bislang vorliegenden Studien darauf hin, dass eine phonologische Förderung gleichermaßen bei Kindern mit und ohne Zuwanderungshintergrund wirkt (Pröscholdt et al., 2013; Weber, Marx & Schneider, 2007) oder sogar etwas wirksamer bei den Kindern nicht-deutscher Herkunft ist (Blatter et al., 2013). Inhalte der Förderung: Gemäß der «phonological linkage»-Hypothese (Hatcher, Hulme & Ellis, 1994) sind mit der Kombination aus einer phonologischen Förderung und einem Training der Graphem-Phonem-Korrespondenzen (GPK) größere Effekte auf die Lesekompetenz verbunden als mit einer rein phonologischen Förderung, was in den internationalen Metaanalysen bestätigt werden konnte (Bus & van Ijzendoorn, 1999; Ehri et al., 2001). Auch in Deutschland ist die Kombination einer phonologischen Förderung mit einem Buchstaben-Laut-Training sehr populär. Sehr häufig sind GPK-Übungen Bestandteil der phonologischen Förderprogramme oder sie werden in Form eigener Programme mit der phonologischen Förderung kombiniert (z. B. «Hören, lauschen, lernen 2» von Plume & Schneider, 2004). Teilweise beanspruchen die Programme, darüber hinaus noch weitere Kompetenzen zu fördern, wie beispielsweise dialogische Fähigkeiten oder Lesestrategien. Während Studien der Würzburger Arbeitsgruppe darauf hindeuten, dass die Kombination mit einem Buchstaben-Laut-Training im direkten Vergleich größere und nachhaltigere Effekte insbesondere auf die Rechtschreibleistungen ausübt als eine rein phonologische Förderung (Roth & Schneider, 2001, 2002; Schneider, Roth & Ennemoser, 2000), berichten andere Studien insgesamt geringe Effekte für ein kombiniertes Training (Blaser, Preuss, Groner, Groner & Felder, 2007; Hatz & Sachse, 2010). Folglich ist bislang ungeklärt, ob im Sinne der «phonological linkage»-Hypothese durch eine Kombination aus phonologischen und weiteren Förderinhalten inkrementelle Effekte im Vergleich zur rein phonologischen Förderung verbunden sind. Implementationsqualität: Im deutschsprachigen Raum wurde bereits sehr früh nachgewiesen, dass die Implementationsqualität einer phonologischen Förderung die Transfereffekte auf den Schriftspracherwerb entscheidend beeinflusst (Schneider et al., 1994). Demnach konnten nur für die Fördergruppen signifikante Effekte auf den Schriftspracherwerb ermittelt werden, in denen erstens das Training konsequent und vollständig durchgeführt wurde und zweitens die Förderkraft motiviert war, die Förderung umzusetzen (Schneider, Küspert, Roth, Visé & Marx, 1997; Schneider et al., 1994). Obwohl die Bedeutung der Implementationsqualität für die Wirksamkeit einer phonologischen Förderung außer Frage steht, werden in den meisten Evaluationsstudien keine Angaben zur Implementationsqualität gemacht. Dies dürfte unter andeZeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
13
rem daran liegen, dass die Implementationsqualität allgemein schwer zu quantifizieren ist.
Fragestellungen Im Rahmen der vorliegenden Metaanalyse sollen die Effekte von Fördermaßnahmen der phonologischen Bewusstheit in der deutschen Sprache auf die Entwicklung der phonologischen Bewusstheit sowie auf frühe Kompetenzen im Lesen und Rechtschreiben untersucht werden. Geprüft wird, ob die Befunde der internationalen Metaanalysen auf das deutsche Schriftsystem generalisiert werden können. Da die für das Schreiben relevanten PhonemGraphem-Korrespondenzen in der deutschen Sprache deutlich weniger konsistent sind als die für das Lesen bedeutsamen Graphem-Phonem-Korrespondenzen, werden für die phonologische Förderung in der deutschen Sprache stärkere Effekte auf die frühen Rechtschreibfähigkeiten angenommen als auf die frühen Lesefertigkeiten. Da weiterhin für die Fördermaßnahmen in der Schule angenommen werden kann, dass die Vergleichsgruppen im Rahmen des Schriftsprachunterrichts ebenfalls eine systematische Förderung der phonologischen Bewusstheit erhalten (vgl. Einsiedler et al., 2002), werden im Gegensatz zur Metaanalyse von Fischer und Pfost (2015) die Effekte für kitabasierte und schulbasierte Interventionen in der vorliegenden Metaanalyse getrennt betrachtet, um so die Überlagerung potenziell unterschiedlicher Effektstärken zu vermeiden. Mit Hilfe von Moderatorenanalysen soll weiterhin untersucht werden, ob a) Merkmale der Stichprobe, b) Merkmale der Förderung, c) Merkmale der Implementationsqualität und d) Merkmale der Untersuchung einen Einfluss auf die mittlere Effektstärke haben. Folgende Fragestellungen werden so unter anderem überprüft: Profitieren Kinder mit schwachen Ausgangskompetenzen mehr oder weniger von einer phonologischen Förderung als Kinder mit unauffälligen Ausgangskompetenzen? Sind mit der Kombination aus phonologischen Fördereinheiten und einem Training der Graphem-Phonem-Korrespondenzen oder weiteren Förderinhalten größere Effekte verbunden als mit einer rein phonologischen Förderung? Lassen sich Merkmale der Implementationsqualität identifizieren, die die Wirksamkeit der Förderung bedeutsam beeinflussen? Insbesondere die Ergebnisse zur Implementationsqualität versprechen einen Informationsgewinn, da diese in der Metaanalyse von Fischer und Pfost (2015) lediglich anhand der Förderkraft untersucht worden ist. In Abgrenzung zur bereits vorliegenden deutschsprachigen Metaanalyse erscheinen darüber hinaus separate Moderatorenanalysen für das Lesen und Schreiben notwendig, da © 2016 Hogrefe
14
zu vermuten ist, dass sich die Unterschiede in der Konsistenz der Graphem-Phonem- bzw. Phonem-Graphem-Korrespondenzen auch differenziell auf die Bedeutung von Moderatoren für beide Kompetenzen auswirken. Darüber hinaus wird eine metaanalytische Untersuchung der Effekte einer phonologischen Förderung in der deutschen Sprache sowie des Einflusses potentieller Moderatoren anhand einer größeren Stichprobe zu präziseren Ergebnissen beitragen.
Methoden Datenbasis Für die Aufnahme in die Metaanalyse mussten folgende Inklusionskriterien erfüllt sein: (1) Trainingsstudie zur Förderung der phonologischen Bewusstheit in der deutschen Sprache; bei kombinierten Trainingsprogrammen fokussiert mindestens die Hälfte der Fördereinheiten auf die phonologische Bewusstheit, (2) Effekte auf die phonologische Bewusstheit und/oder Lese-/Rechtschreibfähigkeiten wurden mit Hilfe standardisierter Leistungstests untersucht, (3) Vorhandensein einer Vergleichsgruppe, die keine systematische Sprachförderung erhalten hat und prinzipiell vergleichbare Kompetenzen zur Trainingsgruppe aufweist (Trainings-Kontrollgruppendesign), (4) mindestens zwei Messzeitpunkte (Prä-Post-Design) und (5) Angabe von Effektstärkemaßen oder von Statistiken, die die Berechnung von Effektstärken erlauben. Zur Identifikation aller relevanten Studien wurden mehrere Suchstrategien verfolgt. Zunächst wurde eine vollständige Literaturrecherche in den Datenbanken PsycInfo/Psyndex, ERIC und ISI Web of Science/Web of Knowledge durchgeführt. Des Weiteren wurden die Suchmaschinen Google und Google Scholar sowie einschlägige deutsch- und englischsprachige Fachzeitschriften (Zeitschrift für Pädagogische Psychologie, Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, Diagnostica, Kindheit und Entwicklung, Zeitschrift für Psychologie, Psychologische Rundschau, Zeitschrift für Differentielle und Diagnostische Psychologie/Journal of Individual Differences, Journal of Learning Disabilities und Journal of Educational Psychology) in die Suche einbezogen. Zur Anwendung kamen folgende Kombinationen von Suchbegriffen: phonolog* und bewusstheit* sowie prävent*/intervent*/evaluat* (englisch: phonolog*/phonem* und awareness* sowie prevent*/intervent*/evaluat*). Zusätzlich wurden die Literaturverzeichnisse aller identifizierten Arbeiten nach weiteren relevanten Studien überprüft (rolling snowball method). © 2016 Hogrefe
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
Um einem möglichen Publication Bias vorzubeugen, wurden Kolleginnen und Kollegen über die entsprechenden Fachgruppenverteiler der Deutschen Gesellschaft für Psychologie um ihre Mithilfe und die Zusendung bis dato unveröffentlichter Forschungsergebnisse gebeten. Auf diese Weise konnten drei unveröffentlichte Diplomarbeiten der Jenaer Arbeitsgruppe um Peter Noack (Hennig, 2005; Polotzek, 2007; Stahn, 2006) dem Pool an Studien hinzugefügt werden. Des Weiteren wurden vier Autorinnen und Autoren von Studien mit unvollständiger Ergebnisdarstellung um die Übermittlung der betreffenden Statistiken gebeten. Leider konnten die fehlenden Angaben in drei von vier Fällen wegen Nonresponsivität der Autoren bzw. eines fehlenden Datensatzes nicht ergänzt werden (vgl. Wicherts, Borsboom, Kats & Molenaar, 2006). Insgesamt 27 Studien aus 31 Publikationen erfüllten die Inklusionskriterien; sie bilden die Datengrundlage für die nachfolgend berichteten Analysen (vgl. Tabelle 1). 22 Studien untersuchen Effekte einer kitabasierten und fünf Studien einer schulbasierten Förderung. Teilweise werden in den Publikationen Gruppenvergleiche – zum Beispiel zwischen Kindern mit deutscher und nicht-deutscher Familiensprache – gezogen. Insgesamt liegen 34 Gruppenvergleiche zur Förderung in der Kita und neun Gruppenvergleiche zur Förderung in der Schule vor, die die Basis der Moderatorenanalysen bilden. Eine vollständige Übersicht über die Merkmale der Gruppenvergleiche wird im online supplement (s. Tabelle in Elektronische Supplement 1) bereitgestellt. Die Publikationen Blatter et al. (2013), Jäger et al. (2012) und Schöppe et al. (2013) entstammen zwar dem gleichen Forschungsprojekt; aufgrund der unterschiedlichen Operationalisierung des Sprachhintergrunds bei der Gruppenbildung (Erstsprache der Eltern, Erstsprache des Kindes) wurden diese Publikationen jedoch als Einzelstudien behandelt. Neben dem Würzburger Trainingsprogramm «Hören, lauschen, lernen 1» (Küspert & Schneider, 2006) wurden folgende Programme zur Förderung der phonologischen Bewusstheit verwendet: die «Lobo vom Globo»-Programme für den Einsatz in der Kita, in der Schule und zuhause (Fröhlich, Metz & Petermann, 2010; Metz, Fröhlich & Petermann, 2010; Petermann, Fröhlich, Metz & Koglin, 2010), «Lass uns Lesen» (Rückert, Kunze & Schulte-Körne, 2010), «Leichter lesen und schreiben lernen mit der Hexe Susi» (Forster & Martschinke, 2001), die Heifer-Methode (Heifer, 2004; Röhr-Sendlmeier & Rauch-Redeker, 2009), das «Münsteraner Trainingsprogramm» (Mannhaupt, 2006), eine Schweizer Adaption von «Hören, lauschen, lernen» (Küspert, Plume & Schneider, 2005), eine Förderung nach den Leitideen des Modellversuchs der Bund-LänderKommission «Elementare Schriftkultur als Prävention von Lese-/Rechtschreibschwierigkeiten und Analphabetismus bei Grundschulkindern» (vgl. Hüttis-Graf & Widmann, Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
15
Tabelle 1. Effektstärken der integrierten Studien Förderung in der Kita
pB (kurz)
pB (mittel) g
g
v
DF (lang)
LV (kurz bis lang)
RS (kurz bis mittel) g
g
v
Blatter et al., 2013
0.69
0.03
Blaser, 2002; Blaser et al., 2007
0.35
0.09
Degé & Schwarzer, 2011
0.84
0.16
Fröhlich et al., 2009; Rißling et al., 2011
0.62
0.00
Fröhlich et al., 2011
0.59
0.05
Hartmann, 2002
0.90
0.10
–0.18
0.10
Henning, 2005; Polotzek, 2007
0.28
0.05
0.16
0.03
Jäger et al., 2012
0.68
0.02
0.26
0.01
Küspert, 1998
0.93
0.01
0.71
0.03
Marx et al., 2005a; Marx et al., 2005b
0.27
0.03
0.11
0.06
May & Okwume, 1999
0.18
0.03
0.48
0.04
–0.30
0.16
Noack & Brändel, 2007
0.18
0.15
Petermann et al., 2010
0.37
0.03
Röhr-Sendlmeier & Krag, 2007; Röhr-Sendlmeier & Renger, 2008
0.60
0.24
0.73
0.02
0.77
0.04
Rothe, 2007
0.97
0.04
0.75
0.05
–0.26
0.02
–0.17
0.03
Rückert et al., 2010
0.40
0.02
Schneider et al., 1997, Studie 1
0.65
0.01
0.38
0.01
0.26
0.01
0.29
0.02
0.15
v
DF (kurz bis mittel)
0.01
1.28
0.06
Schöppe et al., 2013
0.80
0.09
Stahn, 2006
–0.17
pB (kurz)
1.39
0.06
0.15
0.04
pB (mittel)
g
v
Einsiedler et al., 2002
0.36
0.01
Hatz & Sachse, 2010
0.23
0.02
–0.08
–0.55
0.14
–0.11
0.66
0.01
Mannhaupt et al., 1999 Metz et al., 2011
g
v
0.34
0.05
0.24
0.04
–0.21
0.03
0.18
0.45
0.46
0.05
g
Wimmer & Hartl, 1991
v
–0.22
0.01
0.26
0.01
0.26
0.05
0.26
0.05
DF (kurz bis mittel) g
v
0.05
0.02
0.05
0.04
0.03
0.04
–0.09
0.04
0.06
DF (lang) g
–0.15
v
0.20
v
0.10
0.50
0.03
–0.12
0.10
0.52 0.04
0.26 0.01
–0.18
0.02
–0.10
0.06
0.39
0.01 –0.05 0.03
0.39 0.08
–0.11 0.02 0.54 0.01
0.55
0.44
0.02
0.85 0.05
0.03
LV (kurz bis lang)
RS (kurz bis mittel)
g
v
g
v
0.11
0.02
–0.08
0.02
0.20
0.04
–0.08
0.04
0.03
0.69 –0.04
g
0.29 0.07
0.03
0.01 –0.26
v
–0.44 0.04
0.10
Treutlein et al., 2008 Förderung in der Schule
v
0.67
Schneider et al., 1997, Studie 2 Schneider et al., 1998
g
RS (lang)
0.02
RS (lang) g
v
–0.08 0.03
0.37 0.02 0.07
0.20
Anmerkungen. pB = phonologische Bewusstheit, DF = Dekodierfähigkeit, LV = Leseverständnis, RS = Rechtschreiben, g = Effektstärke (ungewichtet), v = Samplingvarianz. Die Publikationen von Blatter et al. (2013), Jäger et al. (2012) und Schöppe et al. (2013) entstammen dem gleichen Forschungsprojekt.
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
© 2016 Hogrefe
16
1996) sowie die metaphonologische Intervention für Schweizerdeutsch sprechende Kindergartenkinder mit einer Sprachentwicklungsstörung von Hartmann (2002).
Abhängige Variablen Mögliche Effekte der Förderung der phonologischen Bewusstheit werden einerseits im Hinblick auf die Entwicklung der phonologischen Bewusstheit und andererseits auf den Erwerb erster schriftsprachlicher Kompetenzen untersucht. Bei der phonologischen Bewusstheit wurde neben einer übergeordneten Einschätzung (phonologische Bewusstheit insgesamt) zwischen der phonologischen Bewusstheit im weiteren und der im engeren Sinne unterschieden. Entsprechend der Klassifikation von Skowronek und Marx (1989) wurden zur phonologischen Bewusstheit im weiteren Sinne alle Skalen gezählt, die Leistungen zur Wahrnehmung größerer sprachlicher Einheiten (Wörter, Silben, Reime) erfassen, wie zum Beispiel Reimen oder Silben segmentieren. Skalen, die auf die Wahrnehmung und Manipulation einzelner Laute fokussieren, wurden dagegen der phonologischen Bewusstheit im engeren Sinne zugeordnet (z. B. Phonemsynthese, -analyse, Alliteration, Anlautdehnung). Bei der Überprüfung der Effekte auf erste Lesekompetenzen wurden die Dekodierfähigkeit sowie das Leseverständnis untersucht. Indikatoren der Schreibkompetenz waren Graphemtreffer sowie die Anzahl korrekter Wörter in Rechtschreibtests und Pseudowörterdiktaten. In den meisten hier einbezogenen Studien wurden die Effekte der phonologischen Förderung zu mehr als zwei Messzeitpunkten untersucht. Für die phonologische Bewusstheit als abhängige Variable wurde in der vorliegenden Metaanalyse zwischen kurz- und mittelfristigen Effekten unterschieden. In die Analyse der kurzfristigen Effekte wurden alle Effektstärken integriert, die bis zu vier Monate nach Ende des Trainings ermittelt wurden. Mittelfristige Effekte beziehen sich auf Effektstärken, die in einem Abstand von fünf bis zwölf Monaten nach dem Training untersucht wurden. Bei den Effekten auf die Dekodierfähigkeit und die Rechtschreibkompetenz wurde zwischen kurz- bis mittelfristigen Effekten (ein bis einschließlich zwölf Monate nach Ende des Trainings) und langfristigen Effekten (mehr als zwölf Monate nach Ende des Trainings) unterschieden. Da nur sehr wenige Studien Effekte auf das Leseverständnis untersucht haben, wurde hier nicht zwischen kurz-, mittel- und langfristigen Effekten unterschieden.
Moderatoren Folgende Moderatorvariablen wurden in der Metaanalyse untersucht: Merkmale der Stichprobe (Ausgangskompe© 2016 Hogrefe
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
tenz der Kinder, Sprachhintergrund der Kinder), Merkmale der Förderung (Inhalte der Förderung, Größe der Fördergruppen), Merkmale der Implementationsqualität (Schulung der Förderkraft, Dauer der Förderung, Forschergruppe) sowie Merkmale der Untersuchung (Zeitpunkt der Untersuchung, Vergleichbarkeit der Ausgangskompetenzen der Untersuchungsgruppen). Ausgangskompetenz der Kinder: Bei einigen Studien bestand die Stichprobe aus so genannten Risikokindern. Dazu gehören Kinder mit einer schwach ausgeprägten phonologischen Bewusstheit (z. B. klassifiziert anhand des Bielefelder Screenings zur Früherkennung von LeseRechtschreibschwierigkeiten von Jansen, Mannhaupt, Marx & Skowronek, 2002), Kinder mit Defiziten in der Grammatik, Kinder mit einer Sprachentwicklungsstörung oder einer diagnostizierten Lese-Rechtschreibstörung. Auch der Sprachhintergrund der Kinder wurde in den Studien anhand unterschiedlicher Indikatoren operationalisiert (z. B. Geburtsland der Eltern, überwiegend zuhause gesprochene Sprache). Die Studien wurden hinsichtlich ihrer Förderinhalte in drei Gruppen eingeteilt: (1) rein phonologische Förderinhalte, (2) eine phonologische Förderung und ein Training der Graphem-Phonem-Korrespondenzen und (3) eine Kombination aus phonologischen Förderinhalten, Graphem-Phonem-Training sowie weiteren Förderinhalten (z. B. basale Lesehandlung, dialogische Kompetenz). Bei der Größe der Fördergruppen wurde unterschieden zwischen (1) Einzelförderung, (2) Kleingruppen mit bis zu zwölf Kindern und (3) größeren Fördergruppen mit mehr als zwölf Kindern. Die Implementationsqualität wurde mit Hilfe von drei Indikatoren abgebildet. Bei der Schulung der Förderkräfte wurde zwischen folgenden Ausprägungen unterschieden: keine Schulung (hierzu wurden auch Studien gezählt, die die Schulung gar nicht erwähnen), eine kurze Schulung (maximal zwei Stunden Fortbildung oder maximal eine Supervision) und eine längere Schulung (mindestens zwei Stunden oder mindestens eine Supervision). Die Dauer der Förderung wurde als Produkt aus der Trainingsdauer in Wochen, der Anzahl von Einheiten pro Woche und der Dauer einer Einheit in Minuten ermittelt. Weiterhin wurde ein dichotomer Moderator Forschergruppe gebildet, der zwischen Studien der Würzburger Forschergruppe und Studien anderer Wissenschaftler differenziert. Der Grund für diese Zweiteilung ist, dass die Würzburger Gruppe bereits früh die Bedeutung der Implementationsqualität (Schulung und Unterstützung der Förderkräfte, konsequentes Training) nachgewiesen (vgl. Schneider et al., 1994) und in weiteren Interventionsstudien explizit auf eine hohe Qualität der Förderung geachtet hat. Sollten sich höhere Effekte in den Würzburger Studien feststellen lassen, könnte dies als Hinweis auf die Bedeutung der ImZeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
plementationsqualität für die Effekte einer phonologischen Förderung gewertet werden. Weitere Aspekte zur Durchführungsqualität der Fördereinheiten konnten aufgrund fehlender Informationen in den Primärstudien nicht abgebildet werden. Der Zeitpunkt der Untersuchung wurde einbezogen, um zu prüfen, ob die Effekte einer phonologischen Förderung seit der Implementation der Bildungs- und Orientierungspläne im Elementarbereich aufgrund eines verbesserten Bildungs- und Betreuungsangebots in den Kindertagesstätten abnehmen. Als «Wendepunkt» wurde das Jahr 2001 festgesetzt, da die KMK nach der Veröffentlichung der ersten PISA-Befunde im Dezember 2001 explizit «Maßnahmen zur Verbesserung der Sprachkompetenz bereits im vorschulischen Bereich» forderte (KMK, 2001). Die Vergleichbarkeit der Ausgangskompetenzen der Untersuchungsgruppen wurde für alle Studien mittels t-Test der Prätest-Gruppenleistungen geprüft. Zwei Rater stimmten in 89 % aller Fälle in den Kodierungen der relevanten Merkmale überein. Die Kodiererübereinstimmung reichte von Cohens κ = 1.00 (Jahr der Untersuchung) bis κ = 0.64 (Inhalte der Förderung). Abweichende Kodierungen wurden kontrolliert und konsensual festgelegt. In einigen Fällen konnten Moderatoren aufgrund fehlender Darstellungen in den Studien nicht kodiert werden. Diese Fälle wurden von den betreffenden Analysen ausgeschlossen (listwise-deletion).
Metaanalytisches Vorgehen Die Effekte der phonologischen Förderprogramme wurden für jede Studie anhand von Leistungsunterschieden zwischen Förder- und Kontrollgruppe zum Posttest beziehungsweise zu den Follow-up-Untersuchungen mittels standardisierter Mittelwertsdifferenz (Hedges g) berechnet. Hedges g ist eine Variante von Cohens d, die auf kleinen Stichproben resultierende Verzerrungen korrigiert (Hedges & Olkin, 1985), aber wie d interpretiert werden kann. Die Overall-Effekte wurden auf Basis der 27 Studien (vgl. Tabelle 1) und getrennt für die Interventionen in der Kita und in der Schule mit Random-Effekt-Modellen ermittelt. Durch diese Schätzungen der Effektstärken aus der Population aller möglichen Studien können Unterschiede in den Methoden und Stichprobenmerkmalen der Primärstudien berücksichtigt werden (Borenstein, Hedges, Higgins & Rothstein, 2009; Hedges & Vevea, 1998; Viechtbauer, 2010). Die Schätzung der Varianz der «wahren» Effekte in der Population, τ2, wurde mit der Restricted Maximum Likelihood-Methode (REML) vorgenommen, da die Schätzung nahezu unverzerrt und effizient ist (Viechtbauer, 2005). Vor der Integration der einzelnen Effektstärken in das Random-Effekt-Modell wurden diese Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
17
mit der inversen Varianz gewichtet. In die Berechnung der inversen Varianz (wi) gehen sowohl die Populationsvarianz (τ2, between-study-variance) als auch die sampling variance (vi, within-study variance) ein (wi = 1/(τ2+vi); vgl. Hedges & Vevea, 1998). Diese Form der Gewichtung ist in RandomEffekt-Modellen mit standardisierter Mittelwertsdifferenz als Effektgrößenindikator die Methode der Wahl, da sie in Simulationsstudien der reinen Gewichtung mit der Stichprobengröße (vgl. Hunter & Schmidt, 1990, 2004) hinsichtlich Akkuratheit und Effizienz überlegen ist (Brannick, Yang & Cafri, 2011; Marín-Martínez & Sánchez-Meca, 2010). Die Homogenität der Effekte wurde mit Cochrans QTest (Cochran, 1954) und I2, das insbesondere bei geringen Stichprobengrößen dem Q-Test vorzuziehen ist (Higgins, Thompson, Deeks & Altman, 2003), geprüft, die beide die Variabilität der beobachteten Effektgrößen zur Sampling-Variabilität in Beziehung setzen. Higgins und Green (2008) bieten zur Interpretation von I2 folgende Richtlinien an: Ein I2 zwischen 0–40 % verweist auf keine bedeutende Heterogenität, zwischen 30–60 % auf moderate, zwischen 50–90 % auf substantielle und zwischen 75–100 % auf beträchtliche Heterogenität. Zusätzlich wurden Moderatorenanalysen mit Mixed-Effekt-Modellen berechnet, um die Heterogenität in den Ergebnissen der Primärstudien auf den Einfluss von Moderatorvariablen zurückzuführen. Aufgrund der geringen Anzahl an Evaluationen von schulbasierten Interventionen wurden die Moderatorenanalysen nur für die kitabasierten Studien durchgeführt. Die Analysen wurden im Gegensatz zur Metaanalyse von Fischer und Pfost (2015) für die Indikatoren der Lese- und Schreibkompetenz getrennt durchgeführt, wodurch differenzierte Aussagen zu Determinanten der Transfereffekte auf die Dekodierfähigkeit, das Leseverständnis und die Rechtschreibkompetenz möglich sind. Die Signifikanz der Moderatoren wurde mit einem Omnibus-Test (QM) geprüft. Der QE-Test untersucht die Homogenität der Residuen, also ob die Variabilität in den beobachteten Effektstärken, die nicht durch die Moderatoren abgedeckt wird, größer ist, als man dies auf Basis der Sampling-Varianz vermuten würde (Viechtbauer, 2014). Ein signifikanter QE-Wert deutet darauf hin, dass weitere, nicht berücksichtigte Moderatoren einen Einfluss auf die Effektstärken haben. Aufgrund der teilweise geringen Anzahl an Primärstudien wird neben der statistischen Signifikanz auch die Höhe der aggregierten Effektstärken bei der Interpretation berücksichtigt. Damit aus jeder Studie jeweils nur eine Effektstärke in die Analysen einbezogen werden konnte, wurden in folgenden Fällen einzelne Effektstärken vor der eigentlichen Metaanalyse metaanalytisch aggregiert: 1) Die Ergebnisse wurden für mehrere Untertests einzeln berichtet (z. B. Leistungen im Pseudowörterdiktat und im Rechtschreib© 2016 Hogrefe
18
test) und mussten auf Konstruktebene (z. B. Rechtschreibkompetenz) zusammengefasst werden. 2) Für die Untersuchung der Effektdistanzen (z. B. kurz- bis mittelfristige Effekte) lagen im entsprechenden Zeitraum (ein bis zwölf Monate nach Ende des Trainings) mehrere Messzeitpunkte vor, so dass deren Ergebnisse aggregiert werden mussten. 3) Die Primärstudien enthielten mehrere Gruppenvergleiche (z. B. Kinder mit deutscher und nicht-deutscher Familiensprache) und eine entsprechend getrennte Ergebnisdarstellung. Für die Kalkulation der Overall-Effekte wurden die Ergebnisse über alle vorliegenden Vergleiche aggregiert. Bei den Moderatorenanalysen wurden dagegen die Ergebnisse aus den verschiedenen Vergleichen einer Studie separat aufgenommen, sofern die zugrundeliegenden Stichproben disjunkt waren (vgl. Darstellung der Vergleiche in Elektronische Supplemente 1). Wegen dieses Vorgehens war die Anzahl der in den Overall-Analysen berücksichtigten Studien teilweise geringer als die Anzahl der Vergleiche, die in die Moderatorenanalysen eingingen. Alle Analysen wurden mit dem R Paket Metafor durchgeführt (Viechtbauer, 2014).
Ergebnisse Publication Bias Zunächst wurden die Daten auf das Vorhandensein eines Publication Bias geprüft. Dabei handelt es sich um eine systematische Selektivität in der Auswahl von Primärstudien, die z. B. dadurch zustande kommt, dass in Fachzeitschriften bevorzugt positive und statistisch bedeutsame Ergebnisse publiziert werden. Um das Risiko für eine solche Verzerrung zu minimieren, wurden auch unveröffentlichte Arbeiten in die Untersuchung einbezogen (siehe Methoden, Datenbasis). Auf analytischer Seite wurden die Daten mit so genannten Funnel Plots, die die einzelnen Effektstärken (x-Achse) und das dazugehörige Gewicht (inverse Varianz; y-Achse) grafisch zueinander in Beziehung setzen (vgl. Abbildung 1), auf das Vorliegen eines Publication Bias geprüft. Wenn Studien mit geringer Präzision oder geringen Effektstärken unterrepräsentiert wären, wäre die Verteilung der Studien im Koordinatensystem asymmetrisch (vgl. Fiebig, Rüdebusch & Urban, 2012). Für die Untersuchung eines Publication Bias sollten mindestens zehn Primärstudien in eine Metaanalyse eingehen (Sterne, Gavaghan & Egger, 2000); dieses Kriterium war in der vorlie2
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
genden Studie erfüllt. Für keine der abhängigen Variablen lagen asymmetrische Verteilungen der Studien in den Funnel Plots vor (siehe Abbildung 1 für die Studien der kitabasierten Interventionen). Dies bedeutet, dass in der Auswahl an Primärstudien keine publikationsbedingte Verzerrung nachgewiesen werden konnte.
Effekte auf die phonologische Bewusstheit Der kurzfristige Effekt der kitabasierten Förderung auf die phonologische Bewusstheit ist mit g = 0.60 mittelstark ausgeprägt2 und deutlich höher als der durchschnittliche Effekt der schulbasierten Fördermaßnahmen, der mit g = 0.28 statistisch nicht bedeutsam ist (vgl. Tabelle 2). Für Fördermaßnahmen in der Kita wurden höhere Effekte auf die phonologische Bewusstheit im engeren Sinne als im weiteren Sinne identifiziert (g = 0.65 vs. g = 0.39). Kitabasierte Fördermaßnahmen erzielen mittelfristig ebenfalls signifikante Effekte auf die phonologische Bewusstheit; die Effekthöhe von g = 0.43 entspricht einem kleinen bis moderaten Effekt. Eine phonologische Förderung in der Schule ist mittelfristig dagegen nicht mit positiven Effekten auf die phonologische Bewusstheit verbunden (g = –0.10). Für die kitabasierten Interventionen wurde eine bedeutsame Heterogenität in den Effektstärken der Studien nachgewiesen (kurzfristige Effekte: I2 = 62 %, mittelfristige Effekte: I2 = 82 %). In Moderatorenanalysen wurde deshalb untersucht, ob die Moderatoren einen Teil der Heterogenität in den Effektstärken aufklären können (vgl. Tabelle 3). Die Ergebnisse belegen tendenziell größere Effekte auf die phonologische Bewusstheit bei Fördermaßnahmen in Kleingruppen sowie bei Studien, die bis 2001 oder von der Würzburger Forschergruppe durchgeführt wurden. Hinsichtlich der kurzfristigen Wirksamkeit hatte die Dauer der Förderung einen signifikanten, positiven Einfluss, bei der mittelfristigen Wirksamkeit war dies noch als Tendenz erkennbar. Weiterhin konnten zumindest tendenziell Vorteile einer rein phonologischen Förderung bei den mittelfristigen Effekten auf die phonologische Bewusstheit identifiziert werden.
Effekte auf den Schriftspracherwerb Für die Dekodierfähigkeit wurden keine statistisch bedeutsamen Effekte der phonologischen Fördermaßnahmen identifiziert. Die kitabasierten Interventionen haben
Die Forest plots der Random-Effekt-Modelle zur Darstellung der Effektstärken der Primärstudien sind in der Abbildung in Elektronische Supplemente 2 dargestellt.
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
19
!
Zeitschrift fßr Pädagogische Psychologie (2016), 30(1), 9–33
Abbildung 1. Funnel plots der Random-Effekt-Modelle zur Kontrolle eines Publication Bias (kitabasierte Interventionen). Anmerkungen: Im Koordinatensystem wurden die Effektstärken der Primärstudien (x-Achse) gegen ihre inverse Varianz (y-Achse) abgetragen.
Š 2016 Hogrefe
20
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
Tabelle 2. Mittlere gewichtete Effektstärken Kurzfristige Effekte
Phonologische Bewusstheit im weiteren Sinne
Zeit
k
g
SE
Kita
15
0.39
0.06
3
0.41
16
Schule Phonologische Bewusstheit im engeren Sinne
Kita
Schule Phonologische Bewusstheit
Kita Schule
Mittelfristige Effekte Z
Q
k
g
SE
Z
6.89* 27.63* 48.3
4
0.28
0.19
1.50
0.09
4.30*
0.0
0
0.65
0.09
7.28* 67.43* 82.3
9
0.57
0.12
4.74* 41.61* 83.5
3
0.46
0.14
3.27*
7.03* 69.1
1
–0.08
0.23
19
0.60
0.07
9.20* 39.87* 62.4
12
0.43
0.11
4
0.28
0.19
1.48
2
–0.10
0.15
2.01
I²
15.95* 88.3
Kurz- bis mittelfristige Effekte Dekodierfähigkeit
Rechtschreiben
Kita
5
0.18
0.15
1.18
Schule
4
0.01
0.09
0.16
Kita
8
0.30
0.12
Schule
4
–0.01
0.09
–0.37
Q
I²
7.92* 58.9
0.00
0.0
3.99* 49.48* 82.5 –0.66
0.01
0.0
Langfristige Effekte 8
0.07
0.09
0.70
0.0
1
–0.15
0.17
–0.87
2.46* 23.25* 75.0
9
0.24
0.13
1.88
37.19* 80.3
2
0.16
0.22
0.71
4.20* 76.2
–0.12
15.85* 77.9 0.41
1.56
0.0
19.41* 59.7 0.00
0.0
Kurz- bis langfristige Effekte Leseverständnis
Kita
5
0.18
0.16
1.15
14.21* 69.4
Schule
2
0.39
0.29
1.35
9.49* 89.5
Anmerkungen. k = Anzahl der integrierten Einzeleffekte, g = mittlere gewichtete Gesamteffektstärke, SE = mittlerer gewichteter Standardfehler, Z = g/SE, Q = Testwert des Q-Tests auf Homogenität der Einzeleffekte mit df = k-1, I2 = Index der Heterogenität der Einzeleffekte (in Prozent). * Parameter ist signifikant (p<.05).
im ersten Jahr nach der Förderung mit g = 0.18 einen geringen Einfluss auf die Entwicklung der Dekodierfähigkeit (siehe Tabelle 2). Sowohl für die kurz- bis mittelfristigen als auch für die langfristigen Effekte der kitabasierten Fördermaßnahmen auf die Dekodierfähigkeit wurde eine bedeutsame Heterogenität in den einzelnen Effektstärken festgestellt (I2 = 78 % bzw. 60 %). Die Moderatorenanalysen belegen, dass bei rein phonologischen Fördermaßnahmen, bei einer Förderung in Kleingruppen, bei einer längeren Schulung der Förderkräfte sowie in Untersuchungen der Würzburger Forschungsgruppe höhere kurz- bis mittelfristige Effekte um g = 0.35 erzielt wurden (vgl. Tabelle 4). Bei der Interpretation der Ergebnisse sind jedoch Konfundierungen der Moderatorvariablen untereinander zu beachten (siehe Diskussion). Überraschenderweise hing die Dauer der Förderung bei der Dekodierfähigkeit negativ mit der kurz- bis mittelfristigen Wirksamkeit zusammen. Hinsichtlich der langfristigen Effekte erwies sich der Sprachhintergrund als bedeutsam, wenngleich der relativ hohe Effekt für Kinder nicht-deutscher Herkunft auf lediglich einer Studie beruht. Die Schulung der Förderkräfte erwies sich wiederum als praktisch bedeutsam, da lediglich für Interventionen mit einer längeren Schulung © 2016 Hogrefe
langfristig signifikante Effekte auf die Dekodierfähigkeit identifiziert werden konnten. Die Effekte auf das Leseverständnis waren bei den kitabasierten Interventionen mit g = 0.18 gering und bei den schulbasierten Fördermaßnahmen mit g = 0.39 moderat ausgeprägt (vgl. Tabelle 2). Weiterhin lag mit I2 = 69 % eine bedeutsame Heterogenität in den Effektstärken der Trainingsstudien mit kitabasierter Förderung vor. Die Moderatorenanalysen belegen, dass bei den kitabasierten Fördermaßnahmen nur Interventionen mit einer Kombination aus phonologischen Förderinhalten, einem Buchstaben-Laut-Training und weiteren Inhalten mit signifikanten Effekten auf das Leseverständnis verbunden waren (vgl. Tabelle 5). Darüber hinaus wurden auch nur bedeutsame Effekte bei Studien nachgewiesen, die nicht von der Würzburger Forschergruppe stammen. Für kitabasierte Fördermaßnahmen wurden Effekte auf die Rechtschreibkompetenz von geringer Höhe nachgewiesen. Für die Zeit von bis zu zwölf Monaten nach Trainingsende ist der Effekt mit g = 0.30 statistisch bedeutsam, nicht jedoch die langfristigen Effekte mit g = 0.24 (siehe Tabelle 2). Die Förderung der phonologischen Bewusstheit in der Schule hing nicht mit Effekten auf die Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
21
Tabelle 3. Ergebnisse der Moderatorenanalysen für die Effekte der kitabasierten Fördermaßnahmen auf die phonologische Bewusstheit Kurzfristige Effekte Moderatorenanalyse
k
g
SE
Mittelfristige Effekte Z
QE
QM
k
g
SE
Z
QE
QM
Merkmale der Stichprobe Ausgangskompetenzen mittel bis hoch gering
0.67
andere Sprache
0.45
0.45
56.72*
0.20
58.62*
0.06
50.71*
3.35
44.13*
0.02
53.67*
0.02
0.97
49.59*
0.95
0.65
54.46*
0.42
58.59*
1.34
55.17*
0.32
24
0.61
0.06
9.45*
14
0.40
0.10
4.02*
4
0.73
0.18
4.15*
4
0.51
0.20
2.51*
Sprachhintergrund deutsch
51.80*
0.77
52.11*
0.59
–0.25
25
0.60
0.07
9.25*
17
0.43
0.09
4.60*
3
0.75
0.18
4.20*
1
0.33
0.39
0.85
Merkmale der Förderung Inhalte der Förderung
–0.46
51.59*
0.21
–1.83
pB
11
0.68
0.10
6.88*
9
0.58
0.12
4.79*
pB + BLT
12
0.56
0.10
5.52*
9
0.27
0.12
2.21*
4
0.61
0.13
4.70*
0
pB + BLT + X Gruppengröße Einzelförderung
–0.30
45.11*
0.09
–0.14
5
0.40
0.10
3.85*
3
0.00
0.24
0.02
Kleingruppe (bis 12)
15
0.72
0.05
13.17*
8
0.61
0.11
5.28*
Großgruppe (ab 12)
5
0.25
0.13
1.95
6
0.25
0.12
2.02*
Implementationsqualität Schulung der Förderkraft
–0.07
52.43*
0.01
0.14
keine
4
0.41
0.20
2.03*
3
0.42
0.25
1.71
kurze Schulung bis 2h
8
0.74
0.10
7.08*
6
0.40
0.17
2.29*
16
0.58
0.08
7.34*
9
0.44
0.13
3.48*
längere Schulung Dauer der Förderung (in Minuten)
15
Forschergruppe
2.57*
36.16
6.58*
1.59
47.04*
2.54
4
Würzburger Gruppe
11
0.72
0.09
8.42*
7
0.50
0.14
3.51*
andere
17
0.54
0.07
7.25*
11
0.38
0.12
3.27*
Merkmale der Untersuchung Jahr der Untersuchung
–1.25
48.07*
1.57
–1.17
bis 2001
11
0.72
0.10
7.34*
11
0.51
0.12
4.41*
nach 2001
17
0.57
0.12
7.82*
7
0.30
0.14
2.10*
Vergleichbare Ausgangskompetenzen ja nein
0.24
51.45*
0.06
0.57
20
0.61
0.07
8.63*
12
0.39
0.11
3.59*
8
0.65
0.12
5.42*
6
0.51
0.17
2.98*
Anmerkungen: k = Anzahl der integrierten Einzeleffekte, g = mittlere gewichtete Gesamteffektstärke, SE = mittlerer gewichteter Standardfehler, Z = g/SE, QE = Testwert des Tests auf Residualheterogenität nach Berücksichtigung des Moderators mit df = k-2, QM = Testwert des Omnibustests auf Signifikanz des Moderators mit df = Anzahl der Moderatorkategorien-1, pB = phonologische Bewusstheit, BLT = Buchstaben-Laut-Training, X = andere Förderinhalte. * Parameter ist signifikant (p<.05).
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
© 2016 Hogrefe
22
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
Tabelle 4. Ergebnisse der Moderatorenanalysen für die Effekte der kitabasierten Fördermaßnahmen auf die Dekodierfähigkeit Kurz- bis mittelfristige Effekte Moderatorenanalyse
k
g
SE
Z
Langfristige Effekte QE
QM
7.97
0.00
k
g
SE
Z
QE
QM
24.65*
0.11
18.79*
3.67
24.22*
0.01
23.84*
0.03
17.77*
1.73
0.12
24.25*
0.01
0.28
24.66*
0.08
20.90*
1.06
22.36*
0.00
Merkmale der Stichprobe Ausgangskompetenzen
–0.06
–0.33
mittel bis hoch
4
0.24
0.14
1.72
8
0.10
0.10
1.03
gering
2
0.22
0.23
0.95
3
0.01
0.24
0.06
Sprachhintergrund
1.92
deutsch
6
10
0.05
0.08
0.56
andere Sprache
0
1
0.62
0.29
2.15*
Merkmale der Förderung Inhalte der Förderung
–2.08*
pB
3
0.35
0.08
pB + BLT
1
–0.17
0.33
pB + BLT + X
2
–0.22
0.24
Gruppengröße 1
–0.17
0.33
Kleingruppe (bis 12)
4
0.35
0.08
Großgruppe (ab 12)
0
4.32*
4.55*
–0.10 4
0.10
0.13
0.74
–0.53
7
0.08
0.13
0.62
–0.47
0
1.57
Einzelförderung
3.60
1.83
2.26
–0.53 4.48*
0.18 2
–0.27
0.30
–0.89
5
0.17
0.12
1.36
3
–0.03
0.19
–0.14
Implementationsqualität Schulung der Förderkraft
1.62
keine
0
kurze Schulung bis 2h
2
0.23
0.09
längere Schulung
2
0.45
0.11
Dauer der Förderung (in Minuten)
6
Forschergruppe Würzburger Gruppe
3
0.35
0.07
andere
3
–0.13
0.19
1.69
2.63
1.31 3
0.02
0.18
0.09
2.54*
1
–0.22
0.13
–1.65
4.31*
7
0.19
0.07
–2.16*
3.29
4.65*
2.35*
2.42
5.50*
4.68* –0.70
4
2.49*
7
0.11
0.11
0.96
4
0.05
0.16
0.31
Merkmale der Untersuchung Jahr der Untersuchung
1.03
bis 2001
6
5
0.00
0.12
0.02
nach 2001
0
6
0.18
0.12
1.47
Vergleichbare Ausgangskompetenzen
–0.15
7.70
0.02
–0.02
ja
3
0.24
0.17
1.38
8
0.07
0.12
0.62
nein
3
0.20
0.19
1.05
2
0.07
0.20
0.34
Anmerkungen. k = Anzahl der integrierten Einzeleffekte, g = mittlere gewichtete Gesamteffektstärke, SE = mittlerer gewichteter Standardfehler, Z = g/SE, QE = Testwert des Tests auf Residualheterogenität nach Berücksichtigung des Moderators mit df = k-2, QM = Testwert des Omnibustests auf Signifikanz des Moderators mit df = Anzahl der Moderatorkategorien-1, pB = phonologische Bewusstheit, BLT = Buchstaben-Laut-Training, X = andere Förderinhalte. * Parameter ist signifikant (p<.05).
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
23
Tabelle 5. Ergebnisse der Moderatorenanalysen für die Effekte der kitabasierten Fördermaßnahmen auf das Leseverständnis Kurz- bis langfristige Effekte Moderatorenanalyse
k
g
SE
Z
QE
QM
23.77*
0.49
21.98*
0.41
9.27
8.49*
8.52
0.50
19.78*
0.07
0.22
22.97*
0.05
–2.47*
11.00
6.11*
13.39*
2.95
20.38*
0.33
Merkmale der Stichprobe Ausgangskompetenzen
–0.70
mittel bis hoch
7
0.27
0.15
1.86
gering
1
–0.13
0.55
–0.23
Sprachhintergrund
0.64
deutsch
7
0.21
0.15
1.38
andere Sprache
1
0.49
0.40
1.21
Merkmale der Förderung Inhalte der Förderung
2.91*
pB
1
–0.18
0.22
–0.84
pB + BLT
5
0.22
0.13
1.75
pB + BLT + X
2
0.67
0.23
2.92*
Gruppengröße
0.70
Einzelförderung
2
–0.11
0.30
–0.36
Kleingruppe (bis 12)
4
0.12
0.14
0.89
Großgruppe (ab 12)
0
Implementationsqualität Schulung der Förderkraft
–0.26
keine
3
0.17
0.23
0.75
kurze Schulung bis 2h
2
0.67
0.27
2.46*
längere Schulung
3
0.10
0.18
0.52
Dauer der Förderung (in Minuten)
8
Forschergruppe Würzburger Gruppe
5
0.04
0.13
0.32
andere
3
0.57
0.17
3.31*
Merkmale der Untersuchung Jahr der Untersuchung
1.72
bis 2001
1
–0.18
0.27
nach 2001
9
0.33
0.13
Vergleichbare Ausgangskompetenzen
–0.68 2.57* 0.57
ja
4
0.12
0.23
0.53
nein
3
0.32
0.26
1.26
Anmerkungen. k = Anzahl der integrierten Einzeleffekte, g = mittlere gewichtete Gesamteffektstärke, SE = mittlerer gewichteter Standardfehler, Z = g/SE, QE = Testwert des Tests auf Residualheterogenität nach Berücksichtigung des Moderators mit df = k-2, QM = Testwert des Omnibustests auf Signifikanz des Moderators mit df = Anzahl der Moderatorkategorien-1, pB = phonologische Bewusstheit, BLT = Buchstaben-Laut-Training, X = andere Förderinhalte. * Parameter ist signifikant (p<.05).
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
© 2016 Hogrefe
24
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
Tabelle 6. Ergebnisse der Moderatorenanalysen für die Effekte der kitabasierten Fördermaßnahmen auf die Rechtschreibkompetenz Kurz- bis mittelfristige Effekte Moderatorenanalyse
k
g
SE
Langfristige Effekte
Z
QE
QM
0.10
19.65*
0.01
k
g
SE
Z
QE
QM
1.17
37.40*
1.36
39.57*
0.83
41.73*
0.00
41.37*
0.07
38.90*
0.45
0.34
41.02*
0.12
0.38
41.60*
0.14
41.86*
0.04
28.70*
1.98
Merkmale der Stichprobe Ausgangskompetenzen mittel bis hoch
8
0.27
0.14
1.98*
9
0.18
0.12
1.55
gering
2
0.30
0.27
1.13
2
0.55
0.29
1.89
Sprachhintergrund deutsch andere Sprache
0.91 10
10
0.21
0.12
1.72
0
1
0.59
0.40
1.47
Merkmale der Förderung Inhalte der Förderung
–0.17
19.78*
0.03
–0.01
pB
4
0.25
0.19
1.33
4
0.36
0.18
2.05*
pB + BLT
3
0.36
0.26
1.37
6
0.08
0.16
0.51
pB + BLT + X
3
0.21
0.25
0.84
1
0.52
0.38
1.37
Gruppengröße
–0.61
Einzelförderung
1
–0.12
0.32
Kleingruppe (bis 12)
3
0.39
0.07
Großgruppe (ab 12)
2
–0.35
0.30
10.87*
0.37
–0.38 5.84* –1.17
–0.26 2
–0.02
0.30
6
0.38
0.15
2
–0.05
0.26
–0.06 2.53* –0.20
Implementationsqualität Schulung der Förderkraft
–1.11
15.10*
1.24
0.67
keine
1
0.77
0.34
2.24*
3
0.12
0.26
0.45
kurze Schulung bis 2h
3
0.27
0.20
1.34
2
0.19
0.28
0.67
längere Schulung
4
0.25
0.19
1.32
6
0.30
0.16
1.85
Dauer der Förderung (in Minuten)
8
Forschergruppe
–2.08*
7.65
4.32*
0.89
19.52*
0.79
11
Würzburger Gruppe
3
0.40
0.19
2.18*
7
0.27
0.15
1.81
andere
7
0.19
0.16
1.17
4
0.18
0.20
0.90
Merkmale der Untersuchung Jahr der Untersuchung
1.91
14.88
3.63
0.20
bis 2001
8
0.21
0.11
1.85
4
0.21
0.19
1.07
nach 2001
2
0.63
0.19
3.26*
7
0.26
0.15
1.67
Vergleichbare Ausgangskompetenzen
–0.08
19.75*
0.01
1.41
ja
5
0.29
0.17
1.72
9
0.16
0.12
1.34
nein
5
0.27
0.18
1.50
2
0.53
0.24
2.26*
Anmerkungen. k = Anzahl der integrierten Einzeleffekte, g = mittlere gewichtete Gesamteffektstärke, SE = mittlerer gewichteter Standardfehler, Z = g/SE, QE = Testwert des Tests auf Residualheterogenität nach Berücksichtigung des Moderators mit df = k-2, QM = Testwert des Omnibustests auf Signifikanz des Moderators mit df = Anzahl der Moderatorkategorien-1, pB = phonologische Bewusstheit, BLT = Buchstaben-Laut-Training, X = andere Förderinhalte. * Parameter ist signifikant (p<.05).
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
Rechtschreibkompetenz zusammen. Die Heterogenität in den Effektstärken der kitabasierten Interventionen ist mit I2 = 75 % für die kurz- bis mittelfristigen Effekte und I2 = 80 % für die langfristigen Effekte sehr hoch. Unabhängig von der Effektdistanz erwies sich die Gruppengröße als wichtige Einflussgröße, da nur für die Förderung in Kleingruppen praktisch bedeutsame Effekte nachgewiesen wurden. Wie bereits bei der Dekodierfähigkeit wurde ein signifikanter negativer Zusammenhang zwischen der Förderdauer und der kurz- bis mittelfristigen Wirksamkeit festgestellt (vgl. Tabelle 6). In der vorliegenden Metaanalyse wurde die Vergleichbarkeit der Ausgangskompetenzen in den Untersuchungsgruppen durch einen Moderator berücksichtigt. Tatsächlich haben unterschiedliche Ausgangskompetenzen aber nicht zu Unterschieden in der mittleren Effektstärke geführt.
Diskussion Zusammenfassung In der vorliegenden Metaanalyse wurde die Wirksamkeit von Fördermaßnahmen der phonologischen Bewusstheit in der deutschen Sprache untersucht. Da die für das Schreiben wichtigen Phonem-Graphem-Korrespondenzen in der deutschen Orthografie eine deutlich geringere Konsistenz aufweisen als die für das Lesen wichtigen Graphem-Phonem-Korrespondenzen, wurden größere Transfereffekte auf Rechtschreibfertigkeiten als auf die Dekodierfähigkeit erwartet. Die Analysen wurden getrennt für Fördermaßnahmen in der Kita und in der Schule durchgeführt, da größere Effekte für kitabasierte Interventionen im Vergleich zu schulbasierten Interventionen angenommen wurden. Die kitabasierten, phonologischen Fördermaßnahmen erzielten auf die phonologische Bewusstheit unmittelbare Effekte in moderater Höhe (g = 0.60). Für die phonologische Bewusstheit im engeren Sinne wurden dabei größere Effekte verzeichnet (g = 0.65) als für die phonologische Bewusstheit im weiteren Sinne (g = 0.39). Die mittelfristigen Effekte auf die phonologische Bewusstheit waren mit g = 0.43 etwas geringer ausgeprägt. Auf die Dekodierfähigkeit hatte die phonologische Förderung weder kurzbis mittelfristig noch langfristig einen statistisch bedeutsamen Einfluss (g = 0.18 bzw. g = 0.07). Das trifft auch auf das Leseverständnis zu (g = 0.18). Über alle Studien betrachtet ist eine phonologische Förderung vor der Einschulung demnach nicht mit statistisch bedeutsamen Effekten auf Aspekte der Lesekompetenz verbunden, wenngleich vereinzelte Studien durchaus positive Effekte Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
25
berichten. Für die frühen Rechtschreibfähigkeiten wurden geringe Effekte der phonologischen Fördermaßnahmen nachgewiesen, die an der Grenze zu dem von Cohen aufgestellten Schwellenwert von 0.20 liegen (g = 0.24 und langfristig g = 0.19). Bestimmte Implementationskonditionen, insbesondere die Förderung in Kleingruppen, führten auch bei der Rechtschreibkompetenz zu höheren Effekten. Für schulische Fördermaßnahmen wurden keine signifikanten Effekte ermittelt. Bei den kurzfristigen Effekten auf die phonologische Bewusstheit und den Effekten auf das Leseverständnis ist die Effekthöhe mit g = 0.28 und g = 0.39 zwar nominell hoch, aufgrund der geringen Anzahl der berücksichtigten Primärstudien aber nicht von einem Nulleffekt verschieden. Auf die frühen Dekodier- und Rechtschreibfähigkeiten scheinen erst nach der Einschulung einsetzende Fördermaßnahmen der phonologischen Bewusstheit jedoch keinen Einfluss zu haben. Da sich in der deutschen Sprache – gestützt durch die hohe Konsistenz der Graphem-Phonem-Korrespondenzen – die basalen Dekodierfähigkeiten enorm schnell entwickeln, scheinen nur Fördermaßnahmen vor der Einschulung diesen Prozess zu unterstützen. Die Hypothese, dass aufgrund der geringen Konsistenz der Phonem-Graphem-Korrespondenzen eine phonologische Förderung für das Schreibenlernen bedeutsamer ist als für das Lesen, wurde durch die vorliegenden Befunde bestätigt. Die Effektstärken der Primärstudien zu den kitabasierten Fördermaßnahmen wiesen generell eine bedeutsame Heterogenität auf. Die untersuchten Moderatoren konnten jedoch nur wenig zur Erklärung dieser Variabilität beitragen. Die Ausgangskompetenzen und der Sprachhintergrund der Kinder hatten beispielsweise keinen signifikanten Einfluss auf die Höhe der Effekte, wenngleich für Kinder nicht-deutscher Herkunft oft tendenziell höhere Effekte ermittelt wurden. Ebenso fand sich keine Unterstützung für die Annahme, dass mit der Kombination aus phonologischer Förderung und einem Buchstaben-LautTraining höhere Transfereffekte auf den Schriftspracherwerb verbunden sind. Für die Dekodierfähigkeit wurden sogar gegenteilige Hinweise ermittelt: Mit rein phonologischen Fördermaßnahmen waren kurz- bis mittelfristig moderate Effekte verbunden, die sich auch als statistisch bedeutsam erwiesen. Dies könnte teilweise daran liegen, dass die zusätzlichen Förderinhalte aus dem Zeitkontingent der phonologischen Bewusstheitsförderung bestritten werden. Der Befund, dass nur für die Kombination mit weiteren Förderinhalten signifikante Effekte auf das Leseverständnis bestehen, kann hingegen damit erklärt werden, dass in den beiden zugrunde liegenden Studien mit dem «Globo vom Lobo»-Programm das Textverständnis als weiterer Bestandteil der Übungen explizit gefördert wurde. © 2016 Hogrefe
26
Hinsichtlich der Wirksamkeit einer phonologischen Förderung bei Kindern mit unterschiedlichen Ausgangskompetenzen reihen sich die vorliegenden Ergebnisse in die inkonsistente Befundlage der Primärstudien und der Metaanalyse von Fischer und Pfost (2015) ein. Dass bei Fischer und Pfost (2015) für sogenannte Risikokinder überwiegend signifikant geringere Effekte als für unausgelesene Kinder berichtet wurden, lässt sich dadurch erklären, dass die dort berücksichtigten Studien mehrheitlich eine schulbezogene Förderung evaluierten. Diese wurden jedoch nicht in die vorliegenden getrennten Moderatorenanalysen zu den Effekten einer kitabezogenen Förderung einbezogen. Bei der Interpretation der vorliegenden Befunde ist außerdem zu beachten, dass eine Reihe von Studien vorliegt, die die Effekte einer phonologischen Förderung bei einer Risikostichprobe im Vergleich zu einer unausgelesenen Kontrollgruppe explizit untersuchten (Probst, 2009; Roth, 1999; Roth & Schneider, 2001, 2002; Schneider et al., 1998). Diese Studien kommen mehrheitlich zu dem Ergebnis, dass Risikokinder nach der Förderung der phonologischen Bewusstheit an die Kompetenzen einer unausgelesenen Kontrollgruppe anschließen können. Aufgrund dieser stark unterschiedlichen Ausgangskompetenzen und der daraus resultierenden mangelnden Vergleichbarkeit der Untersuchungsgruppen wurden diese aber aus der vorliegenden Metaanalyse ausgeschlossen. Die Ergebnisse der Moderatorenanalysen zum Sprachhintergrund der Kinder sollten mit Vorsicht interpretiert werden. Es liegen empirische Hinweise darauf vor, dass die phonologische Bewusstheit für die Lesegeschwindigkeit und das Leseverständnis bei Kindern mit Deutsch als Zweitsprache bzw. bilingualen Kindern eine geringere Rolle als bei Kindern deutscher Herkunft spielt (Duzy, Ehm, Souvignier, Schneider & Gold, 2013; Limbird & Stanat, 2006). In Trainingsstudien, die aufgrund des Fehlens einer Vergleichsgruppe ohne phonologische Förderung nicht in die Metaanalyse einbezogen werden konnten, wurden hingegen vergleichbare Effekte für Kinder deutscher und nicht-deutscher Herkunft ermittelt (Pröscholdt et al., 2013; Weber et al., 2007). Die vorliegende Metaanalyse ergab aufgrund der bei Blatter et al. (2013) berichteten Befunde zwar größere Effekte für Kinder mit einer anderen Herkunftssprache als Deutsch, aufgrund der sehr geringen Anzahl an Primärstudien mit Kindern nicht-deutscher Herkunft ist dieser Befund jedoch nur bedingt verlässlich. Die «phonological linkage»-Hypothese, die besagt, dass mit der Kombination aus phonologischer Förderung und einem Buchstaben-Laut-Training höhere Effekte auf den Schriftspracherwerb erzielt werden sollten als mit rein phonologischen Fördermaßnahmen, kann anhand der vorliegenden Befunde nicht bestätigt werden. Dies steht in © 2016 Hogrefe
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
Widerspruch zu den Ergebnissen einer Würzburger Studie (Roth, 1999; Roth & Schneider, 2001, 2002; Schneider et al., 2000), die sehr positive Effekte eines kombinierten Ansatzes bis zum Ende der Grundschulzeit berichtet, die sich auf die Rechtschreibleistung, die Dekodiergeschwindigkeit und das Leseverständnis beziehen. Aufgrund der stark unterschiedlichen Ausgangskompetenzen der Förder- und Vergleichsgruppe wurde diese Studie jedoch nicht in die vorliegende Metaanalyse einbezogen (siehe oben). Für die Dekodierfähigkeit konnten metaanalytisch im Gegenteil sogar nur für rein phonologische Fördermaßnahmen bedeutsame Effekte nachgewiesen werden. Eine mögliche Erklärung ist die hohe Konsistenz der GraphemPhonem-Korrespondenzen und die moderate Konsistenz der Phonem-Graphem-Korrespondenzen, die den Nutzen eines Buchstaben-Laut-Trainings in der deutschen Sprache begrenzen könnten. Allerdings sind allzu generalisierende Aussagen an dieser Stelle nicht möglich; es scheint stark auf die Art und Umsetzung der kombinierten Förderung anzukommen. Da vorschulische Fördermaßnahmen in Deutschland oft einen kompensatorischen Anspruch verfolgen, erscheinen weitere Untersuchungen zur Frage, wer unter welchen Bedingungen profitiert, dringend erforderlich. Hinsichtlich der Implementationsqualität konnten keine Merkmale identifiziert werden, die die Wirksamkeit in allen Kompetenzbereichen beeinflussten. Die Schulung der Förderkraft war für die Höhe der Effekte nicht relevant, was darauf zurückzuführen sein könnte, dass die Schulungen sehr unterschiedlich ausgestaltet wurden, die Dauer wenig über die Qualität der Schulung aussagt und teilweise auch Angaben in den Primärstudien fehlten. Die Dauer der Förderung bestätigte sich zwar als bedeutsamer Moderator, überraschenderweise waren die Ergebnisse zur Wirkrichtung aber inkonsistent. Hinsichtlich der kurzfristigen Effekte auf die phonologische Bewusstheit wiesen die Befunde darauf hin, dass eine Förderung umso wirksamer ist, je länger sie dauert. Bei den kurz- bis mittelfristigen Effekten auf die Dekodierfähigkeit und die Rechtschreibfähigkeit sowie bei den Effekten auf das Leseverständnis nahm die Wirksamkeit dagegen mit der Förderdauer ab. Eine mögliche Erklärung für diesen kontraintuitiven Befund sind einige wenige Studien in der Stichprobe, in denen durch wiederholte Fördermaßnahmen sehr lange gefördert wurde (z. B. im vorletzten und letzten Kitajahr bei Rothe, 2007) und für die keine oder negative Effekte auf den Schriftspracherwerb ermittelt wurden. Bezüglich der Forschergruppe wurden für die Dekodier- und Rechtschreibfähigkeiten höhere kurz- bis mittelfristige Effekte in den Studien der Würzburger Arbeitsgruppe festgestellt. Dies kann als Hinweis darauf gesehen werden, dass die Anstrengungen der Würzburger Arbeitsgruppe zur Sicherstellung der Implementationsqualität erZeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
folgreich waren, was die Bedeutung der Implementationsqualität für ein erfolgreiches Training unterstreicht. Die gegenteiligen höheren Effekte für das Leseverständnis bei anderen Forschergruppen lassen sich damit erklären, dass die in den Vergleich eingehenden Studien mit dem «Globo vom Lobo»-Programm arbeiteten, dessen Bestandteil auch die Förderung des Textverständnisses ist. Die Vermutung, dass eine phonologische Förderung seit 2001 aufgrund einer zunehmenden Verbreitung systematischer Sprachfördermaßnahmen im Elementarbereich allgemein mit geringeren Effekten verbunden sein könnte, wurde nicht bestätigt. Tendenziell weisen die Effektstärken sogar darauf hin, dass seit 2001 größere Transfereffekte auf den Schriftspracherwerb verzeichnet werden. Ein möglicher Grund ist darin zu sehen, dass die Umsetzung der Forderung der Kultusministerkonferenz erst mit einer zeitlichen Verzögerung erfolgte.
Vergleich mit den internationalen Metaanalysen Auffällig ist, dass die Effekte von phonologischen Fördermaßnahmen in der deutschen Sprache insgesamt geringer sind als die in den internationalen Metaanalysen. Dies trifft auch zu, wenn man aus den internationalen Metaanalysen nur die Befunde zu Fördermaßnahmen unmittelbar vor der Einschulung (kindergarten3) zum Vergleich heranzieht: Für die phonologische Bewusstheit als abhängige Variable ergaben die Analysen internationaler Datensätze eine durchschnittliche Effekthöhe von d = 1.26 (Bus & van Ijzendoorn, 1999) und d = 0.95 (Ehri et al., 2001). Bei der Dekodierfähigkeit betragen die Vergleichswerte d = 0.32 (Bus & van Ijzendoorn, 1999) bzw. d = 0.49 (Ehri et al., 2001). Bemerkenswert ist, dass in den internationalen Metaanalysen hinsichtlich der Dekodierfähigkeit die höchsten Effekte für Fördermaßnahmen in der «preschool» ermittelt wurden, was zeitlich in etwa dem vorletzten Kitajahr in Deutschland gleichzusetzen ist (d = 1.30, Bus & van Ijzendoorn, 1999, bzw. d = 1.25, Ehri et al., 2001). Für das Rechtschreiben wurde von Ehri et al. (2001) ein mittlerer Effekt von d = 0.97 für Fördermaßnahmen im «kindergarten» festgestellt. Vor dem Hintergrund, dass für diese durchschnittlichen Effektstärken der internationalen Moderatorenanalysen die kurz- bis langfristigen Effekte aggregiert wurden, erscheinen die Diskrepanzen zu den Ergebnissen der vorliegenden Metaanalyse noch beachtlicher.
3
27
Dies könnte auf Unterschiede in der Gestaltung des Erstleseunterrichts zurückgeführt werden. Nach Goswami und Kollegen (1998) besteht ein Zusammenhang zwischen der Transparenz einer Orthografie und den verwendeten Unterrichtsmethoden beim frühen Schriftspracherwerb. In intransparenten Orthografien mit inkonsistenten Zuordnungen von Graphemen und Phonemen sind Kombinationen aus der Ganzwortmethode und der phonetischen Methode üblich, während in transparenten Orthografien in der Regel rein phonetische Strategien verwendet werden. In deutschsprachigen Ländern werden entsprechend zumeist synthetische Methoden angewandt, die durch die explizite und systematische Vermittlung der GraphemPhonem- und Phonem-Graphem-Zuordnungen ebenfalls phonologische Fähigkeiten ausbilden oder fördern könnten (Einsiedler et al., 2002). Dies könnte die Bedeutung einer vorschulischen phonologischen Förderung für den Schriftspracherwerb in der deutschen Sprache reduzieren (vgl. Jenkins, 2002). Neben inhaltlichen Erklärungen wie der unterschiedlichen Bedeutsamkeit der Vorläuferfähigkeit phonologische Bewusstheit in unterschiedlichen Sprachen oder der Ausgestaltung des Schriftsprachunterrichts kommen für die diskrepanten Befunde der internationalen und der vorliegenden Metaanalyse auch methodische Alternativerklärungen in Frage. Dazu gehören Unterschiede in der Stichprobengröße der untersuchten Primärstudien, in deren Abhängigkeit die mittlere errechnete Effektgröße einer Metaanalyse variiert. Lipsey und Wilson (1993) schlüsselten die Effektstärken unterschiedlicher pädagogischer und psychologischer Interventionen ungeachtet des Trainingsgegenstandes hinsichtlich der Stichprobengröße auf und erkannten, dass in Studien mit weniger als 50 Teilnehmern die mittleren Effektstärken deutlich höher ausfielen (d = 0.58) als bei mehr als 100 Teilnehmern (d = 0.35). Dieser Effekt wurde mit mangelnder Standardisierung der Trainingsbedingungen einerseits und der sinkenden Qualität der Implementation mit zunehmender Stichprobengröße andererseits erklärt. Insgesamt sind die Stichprobenumfänge der Studien aus den internationalen Metaanalysen geringer als die Stichprobenumfänge, die in die vorliegende Metaanalyse eingingen. Allerdings liegen die durchschnittlichen Stichprobenumfänge aller drei Metaanalysen mit durchschnittlich n = 98 (Bus & van Ijzendoorn, 1999), n = 89 (Ehri et al., 2001) und n = 139 in der aktuellen Metaanalyse nahe beieinander, so dass die angesprochenen Effekte niedriger ausfallen dürften als in der Übersicht von Lipsey und Wilson (1993).
In den USA besuchen Kinder im Alter von drei bis vier Jahren die «preschool» und danach im Jahr vor der Einschulung den «kindergarten». Phonologische Bewusstheitstrainings werden sowohl in der «preschool» als auch im «kindergarten» eingesetzt, während in Deutschland eine kitabasierte, phonologische Förderung in der Regel im letzten Jahr vor der Einschulung stattfindet.
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
© 2016 Hogrefe
28
Vergleich mit der deutschen Metaanalyse Die Befunde von Fischer und Pfost (2015) wurden durch die vorliegende Metaanalyse teilweise repliziert sowie durch den Einbezug weiterer Moderatoren und den für das Lesen und Schreiben getrennten Moderatorenanalysen ergänzt. Die Befunde beider Metaanalysen zu den kurzfristigen Transfereffekten auf die Dekodierfähigkeit und die Rechtschreibkompetenz stimmen überein. Hier ist jedoch zu beachten, dass sich die vorliegenden Befunde nur auf Evaluationen kitabezogener Fördermaßnahmen beziehen, während bei Fischer und Pfost die Effekte für die vorschulischen und schulischen Trainingsprogramme aggregiert wurden. In der vorliegenden Metaanalyse wurden für die schulbasierten Fördermaßnahmen dagegen gar keine kurzfristigen Effekte auf das Dekodieren und Rechtschreiben nachgewiesen. Außerdem widersprechen die vorliegenden Ergebnisse dem Befund, dass unausgelesene Stichproben hinsichtlich der phonologischen Bewusstheit und der langfristigen Effekte auf den Schriftspracherwerb stärker von einer phonologischen Förderung profitieren (siehe oben). Diese abweichenden Befunde sind auf Unterschiede in der Datenbasis4 und im methodischen Vorgehen zurückzuführen. In methodischer Hinsicht grenzt sich die vorliegende Studie von Fischer und Pfost (2015) einerseits durch die Berechnung separater Overall-Analysen für die kita- und schulbasierten Fördermaßnahmen und andererseits durch separate Moderatorenanalysen für die Dekodierfähigkeit, das Leseverständnis und die Rechtschreibfähigkeiten ab. Fischer und Pfost analysierten die Fördereffekte dagegen unabhängig vom Zeitpunkt der Förderung und verwendeten in den Moderatorenanalysen die aggregierte Leistung aus Lesen und Rechtschreiben als Kriterium. Eine aufgesplittete Analyse bietet jedoch den Vorteil differenzierter Ergebnisse und Interpretationen. Zudem wurden im Gegensatz zu Fischer und Pfost Aggregationen von Einzeleffekten auf Ebene der Primärstudien mit Hilfe zusätzlicher, «vorgeschalteter» Metaanalysen vorgenommen und nicht durch die Bildung des arithmetischen Mittelwerts. Weiterhin sind ausschließlich in der vorliegenden Metaanalyse Studien enthalten, die moderate Transfereffekte von kitabasierten Fördermaßnahmen (Küspert, 1998), einen negativen Transfereffekt
4
5
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
von schulischen Fördermaßnahmen (Mannhaupt et al., 1999)5 und hohe Fördereffekte für Kinder mit schwachen Ausgangskompetenzen belegen (Schneider et al., 1998) sowie nicht publizierte Studien (Henning, 2005; Polotzek, 2007; Stahn, 2006).
Limitationen und Ausblick Die hier untersuchten Moderatoren konnten nur einen geringen Beitrag zur Erklärung der Heterogenität in den Effektstärken der einzelnen Primärstudien leisten, was gemeinhin als Hinweis auf den Einfluss weiterer, nicht berücksichtigter Moderatoren gesehen wird. Als potenzielle Faktoren kommen insbesondere strukturelle und qualitative Merkmale der Umsetzung infrage. Die Strukturmerkmale Größe der Fördergruppen und Förderdauer wurden in der vorliegenden Studie untersucht, erklärten das Ausmaß der Heterogenität in den Effektstärken aber nicht bedeutsam. Die Ergebnisse zur Förderdauer scheinen zudem durch Ausreißer verzerrt zu sein (siehe oben die Erläuterungen zu Studien mit wiederholter Förderung und keinen oder negativen Effekten). Bedeutsamer als der quantitative Umfang der Förderung könnte vielmehr der Umfang der rein phonologischen Förderinhalte sein, der anhand der Programm- und Studienbeschreibungen aber nicht quantifiziert werden konnte. Qualitative Merkmale wie die professionelle Kompetenz und die Motivation der Förderkraft zur Umsetzung der phonologischen Fördermaßnahmen sowie die Qualität der realisierten Implementation der Förderung lassen sich zudem nur sehr schwer bestimmen. Dementsprechend fehlen solche Angaben größtenteils in den Studien. Zwar wurde versucht, die Schulung der Förderkräfte hinsichtlich ihres Umfangs zu operationalisieren, aufgrund der unzureichenden Informationen in den Primärstudien gelang dies jedoch nur unzureichend. Detaillierte Angaben, auch zur Qualität der Schulung, wären notwendig, beispielsweise eine Bewertung der Schulung nach den Qualitätsindikatoren für Fortund Weiterbildungen im frühpädagogischen Bereich der Weiterbildungsinitiative «Frühpädagogische Fachkräfte» (Expertengruppe Berufsbegleitende Weiterbildung, 2013). Für Informationen zur Qualität der Durchführung der För-
17 Publikationen wurden in beide Metaanalysen einbezogen. Hinzu kommen zwei weitere Studien, die in der vorliegenden Metaanalyse mit aktuelleren Publikationen berücksichtigt wurden (Blatter et al., 2013; Petermann et al., 2010). Darüber hinaus wurden in der vorliegenden Studie zwölf weitere Publikationen untersucht (Blaser, 2002; Degé & Schwarzer, 2011; Fröhlich et al., 2011; Hartmann, 2002; Henning, 2005; Küspert, 1998; Mannhaupt et al., 1999; Noack & Brändel, 2007; Polotzek, 2007; Schneider et al., 1998; Schöppe et al., 2013; Stahn, 2006). Demgegenüber wurde die Studie von Berger (2010) nicht in die vorliegende Metaanalyse aufgenommen, da der Umfang der phonologischen Bewusstheitsförderung nicht den Einschlusskriterien entsprach. Die negativen Effekte dieser Studie können möglicherweise mit Schwächen im Testdesign erklärt werden. So stammen die Daten der Kontrollgruppe aus einer zwei Jahre vorher durchgeführten Längsschnittstudie, wobei Informationen über eine mögliche Förderung der Kontrollgruppe fehlen. Des Weiteren sind die Stichprobenumfänge der Experimental- und der Kontrollgruppe mit jeweils 27 Kindern gering.
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
dereinheiten wären externe Beobachtungen der Implementationsqualität oder Dokumentationen der Fördereinheiten notwendig, in denen die Förderkraft Angaben zur Häufigkeit und Dauer der Fördereinheiten, der Teilnahme der Kinder sowie eine Einschätzung zur Qualität der Umsetzung protokolliert. So lange entsprechende Erfassungen der Implementationsqualität kein fester Bestandteil wissenschaftlicher Evaluationen sind, kann der Einfluss dieser Aspekte metaanalytisch nicht einheitlich und mit ausreichender Präzision bestimmt werden. Bei der Interpretation der Befunde der Moderatorenanalysen ist weiterhin zu beachten, dass der Umfang der zugrunde liegenden Primärstudien teilweise sehr gering ist. So basieren die Ergebnisse zu Fördereffekten bei Kindern nicht-deutscher Herkunft beispielsweise teilweise auf lediglich einer Studie. Diese Einschränkung trifft zum Teil auch auf die metaanalytischen Befunde zu. Eines der Kriterien zur Aufnahme einer Trainingsstudie war das Vorhandensein einer Vergleichsgruppe, die keine systematische Sprachförderung erhalten hat. Nach PISA 2000 und den eingeleiteten Maßnahmen im Elementarbereich kann jedoch nicht davon ausgegangen werden, dass dies tatsächlich der Fall ist, da alltagsintegrierte und additive Sprachförderkonzepte zunehmend in der pädagogischen Arbeit eingesetzt werden. Hier scheint eine systematische Erfassung der Förderung der Vergleichsgruppen sinnvoll; diese Informationen könnten zu einer statistischen Kontrolle des Einflusses oder einer Berücksichtigung in Form eines Moderators genutzt werden. Die Aussagekraft einer jeden Metaanalyse ist weiterhin stark von der Güte der ihr zugrunde liegenden Primärstudien abhängig. Im Vergleich zu anderen Trainingsprogrammen – mit Ausnahme des Trainings zum induktiven Denken von Klauer (2014) – ist die Datenbasis zur Überprüfung der Effekte von phonologischen Förderprogrammen ausgesprochen gut. Die meisten Evaluationen entsprechen den methodischen Standards (z. B. standardisierte Trainingsbedingung, Prä-Post-Kontrollgruppen-Design, ausreichende Stichprobengröße). Ein Schwachpunkt liegt allerdings häufig in der nicht randomisierten Gruppenzuweisung, was teilweise zu Gruppenunterschieden in den Ausgangskompetenzen zwischen Trainings- und Vergleichsgruppe führt. Weiterhin werden nicht alle für eine Metaanalyse notwendigen Informationen berichtet. Dies bezieht sich nicht nur auf Informationen zur Implementationsgüte, sondern auch auf statistische Angaben. So liegen beispielsweise bereits Ansätze für den metaanalytischen Umgang mit Daten aus einem Prä-PostKontrollgruppendesign vor (Morris, 2008; Morris & DeShon, 2002), die eine statistische Kontrolle unterschiedlicher Ausgangskompetenzen in den Untersuchungsgruppen ermöglichen. Diese erfordern jedoch zur Berechnung der Stichprobenvarianz Angaben zur PräZeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
29
Post-Korrelation in den Untersuchungsgruppen, die in den Primärstudien nicht berichtet wurden. Das Problem sind also weniger das Studiendesign oder die gewählten Analysemethoden als vielmehr das unvollständige Berichten der statistischen Kennwerte, die für eine optimale metaanalytische Auswertung notwendig wären. Da solche Angaben standardmäßig nicht berichtet werden und Publikationen auch nicht alle Eventualitäten berücksichtigen können, wäre es für Re- und Metaanalysen wichtig, dass auch die Datensätze veröffentlicht werden (Wicherts & Bakker, 2012; Wicherts et al., 2006). Die Befunde der Metaanalyse belegen, dass der Zeitpunkt von phonologischen Fördermaßnahmen entscheidend für ihre Wirksamkeit ist. Mit einer kitabasierten Förderung können bedeutsame Effekte auf die phonologische Bewusstheit und die Rechtschreibkompetenz erzielt werden. Eine statistisch bedeutsame Wirksamkeit von schulischen Fördermaßnahmen konnte dagegen nicht bestätigt werden. Des Weiteren kann die in der Praxis verbreitete Kombination aus einer phonologischen Förderung und einem Training der Graphem-Phonem-Korrespondenzen aufgrund der vorliegenden Ergebnisse nicht gestützt werden. Insbesondere hinsichtlich der frühen Dekodierfähigkeit scheinen rein phonologische Fördermaßnahmen effektiver zu sein. Im Vergleich zu vorschulischen, additiven Sprachförderprogrammen mit kompensatorischer Zielsetzung, denen bislang keine statistisch oder praktisch bedeutsamen Transfereffekte auf den Schriftspracherwerb attestiert werden konnten (z. B. Gasteiger-Klicpera, Knapp & Kucharz, 2010; Roos, Polotzek & Schöler, 2010; Wolf, Felbrich, Stanat & Wendt, 2011), erweist sich die Förderung der phonologischen Bewusstheit vor der Einschulung als geeignet, günstige Voraussetzungen für den Schriftspracherwerb, insbesondere für den Erwerb der Rechtschreibfertigkeiten, zu schaffen.
Autorenhinweise Katrin M. Wolf, Institut für Erziehungswissenschaft, Humboldt-Universität zu Berlin; Ulrich Schroeders, Institut für Erziehungswissenschaft, Universität Bamberg; Katharina Kriegbaum, Institut für Psychologie, Universität Heidelberg. Katrin M. Wolf ist jetzt bei der Rambøll Management Consulting GmbH tätig. Wir bedanken uns bei Wolfgang Viechtbauer für die hilfreichen Ratschläge und die Unterstützung bei der Verwendung des R-Pakets Metafor sowie bei Herrn Prof. Sparfeldt und drei anonymen Reviewern für ihre hilfreichen und konstruktiven Kommentare und Überarbeitungsvorschläge. © 2016 Hogrefe
30
Elektronische Supplemente Die elektronischen Supplemente sind mit der Online-Version dieses Artikels verfügbar unter http://dx.doi.org/ 10.1024/1010-0652/a000165. ESM 1. Tabelle. Gruppenvergleiche der Fördermaßnahmen in der Kita ESM 2. Abbildung. Forest Plots
Literatur *Die mit einem Stern versehenen Referenzen bezeichnen Studien, die in der Metaanalyse berücksichtigt wurden. Anthony, J. L. & Francis, D. J. (2005). Development of phonological awareness. Current Directions in Psychological Science, 14, 255–259. Berger, N. (2010). Mehr als nur ein WorT: Zur Diagnostik und Förderung von Grundschulkindern mit schwachen Rechtschreibleistungen im Rahmen des Regelunterrichts. München: Herbert Utz Verlag. *Blaser, R. (2002). Erprobung und Validierung des Konzeptes «Phonologische Bewusstheit» in der Frühdiagnostik und Prävention späterer Lesestörungen an einer Stichprobe Schweizer Kinder. Dissertation der Philosophisch-historischen Fakultät der Universität Bern. Bern: Selbstverlag. *Blaser, R., Preuss, U., Groner, M., Groner, R. & Felder, W. (2007). Kurz-, mittel-, und längerfristige Effekte eines Trainings in phonologischer Bewusstheit und in Buchstaben-Laut-Korrespondenz auf die phonologische Bewusstheit und die Lese- und Rechtschreibleistung. Zeitschrift für Kinder- und Jugendpsychiatrie, 35, 273–280. *Blatter, K., Faust, V., Jäger, D., Schöppe, D., Artelt, C., Schneider, W. et al. (2013). Vorschulische Förderung der phonologischen Bewusstheit und der Buchstaben-Laut-Zuordnung: Profitieren auch Kinder nichtdeutscher Herkunftssprache? In A. Redder & S. Weinert (Hrsg.), Sprachförderung und Sprachdiagnostik – interdisziplinäre Perspektiven (S. 218–239). Münster: Waxmann. Borenstein, M., Hedges, L. V., Higgins, J. P. T. & Rothstein, H. R. (2009). Introduction to meta-analysis. Chichester, U.K: John Wiley & Sons. Brannick, M. T., Yang, L. Q. & Cafri, G. (2011). Comparison of weights for meta-analysis of r and d under realistic conditions. Organizational Research Methods, 14, 587–607. Burgess, S. R. & Lonigan, C. J. (1998). Bidirectional relations of phonological sensitivity and prereading abilites: Evidence from a preschool sample. Journal of Experimental Child Psychology, 70, 117–141. Bus, A. G. & van Ijzendoorn, M. H. (1999). Phonological awareness and reading: A meta-analysis of experimental training studies. Journal of Educational Psychology, 91, 403–414. Caravolas, M., Lervåg, A., Mousikou, P., Efrim, C., Litavský, M., Onochie-Quintanilla, E. et al. (2012). Common patterns of prediction of literacy development in different alphabetic orthographies. Psychological Science, 23, 678–686. Cochran, W. G. (1954). The combination of estimates from different experiments. Biometrics, 10, 101–129. © 2016 Hogrefe
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
Costard, S. (2011). Störungen der Schriftsprache: Modellgeleitete Diagnostik und Therapie. Stuttgart: Georg Thieme Verlag. *Degé, F. & Schwarzer, G. (2011). The effect of a music program on phonological awareness in preschoolers. Frontiers in psychology, 2, 1–7. De Jong, P. F. & van der Leij, A. (2003). Developmental changes in the manifestation of a phonological deficit in dyslexic children learning to read a regular orthography. Journal of Educational Psychology, 95, 22–40. Duzy, D., Ehm, J. H., Souvignier, E., Schneider, W. & Gold, A. (2013). Prädiktoren der Lesekompetenz bei Kindern mit Deutsch als Zweitsprache. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 45, 173–190. Ehri, L. C. (1992). Reconceptualizing the development of sight word reading and its relationship to recoding. In P. B. Gough, L. C. Ehri & R. Treiman (Eds.), Reading acquisition (pp. 107–143). Hillsdale, NJ: Erlbaum. Ehri, L., Nunes, S. R., Willows, D. M., Schuster, B. V., Yahhoub-Zadeh, Z. & Shanahan, T. (2001). Phonemic awareness instruction helps children learn to read: Evidence from the National Reading Panel’s meta-analysis. Reading Research Quarterly, 36, 250–287. Expertengruppe Berufsbegleitende Weiterbildung. (2013). Qualität in der Fort- und Weiterbildung von pädagogischen Fachkräften in Kindertageseinrichtungen: Standards, Indikatoren und Nachweismöglichkeiten für Anbieter. München: Deutsches Jugendinstitut/Weiterbildungsinitiative Frühpädagogische Fachkräfte. *Einsiedler, W., Frank, A., Kirschhock, E. M., Martschinke, S. & Treinies, G. (2002). Der Einfluss verschiedener Unterrichtsformen auf die phonologische Bewusstheit sowie auf Lese- Rechtschreibleistungen im 1. Schuljahr. Psychologie in Erziehung und Unterricht, 49, 194–209. Fiebig, J., Rüdebusch, G. & Urban, D. (2012). Meta-Analyse und «publication bias». Eine empirisch-statistische Fallstudie. SISSSchriftenreihe des Instituts für Sozialwissenschaften der Universität Stuttgart (No. 1/2012). Verfügbar unter: http://www. uni-stuttgart.de/soz/institut/forschung/2012.SISS.1.pdf [Zugriff am 31.10.2014]. Fischer, M. Y. & Pfost, M. (2015). Wie effektiv sind Maßnahmen zur Förderung der phonologischen Bewusstheit? Eine meta-analytische Untersuchung der Auswirkungen deutschsprachiger Trainingsprogramme auf den Schriftspracherwerb. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 47, 35–51. Forster, M. & Martschinke, S. (2001). Leichter lesen und schreiben lernen mit der Hexe Susi: Das Nürnberger Trainingsprogramm zur phonologischen Bewusstheit. Donauwörth: Auer. *Fröhlich, L. P., Metz, D. & Petermann, F. (2009). Kindergartenbasierte Förderung der phonologischen Bewusstheit «Lobo vom Globo». Kindheit und Entwicklung, 18, 204–212. *Fröhlich, L. P., Metz, D. & Petermann, F. (2010). Förderung der phonologischen Bewusstheit und sprachlicher Kompetenzen: das Lobo-Kindergartenprogramm. Göttingen: Hogrefe. *Fröhlich, L. P., Petermann, F. & Metz, D. (2011). Förderung der phonologischen Bewusstheit am Übergang vom Kindergarten zur Grundschule mit den «Lobo-Programmen». Zeitschrift für Pädagogik, 57, 744–759. Furnes, B. & Samuelsson, S. (2011). Phonological awareness and rapid automatized naming predicting early development in reading and spelling: Results from a cross-linguistic longitudinal study. Learning and Individual Differences, 21, 85–95. Gasteiger-Klicpera, B., Knapp, W. & Kucharz, D. (2010). Abschlussbericht der wissenschaftlichen Begleitung des Programms «Sag' mal was» – Sprachförderung für Vorschulkinder. Weingarten: Pädagogische Hochschule Weingarten. Georgiou, G. K., Parrila, R. & Papadopoulos, T. C. (2008). Predictors of word decoding and reading fluency across languages varying Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
in orthographic consistency. Journal of Educational Psychology, 100, 566–580. Goswami, U. (1988). Children's use of analogy in learning to spell. British Journal of Experimental Psychology, 6, 21–33. Goswami, U. & Bryant, P. E. (1990). Phonological skills and learning to read. London: Erlbaum. Goswami, U., Gombert, J. E. & de Barrera, L. F. (1998). Children's orthographic representations and linguistic transparency: Nonsense word reading in English, French, and Spanish. Applied Psycholinguistics, 19, 19–52. *Hartmann, E. (2002). Möglichkeiten und Grenzen einer präventiven Intervention zur phonologischen Bewusstheit von lautsprachgestörten Kindergartenkindern. Fribourg: Sprachimpuls. Hatcher, P. J., Hulme, C. & Ellis, A. W. (1994). Ameliorating early reading failure by integrating the teaching of reading and phonological skills: The phonological linkage hypothesis. Child Development, 65, 41–57. *Hatz, H. & Sachse, S. (2010). Prävention von Lese-Rechtschreibstörungen: Auswirkungen eines Trainings phonologischer Bewusstheit und eines Rechtschreibtrainings im ersten Schuljahr auf den Schriftspracherwerb bei Risikokindern. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 42, 226–240. Hedges, L. V. & Olkin, I. (1985). Statistical methods for meta-analysis. New York: Academic Press. Hedges, L. V. & Vevea, J. L. (1998). Fixed-and random-effects models in meta-analysis. Psychological Methods, 3, 486–504. Heifer, B. (2004). Die Heifer-Methode – Methode der Laut-FarbVerknüpfung. Eine ganzheitliche Methode zur Schulung der phonologischen Bewusstheit als Grundlage der Lese- und Schreibkompetenz. Bonn: Habelt-Verlag. *Hennig, C. (2005). Implementation und Evaluation eines Kompetenztrainings im Kindergarten [Unveröffentlichte Diplomarbeit]. Jena: Friedrich-Schiller-Universität. Higgings, J. & Green, S. (2008). Cochrane handbook for systematic reviews of interventions (Vol. 5). Chichester: Wiley-Blackwell. Higgins, J., Thompson, S. G., Deeks, J. J. & Altman, D. G. (2003). Measuring inconsistency in meta-analyses. British Medical Journal, 327, 557–560. Hunter, J. E. & Schmidt, F. L. (1990). Methods of meta-analysis: Correcting error and bias in research findings. Newbury Park, CA: Sage. Hunter, J. E. & Schmidt, F. L. (2004). Methods of meta-analysis: Correcting error and bias in research synthesis (2nd ed.). Thousand Oaks, CA: Sage. Hüttis-Graf, P. & Widmann, B.-A. (1996). Elementare Schriftkultur als Prävention von Lese-/Rechtschreibschwierigkeiten und Analphabetismus bei Grundschulkindern. Abschlußbericht des Modellversuchs der Bund-Länder-Kommission für Bildungsplanung und Forschungsförderung. Hamburg: Amt für Schule. *Jäger, D., Faust, V., Blatter, K., Schöppe, D., Artelt, C., Schneider, W. et al. (2012). Kompensatorische Förderung am Beispiel eines vorschulischen Trainings der phonologischen Bewusstheit. Frühe Bildung, 1, 202–209. Jansen, H., Mannhaupt, G., Marx, H. & Skowronek, H. (2002). Bielefelder Screening zur Früherkennung von Lese-Rechtschreibschwierigkeiten (BISC). Göttingen: Hogrefe. Jenkins, J. R. (2002). Early identification and intervention for young children with reading/learning disabilities. In R. Bradley, L. Danielson & D. Hallahan (Eds.), Identification of learning disabilities (pp. 99–149). Hillsdale, NJ: Erlbaum. Klauer, K. J. (2014). Training des induktiven Denkens – Fortschreibung der Metaanalyse von 2008. Zeitschrift für Pädagogische Psychologie, 28, 5–19. Kultusministerkonferenz. (2001). Erste Konsequenzen aus den Ergebnissen der PISA-Studie. Beschluss vom 05./06. Dezember Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
31
2001. Verfügbar unter: http://www.kmk.org/index.php?id= 1032&type=123 [Zugriff 19.11.2014]. *Küspert, P. (1998). Phonologische Bewußtheit und Schriftspracherwerb: Zu den Effekten vorschulischer Förderung der phonologischen Bewußtheit auf den Erwerb des Lesens und Rechtschreibens. Europäische Hochschulschriften, Reihe 6, Psychologie, Band 604. Frankfurt: Peter Lang. Küspert, P., Plume, E. & Schneider, W. (2005). Piff, paff, puff … Trainingsprogramm zur phonologischen Bewusstheit und zur Buchstaben-Laut-Verknüpfung, Schweizer Fassung. Göttingen: Vandenhoeck & Ruprecht. Küspert, P. & Schneider, W. (2006). Hören, lauschen, lernen. Würzburger Trainingsprogramm zur Vorbereitung auf den Erwerb der Schriftsprache (Vol. 1). Göttingen: Vandenhoeck & Ruprecht. Landerl, K., Ramus, F., Moll, K., Lyytinen, H., Leppänen, P. H. T., Lohvansuu K. et al. (2013). Predictors of developmental dyslexia in European orthographies with varying complexity. Journal of Child Psychology and Psychiatry, 54, 686–694. Landerl, K. & Wimmer, H. (2000). Deficits in phoneme segmentation are not the core problem of dyslexia: Evidence from German and English children. Applied Psycholinguistics, 21, 243–262. Limbird, C. K. & Stanat, P. (2006). Prädiktoren von Leseverständnis bei Kindern deutscher und türkischer Herkunftssprache: Ergebnisse einer Längsschnittstudie. In A. Ittel & H. Merkens (Hrsg.), Veränderungsmessung und Längsschnittstudien in der empirischen Erziehungswissenschaft (S. 93–123). Wiesbaden: VS Verlag für Sozialwissenschaften. Lipsey, M. & Wilson, D. (1993). The efficacy of psychological, educational, and behavioral treatment: Confirmation from meta-analysis. American Psychologist, 48, 1181–1209. Lisker, A. (2011). Additive Maßnahmen zur vorschulischen Sprachförderung in den Bundesländern. Expertise im Auftrag des Deutschen Jugendinstituts (DJI). Verfügbar unter: https://www. deutsche-digitale-bibliothek.de/binary/Z6VFVEX35GTE32TQHLLVISYJYCOF2C6K/full/1.pdf [Zugriff 24.05.2015]. Lundberg, I., Frost, J. & Petersen, O. P. (1988). Effects of an extensive program for stimulating phonological awareness in preschool children. Reading Research Quarterly, 23, 263–284. Mann, V. & Wimmer, H. (2002). Phoneme awareness and pathways into literacy: A comparison of German and American children. Reading and Writing: An Interdisciplinary Journal, 15, 653–682. Mannhaupt, G. (2006). MÜT – Münsteraner Trainingsprogramm. Förderung phonologischer Bewusstheit am Schulanfang. Berlin: Cornelsen. *Mannhaupt, G, Hüttinger, K., Schöttler, D. & Völzke, V. (1999). Die motivationale Erweiterung einer lernstrategisch orientierten Intervention im frühen Schriftspracherwerb. Zeitschrift für Pädagogische Psychologie, 13, 50–59. Marín-Martínez, F. & Sánchez-Meca, J. (2010). Weighting by inverse variance or by sample size in random-effects meta-analysis. Educational and Psychological Measurement, 70, 56–73. *Marx, P., Weber, J. & Schneider, W. (2005a). Phonologische Bewusstheit und ihre Förderung bei Kindern mit Störungen der Sprachentwicklung. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 37, 80–90. *Marx, P., Weber, J. & Schneider, W. (2005b). Langfristige Auswirkungen einer Förderung der phonologischen Bewusstheit bei Kindern mit Defiziten in der Sprachentwicklung. Die Sprachheilarbeit, 50, 280–285. Melby-Lervåg, M., Lyster, S. A. H. & Hulme, C. (2012). Phonological skills and their role in learning to read: A meta-analytic review. Psychological Bulletin, 138, 322–352. Metz, D., Fröhlich, L. P. & Petermann, F. (2010). Schulbasierte Förderung der phonologischen Bewusstheit und sprachlicher Kompetenzen: das Lobo-Schulprogramm. Göttingen: Hogrefe. © 2016 Hogrefe
32
*Metz, D., Fröhlich, L. P., Rißling, J.-K. & Petermann, F. (2011). Kurzund Langzeiteffekte einer Förderung der phonologischen Bewusstheit bei Schulanfängern. Zeitschrift für Psychiatrie, Psychologie und Psychotherapie, 59, 65–72. Moll, K., Ramus, F., Bartling, J., Bruder, J., Kunze, S., Neuhoff, N. et al. (2014). Cognitive mechanisms underlying reading and spelling development in five European orthographies. Learning and Instruction, 29, 65–77. Morris, S. B. (2008). Estimating effect sizes from the pretest-posttest-control group designs. Organizational Research Methods, 11, 364–386. Morris, S. B. & DeShon, R. P. (2002). Combining effect size estimates in meta-analysis with repeated measures and independent-groups designs. Psychological Methods, 7, 105–125. National Early Literacy Panel (NELP). (2008). Developing early literacy: Report of the National Early Literacy Panel. Washington, DC: National Institute for Literacy. Neef, M. (2005). Die Graphematik des Deutschen. Tübingen: Max Niemeyer Verlag. *Noack, P. & Brändel, S. (2007). Förderung der phonologischen Bewusstheit bei Kindergartenkindern. Diskurs Kindheits- und Jugendforschung, 3, 311–322. Patel, T. K., Snowling, M. J. & de Jong, P. F. (2004). A cross-linguistic comparison of children learning to read in English and Dutch. Journal of Educational Psychology, 96, 785–797. *Petermann, F., Fröhlich, L. P., Metz, D. & Koglin, U. (2010). Elternbasierte Sprachförderung im Vorschulalter. Das Lobo-Programm. Göttingen: Hogrefe. Pfost, M. (2015). Children’s phonological awareness as a predictor of reading and spelling: A systematic review of longitudinal research in German-speaking countries. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 47, 123–138. Plume, E. & Schneider, W. (2004). Hören, lauschen, lernen 2. Spiele mit Buchstaben und Lauten für Kinder im Vorschulalter. Würzburger Buchstaben-Laut-Training. Göttingen: Vandenhoeck & Ruprecht. *Polotzek, S. (2007). Evaluation eines Trainings im Kindergarten: Langzeiteffekte phonologischer Bewusstheit und Auswirkungen auf den Lese- und Rechtschreiberwerb in der 1. Klasse [Unveröffentlichte Diplomarbeit]. Jena: Friedrich-Schiller-Universität. Pröscholdt, M. V., Michalik, A., Schneider, W., Duzy, D., Glück, D., Souvignier, E. et al. (2013). Effekte kombinierter Förderprogramme der phonologischen Bewusstheit und des Sprachverstehens auf die phonologische Bewusstheit von Kindergartenkindern mit und ohne Migrationshintergrund. Frühe Bildung, 2, 122–132. *Rißling, J. K., Metz, D., Melzer, J. & Petermann, F. (2011). Langzeiteffekte einer kindergartenbasierten Förderung der phonologischen Bewusstheit. Kindheit und Entwicklung, 20, 229–235. *Röhr-Sendlmeier, U. M. & Krag, K. (2007). Laut-Farb-Verknüpfung als Baustein der Frühförderung: eine Längsschnittstudie zur Entwicklung phonologischer Bewusstheit und Buchstabenkenntnis. Zeitschrift für Heilpädagogik, 58, 250–257. Röhr-Sendlmeier, U. & Rauch-Redeker, B. (2009). Frühe phonologische Bewusstheit und der Orthographieerwerb in den ersten Grundschuljahren: Teil III der Längsschnittstudie zur LautFarb-Verknüpfung im Kindergarten. Zeitschrift für Heilpädagogik, 60, 188–196. *Röhr-Sendlmeier, U. M. & Renger, K. (2008). Laut-Farb-Verknüpfung als Frühförderung des Rechtschreiberwerbs: Teil II der Längsschnittstudie bis zum Ende des ersten Schuljahrs. Zeitschrift für Heilpädagogik, 59, 174–182. Roos, J., Polotzek, S. & Schöler, H. (2010). EVAS – Evaluationsstudie zur Sprachförderung von Vorschulkindern: Abschlussbericht. Heidelberg: Pädagogische Hochschule. Roth, E. & Schneider, W. (2001). The effectiveness of kindergarten programs which aim at preventing reading and spelling prob© 2016 Hogrefe
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
lems in school: A comparison of three different approaches. Psychology: The Journal of the Hellenic Psychological Society, 8, 313–329. Roth, E. & Schneider, W. (2002). Langzeiteffekte einer Förderung der phonologischen Bewusstheit und der Buchstabenkenntnis auf den Schriftspracherwerb. Zeitschrift für Pädagogische Psychologie, 16, 99–107. *Rothe, E. (2007). Effekte eines vorschulischen und schulischen Trainings der phonologischen Bewusstheit auf den Schriftspracherwerb in der Schule: Vergleich der Trainingseffekte bei zwei verschiedenen Altersgruppen von Kindergartenkindern. Dissertation. Jena: Friedrich-Schiller-Universität. *Rückert, E. M., Kunze, S. & Schulte-Körne, G. (2010). Lass uns lesen. Ein Eltern-Kind-Training zur Vorbereitung auf den Schriftspracherwerb. Bochum: Winklerverlag. Scarborough, H. S. (1998). Early identification of children at risk for reading disabilities: Phonological awareness and some other promising predictors. In B. K. Shapiro, P. J. Accardo & A. J. Capute (Eds.), Specific reading disability: A view of the spectrum (pp. 75–119). Timonium, MD: York Press. *Schneider, W., Küspert, P., Roth, E., Visé, M. & Marx, H. (1997). Short- and long-term effects of training phonological awareness in kindergarten: Evidence from two German studies. Journal of Experimental Child Psychology, 66, 311–340. Schneider, W. & Näslund, J. C. (1993). The impact of early metalinguistic competencies and memory capacity on reading and spelling in elementary school: Results of the Munich Longitudinal Study on the Genesis of Individual Competencies (LOGIC). European Journal of Psychology of Education, 8, 273–287. Schneider, W., Roth, E. & Ennemoser, M. (2000). Training phonological skills and letter knowledge in children-at-risk for dyslexia: A comparison of three kindergarten intervention programs. Journal of Educational Psychology, 92, 284–295. *Schneider, W., Roth, E., Küspert, P. & Ennemoser, M. (1998). Kurzund langfristige Effekte eines Trainings der sprachlichen (phonologischen) Bewusstheit bei unterschiedlichen Leistungsgruppen: Befunde einer Sekundäranalyse. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 30, 26–39. Schneider, W., Visé, M., Reimers, P. & Blaesser, B. (1994). Auswirkungen eines Trainings der sprachlichen Bewusstheit auf den Schriftspracherwerb in der Schule. Zeitschrift für Pädagogische Psychologie, 8, 177–188. *Schöppe, D., Blatter, K., Faust, V., Jäger, D, Stanat, P., Artelt, C. et al. (2013). Effekte eines Trainings der phonologischen Bewusstheit bei Vorschulkindern mit unterschiedlichem Sprachhintergrund. Zeitschrift für Pädagogische Psychologie, 27, 241–254. Schründer-Lenzen, A. (2007). Schriftspracherwerb und Unterricht. Bausteine professionellen Handlungswissens. Wiesbaden: Verlag für Sozialwissenschaften. Seymour, P. H., Aro, M. & Erskine, J. M. (2003). Foundation literacy acquisition in European orthographies. British Journal of Psychology, 94, 143–174. Skowronek, H. & Marx, H. (1989). The Bielefeld longitudinal study on early identification of risks in learning to write and read: Theoretical background and first results. In M. Brambring, F. Lösel & H. Skowronek (Eds.), Children at risk: Assessment, longitudinal research and intervention (pp. 268–294). New York: DeGruyter. *Stahn, U. (2006). Kompetenzförderung bei Vorschulkindern im sprachlichen und mathematischen Bereich – Evaluation zweier Trainingsprogramme [Unveröffentlichte Diplomarbeit]. Jena: Friedrich-Schiller-Universität. Stamm, M. & Edelmann, D. (2013). Handbuch frühkindliche Bildungsforschung. Wiesbaden: Springer Fachmedien. Sterne, J., Gavaghan, D. & Egger, M. (2000). Publication and related bias in meta-analysis. Journal of Clinical Epidemiology, 53, 1119–1129. Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
K. M. Wolf et al., Metaanalyse Training phonologischer Bewusstheit
Vaessen, A., Bertrand, D., Tóth, D., Csépe, V., Faísca, L., Reis, A. et al. (2010). Cognitive development of fluent word reading does not qualitatively differ between transparent and opaque orthographies. Journal of Educational Psychology, 102, 827–842. Viechtbauer, W. (2005). Bias and efficiency of meta-analytic variance estimators in the random-effects model. Journal of Educational and Behavioral Statistics, 30, 261–293. Viechtbauer, W. (2010). Conducting meta-analyses in R with the metafor package. Journal of Statistical Software, 36, 1–48. Viechtbauer, W. (2014). Package ‘metafor’. Verfügbar unter: http:// cran.r-project.org/web/packages/metafor/metafor.pdf [Zugriff am 03.10.2014]. Weber, J., Marx, P. & Schneider, W. (2007). Die Prävention von LeseRechtschreibschwierigkeiten bei Kindern mit nichtdeutscher Herkunftssprache durch ein Training der phonologischen Bewusstheit. Zeitschrift für Pädagogische Psychologie, 21, 65–75. Wicherts, J. M. & Bakker, M. (2012). Publish (your data) or (let the data) perish! Why not publish your data too? Intelligence, 40, 73–76. Wicherts, J. M., Borsboom, D., Kats, J. & Molenaar, D. (2006). The poor availability of psychological research data for reanalysis. American Psychologist, 61, 726–728 *Wimmer, H. & Hartl, M. (1991). Erprobung einer phonologisch, multisensorischen Förderung bei jungen Schülern mit LeseRechtschreibschwierigkeiten. Heilpädagogische Forschung, 17, 74–79.
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 9–33
33
Wolf, K. M., Felbrich, A., Stanat, P. & Wendt, W. (2011). Evaluation der kompensatorischen Sprachförderung in Brandenburger Kindertagesstätten. Empirische Pädagogik, 25, 423–438. Ziegler, J. C., Bertrand, D., Tóth, D., Csépe, V., Reis, A., Faísca, L. et al. (2010). Orthographic depth and its impact on universal predictors of reading a cross-language investigation. Psychological Science, 21, 551–559. Ziegler, J. C. & Goswami, U. (2005). Reading acquisition, developmental dyslexia, and skilled reading across languages: A psycholinguistic grain size theory. Psychological Bulletin, 131, 3–29.
Manuskript eingereicht: 16.12.2014 Nach Revision angenommen: 25.9.2015 Interessenskonflikt: Nein
Katrin M. Wolf Rambøll Management Consulting GmbH Saarbrücker Straße 20/21 10405 Berlin Deutschland katrin.wolf@ramboll.com
© 2016 Hogrefe
M-KIT Modularer Kurzintelligenztest M. Dantlgraber ŋ (UIDVVXQJ GHU *UXQGLQWHOOLJHQ] I¾U DQVSUXFKV YROOH 6WXGLHQ XQG %HUXIVOHKUJ¦QJH ŋ 0RGXODU HLQVHW]EDU Ł UHLQH 7HVW]HLW MH QDFK 0RGXO DE 0LQXWHQ ŋ 0RGHUQVWHV 2QOLQH 7HVWHQ PLW +76 ŋ *XW YHUVW¦QGOLFKH (UJHEQLVEHULFKWH ŋ EHUGXUFKVFKQLWWOLFKH =XVDPPHQK¦QJH LQ GHU 3UD[LV PLW 6FKXO XQG $ELWXUQRWHQ VRZLH /HLVWXQJVEHXUWHLOXQJHQ GXUFK 9RUJHVHW]WH Der Modulare Kurzintelligenztest (M-KIT) ist ein ökonomisches, (gender-) faires, universell und flexibel anwendbares Verfahren zur Erfassung fluider Intelligenz, das durch hohe Validität und hohe Akzeptanzratings besticht. Intelligenz wird dabei weitgehend unabhängig von Faktoren wie erworbenem Schulwissen, spezifischen Berufskenntnissen und ähnlichem erfasst. Test komplett bestehend aus: Manual, Aufgabenheften 1 – 6 (Wortfolgen, Bildteile, Zahlenvergleiche, Kurztexte, Kartenstapel, Ungleichungen), je 5 Antwortbogen 1 – 6 (Wortfolgen, Bildteile, Zahlenvergleiche, Kurztexte, Kartenstapel, Ungleichungen), 5 Auswertebogen, 5 Präsentiermappen, Auswerteschablonen 1 – 3 (Wortfolgen & Kurztexte / Bildteile & Kartenstapel / Zahlenvergleiche & Ungleichungen), Gesamtübersicht und Box Bestellnummer 03 202 01 € 244.00 / CHF 281.00
Der M-KIT ist so konzipiert, dass er in fünf eigenständigen Modulen eingesetzt werden kann. Hierfür wurden sechs neuartige Aufgabenformate entwickelt; zwei verbal (Modul V, verbal), zwei figural-bildhaft (Modul F, figural-bildhaft) und zwei numerisch (Modul N, numerisch) geprägte. Von diesen betont jeweils ein Aufgabenformat die fluid-schlussfolgernde Kernkomponente stärker (Modul K, kernfokussiert) und eines den verbalen, figural-bildhaften bzw. numerischen Aspekt (Modul A, ausbalanciert). Werden alle Aufgabenformate eingesetzt, lässt sich zusätzlich ein Gesamttestergebnis ableiten.
M-KIT HTS 5 Diese Version benötigt Administrationssoftware bzw. eine Jahreslizenz für das Hogrefe TestSystem (HTS). Für alle Informationen zu HTS und zur detaillierten Produktepalette M-KIT HTS 5 wenden Sie sich bitte an Ihre Testzentrale.
Hogrefe Verlag GmbH & Co. KG Testzentrale Tel. +49 551 999 50 99-9 / Fax -8 testzentrale@hogrefe.de www.testzentrale.de
Testzentrale der Schweizer Psychologen AG Tel. +41 31 300 45-45 / Fax -90 testzentrale@hogrefe.ch www.testzentrale.ch
Originalartikel
Erstes Vorlesen: Der frühe Vogel fängt den Wurm Frank Niklas1,2, Caroline Cohrssen2, Collette Tayler2 und Wolfgang Schneider1 1 2
Lehrstuhl für Psychologie IV, Universität Würzburg Melbourne Graduate School of Education, University of Melbourne
Zusammenfassung: Da Vorlesen die Vorläuferfertigkeiten des Schriftspracherwerbs von Kindern stärkt, wird ein früher Beginn des Vorlesens als wichtig angesehen. Allerdings fehlen bislang Studien, die sich damit auseinandersetzen, ob der Vorlesebeginn ein spezifischer Prädiktor für sprachliche Fähigkeiten unter Kontrolle von Hintergrundvariablen ist. Wir untersuchten diese Fragestellung anhand einer deutschen Vorschulstichprobe (N = 746) kurz vor der Einschulung und verglichen die Ergebnisse mit Befunden einer aktuellen australischen Studie. Neben Vorlesebeginn und aktuellem Vorleseverhalten, erfasst im Elternbericht, wurden Alter und Geschlecht der Kinder, Migrationshintergrund und sozioökonomischer Status sowie sprachliche und andere kognitive Fähigkeiten berücksichtigt. Wie schon in der australischen Stichprobe zeigte sich auch für die deutsche Stichprobe, dass ein früher Vorlesebeginn die spätere Vorlesehäufigkeit sowie sprachliche Fähigkeiten im Vorschulalter unter Berücksichtigung von Kontrollvariablen vorhersagte, während dies für andere kognitive Fähigkeiten nur bedingt zutraf. Die Ergebnisse deuten an, dass der Vorlesestart ein guter Indikator für die schriftsprachliche Lernumwelt und ein spezifischer Prädiktor für schriftsprachliche Vorläuferfertigkeiten zu sein scheint. Schlüsselwörter: erstes Vorlesen, Home Literacy Environment (HLE), Vorläuferfertigkeiten des Schriftspracherwerbs, deutsch-australischer Vergleich, Vorschulkinder
Early Reading to Children: The Early Bird Catches the Worm Abstract: Primary caregivers are often encouraged to read to their children from a very young age as we know that reading to children plays a very important role in their literacy development. However, little is known about whether the onset of reading to a child is a specific predictor of language abilities when controlling for child and family characteristics. Literacy skills and other cognitive abilities of 746 German children were assessed shortly before school entry and results were compared to those of a recent Australian study. Parents were asked how old their children were when they were first read to and how often they currently read to their children. In both countries, the age at which children were first read to was closely associated with the frequency with which children were read to as pre-schoolers and with their literacy abilities. It was less closely associated with other cognitive competencies. The findings imply that reading books to infants early may contribute meaningfully to a favourable home literacy environment and support children's literacy development. Keywords: onset of reading to a child, Home Literacy Environment (HLE), precursors of literacy competencies, German-Australian comparison, pre-school children
Theoretischer Hintergrund Kinder erwerben erste Vorläuferfertigkeiten des Schriftsprachwerbs nicht erst beim Eintritt in die Schule. Stattdessen fängt der Erwerb dieser Kompetenzen schon lange vor einer formalen Beschulung an und Kinder verarbeiten sprachliche Reize bereits vorgeburtlich (z. B. Partanen, Kujala, Näätänen, Liitola, Sambeth & Huotilainen, 2013). Vor der Einschulung spielt insbesondere die familiäre Lernumwelt eine große Rolle für die kindliche Entwicklung (Niklas, 2015). Kinder, denen häufiger vorgelesen wird und deren Eltern selbst häufiger lesen, die häufiger Bibliotheken besuchen und die in Haushalten mit einer größeren Anzahl an Büchern und Kinderbüchern leben, weisen einen größeren Wortschatz und eine bessere phonologiZeitschrift für Pädagogische Psychologie (2016), 30(1), 35–44 DOI 10.1024/1010-0652/a000166
sche Bewusstheit im Vorschulalter auf, selbst wenn familiäre Hintergrundvariablen wie der sozioökonomische Status und ein möglicher Migrationshintergrund kontrolliert werden (Niklas, Möllers & Schneider, 2013). All diese Aspekte innerhalb der Familie, die die schriftsprachliche Entwicklung von Kindern fördern, werden unter dem Begriff «Home Literacy Environment» (HLE) zusammengefasst (Niklas, 2015; Niklas & Schneider, 2010). Zahlreiche deutsche und internationale Studien belegen, dass die HLE ein wichtiger Kontext ist, in dem Kinder diejenigen Schriftsprachkompetenzen erwerben, die es ihnen später ermöglichen, erfolgreich am von der Schriftsprache geprägten Alltag teilzunehmen und gute schulische Leistungen zu erzielen (z. B. Aikens & Barbarin, 2008; McElvany, Becker & Lüdtke, 2009; Niklas & Schnei© 2016 Hogrefe
36
der, 2013; Sénéchal & LeFevre, 2002). Ein zentrales Element der HLE ist dabei das Vorlesen (Bus, van IJzendoorn & Pellegrini, 1995; Mol, Bus, de Jong & Smeets, 2008; Raikes et al., 2006). Während schon viele Studien den Zusammenhang zwischen dem Vorlesen im Vorschulalter und späteren schriftsprachlichen Kompetenzen untersuchten, weiß man bisher wenig darüber, ob der Vorlesebeginn das spätere Vorleseverhalten innerhalb der Familie und kindliche Sprachkompetenzen vorhersagen kann. Die vorliegende Arbeit untersuchte diese Fragestellung anhand von Analysen an einer größeren deutschen Stichprobe und setzt die Befunde in Bezug zu einer aktuellen Studie aus Australien (Niklas, Cohrssen & Tayler, 2015).
Frühe schriftsprachliche Vorläuferfertigkeiten und andere kognitive Kompetenzen Die Fähigkeit, lesen und schreiben zu können und den Inhalt eines Textes zu verstehen, ist die Grundlage für schulischen Erfolg, und Erwachsene, die bessere schriftsprachliche Kompetenzen aufweisen, verdienen häufiger mehr Geld, haben bessere Berufsaussichten und erfreuen sich besserer Gesundheit (Fawcett, 2003; Lyon, 2002). Kinder, die vor der Einschulung einen größeren Wortschatz und eine bessere phonologische Bewusstheit (PB) aufweisen, sind später sowohl im englischen als auch im deutschen Sprachkontext häufig besser im Lesen und Rechtschreiben (Ennemoser, Marx, Weber & Schneider, 2012; Näslund & Schneider, 1996; Schatschneider, Fletcher, Francis, Carlson & Foorman, 2004; Torgesen, 2002). Unter der PB versteht man dabei die Fähigkeit, die Lautsprache zu begreifen und manipulieren zu können. Typische Aufgaben, die die PB erfassen, sind Reimaufgaben oder Aufgaben zur Lautstruktur eines Wortes (Schneider & Marx, 2008). Wortschatz und PB hängen eng zusammen, und beide Kompetenzen stellen wichtige Aspekte des frühen kindlichen Schriftspracherwerbs dar (Whitehurst & Lonigan, 1998). Die sprachlichen und schriftsprachlichen Erfahrungen von Kindern innerhalb der ersten Lebensjahre bilden die Grundlage für spätere schriftsprachliche Kompetenzen. Passives Zuhören und nonverbale Kommunikation sind der erste Schritt eines Kindes auf dem Weg zum aktiven Sprechen, und die Fähigkeit, gesprochene Sprache zu segmentieren, ist ein bedeutsamer Prädiktor späterer sprachlicher Kompetenzen (Newman, Ratner, Jusczyk, Jusczyk & Dow, 2006). Je älter Kinder werden, desto wichtiger wird dann das Sprach- und später auch das Leseverständnis (Ennemoser et al., 2012; Flax, Realpe-Bonilla, Roesler, Choudhury & Benasich, 2009). Neben Vorläuferfertigkeiten des Schriftspracherwerbs erwiesen sich aber auch andere kindliche kognitive Fähig© 2016 Hogrefe
F. Niklas et al., Erstes Vorlesen: Der frühe Vogel fängt den Wurm
keiten als bedeutsame Prädiktoren für spätere schulische Leistungen. In einer umfassenden Metaanalyse von Duncan und Kollegen (2007) zeigte sich unter anderem die Bedeutung der Konzentrationsfähigkeit und insbesondere der frühen mathematischen Fähigkeiten. Bei diesen mathematischen Vorläuferfertigkeiten, die spätere mathematische Kompetenzen, aber auch ganz allgemein schulische Leistungen gut vorhersagen können, handelt es sich um erste Zähl- und Rechenfähigkeiten, das Anzahlkonzept oder auch die Fähigkeit, Mengen und Zahlen miteinander in Verbindung zu setzen (Krajewski & Schneider, 2009). Zusätzlich zu den spezifischen schriftsprachlichen und mathematischen Vorläuferfertigkeiten erwiesen sich frühe Abschätzungen der Intelligenz nicht nur als gute Prädiktoren späterer Intelligenzmessungen, sondern auch für den langfristigen Bildungserfolg als relevant (Schmiedeler, Niklas & Schneider, 2014; Schneider, Stefanek & Niklas, 2009).
Die familiäre Lernumwelt und Vorlesen Kinder wachsen im Kontext komplexer soziokultureller Umwelten auf (Bronfenbrenner, 1979). Hierbei üben distale Elemente wie beispielsweise die erweiterte Familie, die Nachbarschaft oder die Gesellschaft zwar Einfluss auf die kindliche Entwicklung aus, aber proximale Faktoren wie die unmittelbare Familie sind bedeutsamer. Gleiches gilt für eher distale familiäre Hintergrundvariablen gegenüber proximalen Familiencharakteristiken. So geht ein hoher sozioökonomischer Status (SÖS), der sich über höheres Einkommen, höheren Bildungsgrad oder das Prestige der ausgeübten Berufe messen lässt, durchaus mit einer positiveren kindlichen Entwicklung einher (vgl. Bradley & Corwyn, 2002). Genauso weisen Kinder mit gegenüber Kindern ohne Migrationshintergrund schon früh geringere sprachliche und mathematische Kompetenzen auf (z. B. Niklas, Schmiedeler, Pröstler & Schneider, 2011; Niklas, Segerer, Schmiedeler & Schneider, 2012). Allerdings bleibt dieser Einfluss hinter demjenigen zurück, den Eltern durch förderliche Aktivitäten in der familiären Lernumwelt mit ihren Kindern ausüben (Niklas, 2015). Sowohl im englischsprachigen als auch deutschen Kontext erwies sich die HLE als Mediator zwischen familiären Hintergrundvariablen und frühen kindlichen Kompetenzen (Aikens & Barbarin, 2008; Niklas et al., 2013). Ein zentrales Element der HLE ist dabei das Vorlesen. Kinder, denen häufiger und in besserer Qualität vorgelesen wurde, wiesen später einen größeren Wortschatz auf (Bus et al., 1995; Mol et al., 2008). Eine bessere Vorlesequalität zeigt sich beim sogenannten dialogischen Vorlesen, bei dem Kinder aktiv in den Vorleseprozess eingebunden werden, indem ihnen z. B. Fragen zur Geschichte Zeitschrift für Pädagogische Psychologie (2016), 30(1), 35–44
F. Niklas et al., Erstes Vorlesen: Der frühe Vogel fängt den Wurm
gestellt werden oder Bezug zu ihrem Alltag hergestellt wird (vgl. Cohrssen, Niklas & Tayler, in Druck). Der Zusammenhang zwischen Vorlesen und Vorläuferfertigkeiten des Schriftspracherwerbs zeigte sich dabei sowohl in Querschnitt als auch in Interventionsstudien (z. B. Niklas & Schneider, 2015; Prevoo et al., 2014), wobei Niklas und Schneider eine mittlere Effektstärke für ihre Vorleseintervention auf den kindlichen Wortschatz berichteten. Die positive Wirkung des Vorlesens ist unter anderem darauf zurückzuführen, dass Bücher im Gegensatz zur Alltagssprache üblicherweise komplexere Worte enthalten (Sénéchal, LeFevre, Hudson & Lawson, 1996). Neben der Häufigkeit und der Qualität des Vorlesens nehmen aber auch weitere Aspekte der Vorlesesituation Einfluss auf die kindliche Entwicklung. So spielt u. a. die Qualität des Vorlesebuchs (Kucirkova, Messer & Whitelock, 2012), das aktuelle Alter des Kindes (Mol et al., 2008) und das Alter des Kindes beim ersten Vorlesen (DeBaryshe, 1993; Burgess, 1997; Payne, Whitehurst & Angell, 1994) eine Rolle.
Erstes Vorlesen Eltern, die ihren Kindern häufiger und länger vorlesen, haben zumeist auch früher damit angefangen, ihren Kindern erstmals vorzulesen (vgl. DeBaryshe, 1993; Burgess, 1997). Das Alter des Kindes beim ersten Vorlesen könnte somit einen wichtigen Aspekt der HLE darstellen. So erwies sich in der Studie von DeBaryshe (1993) das Alter des ersten Vorlesens auch als guter Prädiktor sprachlicher Fähigkeiten von Zweijährigen (mittlere Effektstärken). Allerdings wurden in dieser Studie keine familiären Kontrollvariablen und nur sehr junge Kinder berücksichtigt. Gleiches gilt auch für die Studie von Payne und Kollegen (1994), wobei hier Vierjährige im Kontext des amerikanischen Head Start Programms untersucht und kleine Effektstärken für den Zusammenhang sprachlicher Fähigkeiten mit dem Beginn des Vorlesens gefunden wurden. Burgess (1997) wiederum berichtete signifikante Zusammenhänge (mittlere Effekte) zwischen dem Vorlesestart, kindlichen sprachlichen Fähigkeiten und der durchschnittlichen Länge einer Vorlesesitzung zwischen Eltern und Kind. Dabei gingen bessere sprachliche Fähigkeiten und längere Vorlesezeiten mit einem früheren ersten Vorlesen einher. In einer im Jahr 2014 durchgeführten australischen Studie wurde der Vorlesestart detaillierter und unter Berücksichtigung familiärer und kindlicher Hintergrundvariablen untersucht (Niklas et al., 2015). Von 104 Kindern im Alter von fünf Jahren wurden zwei Monate vor ihrer Einschulung verschiedene kognitive Fähigkeiten erhoben und gleichzeitig ihre Eltern hinsichtlich der aktuellen Vorlesehäufigkeit und dem exakten Alter des Kindes beim ersten Zeitschrift für Pädagogische Psychologie (2016), 30(1), 35–44
37
Vorlesen in Jahren und Monaten befragt. Kindern, denen früher erstmals vorgelesen wurde, wurde auch im Vorschulalter häufiger vorgelesen (großer Effekt); sie kamen eher aus Familien mit höherem SÖS und englischer Familiensprache (mittlerer Effekt) und wiesen bessere sprachliche Fähigkeiten auf (mittlerer Effekt). Diese Zusammenhänge zeigten sich auch in Regressionsanalysen unter Berücksichtigung der kindlichen und familiären Kontrollvariablen.
Untersuchte Fragestellungen Obwohl zahlreiche Studien die besondere Bedeutung der HLE für die frühe Entwicklung von Vorläuferfertigkeiten des Schriftspracherwerbs herausgestellt haben (Aikens & Barbarin, 2008; Niklas & Schneider, 2013; Sénéchal & Young, 2008), gibt es nur wenige und zumeist ältere Befunde darüber, welche Rolle das Kindesalter beim ersten Vorlesen spielt. Die vorhandenen Studien waren zudem meist nicht repräsentativ, da sie mit verhältnismäßig kleinen Stichprobe mit hohem SÖS durchgeführt wurden (Niklas et al., 2015; DeBaryshe, 1993; Burgess, 1997). Sie berücksichtigten weiterhin keine Kontrollvariablen (DeBaryshe, 1993; Burgess, 1997; Payne et al., 1994) und bezogen sich allesamt auf den englischsprachigen Raum. Die Frage, ob das Alter, in dem Kindern erstmals vorgelesen wurde, einen spezifischen Prädiktor vorschulischer sprachlicher Kompetenzen unter Berücksichtigung von Kontrollvariablen auch für eine größere deutsche Stichprobe mit niedrigem bis mittlerem SÖS darstellt, ist bislang unklar. Die vorliegende Arbeit untersuchte diese Fragestellung anhand einer großen deutschen Vorschulstichprobe. Wir vermuteten, dass der Vorlesebeginn sehr eng mit der späteren Vorlesehäufigkeit im Vorschulalter sowie eng mit dem familiären Hintergrund und den sprachlichen Kompetenzen der Kinder zusammenhängt. Weiterhin erwarteten wir, dass der Vorlesebeginn signifikant mit anderen kognitiven Fähigkeiten assoziiert ist (vgl. Niklas, 2015), jedoch unter Berücksichtigung von kindlichen und familiären Kontrollvariablen nur die sprachlichen Fähigkeiten vorhersagen sollte. Da sich die aktuelle australische Studie (Niklas et al., 2015) der gleichen Fragestellung widmete, wurde auch ein Vergleich der Ergebnisse beider Studien vorgenommen. Wir vermuteten, dass die Zusammenhänge in der deutschen Studie ähnlich wie diejenigen im australischen Kontext ausfallen sollten, da aktuelle Ergebnisse darauf hinweisen, dass förderliche Aktivitäten innerhalb der HLE in beiden Kontexten ähnlich häufig durchgeführt werden und die HLE eine vergleichbare Rolle in der kindlichen Entwicklung spielt (Niklas, Tayler & Schneider, 2015). © 2016 Hogrefe
38
Methode Stichprobenbeschreibung Die Untersuchungen fanden im Rahmen der vom Ministerium für Kultus, Jugend und Sport Baden-Württemberg geförderten wissenschaftlichen Begleitung des Projekts «Schulreifes Kind» statt (Hasselhorn et al., 2012)1. Die für die vorliegende Arbeit relevante Erhebung wurde im Sommer 2009 durchgeführt, bei der der Entwicklungsstand der Kinder kurz vor Schulbeginn festgestellt wurde. Von den insgesamt N = 921 am Projekt «Schulreifes Kind» teilnehmenden Kindern konnten zu diesem dritten Messzeitpunkt noch N = 746 Kinder (46.3 % Mädchen, 53.7 % Jungen) untersucht werden, die – verteilt in ganz BadenWürttemberg – insgesamt 63 Kindergärten besuchten und bei denen die Eltern ihr Einverständnis erteilt hatten. Die reduzierte Stichprobe ergab sich durch den Wegzug vieler Kinder in den anderthalb Jahren vor der dritten Erhebung sowie durch Erkrankungen und Urlaube während des Untersuchungszeitraums. Die ausgefallenen Kinder unterschieden sich dabei jedoch weder in ihren Testleistungen noch hinsichtlich ihres familiären Hintergrunds von den kurz vor der Einschulung untersuchten Kindern signifikant (t-Tests; jeweils p > .05). Der überwiegende Teil der untersuchten Kinder besuchte Kindergärten, die in städtischem Gebiet lagen (über 75 %). Zum Erhebungszeitpunkt waren die Kinder zwischen 60 und 93 Monate alt. Diese große Altersspanne ergab sich durch einige jüngere Kinder, die vom Alter her nicht zur eigentlichen Vorschulstichprobe gehörten, aber als Kannkinder ebenfalls untersucht wurden (9.4 % der Stichprobe), und durch vereinzelte Kinder, die trotz höherem Alter noch den Kindergarten anstatt einer Schule oder einer spezifischen schulvorbereitenden Einrichtung besuchten (3.4 % der Stichprobe). Das Altersmittel der Gesamtstichprobe betrug M = 73.7 Monate (SD = 4.5). Dementsprechend waren die Kinder zum Zeitpunkt der Erhebung im Mittel ein Jahr älter als die australische Vergleichsstichprobe (M = 61.7 Monate; SD = 4.0), da in Australien die Einschulung ein Jahr früher erfolgt. Trotz des Altersunterschieds zwischen der deutschen und australischen Stichprobe wurde dieser Vergleich gewählt, da im Jahr vor der Einschulung der Einfluss der HLE sehr groß ist, und da von einer unterschiedlichen Bedeutsamkeit der HLE vor und nach der Einschulung auszugehen ist (vgl. Sénéchal & LeFevre, 2002).
1
F. Niklas et al., Erstes Vorlesen: Der frühe Vogel fängt den Wurm
In der deutschen Stichprobe war in 47.7 % der Fälle entweder das Kind selbst oder mindestens ein Elternteil im Ausland geboren, weshalb ein Migrationshintergrund vorlag. Die Erhebungen wurden von geschulten Mitarbeitern durchgeführt und fanden in den Kindergärten und Kindertagesstätten an zwei verschiedenen Tagen für jeweils etwa 30 Minuten pro Kind statt. Zusätzlich wurden die Eltern gebeten, Fragebögen zum familiären Hintergrund und zum Vorlesen auszufüllen.
Erhebungsinstrumente Zur Erfassung der phonologischen Bewusstheit wurde auf eine deutsche Version der klassischen Reimkategorisierungsaufgabe von Bradley und Bryant (1985) zurückgegriffen. Die Kinder mussten hier z. B. entscheiden, welches der vier Worte «Saum, Baum, Laut, Raum» anders als der Rest klingt und sich folglich nicht reimt. Alle Aufgaben wurden standardisiert von einer CD vorgegeben. Zur Feststellung der Sprachentwicklung wurden die ersten 35 Items des Aktiven Wortschatztests für 3- bis 5-jährige Kinder – Revision (AWST-R; Kiese-Himmel, 2005) verwendet, bei dem Bildkärtchen benannt werden mussten. Dieser Test weist zufriedenstellende bis gute Testgütekriterien auf (Weinert, Doil & Frevert, 2008). Die Columbia Mental Maturity Scale (CMM), die der «Basisdiagnostik Umschriebener Entwicklungsstörungen im Vorschulalter» (BUEVA; Esser, 2002) entstammt, wurde zur Abschätzung der Intelligenz durchgeführt. Die Kinder sollten aus vorgegebenen Zeichnungen (z. B. mehrere Gabeln) diejenige identifizieren, die nicht zu den übrigen passte (z. B. Löffel). Nach Esser (2002) sind die Trennschärfen der Items genügend hoch, die Reliabilität ist als gut einzustufen und die prognostische Validität hinsichtlich der Schulleistungen gewährleistet. Die Konzentration wurde über den Frankfurter Test für Fünfjährige – Konzentration (FTF-K) erhoben, der wie die CMM der BUEVA (Esser, 2002) entnommen wurde. Hierbei wurden die Kinder gebeten, innerhalb von 90 Sekunden so schnell wie möglich alle Birnen in einer gezeichneten Menge von Äpfeln und Birnen durchzustreichen. Mit dem FTF-K kann die kurzfristige Konzentrationsleistung hinreichend genau erfasst werden (Esser, 2002). Zur Erfassung mathematischer Kompetenzen wurde ein Verfahren eingesetzt, das sich stark an den von Krajewski eingesetzten vorschulischen Aufgaben orientierte (z. B.
Wir danken dem Ministerium für Kultus, Jugend und Sport Baden-Württemberg für die Förderung der Untersuchung sowie allen beteiligten Untersuchungsleitern, den Kindern, Eltern, Erzieherinnen und Lehrerinnen für ihre engagierte Mitarbeit. Insbesondere gilt unser Dank unseren Kooperationspartnern bei der wissenschaftlichen Begleitung des Projekts «Schulreifes Kind» in Würzburg (Sandra Schmiedeler, Robin Segerer), Heidelberg (Eva Biermeyer, Isabelle Keppler, Miriam Johnson, Hermann Schöler) und Frankfurt (Jan-Henning Ehm, Katja Krebs, Hanna Wagner, Marcus Hasselhorn), ohne deren Beiträge zur Konzeption, Planung und Realisierung der Studie dieser Beitrag nicht hätte entstehen können.
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 35–44
F. Niklas et al., Erstes Vorlesen: Der frühe Vogel fängt den Wurm
Krajewski & Schneider, 2009). In sechs Subtests wurden dabei Zählfertigkeiten, basale Rechenfertigkeiten, Ziffernkenntnis, Anzahlkonzept, Anzahlseriation sowie Mengen schätzen und vergleichen untersucht, wobei insgesamt maximal 30 Punkte zu erreichen waren. Die interne Konsistenz (Cronbachs α) des vollständigen Tests auf Basis der sechs Subtests lag bei ausreichenden .76. Bei der Erfassung der Konzentrationsfähigkeit und insbesondere des Wortschatzes und der mathematischen Kompetenzen traten Deckeneffekte auf. So erzielten hier 7.8 % bzw. jeweils 13 % der untersuchten Kinder die Höchstpunktzahlen, was zu einer gewissen Varianzeinschränkung führte. Dieser Umstand muss bei der Ergebnisinterpretation berücksichtigt werden.
Fragebogendaten Über Elternfragebögen wurden Informationen über den SÖS und das Vorleseverhalten erfasst. Der SÖS wurde über das Prestige der ausgeführten Berufe der Eltern ermittelt (vgl. Wegener, 1988). Die Skalenwerte reichten von 20 bis 186.8. So erhält beispielsweise eine Hebamme den Wert 69.6 und Ärzte den Maximalwert. Diese Spannweite wurde auch in den beiden vorliegenden Stichproben erreicht. Es konnten die Berufe aus N = 683 Haushalten erfragt werden. Für die weiteren Auswertungen wurde dann jeweils der höchste Prestigewert in der Familie berücksichtigt, wobei der mittlere höchste Prestigewert bei M = 76.16 (SD = 36.74) lag (im Vergleich zu M = 99.71; SD = 33.53 für die australische Stichprobe). Die SÖS-Unterschiede ergaben sich aus der Rekrutierung der Stichproben, wobei in der deutschen Stichprobe viele Kinder aus Brennpunkt-Kindergärten mit hohem Migrantenanteil und niedrigem SÖS rekrutiert wurden. Der durchschnittliche SÖS der australischen Stichprobe fiel zwar relativ hoch aus, war aber durchaus vergleichbar mit deutschen Stichproben aus Universitätsstädten (vgl. z. B. Niklas & Schneider, 2015). In der deutschen Stichprobe wurde der Vorlesebeginn mittels des Items «In welchem Alter war Ihr Kind, als Sie ihm das erste Mal vorgelesen haben?» erfasst (N = 675). Die Antwortmöglichkeiten reichten von 4 = «es wurde nicht vorgelesen», über 3 = «4–5 Jahre» bis hin zu «jünger als 2 Jahre» (0). Knapp drei Viertel der Eltern gaben an, ihrem Kind vor dem Alter von zwei Jahren vorgelesen zu haben. Weitere 16.7 % berichteten zwischen dem Alter von zwei bis drei Jahren erstmals vorgelesen zu haben und nur N = 6 Eltern hatten ihren Kindern nie vorgelesen. Außerdem wurden die Eltern zu ihrem aktuellen Vorleseverhalten befragt (N = 675). Die Antwortmöglichkeiten reichten von 4 = «mehrmals wöchentlich», über 3 = «wöchentlich», 2 = «einmal im Monat» und 1 = «seltener» Zeitschrift für Pädagogische Psychologie (2016), 30(1), 35–44
39
zu 0 = «nie». Etwas mehr als 70 % der Eltern gaben an, ihrem Kind mehrmals wöchentlich vorzulesen und weitere 15.7 % berichteten, zumindest wöchentlich vorzulesen. Die Informationen zum ersten Vorlesen wurden somit nur retrospektiv und per Elternfragebogen erfasst. Es ist nicht auszuschließen, dass manche Eltern sozial erwünschte Antworten gaben und dass der genaue Vorlesestart nicht mehr exakt erinnert wurde. Andererseits erwiesen sich Elternbefragungen im Kontext der Forschung zu HLE als reliabel, und Fragebogenerfassungen führten zu vergleichbaren Ergebnissen wie beispielsweise Tagebucheinträge (vgl. Burgess, 2002). Darüber hinaus sollte die Einordnung des Vorlesestarts in die vorgegebenen, relativ groben Kategorien den Eltern eher leicht gefallen sein. Trotzdem können Fehlangaben nicht ausgeschlossen werden und folglich müssen die Daten vorsichtig interpretiert werden. Detailliertere Informationen zur australischen Vergleichsstichprobe sowie zu den verwendeten Verfahren und den erhobenen Fragebogendaten finden sich bei Niklas und Kollegen (2015). Grundsätzlich ist für die durchgeführten Vergleiche zu beachten, dass diese aufgrund der Unterschiede in den Stichprobencharakteristika sowie aufgrund unterschiedlicher Erfassung der kindlichen Kompetenzen nur als explorativ einzuordnen sind.
Statistische Auswertungen Aufgrund von unvollständigem Rücklauf lagen nicht alle Elternfragebogendaten vor. Zusätzlich fehlten bei einigen Kindern einzelne Testwerte wegen krankheits- oder urlaubsbedingtem Ausfall an einem der zwei Untersuchungstage (Stichprobengröße deutsche Originalstichprobe in Tab. 1). Um diesem Problem zu begegnen, wurden vor den Analysen multiple Datenimputationen für die fehlenden Werte (bis max. 9.5 % der Daten bei einzelnen Variablen) vorgenommen. Bei diesem Vorgehen werden die fehlenden Daten einer Stichprobe mehrfach imputiert und somit mehrere vollständige Datensätze kreiert, wobei die anschließenden Berechnungen zur Hypothesenüberprüfung getrennt für alle Datensätze durchgeführt und die Ergebnisse unter Berücksichtigung aller Varianzquellen gemittelt werden (für genauere Informationen siehe Graham, 2009; Lüdtke, Robitzsch, Trautwein & Köller, 2007). Zunächst werden die deskriptiven Statistiken und Korrelationen zwischen allen Studienvariablen (Rohwerte) berichtet und den entsprechenden Kennwerten der australischen Stichprobe gegenübergestellt. In einem nächsten Schritt wurden lineare Regressionen durchgeführt. Hierbei wurden jeweils die aktuelle Vorlesehäufigkeit, PB, Wortschatz, Intelligenz, Konzentration und mathemati© 2016 Hogrefe
40
F. Niklas et al., Erstes Vorlesen: Der frühe Vogel fängt den Wurm
sche Fähigkeiten in einem ersten Modell durch Alter, Geschlecht, Migrationshintergrund und SÖS vorhergesagt, bevor in einem zweiten Modell das Alter beim ersten Vorlesen aufgenommen wurde. Berichtet werden für alle Regressionen die aufgeklärte Varianz durch alle Variablen R2 und der dabei nur durch das erste Vorlesen zusätzlich aufgeklärte Anteil an Varianz ΔR2. Die Befunde wurden erneut den Ergebnissen gleicher Analysen mit der australischen Stichprobe gegenübergestellt. Aufgrund der großen Stichprobengrößenunterschiede wurde für die deutsche Stichprobe jeweils das Signifikanzniveau p < .001 und für die kleinere australische Stichprobe das Signifikanzniveau p < .05 herangezogen. Da sich die deutschen Kinder auf insgesamt 63 Kindergärten verteilten, wurden die Ergebnisse zudem hinsichtlich ihrer Gültigkeit unter Berücksichtigung der Mehrebenenstruktur überprüft. Hierzu werden einerseits die Intraklassenkorrelationen (Intraclass Correlation Coefficients, ICCs) der abhängigen Variablen zusammen mit den deskriptiven Statistiken berichtet (vgl. Muthén & Satorra, 1995) und andererseits die Ergebnisveränderungen in den Korrelations- und Regressionsanalysen unter Berücksichtigung der hierarchischen
Datenstruktur durch clusterweise z-Standardisierung und hierarchical linear modeling (HLM) diskutiert.
Ergebnisse Tabelle 1 zeigt die Korrelationen und deskriptiven Statistiken für alle Studienvariablen. Hierbei befinden sich die Korrelationen für die australische Vergleichsstichprobe oberhalb und die für die deutsche Stichprobe unterhalb der Diagonalen; die australischen Kennwerte sind rechts, die deutschen Kennwerte unterhalb der Korrelationen aufgeführt. In beiden Stichproben korrelierten die kindlichen Fähigkeiten statistisch bedeutsam miteinander. In der deutschen Stichprobe waren Migrationshintergrund und SÖS stark miteinander und mit den sprachlichen und mathematischen Fähigkeiten der Kinder assoziiert, wobei ein vorhandener Migrationshintergrund und niedrigerer SÖS mit geringeren Leistungen in den Tests einherging. Diese Zusammenhänge fanden sich in der australischen Stich-
Tabelle 1. Korrelationen und deskriptive Statistiken der Studienvariablen (für die australische Stichprobe finden sich die Werte über der Diagonalen, die Werte für die deutsche Stichprobe befinden sich darunter) 1 Erstes Vorlesen (1)
2
3
4
5
–.47*
.18
.08
.20*
*
Spätere Vorlesehäufigkeit (2)
–.48
.12
.01
Geschlecht (0 = ♀; 1 = ♂) (3)
–.06
–.01
Alter in Monaten (4)
.02
–.01
Migrationshintergrund # (5)
.45*
–.26*
*
*
.05
–.02
.26* .03 –.09
6
7
8
9
–.33*
–.36*
–.37*
–.27*
*
*
*
.34
*
.11
–.13
–.20*
–.16
–.03
.26
.12
–.12
–.23*
–.01
–.21*
.12
–.05
–.15
–.03
*
Sozioökonomischer Status (6)
–.32
.26
Phonologische Bewusstheit (7)
–.35*
.32*
–.02
.09
–.33*
.31*
Wortschatz (8)
–.49*
.38*
.01
.06
–.47*
.35*
*
*
*
–.36
*
.24
.27
.16
.14
–.24*
–.22*
*
11
–.11
–.12
.18
M (Max)
SD
6.33
5.71
.22
5.74
1.55
–.07
.56
.50
.28* 61.74
3.96
*
–.13
–.08
.38
.49
99.83
32.09
.25
.18
.02
.10
.63*
.34*
.36*
.39*
6.55 (17)
4.17
.51*
.40*
.49* 22.09 (71)
5.64
.50* *
.21
10
*
*
Intelligenz (9)
–.20
.22
–.03
.18
–.12
.11
.39
Konzentration (10)
–.13
.10
–.19*
.17*
–.11
.15*
.29*
.22*
.29*
Mathematische Fähigkeiten (11)
–.19*
.18*
.03
.26*
–.16*
.20*
.46*
.39*
.42*
N (dt. Originalstichprobe)
675
675
746
745
738
643
741
721
742
740
721
.42
3.51
.53
73.74
.48
75.21
5.43
29.64
52.12
33.20
25.59
10
35
57
42
30
2.57
5.85
4.06
6.08
4.20
.15
.29
.04
.04
.06
M (dt. Stichprobe) Max (dt. Stichprobe) SD (dt. Stichprobe) ICC (dt. Stichprobe)
.75
.86
.50
4.54
.50
36.46
.31
.31
*
.43
9.93 (40)
6.37
.43* 28.41 (42)
5.87
.34*
21.45 (30.5) 5.97
Anmerkungen. * Signifikant (p < .001 für die deutsche und p < .05 für die australische Stichprobe) # 0 = kein Migrationshintergrund; 1 = ein oder beide Elternteile im Ausland geboren ICC = Intraclass Correlation Coefficients
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 35–44
F. Niklas et al., Erstes Vorlesen: Der frühe Vogel fängt den Wurm
probe in wesentlich geringerem und oftmals nicht statistisch bedeutsamem Ausmaß. Erstes Vorlesen und spätere Vorlesehäufigkeit korrelierten in beiden Stichproben hoch miteinander und auch die Korrelationen mit den familiären Hintergrundvariablen sowie den sprachlichen Fähigkeiten und der Intelligenz der Kinder unterschritten die Signifikanzgrenze (Ausnahme: spätere Vorlesehäufigkeit und Migrationshintergrund in der australischen Stichprobe). In der deutschen Stichprobe waren auch die Korrelationen der Vorlesevariablen mit den mathematischen Fähigkeiten statistisch bedeutsam, wobei diese jedoch ähnlich hoch ausfielen wie in der australischen Stichprobe. Es zeigte sich kein signifikanter Zusammenhang der Vorlesevariablen mit Alter und Geschlecht der Kinder sowie deren Konzentrationsfähigkeit. Die ICCs wiesen darauf hin, dass zumindest für die Konzentrationsfähigkeit und die Intelligenz keine allzu großen Effekte der Kindergartengruppenzugehörigkeit zu erwarten sind. Anders verhielt sich dies bei den mathematischen Kompetenzen und insbesondere hinsichtlich der PB und des Wortschatzes. Bei diesen Variablen wurden substanzielle Intraklassenkorrelationen beobachtet. Eine Berücksichtigung der hierarchischen Datenstruktur bei den Korrelationsanalysen führte in der deutschen Stichprobe zu reduzierten Zusammenhangsmaßen. Allerdings blieb das grundsätzliche Korrelationsmuster bestehen und exakt die gleichen Korrelationen unterschritten nach wie vor die Signifikanzgrenze (Ausnahmen: die Korrelation zwischen Konzentration und SÖS sowie die Korrelation zwischen Migrationshintergrund und mathematischen Fähigkeiten waren nicht länger statistisch bedeutsam; p > .001). Tabelle 2. Gesamte aufgeklärte Varianz (R2) und dabei durch das erste Vorlesen zusätzlich aufgeklärte Varianz (ΔR2) in multiplen Regressionsanalysen unter Kontrolle von Alter, Geschlecht, Migrationshintergrund und SÖS für die deutsche im Vergleich zur australischen Stichprobe Deutsche Stichprobe R2/ΔR2
Australische Stichprobe R2/ΔR2
.25*/.15*
.29*/.19*
Phonologische Be- .19*/.04* wusstheit
.23*/.06*
Wortschatz
.34*/.08*
.24*/.06*
Intelligenz
.08*/.03*
.17*/.03
Konzentration
.11*/.01
.09*/.00
Mathematische Fähigkeiten
.13*/.01*
.13*/.00
Spätere Vorlesehäufigkeit
Anmerkungen. * Signifikant (p < .001 für die deutsche und p < .05 für die australische Stichprobe)
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 35–44
41
Tabelle 2 zeigt die Endergebnisse der linearen Regression zur Vorhersage der Studienvariablen durch das erste Vorlesen unter Kontrolle von Alter, Geschlecht, Migrationshintergrund und SÖS. Die Ergebnisse fielen für beide Stichproben sehr ähnlich aus. Der Vorlesestart erwies sich als sehr wichtiger Prädiktor für die Vorlesehäufigkeit im Vorschulalter, der über die Kontrollvariablen hinaus 15 bzw. 19 % an zusätzlicher Varianz aufklärte (großer Effekt). Daneben konnte das erste Vorlesen auch zusätzliche Varianz der sprachlichen Fähigkeiten der Kinder aufklären (statistisch bedeutsame und zumeist mittlere Effekte). Die Aufklärungsleistung für die anderen kognitiven Fähigkeiten fiel deutlich geringer aus und unterschritt in der australischen Stichprobe nicht die Signifikanzgrenze. In der deutschen Stichprobe erwies sich der Vorlesestart als statistisch bedeutsamer Prädiktor für alle Variablen mit Ausnahme der Konzentrationsfähigkeit, wobei aber die signifikant zusätzlich aufgeklärte Varianz insbesondere für die mathematischen Kompetenzen der Kinder als kaum bedeutsam eingeschätzt werden kann. In allen Fällen war ein früherer Vorlesestart mit größeren kindlichen Kompetenzen verbunden. Eine Überprüfung der Ergebnisse unter Berücksichtigung der hierarchischen Datenstruktur wurde mittels HLM durchgeführt. In den Mehrebenenanalysen konnte für alle Untersuchungsvariablen ein noch größerer Varianzanteil R2 aufgeklärt werden, wobei sich dieser Zuwachs insbesondere bei der PB (von .19 auf .26) und beim Wortschatz (von .34 auf .50) zeigte. Gleichzeitig reduzierte sich die dabei durch das erste Vorlesen zusätzlich aufgeklärte Varianz ΔR2 (z. B. von .08 auf .04 im Wortschatz). Wie bei den Korrelationsanalysen blieb aber auch bei den Regressionsanalysen die gleiche Befundlage bestehen. Nach wie vor erwies sich das erste Vorlesen als signifikanter Prädiktor für alle kindlichen Leistungen mit Ausnahme der Konzentrationsleistung, wobei sich aber nur noch kleine Effekte zeigten.
Diskussion Internationale und deutsche Studien stellen die große Bedeutung der familiären Lernumwelt für die frühe kindliche Entwicklung hinsichtlich schriftsprachlicher Kompetenzen (z. B. Niklas et al., 2013; Sénéchal & LeFevre, 2002), mathematischer Kompetenzen (z. B. Kleemans, Peeters, Segers & Verhoeven, 2012; Niklas & Schneider, 2012) und auch hinsichtlich von Verhaltensmaßen (z. B. Schmiedeler et al., 2014) deutlich heraus. Dabei erwies sich die HLE als spezifischer Prädiktor schriftsprachlicher Vorläuferfähigkeiten, die jedoch auch mit anderen kognitiven Fähigkeiten assoziiert ist (vgl. Niklas, 2015). Auch © 2016 Hogrefe
42
wenn die Vorlesehäufigkeit und -qualität als wichtige Aspekte der HLE bereits einige Beachtung erfahren haben (z. B. Bus et al., 1995; Mol et al., 2008), fehlten bislang Studien, die sich intensiv mit der Bedeutung des kindlichen Alters beim ersten Vorlesen im deutschen Sprachraum auseinandergesetzt haben. Zwar identifizierten ältere Studien aus dem englischen Sprachraum den Vorlesebeginn als wichtigen Prädiktor sprachlicher Fähigkeiten von jungen Kindern (DeBaryshe, 1993; Burgess, 1997; Payne et al., 1994), doch gab es mit einer Ausnahme (Niklas et al., 2015) noch keine Befunde zum Zusammenhang des Vorlesestarts mit der Vorlesehäufigkeit und kindlichen Kompetenzen im Vorschulalter unter Kontrolle von kindlichem und familiärem Hintergrund. Die vorliegende Studie nutzte Daten einer großen Vorschulstichprobe in Deutschland zum Thema Vorlesen und verglich diese explorativ mit aktuellen Daten aus Australien (Niklas et al., 2015). Obwohl aufgrund von Unterschieden in Stichprobe und Testverfahren nur eine eingeschränkte Vergleichbarkeit vorlag, zeigten sich sehr ähnliche Befunde in beiden Studien, wie dies schon in früheren Vergleichen zur Bedeutsamkeit der HLE in beiden Kontexten der Fall war (Niklas et al., 2015). Interessant ist dies schon insofern, als die australische Stichprobe einen deutlich höheren SÖS als die deutsche Stichprobe aufwies (vgl. auch Befunde von DeBaryshe, 1993). Die deutschen Befunde deuten darauf hin, dass die gefundenen Assoziationen unabhängig vom durchschnittlichen SÖS einer Stichprobe auftreten könnten (vgl. auch Befunde von Payne et al., 1994). In beiden Studien war ein früher Vorlesestart jeweils mit häufigerem Vorlesen im Vorschulalter und größeren kindlichen Kompetenzen assoziiert. Dabei deuten die Ergebnisse darauf hin, dass der Vorlesebeginn ein relativ spezifischer Prädiktor von PB und Wortschatz zu sein scheint, der andere kognitive Fähigkeiten unter Berücksichtigung von Kontrollvariablen nur im begrenzten Umfang vorhersagen kann. Es ist zu vermuten, dass das Vorlesen eine sehr gute Möglichkeit für Kinder darstellt, um ihren Wortschatz zu erweitern, um mit der Lautstruktur der Sprache zu spielen und um Erfahrungen mit Printmedien zu sammeln. Solche Erfahrungen tragen zur Entwicklung schriftsprachlicher Kompetenzen bei (Bus et al., 1995; Mol et al., 2008; Niklas & Schneider, 2015; Schatschneider et al., 2004; Torgesen, 2002). Im Vergleich zum Zusammenhang des Vorlesestarts mit Konzentration und mathematischen Kompetenzen zeigte sich auch ein relativ enger Zusammenhang des ersten Vorlesens mit Tests, die die Intelligenz abschätzen. In den Regressionsanalysen konnte der Vorlesebeginn unter Berücksichtigung der Kontrollvariablen in beiden Stichproben je 3 % an zusätzlicher Varianz aufklären, was in der deutschen Stichprobe eine statistisch bedeutsame Aufklä© 2016 Hogrefe
F. Niklas et al., Erstes Vorlesen: Der frühe Vogel fängt den Wurm
rung darstellte. Diese Ergebnisse stimmen gut mit anderen Studien überein, die Zusammenhänge im Bereich kleiner bis mittlerer Zusammenhänge zwischen der HLE und Intelligenz berichteten (z. B. Kleemans et al., 2012; Niklas & Schneider, 2013). Weiterhin zeigte sich wie in früheren Studien ein enger Zusammenhang des Vorlesebeginns als Indikator der HLE mit den familiären Hintergrundvariablen, der im deutschen gegenüber dem australischen Kontext für den Migrationshintergrund deutlich größer ausfiel (Aikens & Barbarin, 2008; Niklas et al., 2015; Prevoo et al., 2014). Einschränkend ist bei der vorliegenden Studie und auch der australischen Vergleichsstudie zu beachten, dass die Informationen zum Vorlesen per Elternfragebogen und retrospektiv erfasst wurden. Somit sind fehlerhafte Beantwortungen nicht auszuschließen, auch wenn sich Elternbefragungen im Kontext der Forschung zu HLE als reliabel erwiesen haben (vgl. Burgess, 2002). Dennoch wären prospektive Längsschnittstudien zum Vorlesestart wünschenswert, insbesondere, wenn solche Studien Beobachtungen innerhalb der Familie beinhalten würden. Daneben traten bei einigen Testverfahren Deckeneffekte auf, die zu eingeschränkter Varianz in der deutschen Stichprobe geführt haben. Eingeschränkte Varianz fand sich auch in den Fragebogendaten zum ersten Vorlesen und zur Vorlesehäufigkeit im Vorschulalter, und mit diesen beiden Variablen wurden Korrelationen und Regressionen berechnet, obwohl streng genommen keine Intervallskalierung vorliegt. All diese Einschränkungen führten aber eher zu einer Unterschätzung der Zusammenhänge und Effekte. Analysen auf Ordinalniveau bzw. mithilfe von Dummyvariablen änderten zudem die berichtete Befundlage nicht. Da jeweils mehrere Kinder die gleichen Kindergartengruppen besuchten und deshalb Unterschiede zwischen diesen Gruppen auftreten könnten, wurde in Folgeanalysen zusätzlich die hierarchische Datenstruktur berücksichtigt, um die gefundenen Ergebnisse zu überprüfen. Die Intraclass Correlation Coefficients (ICC) wiesen darauf hin, dass insbesondere für die mathematischen Kompetenzen, die PB und den Wortschatz substanzielle Einflüsse der hierarchischen Datenstruktur zu erwarten waren (Muthén & Satorra, 1995). Tatsächlich führten die Folgeanalysen zu reduzierten Zusammenhängen zwischen den untersuchten Variablen und zu einer geringeren Varianzaufklärung durch den Vorlesestart. Dies könnte ein Hinweis darauf sein, dass in bestimmten Kindergartengruppen bessere Förderung stattfand oder aber dass die Zusammensetzung der Kindergartengruppe auf die kindlichen Kompetenzen Einfluss nahm (vgl. Niklas et al., 2011). Weitere Forschung zur Wechselwirkung zwischen Aspekten der HLE und institutionellen Bedingungen sind notwendig (vgl. auch Lehrl, Ebert, Roßbach & Weinert, 2012). Gleichzeitig zeigten sich auch unter Berücksichtigung der Zeitschrift für Pädagogische Psychologie (2016), 30(1), 35–44
F. Niklas et al., Erstes Vorlesen: Der frühe Vogel fängt den Wurm
hierarchischen Datenstruktur die gleichen Ergebnismuster. Somit hing das kindliche Alter beim ersten Vorlesen nicht nur unabhängig von der Datenstruktur statistisch bedeutsam mit den kindlichen Kompetenzen zusammen, sondern es erwies sich auch als signifikanter Prädiktor unter Berücksichtigung von Kontrollvariablen. Der Fokus dieser Studie lag nur auf dem Alter der Kinder beim ersten Vorlesen. Dadurch blieben andere wichtige Aspekte wie beispielsweise die Qualität des Vorlesens oder des Buches unberücksichtigt (vgl. Kucirkova et al., 2012; Mol et al., 2008). Zudem ist nicht zu erwarten, dass das reine Alter bei Vorlesebeginn entscheidend für spätere kindliche Fähigkeiten ist. Vielmehr kann davon ausgegangen werden, dass Eltern, die früher mit dem Vorlesen beginnen, ihren Kindern auch in anderer Hinsicht eine förderliche HLE bieten (DeBaryshe, 1993; Burgess, 1997). Somit könnte sich der Vorlesestart als ein wichtiger Indikator für die Qualität der HLE erweisen. Trotz der genannten Einschränkungen handelt es sich bei den vorgestellten Analysen um eine der ersten Arbeiten – insbesondere im deutschen Sprachraum, die sich intensiv mit der Bedeutung des Vorlesestarts für die spätere Vorlesehäufigkeit und spätere kindliche Kompetenzen auseinandergesetzt hat. Die Ergebnisse weisen darauf hin, dass ein früher Beginn des Vorlesens wünschenswert ist und mit insbesondere größeren sprachlichen Fähigkeiten im Vorschulalter assoziiert ist. Deshalb sollten Eltern dazu ermutigt werden, schon ihren jungen Kindern vorzulesen – auch wenn dies nur den ersten Schritt zu einer gelungenen schriftsprachlichen Lernumwelt in der Familie darstellen mag: Der frühe Vogel fängt den Wurm.
Danksagung Die Arbeit wurde mit Unterstützung eines Stipendiums im Rahmen des Post-doc-Programms des Deutschen Akademischen Austauschdienstes (DAAD) ermöglicht.
Literatur Aikens, N. L. & Barbarin, O. (2008). Socioeconomic differences in reading trajectories: The contribution of family, neighborhood, and school contexts. Journal of Educational Psychology, 100, 235–251. Bradley, L. & Bryant, P. E. (1985). Rhyme and reason in reading and spelling. Ann Arbor, MI: University of Michigan Press. Bradley, R. H. & Corwyn, R. F. (2002). Socioeconomic status and child development. Annual Review of Psychology, 53, 371–399. Bronfenbrenner, U. (1979). The ecology of human development. Cambridge, MA: Harvard University Press. Burgess, S. R. (1997). The role of shared reading in the development of phonological awareness: A longitudinal study of middle Zeitschrift für Pädagogische Psychologie (2016), 30(1), 35–44
43
to upper class children. Early Child Development and Care, 127, 191–199. Burgess, S. R. (2002). The influence of speech perception, oral language ability, the home literacy environment, and pre-reading knowledge on the growth of phonological sensitivity: A one-year longitudinal investigation. Reading and Writing, 15, 709–737. Bus, A. G., van IJzendoorn, M. H. & Pellegrini, A. D. (1995). Joint book reading makes for success in learning to read: A metaanalysis on inter-generational transmission of literacy. Review of Educational Research, 65, 1–21. Cohrssen, C., Niklas, F. & Tayler, C. (in Druck). “Is that what we do?” Using a conversation analytic approach to highlight the contribution of dialogic reading strategies to educator-child interactions during storybook reading in two early childhood settings. Journal of Early Childhood Literacy. DeBaryshe, B. D. (1993). Joint picture-book reading correlates of early oral language skill. Journal of Child Language, 20, 455–461. Duncan, G. J., Dowsett, C. J., Claessens, A., Magnuson, K., Huston, A. C., Klebanov, P. et al. (2007). School readiness and later achievement. Developmental Psychology, 43, 1428–1446. Ennemoser, M., Marx, P., Weber, J. & Schneider, W. (2012). Spezifische Vorläuferfertigkeiten der Lesegeschwindigkeit, des Leseverständnisses und des Rechtschreibens. Evidenz aus zwei Längsschnittstudien vom Kindergarten bis zur 4. Klasse. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 44, 53–67. Esser, G. (2002). BUEVA – Basisdiagnostik Umschriebener Entwicklungsstörungen im Vorschulalter. Göttingen: Beltz. Fawcett, A. J. (2003). The international adult literacy survey in Britain: Impact on policy and practice. Dyslexia, 9, 99–121. Flax, J. F., Realpe-Bonilla, T., Roesler, C., Choudhury, N. & Benasich, A. (2009). Using early standardized language measures to predict later language and early reading outcomes in children at high risk for language-learning impairments. Journal of Learning Disabilities, 42, 61–75. Graham, J. W. (2009). Missing data analysis: Making it work in the real world. Annual Review of Psychology, 60, 549–576. Hasselhorn, M., Schöler, H., Schneider, W., Ehm, J.-H., Johnson, M., Keppler, I., Krebs et al. (2012). Gezielte Zusatzförderung im Modellprojekt «Schulreifes Kind» – Auswirkungen auf Schulbereitschaft und schulischen Lernerfolg. Frühe Bildung, 1, 3–10. Kiese-Himmel, C. (2005). AWST-R – Aktiver Wortschatztest für 3bis 5-jährige Kinder. Göttingen: Hogrefe. Kleemans, T., Peeters, M., Segers, E. & Verhoeven, L. (2012). Child and home predictors of early numeracy skills in kindergarten. Early Childhood Research Quarterly, 27, 471–477. Krajewski, K. & Schneider, W. (2009). Early development of quantity to number-word linkage as a precursor of mathematical school achievement and mathematical difficulties: Findings from a four-year longitudinal study. Learning and Instruction, 19, 513–526. Kucirkova, N., Messer, D. & Whitelock, D. (2012). Parents reading with their toddlers: The role of personalization in book engagement. Journal of Early Childhood Literacy, 13, 445–470. Lehrl, S., Ebert, S., Roßbach, H.-G. & Weinert, S. (2012). Die Bedeutung der familiären Lernumwelt für Vorläufer schriftsprachlicher Kompetenzen im Vorschulalter. Zeitschrift für Familienforschung, 24, 115–133. Lüdtke, O., Robitzsch, A., Trautwein, U. & Köller, O. (2007). Umgang mit fehlenden Werten in der psychologischen Forschung. Probleme und Lösungen. Psychologische Rundschau, 58, 103–117. Lyon, G. R. (2002). Reading development, reading difficulties, and reading instruction educational and public health issues. Journal of School Psychology, 40, 3–6. McElvany, N., Becker, M. & Lüdtke, O. (2009). Die Bedeutung familiärer Merkmale für Lesekompetenz, Wortschatz, Lesemotivati© 2016 Hogrefe
44
on und Leseverhalten. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 41, 121–131. Mol, S. E., Bus, A. G., de Jong, M. T. & Smeets, D. J. H. (2008). Added value of dialogic parent-child book readings: A meta-analysis. Early Education and Development, 19, 7–26. Muthén, B. O. & Satorra, A. (1995). Complex sample data in structural equation modeling. Sociological Methodology, 25, 267–316. Näslund, J. C. & Schneider, W. (1996). Kindergarten letter knowledge, phonological skills, and memory processes: Relative effects on early literacy. Journal of Experimental Child Psychology, 62, 30–59. Newman, R., Ratner, N. B., Jusczyk, M., Jusczyk, P. W. & Dow, K. A. (2006). Infants' early ability to segment the conversational speech signal predicts later language development: A retrospective analysis. Developmental Psychology, 42, 643–655. Niklas, F. (2015). Die familiäre Lernumwelt und ihre Bedeutung für die kindliche Kompetenzentwicklung. Psychologie in Erziehung und Unterricht, 62, 106–120. Niklas, F., Cohrssen, C. & Tayler, C (2015). The sooner, the better: Early reading to children. Unpublished Manuscript, University of Melbourne. Niklas, F., Möllers, K. & Schneider, W. (2013). Die frühe familiäre Lernumwelt als Mediator zwischen strukturellen Herkunftsmerkmalen und der basalen Lesefähigkeit am Ende der ersten Klasse. Psychologie in Erziehung und Unterricht, 60, 94–111. Niklas, F., Schmiedeler, S., Pröstler, N. & Schneider, W. (2011). Die Bedeutung des Migrationshintergrunds, des Kindergartenbesuchs sowie der Zusammensetzung der Kindergartengruppe für sprachliche Leistungen von Vorschulkindern. Zeitschrift für Pädagogische Psychologie, 25, 115–130. Niklas, F. & Schneider, W. (2010). Der Zusammenhang von familiärer Lernumwelt mit schulrelevanten Kompetenzen im Vorschulalter. Zeitschrift für Soziologie der Erziehung und Sozialisation, 30, 149–165. Niklas, F. & Schneider, W. (2012). Einfluss von «Home Numeracy Environment» auf die mathematische Kompetenzentwicklung vom Vorschulalter bis Ende des 1. Schuljahres. Zeitschrift für Familienforschung, 24, 134–147. Niklas, F. & Schneider, W. (2013). Home literacy environment and the beginning of reading and spelling. Contemporary Educational Psychology, 38, 40–50. Niklas, F. & Schneider, W. (2015). With a little help: improving kindergarten children's vocabulary by enhancing the home literacy environment. Reading and Writing: An Interdisciplinary Journal, 28, 491–508. Niklas, F., Segerer, R., Schmiedeler, S. & Schneider, W. (2012). Findet sich ein «Matthäus-Effekt» in der Kompetenzentwicklung von jungen Kindern mit oder ohne Migrationshintergrund? Frühe Bildung, 1, 26–33. Niklas, F., Tayler, C. & Schneider, W. (2015). Home-based literacy activities and children’s cognitive outcomes: A comparison between Australia and Germany. International Journal of Educational Research, 71, 75–85. Partanen, E., Kujala, T., Näätänen, R., Liitola, A., Sambeth, A. & Huotilainen, M. (2013). Learning induced neural plasticity of speech processing before birth. PNAS, 110, 15145–15150. Payne, A. C., Whitehurst, G. J. & Angell, A. L. (1994). The role of home literacy environment in the development of language ability in preschool children from low-income families. Early Childhood Research Quarterly, 9, 427–440. Prevoo, M. J. L., Malda, M., Mesman, J., Emmen, R. A. G., Yeniad, N., van IJzendoorn, M. H. et al. (2014). Predicting ethnic minority
© 2016 Hogrefe
F. Niklas et al., Erstes Vorlesen: Der frühe Vogel fängt den Wurm
children's vocabulary from socioeconomic status, maternal language and home reading input: different pathways for host and ethnic language. Journal of Child Language, 41, 963–984. Raikes, H., Pan, B. A., Gayle, L., Tamis-LeMonda, C. S., BrooksGunn, J., Constantine, J. et al. (2006). Mother-child reading in low-income families: Correlates and outcomes during the first three years of life. Child Development, 77, 924–953. Schatschneider, C., Fletcher, J. M., Francis, D. J., Carlson C. D. & Foorman, B. R. (2004). Kindergarten prediction of reading skills: A longitudinal comparative analyses. Journal of Educational Psychology, 96, 265–282. Schmiedeler, S., Niklas, F. & Schneider, W. (2014). Symptoms of attention-deficit hyperactivity disorder (ADHD) and home learning environment (HLE): Findings from a longitudinal study. European Journal of Psychology of Education, 29, 467–482. Schneider, W. & Marx, P. (2008). Früherkennung und Prävention von Lese-Rechtschreibschwierigkeiten. In F. Petermann & W. Schneider (Hrsg.), Angewandte Entwicklungspsychologie. Enzyklopädie der Psychologie, Serie Entwicklungspsychologie, Bd. VII (S. 237–273). Göttingen: Hogrefe. Schneider, W., Niklas, F. & Schmiedeler, S. (2014). Intellectual development from early childhood to early adulthood: The impact of early IQ differences on stability and change over time. Learning and Individual Differences, 32, 156–162. Schneider, W., Stefanek, J. & Niklas, F. (2009). Development of intelligence and thinking. In W. Schneider & M. Bullock (Eds.), Human development from early childhood to early adulthood. Findings from a 20 year longitudinal study (pp. 7–33). New York: Psychology Press. Sénéchal, M. & LeFevre, J.-A. (2002). Parental involvement in the development of children's reading skill: A five-year longitudinal study. Child Development, 73, 445–460. Sénéchal, M., LeFevre, J.-A., Hudson, E. & Lawson, E. P. (1996). Knowledge of storybooks as a predictor of young children's vocabulary. Journal of Educational Psychology, 88, 520–536. Sénéchal, M. & Young, L. (2008). The effect of family literacy interventions on children’s acquisition of reading from kindergarten to grade 3: A meta-analytic review. Review of Educational Research, 78, 880–907. Torgesen, J. K. (2002). The prevention of reading difficulties. Journal of School Psychology, 40, 7–26. Wegener, B. (1988). Kritik des Prestiges. Opladen: Westdeutscher Verlag. Weinert, S., Doil, H. & Frevert, S. (2008). Kompetenzmessungen im Vorschulalter: eine Analyse vorliegender Verfahren. In H.-G. Roßbach & S. Weinert (Hrsg.), Kindliche Kompetenzen im Elementarbereich: Förderbarkeit, Bedeutung und Messung (S. 89–209). Bonn: Bundesministerium für Bildung und Forschung. Whitehurst, G. J. & Lonigan, C. J. (1998). Child development and emergent literacy. Child Development, 69, 848–872.
Manuskript eingereicht: 3.6.2015 Nach Revision angenommen: 12.11.2015 Interessenskonflikt: Nein Dr. Frank Niklas Lehrstuhl für Psychologie IV, Universität Würzburg Röntgenring 10 97070 Würzburg Deutschland niklas@psychologie.uni-wuerzburg.de
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 35–44
Kindliche Entwicklung und Entwicklung der Malerei
Bettina Egger
Urformen des Malens Spuren der Wandlung und kunsttherapeutische Anwendung 2015. 176 S., 175 Abb., 2 Tab., Kt € 24.95 / CHF 32.50 ISBN 978-3-456-85537-0
Bettina Egger
Urformen des Malens Spuren der Wandlung und kunsttherapeutische Anwendung
«Wie soll ich Kinderbilder verstehen?» ist eine Frage, die überall gestellt wird, wo Kinder leben oder in die Schule gehen. Hier wird vorschnellen psychologischen Interpretationen eine überzeugende Alternative gegenübergestellt. Die Entwicklung von der ersten Kritzelei bis zur Kastenform wird durch Urformen der Kindermalerei aufgezeigt und jede Urform genau erläutert. Die Abwicklung aller Urformen wird auf die entsprechenden Entwicklungsstadien des Kindes bezogen und mit Fotos eines Kindes in diesen Stadien illustriert. Dass Urformen allgemeingültig sind, wird über ihr Erscheinen in der bilden-
www.hogrefe.com
den Kunst und in prähistorischen Darstellungen gezeigt. Zum Schluss wird eine Maltherapie der Urformen vorgeschlagen, die zur Selbstbehandlung geeignet ist. Das Buch eignet sich sowohl zur Anregung und als Geschenk für Eltern als auch als überzeugende Information für professionelle Kinder- und Maltherapeuten.
Empirische Praxis in der Geistigbehindertenpädagogik
Jan Kuhl / Nils Euker (Hrsg.)
Evidenzbasierte Diagnostik und Förderung von Kindern und Jugendlichen mit intellektueller Beeinträchtigung 2016. 312 S., 15 Abb., 11 Tab., Kt € 29.95 / CHF 39.90 ISBN 978-3-456-85499-1 AUCH ALS E-BOOK
Innerhalb der Erziehungs- und Bildungswissenschaft, der pädagogischen Praxis und auch der Bildungspolitik setzt sich immer stärker die Ansicht durch, dass die Unterrichtung, Förderung und Therapie von Kindern und Jugendlichen auf Grundlage fundierter empirischer Erkenntnisse erfolgen sollte. Innerhalb der deutschen Geistigbehindertenpädagogik hat sich dieser Ansatz der evidenzbasierten Praxis noch nicht so sehr verbreitet, wie in anderen Teildisziplinen der (Sonder-) Pädagogik.
www.hogrefe.com
Dennoch gibt es, international und inzwischen auch vermehrt in Deutschland, eine substanzielle Anzahl fundierter Studien zur Diagnostik und Förderung von Kindern und Jugendlichen mit intellektueller Beeinträchtigung in verschiedenen Inhaltsbereichen. Ziel des Buches ist es, die aktuelle Forschungslage zusammenzutragen und für weitere Forschung, insbesondere aber für eine evidenzbasierte Praxis nutzbar zu machen.
Originalartikel
Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter Nele McElvany1, Wahiba El-Khechen1, Franziska Schwabe1 und Ursula Kessels2 1 2
Institut für Schulentwicklungsforschung (IFS), TU Dortmund Arbeitsbereich Bildungsforschung/Heterogenität und Bildung, Freie Universität Berlin
Zusammenfassung: Schulerfolg beruht auf umfassenden sprachlichen Kompetenzen, deren Grundlage der Wortschatz ist. Unterschiede in den Entwicklungskontexten von Mädchen und Jungen können zu systematischen Unterschieden in der Qualität ihres Wortschatzes führen. Vor diesem Hintergrund wird in der vorliegenden Studie anhand von Differential Item Functioning-Analysen empirisch überprüft, ob Jungen und Mädchen am Ende der Grundschulzeit bei gleichem Gesamtwortschatzkompetenzniveau über einen systematisch unterschiedlichen Wortschatz bei männlich, weiblich oder neutral konnotierten Wörtern verfügen. Die Analysen der Lösungswahrscheinlichkeiten von 96 Wortschatztestitems, die von 1 039 Kindern der dritten Klassenstufe bearbeitet wurden, zeigten keine quantitativen Wortschatzunterschiede in Abhängigkeit vom Geschlecht, jedoch qualitative: Bei männlich konnotierten Wörtern hatten Jungen, bei weiblich konnotierten Wörtern Mädchen relative Vorteile. Dieses galt auch bei Kontrolle zentraler sozialer Hintergrundmerkmale, wobei die Effekte von kleiner Größe waren. Die Implikationen für die schulische Praxis und weitere Forschungsdesiderate werden diskutiert. Schlüsselwörter: Wortschatz, Geschlecht, Sprache, Grundschule, DIF-Analysen
Qualitative Differences in Vocabulary Between Boys and Girls in Elementary School Age Abstract: Success at school depends on extensive verbal skills which are based on vocabulary knowledge. Developmental differences between girls and boys can result in systematic differences in the quality of their vocabularies. Against this background, and by using Differential Item Functioning-analyses, this study empirically examines the question whether boys and girls at the end of their primary school education master a systematically different vocabulary regarding words connoted with masculine, feminine or neutral concepts, while not exhibiting competence differences with respect to their levels of overall vocabulary. Analyses of 1039 third-graders regarding the probability of solving 96 vocabulary items correctly did not result in any quantitative vocabulary differences based on gender. However, qualitative differences could be shown: Boys displayed relative advantages with respect to masculine-connoted words; girls were advantageous with respect to feminine-connoted words. The same results applied when controlling for central social background criteria with the effects being of small size. The implications for schools as well as further research desiderata are being discussed. Keywords: vocabulary, gender, language, primary school, DIF-studies
Einleitung Schulerfolg beruht auf umfassenden sprachlichen Handlungskompetenzen, deren Grundlage der Wortschatz ist. Rezeptiver wie produktiver Wortschatz werden zu wesentlichen Teilen implizit aus dem Kontext erworben (Sternberg, 1987). Befunde aus der Entwicklungspsychologie weisen darauf hin, dass Mädchen und Jungen unterschiedliche Interessen ausbilden und verschiedene Aktivitäten präferieren (z. B. Goble, Martin, Hanish & Fabes, 2012). Entsprechend dürften sie auch mit unterschiedlichen Wörtern in Kontakt kommen, Wörter unterschiedlich häufig hören bzw. lesen oder mit unterschiedlicher AufmerkZeitschrift für Pädagogische Psychologie (2016), 30(1), 45–55 DOI 10.1024/1010-0652/a000167
samkeit wahrnehmen. Auch wenn Mädchen und Jungen in vielen Studien im Mittel keine geschlechtsspezifischen Differenzen in der Quantität ihres Wortschatzes aufweisen (Hyde, 2014), könnten Unterschiede in den von ihnen typischerweise aufgesuchten Umgebungen und Aktivitäten jedoch zu systematischen Unterschieden in der Qualität ihres Wortschatzes führen. Vor dem Hintergrund theoretischer Überlegungen soll in der vorliegenden Studie mittels Differential Item Functioning (DIF)-Analysen empirisch überprüft werden, ob Jungen und Mädchen am Ende der Grundschulzeit über einen systematisch unterschiedlichen Wortschatz bei männlich, weiblich oder neutral konnotierten Wörtern verfügen. © 2016 Hogrefe
46
N. McElvany et al., Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter
Theoretischer Hintergrund Wortschatz Der Wortschatz, also die Gesamtheit aller Wörter, die die Person kennt oder verwendet, gehört zu den grundlegenden Bestandteilen der Sprache (Lengyel, Reich, Roth & Döll, 2009) und ist im schulischen Kontext ein maßgeblicher Einflussfaktor für die systematische Bildung eines umfassenden Gesamtverständnisses und des Schriftspracherwerbs (Lesaux, Lipka & Siegel, 2006). Dabei ist es wesentlich, zwischen rezeptivem (passivem) und produktivem (aktivem) Wortschatz zu unterscheiden. Neben dem produktiven Wortschatz, der die Bildung sinnvoller Sätze und Äußerungen und damit das Schreiben und Sprechen im Unterrichtskontext ermöglicht, kommt dem rezeptiven Wortschatz eine Schlüsselfunktion zu, indem er das sinnerfassende Lesen und Hören während der Lernprozesse und damit das Verständnis gesprochener und geschriebener Sprache ermöglicht (Graves, 2006; Sénéchal, Oullette & Rodney, 2006). Der Erwerb von Wortschatz und seine Förderung können im Allgemeinen explizit und implizit erfolgen (vgl. Überblick National Institute of Child Health and Human Development [NICHD], 2000), wobei der beiläufige, implizite Wortschatzerwerb aus dem mündlichen oder schriftlichen Kontext den größten Anteil an der Wortschatzerweiterung hat (schon Sternberg, 1987; vgl. auch Shanahan, 2006). Dementsprechend bedingen familiäre Kommunikation, Bildung, soziale Netzwerke, Hobbies und Interessen interindividuelle Unterschiede im Umfang des aktiven und passiven mentalen Lexikons innerhalb von Alterskohorten (vgl. Tracy, 2009). Das Anregungspotenzial in Form vielfältiger und lernspezifischer Sprechanlässe in Familien, der sonstigen außerunterrichtlichen Zeit sowie in der Schule ist für die Entwicklung lexikalischer Kenntnisse zentral, so dass sich der Wortschatz in Abhängigkeit von dem Sprachinput in den entsprechenden Sozialisationskontexten der Kinder in jeweils spezifischen Themenfeldern ausbildet (vgl. Eckhardt, 2008).
Wortschatz und Geschlecht Als ein zentraler Sozialisationskontext eines Kindes kann die Zugehörigkeit zu einer der beiden Geschlechtergruppen gelten. Kognitive Entwicklungstheorien (z. B. Martin & Ruble, 2004; Martin, Ruble & Szkrybalo, 2002) nehmen an, dass Kinder schon sehr früh verallgemeinertes Wissen über die Geschlechter (Geschlechterschemata) erwerben, welches die Grundlage dafür bildet, dass die nachfolgende eigene Kategorisierung als Mädchen oder Junge dazu führt, dass Mädchen sich vor allem Dingen und Tätigkeiten zu© 2016 Hogrefe
wenden, die sie als zu Mädchen gehörend kategorisieren, wohingegen Jungen sich von diesen fernhalten und sich Dingen und Tätigkeiten zuwenden, die sie als zu Jungen passend ansehen (z. B. Martin & Halverson, 1981; 1987). Zahlreiche aktuelle Studien zeigen entsprechend, dass sich Jungen und Mädchen in ihren Präferenzen für Spielzeuge (Jungen z. B. Fahrzeuge, Werkzeuge; Mädchen z. B. Puppen, Haushalt, Garderobe) und Aktivitäten (z. B. bzgl. Fernsehsendungen, Spiele) unterscheiden und deshalb auch unterschiedlich viele Erfahrungen mit den als Mädchen- bzw. Jungenspielzeugen geltenden Objekten sammeln (z. B. Cherney & London, 2006; Freeman, 2007; Goble et al., 2012 mit großen Effektstärken von d ≥ 1.0 für die geschlechtsspezifischen Spielpräferenzen). Zudem typisieren sie in ähnlicher Weise auch Kompetenzdomänen (z. B. Mathematik versus Sprachen) und Eigenschaften (z. B. stark versus hilfsbereit) in Übereinstimmung mit gängigen Geschlechterstereotypen (Miller, Lurye, Zosuls & Ruble, 2009). Auch in dem für die Wortschatzentwicklung besonders wichtigen Bereich des Lesens wurde bereits aufgezeigt, dass Mädchen und Jungen unterschiedlichen Lesestoff präferieren und wählen, welcher sich sowohl hinsichtlich der Thematik als auch des Textgenres unterscheidet (z. B. die Präferenz von Jungen für Sachbücher oder Technikthemen [Garbe, 2008; Pfost, Dörfler & Artelt, 2012]). Darüber hinaus zeigte die entwicklungspsychologische Forschung, dass nicht nur Präferenzen, sondern auch ein basaler kognitiver Prozess wie das Erinnern davon beeinflusst ist, ob die Geschlechtsstereotypisierung der gezeigten Objekte, Tätigkeiten oder Personen mit der eigenen Geschlechtszugehörigkeit übereinstimmt oder nicht (vgl. Meta-Analyse von Signorella, Bigler & Liben, 1997; Effektstärken von d = 0.35 [Vorteil in der Erinnerungsleistung von Mädchen bei femininen Objekten] bzw. d = 0.34 [Vorteil von Jungen bei maskulinen Objekten]). Aufgrund dieser Geschlechtsunterschiede in der Beschäftigung mit sowie dem Erinnern von geschlechtstypisierten Objekten und Domänen, Aktivitäten und Eigenschaften wäre zu erwarten, dass zumindest im Kindesalter auch entsprechende Unterschiede in der Kenntnis der Wörter, die diese Objekte, Domänen, Aktivitäten und Eigenschaften bezeichnen, bestehen. Diese könnten wiederum bedeutsam für die Rezeption und Verarbeitung schulrelevanter Informationen und Aufgaben sein (z. B. wenn Jungen ein Wort wie «Profit» häufiger kennen als Mädchen und dieses Wort Teil einer Mathematikaufgabe ist). Empirische Befunde zu Wortschatz und Geschlecht Empirische Forschungsbefunde in Hinblick auf die geschlechtsbezogene Untersuchung sprachlicher Kompetenzen weisen auf systematische Unterschiede zwischen den Geschlechtern hin. So wurden vielfach Vorteile von Mädchen gegenüber Jungen in der Lesekompetenz, der LeseZeitschrift für Pädagogische Psychologie (2016), 30(1), 45–55
N. McElvany et al., Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter
motivation und teilweise dem Leseverhalten im Jugendalter gezeigt (z. B. Baker & Wigfield, 1999; Lynn & Mikk, 2009). Auch für die frühe Kindheit wurden punktuell sprachliche Vorteile (früheres Sprechen, komplexere Ausdrücke) von Mädchen berichtet (Bornstein, Hahn & Haynes, 2004). Für den Wortschatz wurden hingegen in den meisten Studien keine geschlechtsbedingten quantitativen Unterschiede gefunden (siehe Hedges & Nowell, 1995; Hyde, 2014; siehe jedoch für Kinder unter drei Jahren Eriksson et al., 2012). Auch die Manuale von Wortschatztests weisen in der Regel auf keine bedeutsamen Mittelwertunterschiede zwischen Jungen und Mädchen hin (z. B. Wortschatztest aus dem Grundintelligenztest CFT 20, Weiß, 2006; Aktiver Wortschatztest für 3- bis 5-jährige Kinder – Revision, Kiese-Himmel, 2005). Zu der Frage qualitativer Unterschiede im Wortschatz von Jungen und Mädchen liegen deutlich weniger Forschungsergebnisse vor. Stennes, Burch, Sen und Bauer (2005) zeigten, dass Jungen und Mädchen im Alter von zwei bis drei Jahren im produktiven Wortschatz Unterschiede in Abhängigkeit von der Geschlechtstypizität der Wörter aufwiesen. Richter (1994) fand unterschiedliche «Lieblingswortschätze» von Jungen (z. B. aus den Bereichen Technik und Sport) und Mädchen (z. B. aus den Bereichen Kleidung und Tiere). Sowohl die Analyse von 145 Aufsätzen und Texten in einem deutschen Grundschulsample (Richter & Brügelmann, 1996) als auch in einer internationalen Textdatenbank (Newman, Groom, Handelman & Pennebaker, 2008) ergab geschlechtsspezifische Textausgestaltungen bzw. eine geschlechtsspezifische unterschiedliche Nutzung von Wörtern (insbesondere in Bezug auf psychologische und soziale Prozesse). Entsprechende Differenzen bei der Nutzung verschiedener Wortarten fanden sich auch in der Sprachproduktion von Erwachsenen (Singh, 2001). Neuere Studien, die Leseitems anhand von Differential Item Functioning-Analysen untersuchten, identifizierten zudem Leseaufgaben, bei denen Mädchen systematisch andere Lösungswahrscheinlichkeiten aufwiesen als Jungen mit der gleichen Lesekompetenz (Schwabe, McElvany & Trendtel, 2015; Stoneberg, 2004). Insgesamt finden sich in den wenigen vorhandenen Studien Hinweise auf Wortschatzdifferenzen zwischen Jungen und Mädchen, die sich bisher vor allem auf den produktiven Wortschatz beziehen und keine Aussagen über Geschlechtsunterschiede im rezeptiven Wortschatz erlauben. Da der Wortschatz in substantiellem Umfang implizit erworben wird, ist davon auszugehen, dass der familiäre Kontext hierbei eine bedeutende Rolle spielt. Zentrale Merkmale des familiären Hintergrunds von Jungen und Mädchen sind nicht nur die geschlechtsspezifischen Lernund Spielumgebungen, sondern auch der soziale Status ihrer Familie und die Familiensprache. Zeitschrift für Pädagogische Psychologie (2016), 30(1), 45–55
47
Wortschatz und familiärer Hintergrund Zwei im Bildungskontext einflussreiche Merkmale des familiären Hintergrunds sind der soziale Status und die Familiensprache, welche migrationsbedingt eine andere Sprache als die in der Schule gesprochene Sprache sein kann. Positive Zusammenhänge zwischen dem sozialen familiären Hintergrund und der rezeptiven sowie produktiven Wortschatzentwicklung von Kindern sind sowohl international (Hart & Risley, 1995; Hoff, 2003; McLoyd, 1990; für einen Überblick siehe Fernald & Weisleder, 2011 und Vasilyeva & Waterfall, 2011) als auch national (Becker, 2011; Hoff-Ginsberg, 2000; Weinert & Ebert, 2013) vielfach empirisch belegt. Weinert und Ebert (2013) konnten in einer deutschen Studie zeigen, dass mit sozialem Hintergrund korrelierte Wortschatzunterschiede bereits zu Beginn des Kindergartens vorlagen (vgl. auch Ermisch, 2008). Die Unterschiede waren über die Kindergartenzeit hinweg stabil bzw. nahmen sogar zu (international: Farkas & Beron, 2004; Deutschland: Weinert & Ebert, 2013). Untersuchungen mit Zwillingen, die in unterschiedlichen sozialen Umwelten aufwuchsen, konnten zeigen, dass Wortschatzunterschiede zwischen zweijährigen Kindern größtenteils (ca. 70 %) auf unterschiedliche Umweltbedingungen zurückzuführen sind (vgl. z. B. Dale et al., 1998). Huttenlocher, Vasilyeva, Cymerman und Levine (2002) fanden empirische Hinweise dafür, dass Effekte des sozialen Hintergrunds auf den Wortschatz zumindest teilweise durch das Sprachinput der Eltern vermittelt werden (siehe auch Cartmill et al., 2013; Hoff, 2003). Neben dem sozialen Status ist die Familiensprache ein wichtiges familiäres Hintergrundmerkmal. Eine substantiell große Gruppe von Lernenden an deutschen Schulen (40 %) spricht zu Hause ausschließlich oder zusätzlich eine andere Sprache als Deutsch, muss aber im schulischen Kontext auf Deutsch und somit in einer Zweitsprache kommunizieren (OECD, 2010). Diese Lernenden befinden sich in einer spezifischen Situation hinsichtlich ihres Wortschatzerwerbs (vgl. Gogolin & Lange, 2011). Vor dem Hintergrund, dass ein großer Teil des Wortschatzes in der Regel implizit aus dem Umfeld gelernt wird, stehen diese Kinder und Jugendlichen vor besonderen Herausforderungen in Bezug auf Niveau und Weiterentwicklung ihres Wortschatzes. Inzwischen ist gut dokumentiert, dass bilinguale Kinder im Vergleich zu monolingualen Kindern in beiden Sprachen über einen quantitativ geringeren Wortschatz verfügen (z. B. Bialystok, 2009; Limbird, 2007), sodass die Förderung sprachlicher Kompetenzen und insbesondere auch des deutschen Wortschatzes für den schulischen Erfolg dieser Schülergruppe von wesentlicher Relevanz ist. © 2016 Hogrefe
48
N. McElvany et al., Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter
Forschungsanliegen Wegen der großen Bedeutung des Wortschatzes von Kindern für ihr weiteres Lernen und vor dem Hintergrund der vorliegenden Befunde zu geschlechtstypisierten Interessen und Aktivitäten von Kindern untersucht der vorliegende Beitrag unter Anwendung von Differential Item Functioning (DIF)-Analysen die übergeordnete Frage, ob es qualitative Unterschiede im Wortschatz von Mädchen und Jungen im Grundschulalter gibt. Es werden drei konkrete Forschungsfragen und damit verbundene Hypothesen verfolgt. Erstens wird geprüft, ob es quantitative Unterschiede im Wortschatz von Mädchen und Jungen gibt. Es werden keine quantitativen Unterschiede im Gesamtwortschatz zwischen beiden Gruppen erwartet (Hypothese 1). Zweitens wird untersucht, ob qualitative Unterschiede im Wortschatz von Mädchen und Jungen bestehen. Auf Basis der theoretischen Überlegungen zu geschlechtsspezifischem Wortschatz wird angenommen, dass bei männlich konnotierten Wörtern unter Kontrolle des allgemeinen Wortschatzes die Wahrscheinlichkeit für Jungen, die Bedeutung der Wörter zu kennen, größer ist als für Mädchen (Hypothese 2a). Demgegenüber wird angenommen, dass die Wahrscheinlichkeit der Kenntnis weiblich konnotierter Wörter für Mädchen größer als für Jungen (Hypothese 2b) und dass die Lösungswahrscheinlichkeit bei neutralen Wörtern gleich groß für beide Geschlechter ist (Hypothese 2c). Schließlich wird geprüft, ob die Ergebnismuster zu quantitativen und qualitativen Unterschieden im Wortschatz von Mädchen und Jungen im Grundschulalter bestehen bleiben, wenn der soziale Hintergrund und die Familiensprache der Kinder in den Auswertungen kontrolliert werden. Es wird zwar erwartet, dass sich ein weniger sozial privilegierter Hintergrund sowie eine andere Familiensprache als Deutsch negativ auf die Wortschatzkompetenzen bei männlich, weiblich oder neutral konnotierten Wörtern auswirken (Hypothese 3a), die erwarteten Ergebnismuster zu quantitativen und qualitativen Wortschatzunterschieden aber auch bei Kontrolle des Familienhintergrunds zwischen den Geschlechtern konstant bleiben (Hypothese 3b).
Grundschulen in einer deutschen Großstadt und deren Umgebung teil. Die Teilnahme der Schulen war ebenso wie die von individuellen Schülerinnen und Schülern und deren Erziehungsberechtigten freiwillig und eine Elterngenehmigung zur Teilnahme an den Tests war notwendig. Diese lag für N = 1 050 Kinder vor. Die Analyse-Stichprobe wurde um weitere elf Kinder reduziert, weil für diese Kinder keine Angaben zu den relevanten Hintergrundvariablen vorlagen. Für N = 956 Kinder lagen zusätzlich Angaben aus Elternfragebögen vor. Die Kinder waren im Durchschnitt 9.08 Jahre alt (SD = 0.50) und 50.3 % der Teilnehmenden waren weiblich. Die Angaben zum sozialen Hintergrund, für den anhand der Angaben zur elterlichen Berufstätigkeit der höchste ISEI-Index (International Socio-Economic Index of Occupational Status; Ganzeboom, de Graaf & Treiman, 1992) berechnet wurde, deuten mit einem Mittelwert von M = 47.59 (SD = 15.65) auf eine sozial durchschnittliche Stichprobe hin. Für 60.0 % der Kinder ist Deutsch die zu Hause ausschließlich gesprochene Familiensprache, 38.2 % sprechen auch mindestens eine andere Sprache als Deutsch und 1.8 % nur eine andere Sprache oder andere Sprachen in der Familie. Die Kinder bearbeiteten die Wortschatzitems am Computer durch Anklicken der von ihnen für richtig gehaltenen Lösung sowie die ergänzenden Hintergrundfragen im Anschluss an die Computertestung im Papier-und-Stift-Format, nachdem sie eine entsprechende Einführung erhalten hatten (vgl. Abschnitt Instrumente). Die Erhebung fand im Klassenverband statt und wurde von zwei geschulten Testleitungen durchgeführt. Die Gesamtzeit der Erhebung war auf 90 Minuten begrenzt, wobei der Wortschatzteil pro Kind etwa fünf Minuten in Anspruch nahm. Da der Test ein reiner Power-Test ist, gab es kein zeitliches Stoppkriterium und individuelle Bearbeitungszeiten. Um eine Überlastung der Kinder und eine Reduktion der Validität durch überlange Testzeit bei gleichem Aufgabentyp zu vermeiden, erhielt jedes Kind zufällig einen Aufgabenblock mit 20 Wortschatzaufgaben zugewiesen, wobei zur Verlinkung jeweils die Hälfte der Aufgaben eines Testhefts mit der Hälfte der Aufgaben eines anderen Testhefts identisch war. So wurde jedes Wort von durchschnittlich 189 Kindern bearbeitet.
Methode Instrumente Stichprobe und Design An der vorliegenden Studie nahmen im Frühjahr 2012 1 106 Schülerinnen und Schüler aus 57 dritten Klassen von 1
Wortschatz Zur Erfassung des Wortschatzes wurden 96 Wortschatzitems1 eingesetzt (FALKE-WS; Schwabe & McElvany, 2013). Die Kinder hatten zu jedem vorgegebenen Wort aus
Insgesamt wurden 110 Wörter eingesetzt. Aufgrund einer Korrelation von < 0.2 mit dem Gesamtscore wurden im Rahmen der Skalierung jedoch zwölf Items ausgeschlossen. Zwei weitere Items konnten bezüglich ihrer Konnotation nicht kategorisiert werden und wurden daher ebenfalls ausgeschlossen.
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 45–55
N. McElvany et al., Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter
vier Alternativen dasjenige Wort auszuwählen, das die gleiche oder eine sehr ähnliche Bedeutung hatte wie das Zielwort. Es handelt sich demnach um die Erfassung des passiven Wortschatzes. Der Aufgabentyp entspricht der Erfassung in anderen Testverfahren wie dem KFT (Untertest 1 Sprachverständnis; Heller & Geisler, 1983) oder dem CFT (Wortschatz-Test; Weiß, 2006). Die Items wurden in einem mehrstufigen Verfahren entwickelt, das sowohl theoretische Schritte (z. B. Feedback zu Iteminhalten von Expertinnen und Experten, u. a. Grundschullehrkräfte im Schuldienst, Linguisten und Empirische Bildungsforscherinnen und Bildungsforscher) als auch empirische Überprüfungen (z. B. Pilotierung im Papier-und-Stift-Format; Skalierung; DIF-Analysen; Pilotierung computerbasierter Darbietung) umfasste. Die Aufgaben wurden computerbasiert an Laptops im Klassenzimmer vorgegeben. Die Zielwörter umfassen die Wortarten Substantive (N = 40), Verben (N = 29) und Adjektive/Präpositionen/andere Wortarten (N = 27) und stammen sowohl aus dem Alltagsals auch aus dem Bildungswortschatz. Richtige Antworten wurden mit einem Punkt, falsche Antworten mit null Punkten bewertet. Die Wortschatzitems wurden mittels eines 1PL-Modells mit den Paketen TAM (Kiefer, Robitzsch & Wu, 2014) und lme4 (Bates, Maechler, Bolker & Walker, 2014) der Programmierumgebung R (R Core Team, 2014) Rasch-skaliert und weisen eine zufriedenstellende EAP-Reliabilität von .70 auf. A-priori-Kodierung der Geschlechtskonnotation Um die Zielwörter des Wortschatz-Tests als männlich konnotiert, weiblich konnotiert oder neutral zu kategorisieren, wurde in zwei Schritten vorgegangen: Zunächst wurden aus der pädagogischen und psychologischen Fachliteratur Merkmale zusammengetragen, die geschlechtstypische Eigenschaften oder geschlechtstypische Interessen und Aktivitäten wiedergeben (z. B. Athenstaedt, 2003; Eckes, 1997; vgl. auch Abschnitt Wortschatz und Geschlecht). Anhand der daraus abgeleiteten Indikatoren (siehe Tabelle 12) wurde anschließend jedes der 96 Wörter von drei der Autorinnen unabhängig voneinander als männlich oder weiblich konnotiert oder als geschlechtsneutral eingestuft. Als Kriterium für die anschließende finale Kategorisierung galten zwei übereinstimmende Urteile als männlich/weiblich/neutral (51.0 % der Wörter wurden in vollständiger Übereinstimmung geratet; Cohens κ: .34 – .46). Von den 96 Wörtern sind demnach anhand der theoriebasierten Indikatoren 17 als männlich konnotiert, 18 als weiblich konnotiert und 61 als neutral anzusehen.
2
3
49
Tabelle 1. Literaturbasierte Indikatoren für eine geschlechtsspezifische Konnotation von Wörtern Weiblich konnotiert:
Männlich konnotiert:
• Emotionen, Expressivität und Introspektion (z. B. Warmherzigkeit, Empfindsamkeit, Einfühlsamkeit) • Femininität, Attraktivität • Kleidung und Mode • Gemeinschaftsorientierung, Freundschaften, Fürsorglichkeit • Unterwürfigkeit • Abergläubigkeit • Haushalt, kochen • «Weiche» Themen/Hobbies wie z. B. Tiere, Musik, Puppen, Basteln
• • • •
• • •
•
Kompetenz und Instrumentalität Maskulinität Stärke, Dominanz, Aggressivität Individualität, Unabhängigkeit, Selbstbehauptung, Durchsetzungsvermögen, Selbstvertrauen Unternehmungslust, Abenteuer, Mut Sport «Technische» Themen/Hobbies wie Bausteine, Computer, Konsolen, Internet, Fachbegriffe aus Sach- und Fachbüchern Wirtschaft, Politik, Geschichte
Die weiblichen Indikatoren wurden bis auf den Indikator Abergläubigkeit in den Wortschatzitems identifiziert (z. B. für Unterwürfigkeit «ertragen»). Ein Schwerpunkt lag auf dem Indikator Emotionen, Expressivität und Introspektion (z. B. «innig»). Von den männlichen Indikatoren wurden zwei Indikatoren Maskulinität und Unternehmungslust, Abenteuer, Mut nicht in den Wortschatzitems identifiziert. Ein Schwerpunkt lag auf dem Indikator «Technische» Themen/Hobbies wie Bausteine, Computer, Konsolen, Internet, Fachbegriffe aus Sach- und Fachbüchern (z. B. «Helikopter»). Geschlecht Das Geschlecht der Kinder wurde anhand des von den Kindern ausgefüllten Schülerfragebogens erhoben, wobei fehlende Angaben durch Angaben aus der Schülerteilnahmeliste bzw. dem Elternfragebogen ergänzt wurden. Sozialer Hintergrund Zur Erfassung des sozialen Status wurde der Indikator Buchbesitz im Haushalt verwendet, wobei fehlende Angaben aus dem Elternfragebogen durch Angaben aus dem Schülerfragebogen ergänzt wurden3. Aus den erhobenen fünf Antwortkategorien wurde eine Dummy-Variable gebildet, die einen eher niedrigen sozialen Status (0 = bis zu 100 Bücher) von einem eher hohen sozialen Status (1 = mehr als 100 Bücher) unterscheidet. Die Kinder mit eher niedrigem sozialen Status (N = 523) unterschieden sich in ihrer Gesamttestleistung zu ihren Ungunsten signifikant von den Kindern mit eher hohem sozialen Status (N = 516; t(1034.93) = –10.86, p < .05, d = 0.67)
Eine ausführlichere Tabelle, die die Literaturquellen für die einzelnen Aspekte jeweils gesondert angibt und weitere Beispielitems enthält, kann bei der Erstautorin angefordert werden. Die Analysen zu Forschungsfrage 3 wurden zum Vergleich auch mit dem HISEI als Indikator für den sozialen Status gerechnet. Dieses führte zu dem gleichen Ergebnismuster. Aufgrund der deutlich höheren Missing-Anzahl beim HISEI wird daher die Bücher-Variable verwendet.
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 45–55
© 2016 Hogrefe
50
N. McElvany et al., Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter
Familiensprache Für die Analysen wurde eine Dummy-Variable gebildet, die zwischen Kindern, die in ihren Familien nur Deutsch sprechen, und Kindern, die in ihren Familien Deutsch und eine andere Sprache oder nur eine andere Sprache sprechen, differenziert (0 = nur Deutsch; 1 = Deutsch und eine andere Sprache oder nur eine andere Sprache). Dabei wurden fehlende Angaben aus dem Elternfragebogen durch Angaben aus dem Schülerfragebogen ergänzt. Die Kinder mit nur deutscher Familiensprache (N = 623) wiesen eine signifikant höhere Gesamttestleistung auf als die Kinder mit nichtdeutscher Familiensprache (N = 416; t(879.98) = 8.08, p < .05, d = 0.51).
Analysestrategie Der Frage nach quantitativen Wortschatzunterschieden zwischen Mädchen und Jungen im Gesamtwortschatztest wurde nachgegangen, indem die mittleren Leistungswerte der Jungen und Mädchen mit einem t-Test auf Unterschiedlichkeit getestet wurden. Zur besseren Interpretation der Effekte wird zusätzlich Cohens d berichtet. Zur Untersuchung der Fragen zu qualitativen Wortschatzunterschieden wurden Generalized Linear Mixed Models (GLMM) in der Formulierung nach De Boeck et al. (2011) zur Aufdeckung von uniform DIF, also Gruppenunterschieden in den Itemparametern, die über alle Fähigkeitslevel gleichgerichtet sind, implementiert. In diesem Artikel entspricht dies der Frage, ob Jungen und Mädchen sich trotz gleichem Gesamtwortschatz in der Wahrscheinlichkeit der Kenntnis einer bestimmten Wortgruppe unterscheiden. Aufgrund der fehlenden empirischen Basis für die Annahme von Unterschieden in Größe und Ausrichtung des DIF-Effekts wird uniform – d. h. gleichförmiger – DIF untersucht. Die Modellparameter wurden in einem IRTKontext mit dem Paket lme4 (Bates et al., 2014) geschätzt (vgl. für ein analoges Vorgehen Schwabe et al., 2015). Nach De Boeck et al. (2011) kann das 1PL-Modell der IRT für eine Person p und ein Item i wie folgt aufgestellt werden: ηpi = θp + βi wobei ηpi den Logit der Wahrscheinlichkeit einer korrekten Antwort, θp ~N(0,σ2θ) die Fähigkeit der Person und βi die Leichtigkeit des Items beschreiben. Weiter lässt sich ein DIF-Modell formulieren als: ηpi = θp + βi + ζfocal Z(p,i)focal + ∑Hh=1 ωhW(p,i)h mit ζfocal als übergeordneter Effekt der Zugehörigkeit zur Fokusgruppe [hier Jungen] im Vergleich zur Referenzgruppe [hier Mädchen], wobei Z die Gruppenzugehörigkeit indi-
4
ziert (Fokusgruppe: Z(p,i)focal = 1; Referenzgruppe: Z(p,i)focal = 0); W(p,i)h die Indikatormatrix der Person-by-Item Kovariaten h, wobei W(p,i)h den Wert 1 annimmt, wenn das betrachtete Item als DIF-Item angenommen wird und gleichzeitig die betrachtete Person zur Fokusgruppe gehört, andernfalls gilt W(p,i)h = 0; ωh bezeichnet den zugehörigen DIF-Parameter (De Boeck et al., 2011, S. 18; leicht paraphrasierte Übersetzung durch Autorengruppe). Betrachtet wurde DIF in Subgruppen von Items, die ein bestimmtes Merkmal, beispielsweise eine männliche Konnotation, aufweisen (vgl. «item subset DIF», De Boeck et al., 2011, S. 18). Die resultierenden DIF-Parameter-Schätzer der einzelnen Modelle wurden mittels tTests zu einem α-Niveau von .05 auf Verschiedenheit von Null getestet. Zusätzlich werden Effektstärken über MacFaddens (1973) Pseudo R2 beziehungsweise dem zugehörigen f 2 nach berichtet. f 2 > .02 gelten hierbei als kleine Effekte. In den Analysen wurden Itemgruppen, die ein bestimmtes Merkmal (Modell 1: männlich konnotierte Wörter; Modell 2: weiblich konnotierte Wörter; Modell 3: geschlechtsneutrale Wörter) aufweisen, in Hinblick auf ihre Interaktion mit der fokussierten Schülergruppe (weiblich bzw. männlich) analysiert. Um quantitative Unterschiede zwischen den Schülergruppen nach Geschlecht zu kontrollieren, umfassen alle spezifizierten Modelle Haupteffekte des Geschlechts. Weiterhin wurden die Schülerinnen und Schüler selbst und die Schule als zufällige Effekte in die Modelle aufgenommen, um individuelle Unterschiede und Effekte der Schulzugehörigkeit zu kontrollieren. Um zum Abschluss zu prüfen, ob sich eine Kontrolle des sozialen Hintergrunds und der Familiensprache auf die Ergebnismuster zu quantitativen und qualitativen Wortschatzunterschieden auswirkt, wurden im letzten Schritt in allen oben genannten Modellen zusätzlich Haupteffekte der beiden familiären Hintergrundmerkmale (sozialer Status, Familiensprache) mit modelliert.
Ergebnisse Quantitative Wortschatzunterschiede zwischen Mädchen und Jungen Die Mittelwerte und Standardabweichungen für den Gesamttest und für die Wörtergruppen nach Konnotation werden in Tabelle 2 für die Gesamtstichprobe und getrennt für beide Geschlechter angegeben4. Ein t-Test für
Es wird theoretisch davon ausgegangen, dass der geschlechterspezifische Wortschatz von Grundschulkindern vor allem im familiären Kontext erworben wurde und insofern die pragmatische Erhebung im Klassenverbund in den Analysen nicht weiter zu berücksichtigen ist. Diese Annahme wird empirisch durch eine Analyse der Varianzzerlegung unterstützt, die nur 1 % Varianz auf Klassenebene und 9 % Varianz auf Schulebene ergibt – ein plausibler Indikator vor dem Hintergrund sozialer Kompositionen von Schulen und dem Zusammenhang von sozialem Hintergrund und Wortschatz (vgl. Forschungsfrage 3). Der Designeffekt beträgt 2.86.
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 45–55
N. McElvany et al., Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter
51
Tabelle 2. Mittelwerte und Standardabweichungen des Prozentsatzes der korrekt gelösten Wortschatzitems für die Gesamtgruppe und nach Geschlecht Gesamt
Mädchen
Jungen
M
SD
M
SD
M
SD
Gesamt
63.0
19.2
63.7
19.2
62.3
19.2
Männlich konnotiert
65.6
30.3
65.0
29.6
66.1
31.0
Weiblich konnotiert
65.1
30.3
67.1
29.6
63.1
30.8
Neutral
61.7
21.0
62.5
21.3
60.9
20.6
Wortschatz
unabhängige Stichproben zeigt bezüglich der ersten Forschungsfrage nach quantitativen Unterschieden im Gesamtwortschatz, dass Mädchen und Jungen keine statistisch signifikanten Wortschatzunterschiede aufweisen (t(1036.77) = –1.15, p > .05, d = 0.07). Mädchen kennen im Mittel von 63.7 % der Wörter, die sie insgesamt bearbeitet haben, die richtige Bedeutung, Jungen von 62.3 %. Hypothese 1 erhält somit auch in dieser Stichprobe von Schülerinnen und Schülern der dritten Klassenstufe an Grundschulen in Deutschland empirische Unterstützung. Für die männlich konnotierten (t(1033.03) = 0.59, p > .05, d = 0.03) und neutralen (t(1036.42) = –1.22, p > .05, d = 0.08) Wörter wurden ebenfalls keine Unterschiede in den prozentualen Mittelwerten von Jungen und Mädchen gefunden. Bei den weiblich konnotierten Wörtern erreichten die Mädchen hingegen einen höheren Mittelwert (t(1033.98) = –2.15, p < .05, d = 0.13). Insgesamt wird eine große Streuung der Wortschatzkenntnisse deutlich.
Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen Zur Überprüfung der zweiten Forschungsfrage nach qualitativen Unterschieden im Wortschatz von Mädchen und Jungen wurde zunächst ein 1PL-Modell mit dem Haupteffekt als Basismodell spezifiziert (Modell 0) und darauf aufbauend ein DIF-Modell mit der zusätzlichen Interaktion Geschlecht × männlich konnotierte Wörter (Modell 1), ein DIF-Modell mit der Interaktion Geschlecht × weiblich konnotierte Wörter (Modell 2) und ein DIF-Modell mit der Interaktion Geschlecht × neutrale Wörter (Modell 3). Der Haupteffekt für das Geschlecht war in allen vier Modellen statistisch nicht signifikant (vgl. Tabelle 3). Der Interaktionseffekt in Modell 1 war statistisch signifikant. Männlich konnotierte Wörter wurden demnach seltener von Mädchen als von Jungen mit gleichem mittlerem Gesamtwort-
Tabelle 3. Differentielle Effekte der Konnotation auf die Schwierigkeiten der Wortschatzitems nach Geschlecht (1PL-Modelle) Effekte
Modell 0
Modell 1 (männlich konnotierte Wörter)
Modell 2 (weiblich konnotierte Wörter)
Modell 3 (neutrale Wörter)
Parameter (SE)
Parameter (SE)
Parameter (SE)
Parameter (SE)
Haupteffekt Geschlecht (weiblich)
0.05 (0.06)
0.10 (0.07)
0.01 (0.07)
0.04 (0.08)
Interaktionen Konnotation männlich: Geschlecht (weiblich) Konnotation weiblich: Geschlecht (weiblich) Neutral: Geschlecht (weiblich)
–0.25* (0.09) 0.21* (0.09) 0.02 (0.07)
Anmerkungen. SE = Standardfehler des Parameters; * p < .05.
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 45–55
© 2016 Hogrefe
52
N. McElvany et al., Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter
schatz gekannt. Dies unterstützt Hypothese 2a zu Vorteilen von Jungen bei männlich konnotierten Wörtern. Der Interaktionseffekt in Modell 2 war ebenfalls statistisch signifikant, allerdings mit umgekehrtem Vorzeichen: Weiblich konnotierte Wörter waren Mädchen häufiger bekannt als Jungen mit gleich großem Gesamtwortschatz. Hypothese 2b zu Vorteilen von Mädchen bei weiblich konnotierten Wörtern erhält empirische Unterstützung. Der Interaktionseffekt in Modell 3 war nicht signifikant. Dies unterstützt Hypothese 2c dahingehend, dass weder Mädchen noch Jungen bei neutralen Wörtern Vorteile haben. Das Pseudo R2 der Modelle 1–3 beträgt jeweils .15. Im Vergleich zu einem Basismodell, das keine Interaktionseffekte umfasst liegen die f 2 Kennzahlen für diese Modelle bei .01, dies entspricht kleineren als kleinen Effekten.
Ergebnismuster bei Kontrolle des familiären Hintergrunds In einem letzten Schritt wurde geprüft, ob das Ergebnismuster stabil bleibt, wenn zusätzlich zentrale Merkmale des familiären Hintergrunds kontrolliert werden. Wie auch in anderen Studien zeigte sich auch hierbei in allen Modellen ein positiver Haupteffekt eines höheren sozialen
Status und ein negativer Haupteffekt einer anderen Familiensprache als Deutsch auf den Wortschatz als zentrale sprachliche Kompetenz (siehe Tabelle 4). Der Haupteffekt des Geschlechts ist in allen Modellen nicht statistisch signifikant (vgl. Hypothese 3a) und ebenso änderte sich das Muster der Interaktionen nicht (vgl. Hypothese 3b): Auch bei zusätzlicher Kontrolle zentraler Familienmerkmale wurden männlich konnotierte Wörter häufiger von Jungen als von Mädchen und weiblich konnotierte Wörter häufiger von Mädchen als von Jungen mit jeweils gleichen Gesamtwortschatzfähigkeiten hinsichtlich ihrer Bedeutung gekannt. Bei neutralen Wörtern hatte keines der Geschlechter einen Vorteil. Das Pseudo R2 der kontrollierten Modelle beträgt jeweils .16. Im Vergleich zu einem Basismodell, das keine Interaktionseffekte umfasst liegen die f 2 Kennzahlen für diese Modelle bei .02, dies entspricht kleinen Effekten.
Diskussion Der Beitrag untersuchte vor dem Hintergrund von theoretischen Annahmen zu geschlechterspezifischen Sozialisationskontexten und Interessen mit DIF-Analysen qualita-
Tabelle 4. Differentielle Effekte der Konnotation auf die Schwierigkeiten der Wortschatzitems nach Geschlecht, kontrolliert für sozialen Status und Familiensprache (1PL-Modelle) Effekte
Modell 0
Modell 1 (männlich konnotierte Wörter)
Modell 2 (weiblich konnotierte Wörter)
Modell 3 (neutrale Wörter)
Parameter (SE)
Parameter (SE)
Parameter (SE)
Parameter (SE)
Haupteffekt Geschlecht (weiblich)
0.04 (0.06)
0.09 (0.06)
0.00 (0.06)
0.02 (0.08)
Sozialer Status (hoch)
0.51* (0.07)
0.52* (0.07)
0.52* (0.07)
0.51* (0.07)
–0.39* (0.07)
–0.39* (0.07)
–0.39* (0.07)
–0.39* (0.07)
Familiensprache (nicht Deutsch)
Interaktionen Konnotation männlich: Geschlecht (weiblich)
Konnotation weiblich: Geschlecht (weiblich)
Neutral: Geschlecht (weiblich)
–0.25* (0.09)
0.21* (0.09)
0.02 (0.07)
Anmerkungen. SE = Standardfehler des Parameters; * p < .05.
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 45–55
N. McElvany et al., Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter
tive Unterschiede in sprachlichen Kompetenzen, konkret im Wortschatz, von Mädchen und Jungen im Grundschulalter. Die empirischen Befunde weisen auf Vorteile von Mädchen im Vergleich zu Jungen bei weiblich konnotierten und auf Nachteile bei männlich konnotierten Wörtern hin. Hypothesenkonform gibt es bei von der Konnotation her geschlechtsneutralen Wörtern keine Unterschiede in der Wortschatzkenntnis beider Gruppen. Das Ergebnismuster erwies sich auch unter Kontrolle zentraler familiärer Merkmale wie dem sozialen Status und der Sprache der Familien als stabil, wobei die Effekte von kleiner Größe sind. Während der Nachteil der Mädchen bei männlich konnotierten Wörtern bei der bloßen Betrachtung von Mittelwertunterschieden aufgrund der fehlenden Berücksichtigung des Gesamtfähigkeitsniveaus nicht aufgedeckt wurde, ermöglichen die DIF-Analysen ein differenzierteres Bild. Somit konnte mit dieser Studie erstmals unter Verwendung von DIF-Analysen nachgewiesen werden, dass Jungen und Mädchen im Grundschulalter diejenigen Wörter, die mit der eigenen Geschlechtsgruppe assoziiert sind, häufiger kennen als die jeweils andere Geschlechtsgruppe diese kennt. Im Fokus der Analysen stand die Untersuchung der Bedeutung von Wörtern als der zentralen Wortschatzkenntnisdimension (vgl. Nation, 2001). Diese Kenntnis der Bedeutung von Wörtern bildet eine zentrale Komponente des rezeptiven Wortschatzes ab, dem eine Schlüsselfunktion für sämtliche Lernprozesse zukommt, die auf sinnerfassendem Lesen und Hören aufbauen. Unsere Ergebnisse verdeutlichen, dass Jungen und Mädchen im Grundschulalter jene Wörter besser kennen, die etwas aus der zur eigenen Geschlechtsgruppe passend stereotypisierten Lebenswelt beschreiben. Dieser Befund könnte daraus resultieren, dass Jungen und Mädchen mit den als zur eigenen (statt zur anderen) Geschlechtsgruppe passend stereotypisierten Objekten und Aktivitäten häufiger Kontakt haben und deshalb die Wörter, die diese bezeichnen, wahrscheinlicher kennenlernen können. Damit stehen diese Ergebnisse in einer Reihe mit empirischen Studien, die auf verschiedenen Ebenen zeigten, dass Kinder Dinge und Aktivitäten präferieren, die als zum eigenen Geschlecht passend kategorisiert wurden. Sie interagieren mit diesen länger, wodurch sie mehr Lern- und Übungsgelegenheiten im Umgang mit diesen haben, was schließlich zu besseren Leistungen führt (zusammenfassend aktuell Brown, 2014). Darüber hinaus ist vor dem Hintergrund vorliegender experimenteller Studien zum Einfluss von Geschlechtsstereotypisierung von Objekten auf die Erinnerungsleistung anzunehmen, dass unser Befund auch die differentielle Lernleistung im Sinne des geschlechtsbezogenen selektiven Erinnerns abbildet (vgl. Signorella et al., 1997). Zusammen mit den bereits vorliegenden Befunden kann anhand der aktuellen Studie gefolgert werden, dass Zeitschrift für Pädagogische Psychologie (2016), 30(1), 45–55
53
am Ende des Grundschulalters nicht nur Geschlechtsunterschiede in der aktiven Nutzung von Wörtern bestehen (vgl. Newman et al., 2008; Stennes et al., 2005; Richter & Brügelmann, 1996), sondern auch solche in der Kenntnis der Wortbedeutungen. Einschränkend ist darauf hinzuweisen, dass der untersuchte Wortschatztest keine systematische Gruppierung der einbezogenen Wörter nach Inhaltsbereichen vorsah, die eine noch direktere Ableitung der geschlechtsbezogenen Kategorisierung über die Ebene des einzelnen Wortes hinaus erlaubt hätte. Ebenso gab es keine systematische Trennung in Alltags- und Bildungswortschatz (vgl. Berendes, Dragon, Weinert, Heppt & Stanat, 2013; Gogolin & Lange, 2011). Kritisch anzumerken ist schließlich auch, dass Qualität in Bezug auf den Wortschatz in dieser Studie nur über eine mögliche Definition operationalisiert wurde – die Kenntnis unterschiedlich konnotierter Wörter –, während andere mögliche Definitionen (vgl. z. B. Wortschatztiefe, Oullette, 2006) nicht untersucht wurden. Die genannten Einschränkungen weisen gleichzeitig auf Desiderate für zukünftige Forschung hin, die insbesondere die Zahl und Art der untersuchten Wörter verbreitern und systematisieren und auch vermehrt schwierigere Wörter in allen Bedingungen einbeziehen sollte. Angesichts der Geschlechtskonnotation vieler alltäglicher Erfahrungsbereiche von Kindern würde eine ausschließliche Verwendung von geschlechtsneutralen Wörtern in Wortschatztests zu einer wenig sinnvollen Reduktion verwendbarer Begriffe führen. Wie hoch der Anteil geschlechtskonnotierter Wörter insgesamt sein sollte, ist letztlich eine normative Frage. Unsere Ergebnisse unterstreichen jedoch die Wichtigkeit, bei der Konstruktion von Messinstrumenten zur Erfassung des kindlichen Wortschatzes auf eine ausgewogene und damit geschlechtergerechte Verwendung von vergleichbar schwierigen männlich und weiblich konnotierten Wörtern zu achten, da andernfalls die Kenntnisse systematisch über- oder unterschätzt werden könnten. Bei dem hier verwendeten Testinstrument ist dieses Ziel insgesamt realisiert, indem sich die weiblich und männlich konnotierten Wörter in ihrer Schwierigkeit nicht systematisch voneinander unterscheiden und durch eine balancierte Administration der Wörter in den Gesamtscores keine Instrument-bedingten Geschlechtsunterschiede auftraten. In Bezug auf die pädagogische Praxis weist die Studie mit den Befunden zu signifikanten Geschlechtsunterschieden im rezeptiven Wortschatz bei Kindern am Ende der Grundschulzeit auf die Relevanz, Kindern im schulischen Kontext Erfahrungen und Kenntnisse über eine möglichst große Bandbreite an Dingen und Aktivitäten zu ermöglichen. Dies ist vor allem auch für Bereiche relevant, deren Geschlechtskonnotation nicht zur eigenen Geschlechtsgruppe passt, da bekannt ist, dass viele Kinder © 2016 Hogrefe
54
N. McElvany et al., Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter
von sich aus viel zu wenige der Gegenstände und Aktivitäten explorieren, die sie als zur anderen Geschlechtsgruppe gehörig kategorisiert haben (z. B. Goble et al., 2012). Diese Beschränkung verschafft ihnen in den als nicht zur eigenen Geschlechtsgruppe kategorisierten Bereichen einen Nachteil wie hier im Wortschatz. Geschlechtergerechte Bildungsarbeit bedeutet in diesem Kontext, dem pädagogischen Auftrag nachzukommen, bei den Kindern – Jungen wie Mädchen – Interesse für Themen und Tätigkeiten zu wecken, die sonst im Alltag häufig dem jeweils anderen Geschlecht zugeschrieben werden, und die sprachliche Bildung aktiv um die damit verbundenen Begriffe zu erweitern.
Literatur Athenstaedt, U. (2003). On the content and structure of the gender role self-concept: Including gender-stereotypical behaviors in addition to traits. Psychology of Women Quarterly, 27, 309–318. Baker, L. & Wigfield, A. (1999). Dimensions of children's motivation for reading and their relations to reading activity and reading achievement. Reading Research Quarterly, 34, 452–477. Bates, D., Maechler, M., Bolker, B. & Walker, S. (2014). lme4: Linear mixed-effects models using Eigen and S4 (R-Paket Version 1.1-7). Zugriff am 10.12.2014 http://CRAN.R-project.org/ package=lme4 Becker, B. (2011). Social disparities in children's vocabulary in early childhood. Does preschool education help to close the gap? British Journal of Sociology, 62, 69–88. Berendes, K., Dragon, N., Weinert, S., Heppt, B. & Stanat, P. (2013). Hürde Bildungssprache? Eine Annäherung an das Konzept «Bildungssprache» unter Einbezug aktueller empirischer Forschungsergebnisse. In A. Redder & S. Weinert (Hrsg.), Sprachförderung und Sprachdiagnostik – interdisziplinäre Perspektiven (S. 17–41). Münster: Waxmann. Bialystok, E. (2009). Bilingualism – The good, the bad, and the indifferent. Bilingualism: Language and Cognition, 12, 3–11. Bornstein, M. H., Hahn, C.-S. & Haynes, O. M. (2004). Specific and general language performance across early childhood: Stability and gender considerations. First Language, 24, 267–304. Bradley, R. H. & Corwyn, R. F. (2002). Socioeconomic status and child development. Annual Review of Psychology, 53, 71–99. Brown, C. S. (2014). Parenting beyond pink & blue: How to raise your kids free of gender stereotypes. New York: Ten Speed Press. Cartmill, E. A., Armstrong, B. F., Gleitman, L. R., Goldin-Meadow, S., Medina, T. N. & Trueswell, J. C. (2013). Quality of early parent input predicts child vocabulary 3 years later. Proceedings of the National Academy of Sciences, 110, 11278–11283. Cherney, I. D. & London, K. (2006). Gender-linked differences in the toys, television shows, computer games, and outdoor activities of 5- to 13-year-old children. Sex Roles, 54, 717–726. Dale, P. S., Simonoff, E., Bishop, D. V. M., Eley, T. C., Oliver, B., Price, T. S. et al. (1998). Genetic influence on language delay in twoyear-old children. Nature Neuroscience, 1, 324–328. De Boeck, P., Bakker, M., Zwitser, R., Nivard, M., Hofman, A., Tuerlinckx, F. et al (2011). The estimation of item response models with the lmer function from the lme4 package in R. Journal of Statistical Software, 39, 1–28. Dorans, N. J. & Holland, P. W. (1993). DIF detection and description: Mantel-Haenszel and standardization. In P. W. Holland & H. © 2016 Hogrefe
Wainer (Eds.), Differential item functioning (pp. 35–66). Hillsdale, NJ: Lawrence Erlbaum. Eckes, T. (1997). Geschlechterstereotype: Frau und Mann in sozialpsychologischer Sicht. Pfaffenweiler: Centaurus. Eckhardt, A. G. (2008). Sprache als Barriere für den schulischen Erfolg: Potentielle Schwierigkeiten beim Erwerb schulbezogener Sprache für Kinder mit Migrationshintergrund. Münster: Waxmann. Eriksson, M., Marschik, P. B., Tulviste, T., Almgren, M., Perez Pereira, M., Wehberg, S. et al. (2012). Differences between girls and boys in emerging language skills: Evidence from 10 language communities. British Journal of Developmental Psychology, 30, 326–343. Ermisch, J. (2008). Origins of social immobility and inequality: Parenting and early child development. National Institute Economic Review, 205 (1), 62–71. Farkas, G. & Beron, K. (2004). The detailed age trajectory of oral vocabulary knowledge: Differences by class and race. Social Science Research, 33, 464–497. Fernald, A. & Weisleder, A. (2011). Early language experience is vital to developing fluency in understanding. In S. B. Neuman & D. K. Dickinson (Eds.), Handbook of early literacy research (Vol. 3, pp. 3–19). New York: Guilford Press. Freeman, N. K. (2007). Preschoolers' perceptions of gender appropriate toys and their parents' beliefs about genderized behaviors: Miscommunication, mixed messages, or hidden truths? Early Childhood Education Journal, 34, 357–366. Ganzeboom, H. B. G., de Graaf, P. M. & Treiman, D. J. (1992). A standard international socio-economic index of occupational status. Social Science Research, 21, 1–56. Garbe, C. (2008). «Echte Kerle lesen nicht!?» – Was eine erfolgreiche Leseförderung für Jungen beachten muss. Leicht gekürzt. In M. Matzner & W. Tischner (Hrsg.), Handbuch Jungen-Pädagogik (S. 301–315). Weinheim: Beltz. Goble, P., Martin, C. L., Hanish, L. D. & Fabes, R. A. (2012). Children's gender-typed activity choices across preschool social contexts. Sex roles, 67, 435–451. Gogolin, I. & Lange, I. (2011). Bildungssprache und Durchgängige Sprachbildung. In S. Fürstenau & M. Gomolla (Hrsg.), Migration und schulischer Wandel: Mehrsprachigkeit (S. 107–128). Wiesbaden: VS Verlag für Sozialwissenschaften. Graves, M. F. (2006). The vocabulary book: Learning and instruction. Newark, DE: International Reading Association. Hart, B. & Risley, T. R. (1995). Meaningful differences in the everyday experiences of young American children. Baltimore: P. H. Brookes. Hedges, L. V. & Nowell, A. (1995). Sex differences in mental test scores, variability, and numbers of high-scoring individuals. Science, 269, 41–45. Heller, K. A. & Geisler, H. J. (1983). Kognitiver Fähigkeitstest für 1. bis 3. Klassen (KFT 1–3). Göttingen: Hogrefe. Hoff, E. (2003). Causes and consequences of SES-related differences in parent-to-child-speech. In M. H. Bornstein & R. H. Bradeley (Eds.), Socioeconomic status, parenting and child development (pp. 145–160). Mahwah, NJ: Erlbaum. Hoff-Ginsberg, E. (2000). Soziale Umwelt und Sprachlernen. In H. Grimm (Hrsg.), Sprachentwicklung. Enzyklopädie der Psychologie C/III/3 (S. 463–494). Göttingen: Hogrefe. Huttenlocher, J., Vasilyeva, M., Cymerman, E. & Levine, S. (2002). Language input and child syntax. Cognitive Psychology, 45, 337–374. Hyde, J. (2014). Gender similarities and differences. Annual Review of Psychology, 65, 373–398. Kiefer, T., Robitzsch, A. & Wu, M. (2014). TAM: test analysis modules (R-Paket Version 1.0-3.18-1). Zugriff am 10.12.2014 http:// CRAN.R-project.org/package=TAM Zeitschrift für Pädagogische Psychologie (2016), 30(1), 45–55
N. McElvany et al., Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter
Kiese-Himmel, C. (2005). AWST-T. Aktiver Wortschatztest für 3- bis 5-jährige Kinder – Revision. Göttingen: Beltz Test GmbH. Lengyel, D., Reich, H. H., Roth, H.-J. & Döll, M. (2009). Von der Sprachdiagnose zur Sprachförderung (FörMig Edition, Bd. 5). Münster: Waxmann. Lesaux, N. K., Lipka, O. & Siegel, L. S. (2006). Investigating cognitive and linguistic abilities that influence the reading comprehension skills of children from diverse linguistic backgrounds. Reading and Writing: An Interdisciplinary Journal, 19, 99–131. Limbird, C. (2007). Phonological processing, verbal abilities, and second language literacy development among bilingual Turkish children in Germany. Dissertation, Freie Universität Berlin. Zugriff am 15.11.2013. Verfügbar unter http://www.diss.fu-berlin. de/2007/742/index.html Lynn, R. & Mikk, J. (2009). Sex differences in reading achievement. TRAMES, 13, 3–13. Martin, C. L. & Halverson Jr, C. F. (1981). A schematic processing model of sex typing and stereotyping in children. Child Development, 52, 1119–1134. Martin, C. L. & Halverson, C. F. (1987). The roles of cognition in sex role acquisition. In D. B. Carter (Ed.), Current conceptions of sex roles and sex typing: Theory and research (pp. 123–137). New York: Praeger. Martin, C. L. & Ruble, D. (2004). Children's search for gender cues cognitive perspectives on gender development. Current Directions in Psychological Science, 13, 67–70. Martin, C. L., Ruble, D. N. & Szkrybalo, J. (2002). Cognitive theories of early gender development. Psychological Bulletin, 128, 903–933. McLoyd, V. C. (1990). The impact of economic hardship on Black families and children: Psychological distress, parenting, and socioemotional development. Child Development, 61, 311–346. Miller, C. F., Lurye, L. E., Zosuls, K. M. & Ruble, D. N. (2009). Accessibility of gender stereotype domains: Developmental and gender differences in children. Sex Roles, 60, 870–881. Nation, I. S. P. (2001). Learning vocabulary on another language. Cambridge: Cambridge University Press. National Institute of Child Health and Human Development. (2000). Report of the National Reading Panel. Teaching children to read: An evidence – based assessment of the scientific research literature on reading and its implications for reading instruction: Reports of the subgroups (NIH Publication No. 004754). Washington, DC: U.S. Government Printing Office. Newman, M. L., Groom, C. J., Handelman, L. D. & Pennebaker, J. W. (2008). Gender differences in language use: An analysis of 14,000 text samples. Discourse Processes, 45, 211–236. OECD. (2010). PISA 2009 results: Executive summary. OECD Publishing. Zugriff am 29.10.2013. Verfügbar unter http://www.oecd. org/pisa/pisaproducts/46619703.pdf Ouelette, G. P. (2006). What's meaning got to do with it: The role of vocabulary in word reading and reading comprehension. Journal of Educational Psychology, 98, 554–566. Pfost, M., Dörfler, T. & Artelt, C. (2012). Reading competence development of poor readers in a German elementary school sample: An empirical examination of the Matthew effect model. Journal of Research in Reading, 35, 411–426. R Core Team (2014). R: A language and environment for statistical computing. Wien: R Foundation for Statistical Computing. Zugriff am 10.12.2014 Verfügbar unter http://www.R-project.org/ Richter, S. (1994). Geschlechtsspezifischer Lieblingswortschatz. Ergebnisse einer Untersuchung zu «Jungen- und Mädchenwörtern». In S. Richter & H. Brügelmann (Hrsg.), Mädchen lernen anders/anders lernen Jungen (S. 51–65). Bottighofen: Libelle. Richter, S. & Brügelmann, H. (1996). Mädchen lernen anders/anders lernen Jungen. Geschlechtsspezifische Unterschiede beim
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 45–55
55
Schriftspracherwerb. DGLS Reihe «Lesen und Schreiben» (2. Aufl.). Bottighofen: Libelle. Schwabe, F. & McElvany, N. (2013). Development of a computerized adaptive test of reading competence. Paper presented at the 15th Biennial Conference of the European Association of Research on Learning and Instruction (EARLI), München. Schwabe, F., McElvany, N. & Trendtel, M. (2015). The school age gender gap in reading achievement: Examining the influences of item format and intrinsic reading motivation. Reading Research Quarterly, 50, 1–14. Sénéchal, M., Ouellette, G. & Rodney, D. (2006). The misunderstood giant: On the predictive role of vocabulary to reading. In D. K. Dickinson & S. B. Neuman (Eds.), Handbook of early literacy research (Vol. 2, pp. 173–182). New York: Guilford Press. Shanahan, T. (2006). Vocabulary. In T. Shanahan (Ed.), The National Reading Panel report: Practical advice for teachers (pp. 23–27). Naperville, IL: Learning Point Associates. Signorella, M. L., Bigler, R. S. & Liben, L. S. (1997). A meta-analysis of children's memories for own-sex and other-sex information. Journal of Applied Developmental Psychology, 18, 429–445. Singh, S. (2001). A pilot study on gender differences in conversational speech on lexical richness measures. Literary & Linguistic Computing, 16, 251–264. Stennes, L. M., Burch, M. M., Sen, M. G. & Bauer, P. J. (2005). A longitudinal study of gendered vocabulary and communicative action in young children. Developmental Psychology, 41, 75–88. Sternberg, R. (1987). Most vocabulary is learned from context. In M. G. McKeown & M. E. Curtis (Eds.), The nature of vocabulary acquisition (pp. 89–105). Hillsdale: Lawrence Erlbaum. Stoneberg, B. D., Jr. (2004). A study of gender-based and ethnicbased differential item functioning (DIF) in the spring 2003 Idaho Standards Achievement Tests applying the simultaneous bias test (SIBTEST) and the Mantel-Haenszel chi square test. Unpublished manuscript, The University of Maryland. Tracy, R. (2009). Multitasking: Mehrsprachigkeit jenseits des «Streitfalls». In I. Gogolin & U. Neumann (Hrsg.), Streitfall Zweisprachigkeit – The Bilingualism Controversy (S. 163–196). Wiesbaden: VS Verlag für Sozialwissenschaften. Vasilyeva, M. & Waterfall, H. (2011). Variability in language development: Relation to socioeconomic status and environmental input. In S. B. Neuman & D. K. Dickinson (Eds.), Handbook of early literacy research (Vol. 3, pp. 36–48). New York: Guilford Press. Weinert, S. & Ebert, S. (2013). Spracherwerb im Vorschulalter: Soziale Disparitäten und Einflussvariablen auf den Grammatikerwerb. Zeitschrift für Erziehungswissenschaft, 16, 303–332. Weiß, R. H. (2006). Grundintelligenztest Skala 2 – Revision (CFT 20R). Göttingen: Hogrefe.
Manuskript eingereicht: 4.6.2015 Nach Revision angenommen: 16.11.2015 Interessenskonflikt: Nein
Prof. Dr. Nele McElvany Institut für Schulentwicklungsforschung (IFS) TU Dortmund Vogelpothsweg 78 44227 Dortmund Deutschland nele.mcelvany@tu-dortmund.de
© 2016 Hogrefe
Als Lehrkraft die Ressourcen nutzen
Jürg Frick
Gesund bleiben im Lehrberuf Ein ressourcenorientiertes Handbuch 2015. 392 S., 5 Abb., 15 Tab., Kt € 29.95 / CHF 39.90 ISBN 978-3-456-85474-8 AUCH ALS E-BOOK
Als Lehrkraft zu arbeiten ist anstrengend, Kräfte raubend, fordernd und bedingt ein hohes Maß an Engagement und Widerstandsfähigkeit. Dabei ist die Gesundheit die wesentlichste Voraussetzung und Basis für eine befriedigende Berufsausübung. Der Zusammenhang zwischen Gesundheit, Wohlbefinden und Leistungsfähigkeit ist eindeutig und vielfach belegt. So sind nicht zuletzt Gesundheit und Fitness – auch im Lehrberuf – in den vergangenen Jahren zu einem viel beachteten Thema geworden. In diesem Buch werden die LeserInnen nicht zu «SchonerInnen» (Schaarschmidt 2005) oder gar zur Resignation, zum Berufsausstieg oder zur Berufsaufgabe angeleitet. Vielmehr erhalten sie vielfältige Anregungen, wie sie konkret mit Belastungen besser
www.hogrefe.com
klarkommen, Möglichkeiten entwickeln können, darauf konstruktiv einzuwirken, und sich so auch besser gegen ein mögliches Krankwerden schützen können. Das Buch bietet konkrete Hilfestellungen und Entlastungsmöglichkeiten, die dazu beitragen, dass Lehrpersonen wieder mehr Selbstermächtigung im Berufsfeld bekommen, die eigene Selbstwirksamkeit erhöhen, wie sie erweiterte Handlungsmöglichkeiten und Spielräume erhalten.
Originalartikel
Unterrichtsbezogene Fehlerorientierung von Lehrkräften – Adaption und Validierung eines Fragebogens Anja Böhnke und Felicitas Thiel Fachbereich Erziehungswissenschaft und Psychologie, Freie Universität Berlin Zusammenfassung: Fehlerorientierung gilt als zentrale individuelle Bedingung des Lernens aus Fehlern. Beim Lernen aus Fehlern werden Lernprozesse durch die Reflexion dysfunktionaler Handlungsroutinen provoziert. Der vorliegende Beitrag eröffnet den Blick auf eine Nutzbarmachung des Konzepts der Fehlerorientierung für die Analyse des Handelns von Lehrkräften im Unterricht. Vorgestellt wird ein adaptiertes, domänenspezifisches Instrument zur Erfassung der unterrichtsbezogenen Fehlerorientierung von Lehrkräften, das durch Expertenbeurteilungen inhaltlich validiert wurde. 959 Lehrpersonen aus drei Substichproben unterschiedlicher Expertisestufen (Lehramtsstudierende, Referendare, Lehrkräfte) bearbeiteten das adaptierte Instrument. Konfirmatorische Mehrgruppen-Faktorenanalysen ergaben (1) eine konsistente sechsdimensionale Struktur für alle drei Stichproben, (2) überzeugende Modellkennwerte hinsichtlich vorliegender metrischer und partieller skalarer Messinvarianz und (3) theoriegerechte Zusammenhänge mit beruflicher Zielorientierung und Lehrerselbstwirksamkeit. Trotz einiger Limitationen der Studie gibt es erste Belege dafür, dass mit dem adaptierten Instrument eine valide und domänenspezifische Messung der unterrichtsbezogenen Fehlerorientierung von Lehrkräften möglich ist. Schlüsselwörter: Fehlerorientierung, Lernen aus Fehlern, Unterricht, Domänenspezifität, Messinvarianz
Teaching-related Error Orientation. Adaptation and Validation of a Teacher Questionnaire Abstract: Error orientation is a critical individual prerequisite for successful learning from errors. Learning from errors prompts learning processes through the reflection on dysfunctional operational routines. This article seeks to illustrate how the concept of error orientation can be applied to analyzing the actions of teachers during lessons. We introduce an adapted, domain-specific instrument for assessing educators' teaching-related error orientation. Expert validation ensured the content validity of the adapted instrument. Participants were 959 teachers in three subsamples, representing different levels of expertise (preservice teachers, teacher trainees, in-service teachers). Multiple-group confirmatory factor analyses revealed (1) a consistent six-dimensional structure for all subsamples, (2) metric and partial scalar measurement invariance, and (3) relations with professional goal orientation and teacher self-efficacy which were consistent with theoretical expectations. Despite limitations of this study, there is some first evidence that the adapted instrument allows for a valid domain-specific assessment of teaching-related error orientation. Keywords: error orientation, learning from errors, teaching expertise, domain specificity, measurement invariance
Einleitung Wurden Fehler lange Zeit unter den Vorzeichen dysfunktionalen Handelns betrachtet, so rückt mit der Forschung zum Stellenwert negativen Wissens (Oser & Spychiger, 2005) zunehmend das Lernpotential von Fehlern in den Mittelpunkt. Negatives Wissen, das gewissermaßen ein Produkt des Lernens aus Fehlern darstellt, wird von Oser und Spychiger als «geistiges Immunsystem» (S. 42) bezeichnet, das Personen davor bewahrt, dieselben Fehler in ähnlichen Situationen zu wiederholen. Lernen aus Fehlern hilft handelnden IndividuZeitschrift für Pädagogische Psychologie (2016), 30(1), 57–67 DOI 10.1024/1010-0652/a000168
en, zu identifizieren, wo relevante Wissens- und Kompetenzlücken bestehen. Dies ist insbesondere für professionelles Lernen ein interessanter Ansatz (z. B. Harteis, Bauer & Gruber, 2008): Professionelle bewegen sich oft in dynamischen Kontexten, wo Wissen rasch obsolet oder unpraktikabel wird und einer kontinuierlichen Anpassung bedarf. Sie müssen außerdem vor dem Hintergrund komplexer Anforderungen oftmals Entscheidungen auf Grundlage unvollständiger Informationen und unter Bedingungen hohen Handlungsdrucks treffen, was zur besonderen Fehleranfälligkeit dieser Entscheidungen beiträgt. © 2016 Hogrefe
58
Manche Fehler haben drastische Konsequenzen, daher ist es in vielen Fällen nicht nur wichtig, Lernbedarf zu identifizieren, sondern auch Handlungsstrategien auszuschließen, die nicht funktionieren (Oser, 2007). Der Prozess des Lernens aus Fehlern gründet dabei auf der Konstruktion oder Modifikation von Wissen durch praktische Erfahrung (Bauer & Mulder, 2008). Für Oser (2007) ist entscheidend, dass die Erfahrung eines Fehlers in einen Lernzusammenhang gestellt wird: Eine Person muss ihren Fehler, seine Ursachen und Folgen erkennen und reflektieren können, wie er zu vermeiden wäre. So kann die Erfahrung in das episodische Gedächtnis integriert werden, vor neuem Falschen schützen und die Sicherheit für das Richtige erhöhen. Dafür ist laut Oser eine Fehlerkultur wichtig, die der Angst vor dem Fehlermachen entgegenwirkt. Im Unterschied zum Lernpotential von Schülerfehlern im Unterricht (Spychiger, Kuster & Oser, 2006) wurden das Lernen aus Fehlern bei Lehrpersonen und die damit verbundenen Chancen zur Entwicklung von Unterrichtsexpertise bislang nicht systematisch untersucht. Dass genau dies fruchtbar sein könnte, lässt sich aus der Beschaffenheit der Unterrichtsarbeit ableiten: Charakteristische Anforderungsmerkmale des Unterrichtens sind die Notwendigkeit von raschem, situationsangemessenem Handeln und die eingeschränkten Möglichkeiten der Antizipation dynamischer Unterrichtsverläufe (Doyle, 2006). Das Risiko fehlerhafter Entscheidungen ist dadurch besonders hoch. Eine Indizierung von Situationen, in denen bestimmte Handlungsstrategien mit hoher Wahrscheinlichkeit nicht zum Erfolg führen, kann daher zur Entwicklung von Unterrichtsexpertise beitragen. Ein weitgehender Konsens der Forschung zum Lernen aus Fehlern besteht darin, dass es sich bei Fehlern nicht um Merkmale einer bestimmten Handlung oder des Ergebnisses einer Handlung handelt. «Errors are individual actions or decisions that result in a deficient deviation from a desired goal and endanger the attainment of higher order goals» (Bauer & Mulder, 2008, S. 116). Die Feststellung eines Fehlers basiert daher immer auf der Akzeptanz von Normen, wobei die entscheidende Frage ist, wer eine solche Norm definiert. Zwei grundsätzliche Möglichkeiten kommen im Zusammenhang mit professionellem Lernen in Betracht: Entweder es existiert ein allgemein akzeptierter Standard, oder es wird auf die Beurteilung einer Handlung oder deren Ergebnis durch Personen bzw. Institutionen, denen Expertise und Legitimation zuerkannt wird, rekurriert. Schließlich muss die Verfehlung der Norm als Fehler wahrgenommen werden, diese Zuschreibung kann die handelnde Person selbst treffen oder sie kann extern vorgenommen werden. Für das Lernen aus Fehlern ist die normenbasierte Evaluation (des Ergebnisses) einer Handlung als fehlerhaft eine grundlegende Voraussetzung. Kognitionswissenschaftliche und handlungstheoretische © 2016 Hogrefe
A. Böhnke & F. Thiel, Unterrichtsbezogene Fehlerorientierung
Theorien bieten hier verschiedene, sich ergänzende Erklärungsansätze (Bauer, 2008). Aus einer kognitiven Perspektive haben Fehler deshalb Lernpotential, weil sie eine notwendige Veränderung kognitiver Schemata und Skripts anregen können. Aus einer handlungstheoretischen Perspektive kann die retrospektive Bewertung einer Handlung als fehlerhaft Ausgangspunkt für einen selbstgesteuerten Zyklus der Anpassung und Optimierung zukünftiger Handlungen sein (Gruber, 1999). Ob aus Fehlern gelernt wird, ist zudem von unterschiedlichen individuellen, kognitiven, motivationalen und emotionalen sowie institutionellen Bedingungen abhängig. Als entscheidender individueller Einflussfaktor für fehlerbasiertes Lernen wird die Fehlerorientierung von Personen diskutiert (Rybowiak, Garst, Frese & Batinic, 1999), die als multi-dimensionales Konstrukt die Bewertung von und den Umgang mit Fehlersituationen umfasst. Rybowiak et al. (1999) haben das Konzept der Fehlerorientierung mit dem Error Orientation Questionnaire (EOQ ) operationalisiert. Der EOQ umfasst mit Fehlerkompetenz, kognitivem Umgang mit Fehlern, Lernen aus Fehlern, Risikobereitschaft in Bezug auf Fehler, Belastung durch Fehler, Erwartung von Fehlern, Vertuschen von Fehlern und Kommunikation über Fehler acht Faktoren (zur Darstellung des Instruments und inhaltlichen Beschreibung der Subskalen vgl. Rybowiak et al., 1999). Inwieweit die im EOQ operationalisierten unterschiedlichen Ausprägungen von Fehlerorientierung das Lernen aus Fehlern bedingen, lässt sich am Beispiel des Handelns von Lehrkräften verdeutlichen. Eine Lehrkraft, die z. B. bereit ist, Neues (Fehleranfälliges) in ihrem Unterricht auszuprobieren, einen aufgetretenen Fehler reflektiert und als Ausgangspunkt der Optimierung ihres Unterrichts heranzieht und die keine übergroße Angst vor Eintreten eines Fehlers entwickelt, hat gute Voraussetzungen, um Fehler als Lernanlass zu nutzen. Fehlerorientierung wird von mehreren Autoren (z. B. Rybowiak et al., 1999; Schell & Conte, 2008) in Zusammenhang mit verschiedenen anderen selbstbezogenen Variablen gebracht. So argumentieren Rybowiak et al. (1999), dass Selbstwirksamkeit als Coping-Ressource in engem Zusammenhang mit Fehlerorientierung steht. Ein solcher Zusammenhang lässt sich auch für Lehrkräfte ableiten: Selbstwirksame Lehrkräfte haben die Überzeugung, auch beruflich schwierige Situationen meistern zu können (Schmitz & Schwarzer, 2000). Fehler im Unterricht sind solche schwierigen Situationen, in denen selbstwirksame Lehrkräfte sich dementsprechend resilient und persistent zeigen sollten. Schell und Conte (2008) zeigen einen Zusammenhang zwischen Fehlerorientierung und Zielorientierung auf. Dass verschiedene Zielorientierungen, als motivationale Ausrichtung von Personen auf bestimmte Ziele (Dweck & Leggett, 1988), auch für den Umgang mit den Herausforderungen des Unterrichtens bei Lehrkräften entscheidend sind, stelZeitschrift für Pädagogische Psychologie (2016), 30(1), 57–67
A. Böhnke & F. Thiel, Unterrichtsbezogene Fehlerorientierung
len Nitsche, Dickhäuser, Fasching und Dresel (2011) dar. Während eine Lernzielorientierung das Streben beschreibt, die eigenen Kompetenzen zu verbessern, wird bei einer Leistungszielorientierung die Demonstration von Kompetenz (Annäherungsleistungsziele) bzw. das Verdecken fehlender Kompetenz (Vermeidungsleistungsziele) fokussiert. Der Zusammenhang zur Fehlerorientierung ergibt sich daraus, dass verschiedene Zielorientierungen vor allem im Zusammenhang mit unterschiedlichen Handlungsstilen nach Misserfolgen diskutiert werden. Dickhäuser, Buch und Dickhäuser (2011) argumentieren, dass Personen mit einer Lernzielorientierung eigenen Misserfolg und Fehler als Herausforderung wahrnehmen und weiterhin versuchen, ihr Ziel zu verfolgen, während Personen mit einer Vermeidungsleistungszielorientierung eigene Fehler vor allem als bedrohlich empfinden und besonders ungünstige emotionale Reaktionen zeigen. Dickhäuser, Butler und Tönjes (2007) zeigen Zusammenhänge zwischen Zielorientierung und Hilfesuchen auf. Der EOQ findet in ganz unterschiedlichen (Experten-) Domänen bei der Erfassung von Fehlerorientierung am Arbeitsplatz Verwendung (z. B. Hetzner, Gartmeier, Heid & Gruber, 2011; Leicher, Mulder & Bauer, 2013). Obwohl seinen acht Faktoren eine unmittelbare Plausibilität nicht abgesprochen werden kann, ist der Mangel ihrer theoretisch kohärenten Ableitung aus einem allgemeinen Modell zentrales Defizit des EOQ ; diesbezüglich wird auch kritisiert, dass keine systematische Prüfung insbesondere der Inhaltsvalidität vorgenommen wurde (Bauer, 2008). Rybowiak et al. (1999) ermittelten ihre acht Faktoren durch eine Kombination von explorativen und konfirmatorischen Verfahren und konnten an einer weiteren Stichprobe die achtdimensionale Struktur des Instruments replizieren. Die Autoren räumen aber die Möglichkeit einer oder mehrerer übergeordneter Fehlerorientierungsdimensionen ein. Bauer, Festner, Harteis, Heid & Gruber (2004) haben auf der Grundlage einer Faktorenanalyse von mit dem EOQ erhobenen Daten drei Dimensionen der Fehlerorientierung identifiziert: Bewertung von Fehlern (hier laden Items der Skalen Fehlerkompetenz, Lernen aus Fehlern, Risikobereitschaft in Bezug auf Fehler und ein Item der Skala Erwartung aus Fehlern), Strategien zum lernförderlichen Umgang mit Fehlern (hier laden Items der Skalen kognitiver Umgang mit Fehlern und Kommunikation über Fehler) und Emotionen in Verbindung mit Fehlern (hier laden Items der Skala Belastung durch Fehler und ein Item der Skala Vertuschen von Fehlern). Ein weiterer zentraler Kritikpunkt an der Erfassung von Fehlerorientierung mit dem EOQ ist, dass aufgrund des allgemeinen Fehlerbegriffs Befragte ihre Einschätzung jeweils auf unterschiedliche Episoden beziehen. Das grundlegende Problem, dass jeder bei der Befragung zur eigenen Fehlerorientierung nicht nur unterschiedliche Zeitschrift für Pädagogische Psychologie (2016), 30(1), 57–67
59
Fehlersituationen, sondern eventuell auch unterschiedliche Typen von Fehlern vor Augen hat, wird dadurch verschärft, dass der EOQ eine domänenunspezifische Fehlerorientierung erfasst, sich Fehler aber in unterschiedlichen Domänen und bei der Bewältigung unterschiedlicher Anforderungen deutlich unterscheiden (Bauer & Mulder, 2008). Um diesen Problemen der Erfassung von Fehlern zu begegnen, schlagen Gartmeier, Bauer, Gruber und Heid (2008) vor, sich stärker an Methoden zu orientieren, die im Rahmen von Expertenstudien eingesetzt werden, um negatives Wissen empirisch zu erfassen. Die Prompting Task Technique (PTT) (Brewer, 1986), bei der Begriffe oder kurze Beschreibungen von Situationen präsentiert werden, die als Prompts fungieren und die Erinnerung an spezifische Handlungssituationen induzieren, bietet hier eine Möglichkeit. Das erste Ziel der in diesem Beitrag vorgestellten Studie war es, auf Grundlage des EOQ von Rybowiak et al. (1999) ein für die Unterrichtsarbeit von Lehrkräften angepasstes Instrument zur Erhebung der Fehlerorientierung zu entwickeln, das die Kritik an einer unspezifischen Erfassung von Fehlerorientierung aufnimmt. Dazu haben wir 1. einen Eingangstext entwickelt, in dem vor dem Hintergrund der oben beschriebenen PTT ein Prompting auf drei typische Fehler im Unterricht vorgenommen wird; 2. eine domänenspezifische Auswahl der Skalen und Anpassung der Items vorgenommen. Diese Anpassung erfolgte auch vor dem Hintergrund von Befunden zur Messung von Selbstwirksamkeit. Bandura (1997) argumentiert, dass globale Messungen das Selbstwirksamkeitsverhalten unzulässig dekontextualisieren, während durch eine Spezifizierung der Items entsprechend den Anforderungen einer Domäne die Validität der Messung deutlich erhöht werden kann; 3. sowohl den Eingangstext als auch die Auswahl der Skalen und Anpassung der Items durch Experten validieren lassen. Der Grund hierfür war einerseits die oben angesprochene Notwendigkeit eines Abgleichs mit einer akzeptierten Norm und andererseits, dass eine kriteriale Validierung aufgrund der Nichtverfügbarkeit eines Kriteriums nicht möglich ist. Aus unserer Sicht ist daher die Inhaltsvalidierung durch Experten ein entscheidendes Mittel, um den angesprochenen Validitätsproblemen des Original-EOQ zu begegnen. Eine Expertenvalidierung ist wiederum nur in Bezug auf ein domänenspezifisches Instrument möglich. Zweites Ziel der vorliegenden Arbeit war es, die Faktorenstruktur des adaptierten Instruments empirisch zu prüfen und Konstruktvalidität nachzuweisen. Hierfür waren folgende Punkte entscheidend: 1. gehen wir davon aus, dass sich das adaptierte Instrument durch die ermittelten und replizierten Faktoren © 2016 Hogrefe
60
des Original-EOQ modellieren lässt. Wir testeten dieses von uns angenommene Modell gegen eine 3-Faktorenlösung entsprechend der Ergebnisse von Bauer et al. (2004). 2. prüften wir das adaptierte Instrument in drei Stichproben (Lehramtsstudierende, Referendare1, Lehrkräfte). Unabhängig vom Expertisegrad der Lehrperson geschehen in jedem Unterricht Fehler, auch wenn diese sich in Häufigkeit und Schwere unterscheiden mögen. Die Einstellung zu und der Umgang mit Fehlern sollten aber expertiseunabhängig sein. Wir gehen daher davon aus, dass eine Universalität des adaptierten Instruments hinsichtlich unterschiedlicher Stadien der beruflichen Entwicklung gegeben ist und dass Messungen in Gruppen unterschiedlichen beruflichen Entwicklungsstands sich als messinvariant erweisen sollten. Dies könnte als erster Hinweis auf Konstruktvalidität interpretiert werden. 3. sollte das adaptierte Instrument mit Hilfe von konvergenten Kriterien weiter validiert werden. Wir berechneten Korrelationen zwischen unterrichtsbezogener Fehlerorientierung und Lehrerselbstwirksamkeit sowie beruflicher Zielorientierung und prüften auf Konstruktinvarianz. Für Lehrerselbstwirksamkeit erwarteten wir entsprechend der Ergebnisse von Rybowiak et al. (1999) mittlere Korrelationen mit allen Dimensionen der Fehlerorientierung (negativ mit Belastung durch Fehler), wobei es plausibel wäre, dass die Dimensionen, die auf die Bewertung von Fehlern abzielen, höhere Korrelationen mit Selbstwirksamkeit aufweisen, da diese Dimensionen am stärksten auf ein Selbstkonzept im Umgang mit Fehlern abzielen. Entsprechend der theoretischen und empirischen Befundlage erwarteten wir für eine Lernzielorientierung mittlere Korrelationen mit allen Fehlerorientierungsdimensionen (negativ mit Belastung durch Fehler). In Anlehnung an die Argumentation von Dickhäuser et al. (2011) vermuteten wir die höchsten Korrelationen für die Dimensionen, die auf den lernförderlichen Umgang mit Fehlern abzielen. Für eine Vermeidungsleistungszielorientierung erwarteten wir negative mittlere Korrelationen mit allen Fehlerorientierungsdimensionen (positiv für Belastung durch Fehler). Dabei stellt sich die Frage, ob für Belastung durch Fehler (ungünstige emotionale Reaktion auf Misserfolge) und Kommunikation über Fehler (Hilfesuchen) vergleichsweise hohe Korrelationen aufgezeigt werden können.
1
A. Böhnke & F. Thiel, Unterrichtsbezogene Fehlerorientierung
Methode Adaption des EOQ Für die Entwicklung des Einleitungstextes wurden zunächst N = 24 Lehrkräfte schriftlich dazu befragt, was ihrer Meinung nach typische Fehler im Unterricht sind. Aus den häufigsten Antworten wurden drei Fehler formuliert (Einsatz einer didaktisch nicht zielführenden Unterrichtsmethode, fehlgeschlagene Zeitplanung und die «falsche» Reaktion in einem Konflikt mit einem Schüler) und im Einleitungstext beispielhaft als mögliche Fehler im Unterricht dargestellt. Es wurden dann theoretische Überlegungen hinsichtlich des für eine Anpassung des EOQ auf die Unterrichtsarbeit erforderlichen Spezifikationsbedarfs angestellt. Zunächst wurde für alle Skalen des EOQ erörtert, ob sie für den Bereich der Unterrichtsarbeit relevant und passend sind. Bei zwei Skalen wurde dies in Zweifel gezogen. Für die Skala Vertuschen von Fehlern wurde angenommen, dass sie von geringer Bedeutung ist, da sich die Arbeitssituation von Lehrkräften sehr autonom gestaltet. Im Hinblick auf die Skala Erwartung von Fehlern führt die eingeschränkte Möglichkeit der Antizipation von Unterrichtsverläufen dazu, dass die Planung kaum vollständig umgesetzt werden kann. Die Tatsache, dass in jedem Unterricht etwas misslingen kann, ergibt sich daher für Lehrkräfte fast unvermeidlich. Im nächsten Schritt wurden von den übrigen sechs Skalen jeweils die für die Unterrichtsarbeit passendsten Items ausgewählt. Für jedes ausgewählte Item wurde erörtert, ob es sinnvollerweise für die Unterrichtsarbeit spezifiziert werden sollte, und gegebenenfalls wurden entsprechende Umformulierungen und geringe inhaltliche Anpassungen vorgenommen. Im letzten Schritt wurde für jede Skala geprüft, ob für die Unterrichtsarbeit entscheidende Inhalte ergänzt werden müssten und entsprechende Items wurden neu formuliert. Überarbeitungsrunde 1: Eine erste Version des adaptierten Instruments wurde dann mit zwei Expertenrunden (Professionelle aus der Lehrerbildung (N = 4), erfahrene Lehrkräfte aus der Praxis (N = 8)) diskutiert. Für die nicht berücksichtigten Skalen wurde erörtert, ob die Experten eine adäquate Anpassung oder Umdeutung für möglich bzw. sinnvoll erachteten. Dies war nicht der Fall. Ebenfalls wurde diskutiert, ob die Experten zusätzliche, im EOQ nicht berücksichtigte Dimensionen hinsichtlich einer Erfassung von unterrichtsbezogener Fehlerorientierung als notwendig erachteten. Auch dies war nicht der Fall. Auf Basis der Expertenbeurteilungen wurden schließlich der Einleitungstext und einige Items noch einmal umformu-
Im allgemeinen Fall wird zugunsten einer besseren Lesbarkeit stets die männliche Form verwendet
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 57–67
A. Böhnke & F. Thiel, Unterrichtsbezogene Fehlerorientierung
liert, einzelne Items neu verfasst und andere aus ökonomischen Gründen als verzichtbar ausgeschlossen. Überarbeitungsrunde 2: Das adaptierte Instrument wurde dann einer kleinen Gruppe von Lehrkräften (N = 10) vorgelegt, um abschließend Formulierungen, Verständlichkeit und Akzeptanz der Items zu prüfen. Die Hinweise wurden an die Experten zur Diskussion zurückgegeben und resultierend letzte geringfügige Modifikationen vorgenommen. Das adaptierte Instrument besteht hiernach aus 18 Items (drei pro Dimension), die auf einem sechsstufigen Antwortformat (1 [trifft nicht zu] bis 6 [trifft vollkommen zu]) zu beurteilen sind. Jeweils ein Item der Skalen kognitiver Umgang mit Fehlern und Risikobereitschaft in Bezug auf Fehler wurde nach dem Einsatz bei den Lehrkräften noch einmal umformuliert, da häufig Verständnisprobleme auftraten.2 Eine Übersicht über alle Items und darüber, ob sie umformuliert, neu verfasst oder unverändert aus dem EOQ übernommen wurden, ist Tabelle 2 zu entnehmen.
Stichprobe und Prozedere Das adaptierte Instrument «Unterrichtsbezogene Fehlerorientierung von Lehrkräften» wurde insgesamt von 959 Personen in drei Stichproben unterschiedlicher Expertisestufen bearbeitet. 198 Lehramtsstudierende einer großen Berliner Universität bildeten die erste Stichprobe. Sie waren zwischen 22 und 51 Jahre alt (M = 25.98, SD = 4.01) und zu 66 % weiblich. Alle Studierenden hatten ein mindestens vierwöchiges Schulpraktikum absolviert. Die zweite Substichprobe bestand aus 319 Referendaren, die sich zwischen vier Monaten und zweieinhalb Jahren im Vorbereitungsdienst (M = 11.82 Monate, SD = 9.70) befanden und zu 63 % weiblich waren. Aus datenschutzrechtlichen Gründen wurde das Alter kategorial abgefragt (3 % 20–25 Jahre, 45 % 26–30 Jahre, 30 % 31–35 Jahre, 11 % 36–40 Jahre, 11 % > 40 Jahre). Die dritte Substichprobe setzte sich aus 442 Lehrkräften aus Berliner und Brandenburger Oberschulen zusammen, die überwiegend schon lange im Beruf tätig waren (11 % < 5 Jahre, 3 % 5–10 Jahre, 13 % 10–20 Jahre, 73 % > 20 Jahre). Die Lehrkräfte waren zu 75 % weiblich und folgenden Altersklassen zuzuordnen (5 % 21–30 Jahre, 8 % 31–4 Jahre, 37 % 41–50 Jahre, 45 % 51–60 Jahre, 5 % > 60 Jahre). Die Befragung der Studierenden und der Referendare fand innerhalb der Universitätskurse und Schulpraktischen Seminare im paper-pencilFormat statt, was trotz der Freiwilligkeit der Befragung
2
61
dazu führte, dass sich alle anwesenden Personen an der Untersuchung beteiligten. Für die Befragung der Lehrkräfte wurden an 37 weiterführenden Schulen Fragebögen an die Lehrkräfte verteilt, die auf freiwilliger Basis ausgefüllt und in eine aufgestellte Box geworfen werden sollten. Die Rücklaufquote lag bei 40 %.
Weitere Messinstrumente Die berufliche Zielorientierung (Lernzielorientierung und Vermeidungsleistungszielorientierung) der befragten Personen wurde mit dem Instrument «Berufliche Zielorientierung von Lehrkräften» von Nitsche et al. (2011) erfasst. Die Subskala Lernzielorientierung besteht aus neun Items und unterscheidet drei Kompetenzbereiche (pädagogisch, fachlich, fachdidaktisch). Die Subskala Vermeidungsleistungszielorientierung besteht aus zwölf Items und unterscheidet vier Adressatengruppen, auf die sich das Verdecken von Kompetenz bezieht (Kollegen, Vorgesetzte, Schüler, sich selbst). Das Instrument wurde mit einem sechsstufigen Antwortformat (1 [stimmt gar nicht] bis 6 [stimmt genau]) eingesetzt; aus erhebungsorganisatorischen Gründen konnte es bei der Stichprobe der Lehrkräfte nicht eingesetzt werden. Die Reliabilitätskoeffizienten für die einzelnen Stichproben waren gut (siehe Tabelle 4). Zur Erfassung der Lehrerselbstwirksamkeit liegt ein Instrument von Pfitzner-Eden, Thiel und Horsley (2014) vor, das Selbstwirksamkeit in Bezug auf die drei Dimensionen Instruktion, Klassenmanagement und Schüleraktivierung unterscheidet. Es besteht aus zwölf Items und wurde mit einem sechsstufigen Antwortformat (1 [gar nicht sicher] bis 6 [vollkommen sicher]) eingesetzt. Die Reliabilitätskoeffizienten waren befriedigend bis sehr gut (siehe Tabelle 4).
Analysen Konfirmatorische Mehrgruppen-Faktorenanalysen (CFA) wurden mit Mplus (Version 6) durchgeführt. Zunächst wurde geprüft, ob sich das adaptierte Instrument besser durch drei oder sechs Faktoren modellieren lässt. Das favorisierte Modell wurde dann auf Messinvarianz über die drei untersuchten Gruppen geprüft. Für den Nachweis von Konstruktvalidität gilt das Vorliegen von metrischer Messinvarianz als entscheidend (Byrne & Stewart, 2006); eine Vergleichbarkeit der Ergebnisse aus den drei Gruppen ist aber nur bei skalarer Messinvarianz gegeben (Steinmetz,
Diese beiden Items wurden, um die vollständige Vergleichbarkeit zu gewährleisten, weder in den Fit- noch den Mehrgruppenanalysen mit einbezogen.
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 57–67
© 2016 Hogrefe
62
A. Böhnke & F. Thiel, Unterrichtsbezogene Fehlerorientierung
Tabelle 1. Modell-Fit 3- und 6-Faktoren-Modell, multipler Gruppenvergleich zur Messinvarianz und 6-Faktorenmodelle mit Lehrerselbstwirksamkeit und Zielorientierungen χ2
df
p
χ2/df
CFI
RMSEA
SRMR
SCF
Δχ2SBscaled
Studierende (n = 198)
343.12
101
<.01
3.39
.726
.110
.104
1.093
-
Referendare (n = 319)
431.47
101
<.01
4.27
.722
.101
.089
1.148
-
Lehrkräfte (n = 442)
688.61
101
<.01
6.82
.703
.116
.096
1.167
-
Studierende (n = 198)
112.73
89
.05
1.27
.973
.037
.049
1.096
-
Referendare (n = 319)
147.53
89
<.01
1.66
.951
.045
.049
1.152
-
Lehrkräfte (n = 442)
152.93
89
<.01
1.72
.968
.041
.039
1.156
-
3-Faktorenmodell
6-Faktorenmodell
Multipler Gruppenvergleich (3-Gruppenmodell) zur Messinvarianz (N = 959) Baseline Model
414.41
267
<.01
1.55
.963
.042
.045
1.145
-
Metrische Invarianz
482.58
299
<.01
1.61
.957
.044
.062
1.152
67.28 (32)*
part. skalare Invarianz
524.14
311
<.01
1.68
.950
.046
.063
1.138
51.37 (12)*
6-Faktorenmodell mit Lehrerselbstwirksamkeit (N = 959) part. skalare Invarianz
729.28
443
< .01
1.65
.947
.045
.062
1.131
-
Konstruktinvarianz
739.41
455
< .01
1.63
.947
.045
.062
1.133
10.72 (12) ns
6-Faktorenmodell mit Lernzielorientierung (n = 517) part. skalare Invarianz
392.87
287
< .01
1.37
.959
.038
.056
1.119
-
Konstruktinvarianz
395.87
293
< .01
1.35
.960
.038
.057
1.123
3.76 (6) ns
6-Faktorenmodell mit Vermeidungsleistungszielorientierung (n = 517) part. skalare Invarianz
497.25
325
< .01
1.53
.947
.046
.059
1.113
Konstruktinvarianz
503.12
331
< .01
1.52
.947
.045
.060
1.113
5.87 (6) ns
Anmerkungen. CFI = comparative fit index; RMSEA = root mean square error of approximation; SRMR = standardized root mean square residual; SCF = scaling correction factor (zur korrekten Durchführung des χ2-Differenzentests bei MLR-Schätzmethode); * p < .05.
2013). Es wurden entsprechend der Vorgaben von Brown (2006) zum Step-up-Ansatz schrittweise Restriktionen (gleiche Faktorladungen, gleiche Intercepts) vorgenommen. Zur Identifizierung des Messmodells wurden die Varianzen der latenten Variablen auf eins fixiert. Für alle Modellschätzungen wurde ein robustes Maximum-Likelihood-Verfahren (estimator = mlr) genutzt, das für kleine Stichproben und nicht normalverteilte Daten angezeigt ist (Finney & DiStefano, 2006). Um zu prüfen, inwieweit eine Schachtelung der Daten vorliegt, wurden für alle verwendeten Skalen die ICC's berechnet.3 Zur Beurteilung der Modell-Fits wurde eine Kombination verschiedener FitIndizes herangezogen (Hu & Bentler, 1999): CFI (Cut-offWert: nahe .95), RMSEA (Cut-off-Wert: < .06), SRMR 3
(Cut-off-Wert < .08) und aufgrund der vielfach aufgezeigten Probleme der bloßen χ2-Statistik (z. B. Kline, 2010) die χ2/df-Werte, wo Werte unter zwei auf einen sehr guten Modell-Fit hinweisen. Für den Vergleich verschieden restriktiver Modelle wurde entsprechend auf die Änderung des CFI fokussiert, wobei laut Cheung & Rensvold (2002) Änderungen von < .01 trotz signifikantem χ2Differenzentest auf Invarianz der Modelle hinweisen. Zur Prüfung der Reliabilität auf latenter Ebene wurde der Kennwert ρ berechnet (Raykov & Marcoulides, 2015), Cronbachs α als manifester, aber weitverbreiteter Kennwert der Reliabilität wird zusätzlich berichtet. Abschließend wurden die Korrelationen der Fehlerorientierungsdimensionen mit den externen Kriterien ermittelt.
Aufgrund der niedrigen Werte (siehe Tabellen 3 und 4) und da alle Analysen mit der Spezifikation «type is complex» in Mplus zu vergleichbaren Ergebnissen führten, wurde die hierarchische Struktur der Daten in den Analysen nicht berücksichtigt
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 57–67
A. Böhnke & F. Thiel, Unterrichtsbezogene Fehlerorientierung
63
Für eine bessere Übersichtlichkeit sollte jeweils ein übergeordneter Faktor spezifiziert werden, daher wurde Lehrerselbstwirksamkeit über die Ausprägungen der drei enthaltenen Dimensionen indikatorisiert, Lernzielorientierung über die der drei Kompetenzbereiche und Vermeidungsleistungszielorientierung über die der vier Adressatengruppen. Um zu prüfen, ob die Korrelationen der externen Kriterien mit den Fehlerorientierungsdimensionen zwischen den Gruppen variieren, wurde für die so spezifizierten Modelle der Messinvarianzansatz erweitert und die entsprechenden Kovarianzen gleichgesetzt (Konstruktinvarianz).
tercepts aller Items führte zu einem deutlich schlechteren Modell-Fit (CFI: .927, RMSEA: .06, SRMR: .07). Die Modifikationsindizes in Mplus gaben Hinweise darauf, die Restriktionen für drei Items fallen zu lassen (Items: 4, 9, 18). Das resultierende Modell partieller skalarer Messinvarianz wies einen sehr guten Modell-Fit auf mit einer gegenüber dem Modell metrischer Messinvarianz akzeptablen Veränderung von .007 im CFI. Zur weiteren Beurteilung des 6-Faktorenmodells sind die standardisierten Faktorladungen und ρ-Werte in Tabelle 2, manifeste Mittelwerte, Standardabweichungen und Werte für Cronbachs α sowie die der ICC's in Tabelle 3 dargestellt. Latente Interfaktorkorrelationen finden sich in Tabelle 4.
Ergebnisse
Zusammenhänge mit konvergenten Kriterien
Alle Fit-Indizes für die Beurteilung der geprüften Modelle (3- und 6-Faktorenmodell, Mehrgruppenvergleiche und 6-Faktorenmodelle mit konvergenten Kriterien) finden sich in Tabelle 1.
Faktorstruktur Im Gegensatz zum 3-Faktorenmodell zeigte das 6-Faktorenmodell sehr gute Modellkennwerte auf, trotzdem wiesen signifikante χ2-Werte darauf hin, dass zumindest leichte Abweichungen der Daten von der angenommenen Modellstruktur vorlagen. Eine Inspektion der standardisierten Residuen und Modifikationsindizes zeigte, dass diese Abweichung vor allem auf Kreuzladungen von Items der Dimension Lernen aus Fehlern auf dem Faktor kognitiver Umgang mit Fehlern zurückzuführen war. Wir spezifizierten ergänzend Modelle, in denen wir diese Ladungen zuließen, um auf Höhe und Signifikanz zu prüfen. Keine Ladung lag über 0.2 oder war signifikant. Betrachtet man die Formulierung der betreffenden Items, scheinen die geringen Kreuzladungen nicht unplausibel, was in der Diskussion noch einmal aufgegriffen wird.
Das 6-Faktorenmodell Für das 6-Faktorenmodell zeigt Tabelle 1 die Kennwerte zur Annahme von Messinvarianz über die drei untersuchten Gruppen hinweg. Das Baseline-Modell und das Modell metrischer Invarianz wiesen beide sehr gute Fit-Indizes auf. Die Restriktionen im Modell metrischer Invarianz resultierten zwar in einem signifikanten Δχ2SBscaled, aber einer akzeptablen Veränderung von .006 im CFI. Das Vorliegen von konfiguraler und metrischer Messinvarianz konnte somit bestätigt werden. Das Gleichsetzen der InZeitschrift für Pädagogische Psychologie (2016), 30(1), 57–67
Auch die spezifizierten Modelle mit den konvergenten Kriterien erwiesen sich als messinvariant (konfigurale, metrische und partielle skalare Messinvarianz). In Tabelle 1 sind die Fit-Indizes für das angenommene Modell partieller skalarer Messinvarianz mit den drei externen Kriterien und des Modells mit zusätzlich gleichgesetzten Kovarianzen (Konstruktinvarianz) dargestellt. Dass die Restriktionen im Modell der Konstruktinvarianz gegenüber dem Modell partieller skalarer Messinvarianz nicht zu schlechteren Fit-Werten führten, bestätigte die Invarianz der Korrelationen der externen Kriterien mit den Fehlerorientierungsdimensionen über die drei Gruppen. Die latenten Korrelationen der externen Kriterien mit den Fehlerorientierungsdimensionen sind in Tabelle 4 dargestellt. Lehrerselbstwirksamkeit: Wie erwartet, zeigten sich durchgehend signifikante Zusammenhänge mit allen Dimensionen der Fehlerorientierung (negativ mit Belastung durch Fehler) mit mittleren Effekten. Fehlerkompetenz und Lernen aus Fehlern als Facetten der Bewertung von Fehlern wiesen im deskriptiven Vergleich, wie erwartet, die höchsten Korrelationen auf. Für die dritte Facette (Risikobereitschaft in Bezug auf Fehler) galt dies nicht. Lernzielorientierung: Außer für Fehlerkompetenz zeigten sich für alle Fehlerorientierungsdimensionen positive signifikante Zusammenhänge (erwartungswidrig auch für Belastung durch Fehler). Die deskriptiv höchsten Korrelationen zeigten sich für die Dimension kognitiver Umgang mit Fehlern, was unsere Annahme eines engen Zusammenhangs von Lernzielorientierung und den Dimensionen, die auf einen lernförderlichen Umgang mit Fehlern abzielen, unterstützt. Auch die Dimension Kommunikation über Fehler wies deutliche, signifikant positive Zusammenhänge auf, die in der Höhe aber nicht über den Korrelationen der übrigen Fehlerorientierungsdimensionen lagen. © 2016 Hogrefe
64
Vermeidungsleistungszielorientierung: Es zeigten sich außer für kognitiven Umgang mit Fehlern durchgehend die erwarteten negativen Zusammenhänge (positiv für Belastung durch Fehler). Unseren Vermutungen entspre-
A. Böhnke & F. Thiel, Unterrichtsbezogene Fehlerorientierung
chend waren im deskriptiven Vergleich die Korrelationen für Belastung durch Fehler und Kommunikation über Fehler am höchsten.
Tabelle 2. Standardisierte Faktorenladungen und Reliabilitäten (ρ) der Skalen der unterrichtsbezogenen Fehlerorientierung von Lehrkräften Studierende (n = 198)
Referendare (n = 319)
Lehrkräfte (n = 442)
(1) Nachdem mir im Unterricht ein Fehler passiert ist, überlege ich, wie es dazu kommen konnte.~
.62*
.57*
.83*
(2) Wenn mir im Unterricht ein Fehler unterläuft, überlege ich, was ich tun kann, um ähnliche Fehler zu vermeiden.°
.94*
.97*
.87*
-1
-1
-1
(4) Ich habe Strategien, um auf kleinere Fehler im Unterricht spontan zu reagieren.°
.43*
.51*
.57*
(5) Ich finde meistens Möglichkeiten, um mit den Konsequenzen aus Fehlern konstruktiv umzugehen.°
.81*
.85*
.79*
(6) Auch wenn mir im Unterricht größere Fehler passieren, schaffe ich es, mein eigentliches Vorgehen weiter zu verfolgen.°
.69*
.55*
.61*
(7) Meine Fehler zeigen mir, was ich besser kann.+
.65*
.60*
.77*
(8) Aus eigenen Fehlern habe ich schon viel für die Optimierung meines Unterrichts gelernt.~
.85*
.83*
.92*
(9) Frühere Fehler haben mir dabei geholfen, erfolgreiche Strategien für den Umgang mit den Schülern zu entwickeln.°
.66*
.74*
.74*
(10) Um meinen Unterricht weiter zu entwickeln, nehme ich es gern in Kauf, dass auch mal etwas schief gehen kann.~
.58*
.69*
.83*
(11) Lieber mache ich einen Fehler, als gar nicht zu handeln.+
.87*
.77*
.73*
-1
-1
-1
(13) Ich empfinde es als belastend, einen Fehler zu machen.+
.82*
.75*
.65*
(14) Wenn mir im Unterricht ein Fehler passiert, schäme ich mich dafür.~
.85*
.83*
.86*
(15) Ich mache mir im Unterricht oft Sorgen, etwas falsch zu machen.~
.67*
.70*
.56*
(16) Wenn ich im Unterricht etwas falsch gemacht habe, spreche ich mit den Kollegen darüber, wie ich es besser machen könnte.°
.88*
.85*
.81*
(17) Ich behalte Fehler besser für mich.+
.57*
.55*
.73*
(18) Wenn ich im Unterricht einen Fehler mache, erzähle ich es KollegInnen, damit sie von meinen Erfahrungen profitieren können.~
.58*
.53*
.55*
Faktorenladungen Kognitiver Umgang mit Fehlern (ρ = .76/.74/.86)
(3) Wenn mir im Unterricht ein Fehler unterläuft, überlege ich, was genau ich falsch gemacht habe.° Fehlerkompetenz (ρ = .64/.67/.72)
Lernen aus Fehlern (ρ = .78/.78/.86)
Risikobereitschaft in Bezug auf Fehler (ρ = .70/.72/.78)
(12) Um mich als Lehrkraft weiter zu entwickeln, muss ich auch mal einen Fehler riskieren.~ Belastung durch Fehler (ρ = .82/.81/.73)
Kommunikation über Fehler (ρ = .71/.68/.76)
Anmerkungen. ~Item umformuliert; °Item neu; +originales Item; 1Item nicht in allen Stichproben; Reihenfolge (ρ): Studierende, Referendare, Lehrkräfte; *p < .05.
© 2016 Hogrefe
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 57–67
A. Böhnke & F. Thiel, Unterrichtsbezogene Fehlerorientierung
65
Tabelle 3. Manifeste Mittelwerte (Standardabweichungen), Reliabilitäten (α) und ICC's der Skalen der unterrichtsbezogenen Fehlerorientierung von Lehrkräften Studierende (n = 198)
Referendare (n = 319)
Lehrkräfte (n = 442)
Mittelwert (SD)
Cronbachs α
ICC
Mittelwert (SD)
Cronbachs α
Kognitiver Umgang mit Fehlern
5.25 (.75)
.73
.01
5.23 (.71)
.71
Belastung durch Fehler
3.19 (1.12)
.81
.01
3.30 (1.23)
Kommunikation über Fehler
4.51 (.97)
.70
.03
Fehlerkompetenz
4.38 (.80)
.61
Lernen aus Fehlern
4.87 (.84)
Risikobereitschaft in Bezug auf Fehler
4.96 (.80)
Mittelwert (SD)
Cronbachs α
ICC
.01
5.30 (.71)
.83
.05
.80
.02
3.76 (.96)
.72
.03
4.19 (1.01)
.66
.05
4.26 (1.10)
.73
.04
.01
4.31 (.84)
.65
.02
4.87 (.61)
.67
.04
.75
.01
5.01 (.79)
.75
.04
5.99 (.76)
.84
.03
.66
.01
4.97 (.92)
.70
<.01
4.75 (.96)
.75
.04
Diskussion Ausgangspunkt des vorliegenden Beitrags war die Entwicklung eines bereichsspezifischen Instruments zur Erfassung der unterrichtsbezogenen Fehlerorientierung von Lehrkräften. Unsere Adaption des EOQ (Rybowiak et al., 1999) nimmt dabei durch ein vorangestelltes Prompting auf spezifische Fehlersituationen und eine domänenbezo-
ICC
gene, von Experten inhaltlich validierte Item-Formulierung die Kritik an einer unspezifischen Erfassung von Fehlerorientierung auf. Wir gehen davon aus, dass durch die Fokussierung hinsichtlich der Anforderungen einer bestimmten Domäne (einschließlich der Expertenvalidierung) und den Bezug auf spezifische Fehlersituationen eine validere Messung von Fehlerorientierung möglich ist. Es muss aber betont werden, dass eine empirische Prü-
Tabelle 4. Latente Interfaktorkorrelationen der Fehlerorientierungsdimensionen und latente Korrelationen mit Lehrerselbstwirksamkeit und Zielorientierungen Latente Interfaktorkorrelationen der Fehlerorientierungsdimensionen 1 1 Kognitiver Umgang mit Fehler 2 Belastung durch Fehler
2
3
4
5
6
.12/.17*/.04
-
3 Kommunikation über Fehler
.33*/.35*/.34*
–.15/–.12/–.07
-
4 Fehlerkompetenz
.34*/.33*/.58*
–.38*/–.35*/–.16*
.24*/.18*/.23*
-
5 Lernen aus Fehlern
.58*/.37*/.63*
–.13/–.20*/–.14
.55*/.30*/.42*
.60*/.55*/.48*
-
6 Risikobereitschaft in Bezug auf Fehler
.21*/.11/.17*
–.41*/–.28*/–.22*
.16/.25*/.06
.31*/.14/.28*
.24*/.30*.32*
-
Latente Korrelationen der Fehlerorientierungsdimensionen mit Lehrerselbstwirksamkeit und Zielorientierungen 1
2
3
4
5
6
Lernzielorientierung (LZO)
.45*/.39*/--
.19*/.15*/--
.32*/.20*/--
.14/.18*/--
.40*/.23*/--
.19*/.29*/--
Vermeidungsleistungszielorientierung (VZO)
–.04/–.09/--
.34*/.45*/--
–.25*/–.36*/--
–.24*/–.31*/--
–.24*/–.19*/--
–.21*/–.18*/--
Lehrerselbstwirksamkeit (LSW)
.26*/.22*/.35*
–.31*/–.25*/–.22*
.30*/.26*/.21*
.63*/.60*/.54*
.49*/.29*/.44*
.24*/.24*/.22*
Anmerkungen. Reihenfolge Korrelationen: Studierende (S), Referendare (R), Lehrkräfte (L); Reliabilitäten: LZO: S: α = .85/ρ = .86, R: α = .85/ρ = .85, VZO: S: α = .73/ρ = .74, R: α = .75/ρ = .76, LSWglobal: S: α = .86/ρ = .86, R: α = .80/ρ = .85, L: α = .90/ρ = .90, LSWInstruktion: S: α = .68/ρ = .68, R: α = .63/ρ = .63, L: α = .72/ρ = .74, LSWKlassenmanagement: S: α = .83/ρ = .85, R: α = .83/ρ = .84, L: α = .87/ρ = .87, LSWSchüleraktivierung: S: α = .72/ρ = .72, R: α = .67/ρ = .68, L: α = .80/ρ = .81, ICC's: LZO: S = .04, R = .04, VZO: S = .02, R = < .01, LSWglobal: S = .04, R = .01, L = .06, LSWInstruktion: S = .03, R = .02, L = .06, LSWKlassenmanagement: S = .04, R = .01, L = .05, LSWSchüleraktivierung: S = .04, R = .01, L = .05, *p < .05. Zeitschrift für Pädagogische Psychologie (2016), 30(1), 57–67
© 2016 Hogrefe
66
fung der Überlegenheit des adaptierten Instruments von unserem Beitrag nicht geleistet werden kann. Für das adaptierte Instrument konnten die sechs Faktoren nicht nur inhaltlich validiert, sondern auch empirisch bestätigt werden. Es zeigten sich für alle untersuchten Gruppen (Lehramtsstudierende, Referendare, Lehrkräfte) sehr gute Modellkennwerte. Das 6-Faktorenmodell zeigte sich zudem über die drei untersuchten Gruppen hinweg als messinvariant (partielle skalare Messinvarianz). Theoriegerechte Zusammenhänge zu beruflicher Zielorientierung und Lehrerselbstwirksamkeit konnten aufgezeigt werden, die sich ebenfalls als vergleichbar zwischen den Gruppen erwiesen. Modifikationsindizes und standardisierte Residuen zeigten allerdings, dass die Items des Faktors Lernen aus Fehlern (geringe und nicht signifikante) Kreuzladungen mit dem Faktor kognitiver Umgang mit Fehlern aufwiesen. Auch im Rahmen der konvergenten Validierung waren die Korrelationen mit dem Faktor Lernen aus Fehlern zum Teil höher, als mit den Faktoren für die dies –theorieentsprechend- von uns erwartet wurde. Grund könnte eine mangelnde Trennschärfe der Formulierung der Items sein. So wird die definitorische Unterscheidung zwischen der Bewertung von Fehlern als Lernanlass (Lernen aus Fehlern) und der Entwicklung von Strategien im individuellen Umgang mit Fehlern (kognitiver Umgang mit Fehlern) in den Items möglicherweise nicht ausreichend deutlich. Erwartungswidrig wurden positive Zusammenhänge zwischen einer Lernzielorientierung und der Belastung durch Fehler gefunden. Verschiedene Studien geben Hinweise darauf, dass die Rolle, die negative Emotionen für das Lernen aus Fehlern spielen, nicht eindeutig ist (z. B. Spychiger et al., 2006; Zhao, 2011). Auch aus theoretischer Sicht lassen sich nicht nur Argumente für hinderliche, sondern auch für förderliche Einflüsse finden (Bauer, 2008). So ist es durchaus plausibel, dass negative Emotionen ein Gefühl von Relevanz erzeugen, das erst dafür sorgt, dass Reflexionen und Lernprozesse provoziert werden. Oser (2007) argumentiert, dass Emotionen in Bezug auf einen Fehler die Erinnerung an diesen verstärken können. Wann negative Emotionen welchen Einfluss auf das Lernen aus Fehlern haben, sollte in zukünftigen Studien differenzierter untersucht werden. Es könnten unterschiedliche Emotionen (z. B. Schuld, Ärger), die Intensität der Emotion oder vermittelnde Faktoren, wie die Fähigkeit zur Emotionsregulation, entscheidend sein. In der vorliegenden Studie werden ausschließlich Selbstberichtsskalen verwendet; zur weiterreichenden Validierung des adaptierten Instruments wäre der Nachweis eines theoriegerechten Zusammenhangs mit einem objektiv erfassbaren Kriterium wünschenswert: Da Fehlerorientierung als individueller Einflussfaktor fehlerbasierten Lernens konzipiert wird, wären resultierende langfristige © 2016 Hogrefe
A. Böhnke & F. Thiel, Unterrichtsbezogene Fehlerorientierung
Lernerträge hier ein zentrales Kriterium. Interessante Ansatzpunkte wären z. B. eine Analyse des Wissens von Lehrkräften über typische Fehler im Unterricht oder die Beobachtung von Unterricht mit Blick auf einen kompetenten Umgang der Lehrkraft mit möglichen Schwierigkeiten. Trotz der genannten Limitationen unserer Studie, die eine weitere Absicherung der Befunde notwendig machen, konnte ein validiertes Instrument zur Erfassung unterrichtsbezogener Fehlerorientierung präsentiert werden, dem auch für die Aus- und Weiterbildung von Lehrkräften einige Relevanz zukommt. In der Lehrerbildung wird dem Einbezug von Fehlern und ineffektiven Strategien beim Unterrichten zunehmend größere Bedeutung zugemessen (z. B. Gold, Förster & Holodynski, 2013). Eine valide Messung der unterrichtsbezogenen Fehlerorientierung erlaubt die Berücksichtigung individueller Voraussetzungen und Einstellungen im Umgang mit Fehlern beim Unterrichten. Dies ist für die Reflexion erster eigener Unterrichtserfahrungen bei Studierenden, der praktischen Ausbildung von Referendaren und auch für die Weiterbildung von Lehrkräften, z. B. im Rahmen von individuellen oder kollegialen Coachings, von besonderer Bedeutung, will man das Lernpotential, das Fehler haben, für die Ausbildung von Unterrichtsexpertise nutzen.
Literatur Bandura, A. (1997). Self-efficacy: The exercise of control. New York: Macmillan. Bauer, J. (2008). Learning from errors at work: Studies on nurses' engagement in error-related learning activities. Unpublished doctoral dissertation, University of Regensburg. Bauer, J., Festner, D., Harteis, C., Heid, H. & Gruber, H. (2004). Fehlerorientierung im betrieblichen Arbeitsalltag. Ein Vergleich zwischen Führungskräften und Beschäftigten ohne Führungsfunktion. Zeitschrift für Berufs- und Wirtschaftspädagogik, 100, 65−82. Bauer, J. & Mulder, R. H. (2008). Conceptualisation of learning through errors at work. A literature review. In S. Billett, C. Harteis & A. Eteläpelto (Eds.), Emerging perspectives of workplace learning (pp. 115 − 130). Rotterdam: Sense Publishers. Brewer, W. F. (1986). What is autobiographical memory? In D. Rubin (Ed.), Autobiographical memory (pp. 25–49). New York: Cambridge University Press. Brown, T. A. (2006). Confirmatory factor analysis for applied research. New York: Guilford Press. Byrne, B. M. & Stewart, S. M. (2006). Teacher's corner: The MACS approach to testing for multigroup invariance of a second-order structure: A walk through the process. Structural Equation Modeling, 13, 287 − 321. Cheung, G. W. & Rensvold, R. B. (2002). Evaluating goodness-of-fit indexes for testing measurement invariance. Structural Equation Modeling, 9, 233–255. Dickhäuser, C., Buch, S. R. & Dickhäuser, O. (2011). Achievement after failure: The role of achievement goals and negative selfrelated thoughts. Learning and Instruction, 21, 152−162. Dickhäuser, O., Butler, R. & Tönjes, B. (2007). Das zeigt doch nur, dass ich's nicht kann: Zielorientierung und Einstellung gegenZeitschrift für Pädagogische Psychologie (2016), 30(1), 57–67
A. Böhnke & F. Thiel, Unterrichtsbezogene Fehlerorientierung
über Hilfe bei Lehramtsanwärtern. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 39, 120−126. Doyle, W. (2006). Ecological approaches to classroom management. In C. M. Evertson & C. S. Weinstein (Eds.), Handbook of classroom management. Research, practice and contemporary issues (pp. 97−125). Mahwah, NJ: Lawrence Erlbaum Associates. Dweck, C. S. & Leggett, E. L. (1988). A social-cognitive approach to motivation and personality. Psychological Review, 95, 256–273. Finney, S. J. & DiStefano, C. (2006). Non-normal and categorical data in structural equation modelling. In G. R. Hancock & R. O. Mueller (Eds.), Structural equation modelling: A second course (pp. 269–314). Greenwich, CT: Information Age Publishing. Gartmeier, M., Bauer, J., Gruber, H. & Heid, H. (2008). Negative knowledge: Understanding professional learning and expertise. Vocations and Learning, 1, 87−103. Gold, B., Förster, S. & Holodynski, M. (2013). Evaluation eines videobasierten Trainingsseminars zur Förderung der professionellen Wahrnehmung von Klassenführung im Grundschulunterricht. Zeitschrift für Pädagogische Psychologie, 27, 141−155. Gruber, H. (1999). Erfahrung als Grundlage kompetenten Handelns. Bern: Huber. Harteis, C., Bauer, J. & Gruber, H. (2008). The culture of learning from mistakes: How employees handle mistakes in everyday work. International Journal of Educational Research, 47, 223−231. Hetzner, S., Gartmeier, M., Heid, H. & Gruber, H. (2011). Error orientation and reflection at work. Vocations and Learning, 4, 25 − 39. Hu, L. & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling, 6, 1–55. Kline, R. B. (2010). Principles and practice of structural equation modeling (3rd ed.). New York: Guilford. Leicher, V., Mulder, R. H. & Bauer, J. (2013). Learning from errors at work: A replication study in elder care nursing. Vocations and Learning, 6, 207−220. Nitsche, S., Dickhäuser, O., Fasching, M. S. & Dresel, M. (2011). Rethinking teachers' goal orientations: Conceptual and methodological enhancements. Learning and Instruction, 21, 574−586. Oser, F. & Spychiger, M. (2005): Lernen ist schmerzhaft. Zur Theorie des Negativen Wissens und zur Praxis der Fehlerkultur. Weinheim: Beltz Oser, F. (2007). Aus Fehlern lernen. In M. Göhlich, C. Wulf & J. Zirfas (Hrsg.), Pädagogische Theorien des Lernens (S. 203–212). Weinheim: Beltz.
Zeitschrift für Pädagogische Psychologie (2016), 30(1), 57–67
67
Pfitzner-Eden, F., Thiel, F. & Horsley, J. (2014). An adapted measure of teacher self-efficacy for preservice teachers: Exploring its validity across two countries. Zeitschrift für Pädagogische Psychologie, 28, 83–92. Raykov, T. & Marcoulides, G. A. (2015). A direct latent variable modeling based method for point and interval estimation of coefficient alpha. Educational and Psychological Measurement, 75, 146−156. Rybowiak, V., Garst, H., Frese, M. & Batinic, B. (1999). Error orientation questionnaire (EOQ): Reliability, validity, and different language equivalence. Journal of Organizational Behavior, 20, 527−547. Schmitz, G. S. & Schwarzer, R. (2000). Selbstwirksamkeitserwartung von Lehrern: Längsschnittbefunde mit einem neuen Instrument. Zeitschrift für Pädagogische Psychologie, 14, 12−25. Schell, K. L. & Conte, J. M. (2008). Associations among polychronicity, goal orientation, and error orientation. Personality and Individual Differences, 44, 288−298. Spychiger, M., Kuster, R. & Oser, F. (2006). Dimensionen von Fehlerkultur in der Schule und deren Messung. Der Schülerfragebogen zur Fehlerkultur im Unterricht für Mittel-und Oberstufe. Schweizerische Zeitschrift für Bildungswissenschaften, 28, 87−110. Steinmetz, H. (2013). Analyzing observed composite differences across groups: Is partial measurement invariance enough? Methodology, 9, 1−12. Zhao, B. (2011). Learning from errors: The role of context, emotion, and personality. Journal of Organizational Behaviour, 32, 435−463.
Manuskript eingereicht: 2.12.2014 Nach Revision angenommen: 24.11.2015 Interessenskonflikt: Nein
Anja Böhnke Fachbereich Erziehungswissenschaft und Psychologie, Freie Universität Berlin, Habelschwerdter Allee 45 14195 Berlin Deutschland a.boehnke@fu-berlin.de
© 2016 Hogrefe
Das neue Lehrbuch zur Psychologischen Diagnostik Gerhard Stemmler / Jutta Margraf-Stiksrud (Hrsg.) Gerhard Stemmler Jutta Margraf-Stiksrud Herausgeber
Lehrbuch Psychologische Diagnostik
Lehrbuch Psychologische Diagnostik 2015. 386 S., 28 Abb., 37 Tab., Gb € 49.95 / CHF 65.00 ISBN 978-3-456-85518-9 AUCH ALS E-BOOK
Die Psychologische Diagnostik ist eine zentrale angewandte Querschnittsdisziplin der Psychologie. Sie dient der regelgeleiteten Sammlung und Verarbeitung von gezielt erhobenen Informationen, die für die Beschreibung und Prognose menschlichen Erlebens und Verhaltens bedeutsam sind. Die Psychologische Diagnostik ist in allen Anwendungsfächern von großer Bedeutung.
Das neue Lehrbuch zur Psychologischen Diagnostik ist konsequent an den erforderlichen Übungen im Studium ausgerichtet, aber auch interessante für die Fort- und Weiterbildung. Es orientiert sich inhaltlich konsequent an den erforderlichen Übungen im Psychologiestudium: • Verhaltensbeobachtung • Diagnostische Interviews • Testkonstruktion • Testverfahren • Das Psychologische Gutachten Es bietet damit die passgenaue Vorbereitung für die Studierenden in Bachelor und Master.
www.hogrefe.com
Danksagung Gutachterinnen und Gutachter 2015 Herausgeberteam und Verlag danken den nachfolgend genannten Konsultantinnen und Konsultanten, die durch ihre Gutachtertätigkeit im Jahr 2015 (bis zum Stichtag 30.11.2015) maßgeblich an der Gestaltung der Zeitschrift für Pädagogische Psychologie mitgearbeitet haben (Personen, die mehr als ein Manuskript begutachtet haben, sind kursiv gedruckt). Bauer, Johannes (München) Becker, Nicolas (Saarbrücken) Berendes, Karin (Tübingen) Bertrams, Alex (Bern) Bieg, Madeleine (Konstanz) Bieg, Sonja (Augsburg) Biermann, Antje (Saarbrücken) Brunner, Martin (Berlin) Buch, Susanne (Wuppertal) Cress, Ulrike (Tübingen) Deiglmayr, Anne (Zürich) Dickhäuser, Oliver (Mannheim) Dresel, Markus (Augsburg) Felton, Mark (San Jose, CA) Förster, Natalie (Münster) Frenzel, Anne (München) Gebauer, Miriam (Dortmund) Glock, Sabine (Wuppertal) Greiff, Samuel (Luxemburg) Greve, Werner (Hildesheim) Grosche, Michael (Wuppertal) Grube, Dietmar (Oldenburg) Gruber, Hans (Regensburg) Gruehn, Sabine (Münster) Haag, Ludwig (Bayreuth) Hagenauer, Gerda (Bern) Hanfstingl, Barbara (Klagenfurt) Harteis, Christian (Paderborn) Henke, Thorsten (Potsdam) Hertel, Silke (Heidelberg) Hochweber, Jan (St. Gallen) Holodynski, Manfred (Münster) Jansen, Malte (Berlin) Jungmann, Tanja (Rostock) Kessels, Ursula (Berlin) Kohlmann, Carl-Walter (Schwäbisch Gmünd) König, Cornelius (Saarbrücken) Krajewski, Kristin (Ludwigsburg) Kristen, Cornelia (Bamberg) Kubinger, Klaus (Wien) Kuhn, Tobias (Münster) Kunina-Habenicht, Olga (Frankfurt) Lambert, Katharina (Tübingen) Lohaus, Arnold (Bielefeld) Marx, Harald (Leipzig) McElvany, Nele (Dortmund) Mischo, Christoph (Freiburg) Möller, Jens (Kiel) Münzer, Stefan (Mannheim) Zeitschrift für Pädagogische Psychologie (2016), 30(1), 69–69 DOI 10.1024/1010-0652/a000169
Nachtigall, Christof (Jena) Nagy, Gabriel (Kiel) Neumann, Marko (Frankfurt) Nitsche, Sebastian (Mannheim) Nold, Günter (Dortmund) Nückles, Matthias (Freiburg) Oser, Fritz (Fribourg) Päßler, Katja (Olten) Rosé, Carolyn Penstein (Pittsburgh, PA) Perels, Franziska (Saarbrücken) Petermann, Franz (Bremen) Pfost, Maximilian (Bamberg) Praetorius, Anna-Katharina (Frankfurt) Retelsdorf, Jan (Kiel) Roick, Thorsten (Berlin) Rost, Detlef H. (Marburg) Rummel, Nikol (Bochum) Saalbach, Henrik (Leipzig) Sälzer, Christine (München) Sandoval, Bill (Los Angeles, CA) Schneewind, Klaus A. (Berlin) Schneider, Wolfgang (Würzburg) Schöne, Claudia (Gießen) Schroeders, Ulrich (Bamberg) Schult, Johannes (Saarbrücken) Schwinger, Malte (Marburg) Seufert, Tina (Ulm) Souvignier, Elmar (Münster) Spinath, Birgit (Heidelberg) Spörer, Nadine (Potsdam) Stanat, Petra (Berlin) Stark, Robin (Saarbrücken) Steinbrink, Claudia (Erfurt) Steinmayr, Ricarda (Dortmund) Stoll, Gundula (Tübingen) Südkamp, Anna (Dortmund) Tarnai, Christian (München) Tettenborn, Annette (Luzern) Trautner, Hanns Martin (Wuppertal) Trautwein, Ulrich (Tübingen) Urhahne, Detlef (Passau) von Maurice, Jutta (Bamberg) Wagner, Jenny (Kiel) Wagner, Wolfgang (Tübingen) Wetzel, Eunike (Konstanz) Wittwer, Jörg (Freiburg) Zander, Steffi (Weimar) Ziegler, Matthias (Berlin)
© 2016 Hogrefe
Das Beste von Paul Watzlawick – in einem Band! Trude Trunk (Hrsg.) / Paul Watzlawick
Man kann nicht nicht kommunizieren Das Lesebuch Zusammengestellt von Trude Trunk und mit einem Nachwort von Friedemann Schulz von Thun. 2., unveränderte Auflage 2016. 376 Seiten € 19.95 / CHF 26.90 ISBN 978-3-456-85600-1 AUCH ALS E-BOOK
Kein Satz hat Paul Watzlawick so berühmt gemacht wie dieser: Man kann nicht nicht kommunizieren. Auch ohne Worte stehen wir jederzeit im Austausch mit unseren Mitmenschen – ob wir wollen oder nicht. Der Philosoph und Psychoanalytiker hat mit seinen Axiomen und Theorien unser Verständnis über Kommunikation radikal und nachhaltig verändert. Auf unerreichte Weise verbindet Watzlawick dabei wissenschaftliche Erkenntnisse mit einem großen schriftstellerischen Talent. Viele seiner beispielhaften Geschichten sind ebenso ins kollektive Bewusstsein übergegangen wie jener Satz über die Unmöglichkeit des Nichtkommunizierens.
www.hogrefe.com
Ergänzt wird der schmucke Band durch ein Nachwort von Friedemann Schulz von Thun sowie durch ein ausführliches Gespräch mit dem Meister, geführt und mit einer biografischen Notiz versehen von Bernhard Pörksen.
Die Balance zwischen online und offline Isabel Willemse
Onlinesucht Ein Ratgeber für Eltern, Betroffene und ihr Umfeld 2016. 160 S., 11 Abb., 7 Tab., Kt € 19.95 / CHF 26.90 ISBN 978-3-456-85542-4 AUCH ALS E-BOOK
Smartphones, Tablets und Laptops sind
Onlinesucht handeln. Hierbei handelt
zu unseren ständigen Begleitern ge-
es sich um eine sehr neue Diagnose, die
worden, wir verbringen unsere Freizeit
noch nicht in den offiziellen Diagnose-
in Sozialen Netzwerken wie Instagram
instrumenten vorhanden ist. Nichts-
oder Facebook, mit dem Verschicken von
destotrotz wird sie von Eltern, Betrof-
Bildern oder Textnachrichten und mit
fenen und ihrem Umfeld erkannt und in
Videogames. Ein Großteil der Jugendli-
der Beratungspraxis regelmäßig ange-
chen und Erwachsenen beweist einen
troffen.
kompetenten und vernünftigen Umgang mit diesen Gadgets und kann sich prob-
Der Ratgeber wird in einem theoreti-
lemlos zwischen digitaler und analoger
schen Teil eine allgemeine Einführung
Welt hin und her bewegen. Aber es gibt
in die Mediennutzung geben, aber vor
auch einen kleinen Teil, dem das nicht
allem das Störungsbild genau beschrei-
gelingt.
ben. Hierzu gehören die Diagnosekriterien, Verbreitung, Ursachen und auch
Wenn die exzessive Mediennutzung ne-
Begleiterkrankungen. Der praktische
gative Auswirkungen hat auf das Sozial-
Teil enthält viele konkrete Vorschläge
leben und Hobbys, den Beruf oder die
für Bezugspersonen und Betroffene im
Ausbildung und allenfalls auch die Ge-
Umgang mit Onlinesucht.
sundheit, dann könnte es sich um eine
www.hogrefe.com
Das DSM® aus Sicht der ICD
Horst Dilling / Klaus Reinhardt
Überleitungstabellen ICD-10/DSM-5® Ein Praxishandbuch 2016. 120 S., Kt € 19.95 / CHF 26.90 ISBN 978-3-456-85559-2 AUCH ALS E-BOOK
Das Diagnostische und Statistische Ma-
verwendet DSM-5® als Diagnoseziffern
nual Psychischer Störungen (DSM®) der
diejenigen der amerikanischen Modifi-
American Psychiatric Association ist ein
kation ICD-10-CM, die vielfach von der
weltweit etabliertes Klassifikationssys-
in den deutschsprachigen Ländern zur
tem für psychische Störungen. Die neue,
Diagnosenverschlüsselung und Abrech-
2014 auf Deutsch erschienene Ausgabe
nung gebrauchten ICD-10-GM (German
DSM-5 bietet auch deutschsprachigen
Modification) abweicht.
®
Benutzer tiefergehende Anregungen zu einer differenzierten und prozeduralen
Die Tabellen in diesem Buch erschließen
Diagnostik psychischer Störungen.
die neue DSM-5®-Klassifikation aus der Sicht der vertrauten ICD-10 und erhöhen
Jedoch wird die Benutzung des DSM-5®
damit wesentlich die Benutzbarkeit des
für den mit der ICD-10 Vertrauten da-
DSM-5® für deutschsprachige Leser.
durch erschwert, dass zwar viele einzelne Diagnosen, nicht jedoch Struktur und Reihenfolge der beiden Klassifikationssysteme übereinstimmen. Zudem
www.hogrefe.com