48. Jahrgang / Heft 1 / 2016
Zeitschrift für
Entwicklungspsychologie und Pädagogische Psychologie
Herausgeber Horst Krist Mareike Kunter Matthias Nückles Martin Pinquart Tina Seidel
Aggressivoppositionelles Verhalten im Kindesalter Franz Petermann Manfred Döpfner Anja Görtz-Dorten
3., überarbeitete Auflage
Franz Petermann Manfred Döpfner Anja Görtz-Dorten
Franz Petermann Manfred Döpfner Anja Görtz-Dorten
Aggressivoppositionelles Verhalten im Kindesalter
Ratgeber aggressives und oppositionelles Verhalten bei Kindern
Franz Petermann Manfred Döpfner Anja Görtz-Dorten
Ratgeber aggressives und oppositionelles Verhalten bei Kindern Informationen für Betroffene, Eltern, Lehrer und Erzieher 3., überarbeitete Auflage
Leitfaden Kinder- und Jugendpsychotherapie
Informationen für Betroffene, Eltern, Lehrer und Erzieher
(Reihe: „Leitfaden Kinder- und Jugendpsychotherapie“, Band 3). 3., überarb. Auflage 2016, X/181 Seiten, € 24,95 / CHF 32,50 (Im Reihenabonnement € 17,95 / CHF 24,50) ISBN 978-3-8017-2648-5 Auch als E-Book erhältlich
(Ratgeber zur Reihe: „Leitfaden Kinder- und Jugendpsychotherapie“, Band 3) 3., überarb. Auflage 2016, ca. 40 Seiten, Kleinformat, ca. € 7,95 / CHF 10,90 ISBN 978-3-8017-2649-2 Auch als E-Book erhältlich
Der Band beschreibt Leitlinien zur Diagnostik und Therapie aggressiv-oppositioneller Störungen bei Kindern und erläutert deren Umsetzung in der klinischen Praxis.
Der Ratgeber informiert über aggressives Verhalten bei Kindern und gibt Hinweise, wie man in Familie, Schule oder Kindergarten mit dieser Problematik besser klarkommen kann.
Monika Löhle
Effektiv lernen Erprobte Strategien für mehr Erfolg in der Schule
Störung des Sozialverhaltens bei Jugendlichen
Rudolf Eigenheer Bruno Rhiner Marc Schmid Edith Schramm
Die Multisystemische Therapie in der Praxis
Rudolf Eigenheer Bruno Rhiner / Marc Schmid Edith Schramm
Störung des Sozialverhaltens bei Jugendlichen Die Multisystemische Therapie in der Praxis
Praxis der Paarund Familientherapie
2., überarb. Auflage 2016, 186 Seiten, Kleinformat, € 19,95 / CHF 26,90 ISBN 978-3-8017-2730-7 Auch als E-Book erhältlich
(Reihe: „Praxis der Paar- und Familientherapie“, Band 10) 2016, X/289 Seiten, € 29,95 / CHF 39,90 ISBN 978-3-8017-2528-0 Auch als E-Book erhältlich
Schülerinnen und Schüler finden in diesem Ratgeber jede Menge anschauliche Tipps für erfolgreiches und effizientes Lernen. Die erprobten Strategien zeigen Wege für mehr Erfolg in der Schule auf.
Der Band stellt konkret und praxisorientiert ein Therapieverfahren zur Behandlung der Störung des Sozialverhaltens bei Jugendlichen vor, die Multisystemische Therapie.
www.hogrefe.de
Zeitschrift f체r
Entwicklungspsychologie und P채dagogische Psychologie
48. Jahrgang / Heft 1 / 2016 Organ der Deutschen Gesellschaft f체r Psychologie (DGPs) und der Fachgruppen Entwicklungspsychologie und P채dagogische Psychologie
Herausgeber
Prof. Dr. Horst Krist, Universität Greifswald, Institut für Psychologie, Franz-Mehring-Straße 47, 17487 Greifswald Prof. Dr. Mareike Kunter, Frankfurt Prof. Dr. Matthias Nückles, Freiburg Prof. Dr. Martin Pinquart, Marburg Prof. Dr. Tina Seidel, München Verantwortlich für Testbesprechungen: Prof. Dr. Pia Deimann, Wien Prof. Dr. Ursula Kastner-Koller, Wien Prof. Dr. Wolfgang Schneider, Universität Würzburg Prof. Dr. Beate Sodian, LMU München Prof. Dr. Petra Stanat, FU Berlin Prof. Dr. Sabine Weinert, Universität Bamberg
Beirat
Prof. Dr. Gisa Aschersleben, Universität Saarbrücken Prof. Dr. Oliver Dickhäuser, Universität Mannheim Prof. Dr. Marcus Hasselhorn, DIPF Frankfurt Prof. Dr. Manfred Holodynski, Universität Münster Prof. Dr. Eckard Klieme, DIPF Frankfurt Prof. Dr. Birgit Leyendecker, Universität Bochum Prof. Dr. Ulman Lindenberger, MPI Berlin Prof. Dr. Claudia Roebers, Universität Bern
Hinweise für Autoren
Die Richtlinien zur Manuskriptgestaltung und Hinweise für Autoren können unter www.hogrefe.de/produkte/zeitschriften/zepp mit dem Acrobat Reader heruntergeladen werden.
Verlag
Hogrefe Verlag GmbH & Co. KG, Merkelstraße 3, 37085 Göttingen, Postfach 3751, 37027 Göttingen, Tel. 0551 99950 0, Fax 0551 99950 111, E-Mail Verlag: verlag@hogrefe.de Redaktion: journals@hogrefe.de, Internet: http://www.hogrefe.de Verleger: Dr. G.-Jürgen Hogrefe Wissenschaftlicher Verlagsleiter: Dr. Michael Vogtmeier
Herstellung
Nina Barkau, Hogrefe Verlag GmbH & Co. KG, Merkelstraße 3, 37085 Göttingen, Tel. 0551 99950 446, Fax 0551 99950 445
Vertrieb/Verwaltung
Hendriekje Thiel, Hogrefe Verlag GmbH & Co. KG, Herbert-Quandt-Straße 4, 37081 Göttingen, Tel. 0551 99950 900, Fax 0551 99950 998
Anzeigen-/Beilagenverwaltung
Nadine Teichert, Hogrefe Verlag GmbH & Co. KG, Merkelstraße 3, 37085 Göttingen, Tel. 0551 99950 526, Fax 0551 99950 111
Gesamtherstellung
Konrad Triltsch, Print und digitale Medien GmbH, Johannes-Gutenberg-Straße 1 – 3, 97199 Ochsenfurt-Hohestadt
ISSN
ISSN-L 0049-8637, ISSN-Print 0049-8637, ISSN-Online 2190-6262 Die Zeitschrift und alle in ihr enthaltenen einzelnen Beiträge und Abbildungen sind urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Alle Rechte, auch das der Übersetzung, vorbehalten.
Erscheinungsweise
vierteljährlich
Bezugsbedingungen
Jahresabonnement Institute € 201,– / SFr 258,–; Jahresabonnement Privat € 91,– / SFr 121,–; Einzelheft € 51,– / SFr 65,– zzgl. Porto- und Versandgebühren (unverbindliche Preisempfehlung). Die Preise verstehen sich in Deutschland inkl. MwSt. und für Lieferungen von Deutschland ins Ausland exkl. MwSt. Das Abonnement verpflichtet zum Bezug eines ganzen Jahrgangs. Das Abonnement verlängert sich, wenn nicht bis 8 Wochen vor Jahresende abbestellt wird. Bei Ausfall der Lieferung durch höhere Gewalt, Streik oder dergleichen ergeben sich hieraus keine Ansprüche auf Lieferung oder Rückzahlung des Bezugsgeldes durch den Verlag. Lieferung erfolgt auf Gefahr des Empfängers. Der Abonnent ist damit einverstanden, dass der Transportdienstleister ggf. den Verlag während der Laufzeit des Abonnements über eine Anschriftenänderung informiert. Ist er nicht damit einverstanden, hat er dies spätestens zwei Wochen nach Erhalt des ersten Heftes schriftlich dem Verlag mitzuteilen.
Zahlungen
an Hogrefe Verlag GmbH & Co. KG, Merkelstraße 3, 37085 Göttingen Bankverbindung: Deutsche Bank Göttingen, IBAN DE 32 2607 0072 0041 1116 00, BIC DEUTDE2H260
Gelistet in
Social Sciences Citation Index (SSCI), Current Contents/Social & Behavioral Sciences, PsycINFO, PsycLit, PsyJOURNALS, PSYNDEX, IBZ, IBR und Scopus, Impact Faktor (2014): 0.727
Elektronische Volltexte
http://econtent.hogrefe.com
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1)
© 2016 Hogrefe Verlag
Inhalt Originalia
Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN) in Modellprojektstandorten im Saarland
1
The Effects of the Early Prevention Program ”Keiner fällt durchs Netz” (KfdN) [”Nobody Slips Through the net”] in the German State of Saarland. A Longitudinal Study Using a Quasi-Experimental Control-Group Design. Anna Sidor, Elisabeth Kunz, Andreas Eickhorst und Manfred Cierpka Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn? Zusammenhänge zwischen optimistischen, realistischen und pessimistischen Selbstkonzepten und der Leistungsentwicklung von Grundschulkindern
14
Are Students With Optimistic Self-Concepts One Step Ahead? Relations Between Optimistic, Realistic, and Pessimistic Self-Concepts and the Achievement Development of Primary School Children Anna-Katharina Praetorius, Claudia Kastens, Johannes Hartig und Frank Lipowsky Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern deutscher und nicht-deutscher Familiensprache
27
Students’ Growth Trajectories in Mathematics: The Role of Language Proficiency Jennifer Paetsch, Susanne Radmann, Anja Felbrich, Rainer Lehmann und Petra Stanat Stereotype Threat in der Grundschule
42
Stereotype Threat in Primary School Johanna Maria Hermann und Regina Vollmeyer Testbesprechung
RIAS Gerolf Renner
50
Mitteilungen
Ausschreibung der Herausgeber-/Mitherausgeberschaft der Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie
56
Konsultantenliste der ZEPP 2015
57
Hinweise für Autoren
© 2016 Hogrefe Verlag
58
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1)
BRIEF
Verhaltensinventar zur Beurteilung exekutiver Funktionen Deutschsprachige Adaptation des Behavior Rating Inventory of Executive Function (BRIEF®) von G. A. Gioia, P. K. Isquith, S. C. Guy und L. Kenworthy und der Self-Report Version (BRIEF®-SR) von S. C. Guy, P. K. Isquith und G. A. Gioia R. Drechsler / H.-Ch. Steinhausen
Test komplett bestehend aus: Manual, 10 Fragebogen Eltern, Lehrer und Selbstbeurteilung, 10 Auswerte- und Profilbogen Eltern, Lehrer und Selbstbeurteilung, Schablonensatz und Box Bestellnummer 03 156 01 € 183.00/CHF 230.00
Das BRIEF ist ein klinisches Fragebogenverfahren zur Erfassung exekutiver Funktionsbeeinträchtigungen bei Kindern und Jugendlichen. Es stehen drei Versionen zur Verfügung: zur Beurteilung durch Eltern, Lehrer (jeweils für 6- bis 16-Jährige) und zur Selbstbeurteilung (für 11- bis 16-Jährige). Die Fremdbeurteilung erhebt die Skalen Hemmen, Umstellen und Emotionale Kontrolle (= Verhaltensregulations-Index) sowie die Skalen Initiative, Arbeitsgedächtnis,
Planen/Strukturieren, Ordnen/Organisieren und Überprüfen (= Kognitiver RegulationsIndex). Zusammen ergeben sie den Exekutiven Gesamtwert. Die Selbstbeurteilung ist dazu weitgehend parallel aufgebaut. Anhand von Validitätsskalen können die Konsistenz der Einschätzungen und eine negative Färbung der Urteile überprüft werden. Die Auswertung erfolgt komfortabel und zeitökonomisch mit Hilfe farbiger Schablonen.
BRIEF-P
Verhaltensinventar zur Beurteilung exekutiver Funktionen für das Kindergartenalter
Deutschsprachige Adaptation des Behavior Rating Inventory of Executive Function® – Preschool Version (BRIEF®-P) von G. A. Gioia, K. Andrews Espy und P. K. Isquith M. Daseking / F. Petermann
Test komplett bestehend aus: Manual, 10 Fragebogen, 10 Auswerteund Profilbogen, Schablonensatz und Box Bestellnummer 03 194 01 € 114.00/CHF 139.00
Mit dem BRIEF-P können Eltern sowie pädagogisch und psychologisch tätige Fachkräfte das Verhalten eines Kindes mit Fokus auf die exekutiven Funktionen sowohl in der häuslichen Umgebung als auch in den alterstypischen Betreuungseinrichtungen wie Kindergärten oder Kindertagesstätten einschätzen. Das Verfahren ermöglicht auch die Verhaltensbeurteilung von Kindern mit entstehenden Lern- und Aufmerksamkeitsstörungen, Sprachstörungen,
Hogrefe Verlag GmbH & Co. KG Testzentrale Tel. +49 551 999 50 99-9 / Fax -8 testzentrale@hogrefe.de www.testzentrale.de
Testzentrale der Schweizer Psychologen AG Tel. +41 31 300 45-45 / Fax -90 testzentrale@hogrefe.ch www.testzentrale.ch
Hirnschädigungen, tiefgreifenden Entwicklungsstörungen sowie anderen entwicklungsbezogenen, neurologischen, psychiatrischen und medizinischen Bedingungen. BRIEF-P kann im Alter von 2 bis 6 Jahren angewendet werden. Die Auswertung erfolgt komfortabel und zeitökonomisch mit Hilfe farbiger Schablonen.
Originalarbeit
Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN) in Modellprojektstandorten im Saarland Anna Sidor1, Elisabeth Kunz1, Andreas Eickhorst2 und Manfred Cierpka1 1
Institut für Psychosomatische Kooperationsforschung und Familientherapie, Universitätsklinikum Heidelberg
2
Deutsches Jugendinstitut, München Zusammenfassung. Ziel der Studie war es, die Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz” zur Unterstützung risikobelasteter Familien in Saarland zu evaluieren. Die Stichprobe von 182 Mutter-Kind-Dyaden setzte sich aus 91 risikobelasteten Dyaden, die am Präventionsprojekt teilnahmen und 91 risikobelasteten Dyaden aus Kontrollfamilien zusammen. Ergebnisse: Der erwartete bessere Entwicklungsstand der Kinder in der Treatmentgruppe nach der Intervention im Vergleich zu den Kindern aus der Kontrollgruppe konnte im Bereich der sozialen Entwicklung bestätigt werden (d = 0.53). Zudem schätzten die Mütter in der KfdN-Gruppe ihre einjährigen Kinder tendenziell als weniger temperamentsschwierig ein (d = 0.18). Interventionseffekte im Bereich mütterlicher Feinfühligkeit, Stressbelastung und depressiver Symptomatik waren nicht nachweisbar. Fazit: Die Intervention hat einen positiven Effekt auf die kindliche soziale Entwicklung und die elterliche Wahrnehmung des kindlichen Temperaments. Der ausbleibende Interventionseffekt im Bereich der mütterlichen Feinfühligkeit legt eine stärkere Berücksichtigung dieses Aspektes in der Konzeption des Projekts nahe. Schlüsselwörter: Frühe Hilfen, belastete Familien, Präventionsprojekt, Wirksamkeit
The Effects of the Early Prevention Program ”Keiner fällt durchs Netz” (KfdN) [”Nobody Slips Through the net”] in the German State of Saarland. A Longitudinal Study Using a Quasi-Experimental Control-Group Design. Abstract. The study investigated the effects of the German family-supporting prevention program ”Nobody Slips Through the Net” in the federal state of Saarland. The sample consists of 91 psychosocially stressed mothers and their children (KfdN), and a control group of another 91 mothers and their children. We found an improved level of socio-emotional development in the children from the treatment group after intervention compared with the ones from the control group (d = 0.53). In addition, mothers in the KfdN group judged their 1‐year-old children as temperamentally less ”difficult” by trend (d = 0.18). No intervention effects were found for maternal sensitivity, maternal stress, and depressive symptoms. The results suggest that the KfdN intervention exerted a positive effect on children’s social–emotional development and on maternal perception of child temperament. The lack of evidence of the program’s effectiveness in improving maternal sensitivity suggests that this aspect should be taken more into account in further interventions. Keywords: early interventions, families at risk, prevention project, effectiveness
Viele Studien belegen, dass frühe Kindheitserfahrungen auf den Gesundheitsstatus, den Schulerfolg und die Lebensqualität lang andauernde Auswirkungen haben (Cierpka, Franz & Egle, 2011). Die Präventionsprogramme, die bereits um die Geburt oder im ersten Lebensjahr
ansetzen, zielen größtenteils auf eine Stärkung und Schulung der Eltern. Die Kindesentwicklung soll dabei indirekt über eine verbesserte Eltern-Kind-Beziehung und die Anbindung der Familie an Unterstützungssysteme gefördert werden (MacLeod & Nelson, 2000; Nievar,
Anna Sidor und Elisabeth Kunz teilen sich die Erstautorenschaft. Die Studie wurde finanziert durch das Nationale Zentrum Frühe Hilfen im Rahmen des Aktionsprogramms „Frühe Hilfen für Eltern und Kinder und soziale Frühwarnsysteme“ des BMFSFJ. Die Autoren bedanken sich bei den Familien für ihre Teilnahme an der Studie und bei den Familienhebammen für ihre Unterstützung. © 2016 Hogrefe Verlag
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13 DOI: 10.1026/0049-8637/a000139
2
A. Sidor et al., Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN)
Van Egeren & Pollard, 2010). Mittlerweile wurde eine beträchtliche Anzahl an Präventionskonzepten mit vielfältigen Programmkomponenten entwickelt. Effektivitätsstudien zeigen, dass die Programme erfolgreich sind, allerdings mit geringen bis moderaten Effektstärken1. Beelmann (2006) berichtet in einer Überblicksstudie von einem allgemeinen mittleren Effekt früher Präventionsmaßnahmen um etwa ein Drittel bis eine halbe Standardabweichung (Differenz zwischen Interventionsund Kontrollgruppe im Posttest). Indizierte Maßnahmen erzielen dabei stärkere Effekte (d = 0.50) als universelle (d = 0.34). Reynolds, Mathieson und Topitzes (2009) belegen in ihrer Analyse von 14 Hausbesuchsprogrammen einen durchschnittlichen Effekt von Cohens d = 0.20. Die Ergebnisse einer Metaanalyse von Layzer, Goodson, Bernstein und Price (2001), die 665 Studien mit 260 Programmen einschließt, bewegen sich mit d = 0.25 ebenfalls in dieser Größenordnung. MacLeod und Nelson (2000) ermitteln eine Effektstärke von d = 0.41. Bakermans-Kranenburg, IJzendoorn und Bradley (2005) stellen für 48 Studien durchschnittliche Verbesserungen von d = 0.20 fest, in einer Metaanalyse von 2003 ergibt sich für 70 Studien mit 88 Interventionen eine Effektstärke von d = 0.44. Werden die analysierten Variablen im Einzelnen betrachtet, ergeben sich mitunter widersprüchliche Resultate, die eine Generalisierung erschweren. Einfluss auf Kindmerkmale. Layzer und Mitarbeiter (2001) berichten von geringfügigen positiven Effekten auf die sozial-emotionale und kognitive Entwicklung und auf das Auftreten von Kindeswohlgefährdung. Effekte auf die kindliche Gesundheit waren klinisch nicht signifikant. Kindzentrierte Programme erzielten stärkere Effekte als elternzentrierte. Einfluss auf Elternmerkmale. In Bezug auf elterliche Merkmale sind die Ergebnisse weniger einheitlich. Nievar und Mitarbeiter (2010) belegen in ihrer Metaanalyse einen positiven Effekt von d = 0.37 auf das mütterliche Verhalten (Feinfühligkeit und Stimulierung). Layzer und Mitarbeiter (2001) berichten von etwas geringeren Effekten auf elterliches Verhalten. Die von Bakermans-Kranenburg, IJzendoorn und Juffer (2003) untersuchten 81 bindungsorientierten Programme erzielten insgesamt einen moderaten Effekt von d = 0.44 auf die mütterliche Feinfühligkeit. Dabei zeigte sich, dass Programme mit einem Videofeedback-Ansatz effektiver waren. In einer späteren Studie ermittelten Bakermans-Kranenburg und Mitarbeiter (2005) für die mütterliche Responsivität keine klinisch signifikante Effektstärke. Effekte auf die mütterliche psychische Gesundheit liegen ebenfalls im Bereich unterhalb der klinischen Signifi-
1
kanz (Layzer et al., 2001). Gomby (2007) konnte gar keine Effekte auf mütterliche seelische Gesundheit, elterliches Wissen, Einstellungen und Verhalten feststellen. Einfluss auf familiäre Belastung. MacLeod und Nelson (2000) fanden geringere Effekte bei Familien mit niedrigem (versus gemischtem) sozio-ökonomischen Status im Hinblick auf die Reduktion von Kindesmisshandlungen. Dies stimmt mit den Ergebnissen von Bakermans-Kranenburg und Mitarbeitern (2005) überein und wird damit erklärt, dass bei höher belasteten Familien ein Interventionsprogramm nicht ausreiche, um deren Lage deutlich zu verbessern. Das in der vorliegenden Studie vorgestellte Interventionsprogramm „Keiner fällt durchs Netz“ ist ein vom Nationalen Zentrum Frühe Hilfen (NZFH) gefördertes Modellprojekt. Frühe Hilfen in Deutschland adressieren vor allem Familien in multiplen Problemlagen. Das Ziel dabei ist, Risiken für Kindeswohlgefährdung frühzeitig zu identifizieren und durch unterstützende Arbeit zu reduzieren. Das Spektrum reicht dabei von primär-präventiven universellen Unterstützungs- und Beratungsangeboten über sekundär-präventive Angebote bis zu tertiär-präventiven Angeboten wie stationäre Maßnahmen und therapeutische Interventionen (Sann, 2012). Wirksamkeit der Interventionsprograme basierend auf Hausbesuchen von Familienhebammen. Bislang untersuchten nur wenige Studien die langfristigen Effekte von psychosozialen Interventionen von Familienhebammen. Olds und Mitarbeiter (2004, 2007) fanden z. B. einen positiven Effekt auf die nachfolgende Geburtenrate, die Partnerschaft sowie eine niedrigere Inanspruchnahme von Sozialleistungen. Bei den Kindern der Interventionsfamilien konnten u. a. ein niedrigeres Ausmaß an Verhaltensproblemen und bessere intellektuelle Leistungen sowie bessere Schulnoten festgestellt werden (Olds et al., 2004, 2007).
Vorstellung des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN) Bei dem hier vorgestellten Projekt handelt es sich vor allem um ein niedrigschwelliges Hausbesuchsprogramm. Besuche durch Familienhebammen erfolgen auf freiwilliger Basis. KfdN bietet psychosoziale primäre und sekundäre Prävention für Familien mit Kindern im ersten Lebensjahr in insgesamt elf Landkreisen in Hessen, Baden-
Nach Cohen (1969) ist eine Effektstärke d ab 0.20 als “gering”, ab 0.50 als ”mittel” und ab 0.80 als ”groß” einzuschätzen (Cohen, 1969).
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13
© 2016 Hogrefe Verlag
A. Sidor et al., Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN)
Württemberg und dem gesamten Saarland an. Die wesentlichen Bestandteile sind der Elternkurs „Das Baby verstehen“, die thematisch ähnliche aufsuchende Arbeit durch Familienhebammen sowie die Initiierung eines lokalen Netzwerkes mit einer Koordinierungsstelle zur Hilfevermittlung. Das Hauptziel von KfdN ist es, die Eltern in hoch belasteten Familien mit Säuglingen in basalen elterlichen Kompetenzen frühzeitig zu fördern. Dabei werden zusätzlich zur medizinischen Versorgung auch folgende psychosoziale Themen aus dem Elternkurs „Das Baby verstehen“ vermittelt: Selbstfürsorge, Partnerschaft, Signale des Kindes verstehen (z. B. „Warum weint das Baby?“) sowie Stärkung der intuitiven Elternkompetenzen. Diese Inhalte wurden zu einem Manual spezifisch für die aufsuchende Arbeit adaptiert und präzisiert (Cierpka, 2009a, b). Die teilnehmenden Familienhebammen sind berufserfahren und absolvieren zusätzlich ein 160-stündiges Curriculum, das neben dem erwähnten Elternkurs z. B. Themen aus der Entwicklungspsychologie und Pädiatrie umfasst (etwa Eltern-Kind-Interaktion oder familiendynamische Aspekte). Etwa alle zwei Wochen erhalten die Familienhebammen eine Supervision. Die belasteten Familien werden u. a. durch Nachsorgehebammen (28 %), Geburtskliniken (21 %), Sozialhilfe (17 %), Frauenärzte und Kinderärzte (7 %) sowie Beratungsstellen (4 %) identifiziert. Ist eine Familie mit der Teilnahme einverstanden, wird sie von einem lokalen Koordinator kontaktiert, der dann an eine Familienhebamme weiterleitet. Die Hausbesuche beginnen zeitnah nach der Geburt des Kindes und dauern maximal bis zum ersten Geburtstag des Kindes. Die Häufigkeit der Besuche richtet sich nach dem Bedarf und der Bereitschaft der Familie. Von Anfang 2008 bis Ende 2011 konnten beispielsweise in den sechs Landkreisen des Saarlandes 721 belastete Familien durch Familienhebammen unterstützt werden. Insgesamt fanden in dieser Zeit 9.769 projektfinanzierte Hausbesuche statt. Dies entspricht im Mittel 14 Besuchen (Spannbreite 2 – 62) durch Familienhebammen pro Familie (Eickhorst, Sidor, Frey & Cierpka, 2012). Die Familienhebammen sind angehalten, sich während der Besuche thematisch an den Inhalten des Manuals für die aufsuchende Arbeit des Elternkurses „Das Baby verstehen“ (s. o.) zu orientieren, sollten sich aber so flexibel wie möglich der aktuellen Situation vor Ort anpassen. Darüber hinaus enthält das Manual Vorschläge, wie weitere potentiell anwesende Personen (neben Hauptbezugsperson und Kind) ebenfalls eingebunden werden können. Auf einem einseitigen Dokumentationsbogen, der von den Familienhebammen am Ende eines jeden Besuches ausgefüllt wird, werden die Namen der Anwesenden ebenso vermerkt wie die wichtigsten Cha© 2016 Hogrefe Verlag
3
rakteristika, etwa vorherrschende Themen oder besondere Vorkommnisse beim jeweiligen Besuch. Die Analyse der Arbeitsschwerpunkte der Familienhebammen in Saarland zeigt, dass bei den Einzelthemen die „medizinische Versorgung“ dominiert (28 %); psychosoziale Schwerpunkte sind vor allem „Selbstfürsorge“ (27 %) und „Sensibilisieren für Signale des Babys“ (25 %). Nur 13 % der Arbeitsschwerpunkte befassen sich mit der „Stärkung der elterlichen Kompetenzen“ (Eickhorst et al., 2012).
Forschungsdesign Im Rahmen einer Begleitforschung, die als quasi-experimentale Longitudinalstudie konzipiert war, wurde die Wirksamkeit des Projekts KfdN evaluiert. Aus ethischen Gründen wurde auf eine Zufallszuweisung der Familien zur Kontroll- oder Treatmentgruppe verzichtet. Wie Abbildung 1 zu entnehmen ist, wurden bisher drei Messzeitpunkte realisiert: t1 19 Wochen nach der Geburt des Kindes (M = 19.09, SD = 3.21, Spannbreite 10 – 26), t2 im kindlichen Alter von sieben Monaten (M = 6.43, SD = 0.68, Spannbreite 5 – 10) und t3 im Alter von 12 Monaten: (M = 12.46, SD = 0.71, Spannbreite 11 – 16).
Abbildung 1. Zeitlicher Ablauf der Ergebnismessung.
Fragestellung. Zur Überprüfung der Wirksamkeit von KfdN wurden zwei Haupthypothesen und vier untergeordnete Hypothesen getestet. Nach der Intervention zum dritten Messzeitpunkt (t3) wurden signifikante positive Interventionseffekte auf die mütterliche Feinfühligkeit (z. B. Bakermans-Kranenburg et al., 2003, Layzer et al., 2001, Nievar et al., 2010) sowie ein besserer Entwicklungstand der Säuglinge, vor allem in den Bereichen der sozialen Entwicklung und der Kommunikation (Layzer et al., 2001) erwartet (Haupthypothesen). Darüber hinaus wurde erwartet, dass die Mütter aus der Treatmentgruppe nach der Intervention (zu t3) niedrigere Ausprägungen von depressiver Symptomatik und Stressbelastung im Vergleich zur Kontrollgruppe aufweisen (Layzer et al., 2001). Weiterhin wurden in der Treatmentgruppe zu t3 niedrigere Ausprägungen der mütterlichen Wahrnehmung der Kinder als „schwierig“ in ihrem
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13
4
A. Sidor et al., Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN)
Tabelle 1. Soziodemographische Daten der Saarland-KfdN Stichprobe und der Kontrollgruppe Variable
Treatmentgruppe M (SD)
Alter der Mütter Familienstand
Kontrollgruppe M (SD)
24.20 (6.66)
28.36 (6.27)
Häufigkeiten f (f%)
t = -4.01 p < .001
Häufigkeiten f (f%)
verheiratet
16 (23.2 %)
37 (41.6 %)
alleinerziehend
15 (21.7 %)
16 (18.0 %)
ledig. Partnerschaft mit dem Kindesvater
37 (53.6 %)
33 (37.1 %)
1 (1.4 %)
3 (3.4 %)
ledig. ein neuer Partner
Signifikanz
w² = 6.61 p = .067
Schulbildung der Mutter ohne Abschluss
18 (26.5 %)
6 (6.8 %)
Hauptschule
29 (42.6 %)
37 (42.0 %)
Realschule
15 (22.1 %)
28 (31.8 %)
Fachhochschulreife
2 (2.9 %)
3 (3.4 %)
Abitur
3 (4.4 %)
10 (11.4 %)
Hochschule
1 (1.5 %)
4 (4.5 %)
w² = 14.34 p = .014
Netto monatliches Haushaltseinkommen < 1000 Euro
47 (69.1 %)
28 (35.0 %)
1000 – 1500 Euro
6 (8.8 %)
29 (36.3 %)
1500 – 2000 Euro
10 (14.7 %)
10 (12.5 %)
5 (7.4 %)
13 (16.3 %)
deutsch
58 (84.1 %)
67 (75.3 %)
türkisch
3 (4.3 %)
andere
8 (11.6 %)
> 2000 Euro
w² = 22.66 p < .001
Nationalität der Mutter 6 (6.7 %)
w² = 8.16 p = .086
16 (18 %)
Anmerkung: Signifikanz: Statistische Bedeutsamkeit des Unterschiedes in den Mittelwerten der beiden Gruppen.
Temperament und der mütterlichen Wahrnehmungen der Mutter-Kind-Beziehung als „dysfunktional“ erwartet (untergeordnete Hypothesen). Da der Forschungsstand eher für schwache Effekte früher Interventionen spricht (Layzer et al., 2001), wurden in der vorliegenden Studie geringe Effektstärken zugunsten der Treatmentgruppe erwartet.
Methodik Stichprobe Die vorliegende Stichprobe von 182 Mutter-Kind-Dyaden setzte sich aus 2 Gruppen zusammen: Mütter und Kinder (n = 91), die an KfdN im Saarland und der Begleitforschung teilnahmen (TG) und Mütter und Kinder aus Kontrollfamilien (n = 91), die lediglich an der Begleitforschung von KfdN teilnahmen (KG). Psychosoziale Risiken verteilen sich wie folgt in den Gruppen: Armut (Monatseinkommen pro Haushalt unter
1000 €, 69.1 % TG, 35 % KG), Mangel an sozialer Unterstützung (33 % TG, 27.8 % KG), psychische Belastung der Mütter (63.5 % TG, 49.3 % KG), Gewalt in der Partnerschaft (16.9 % TG, 5.2 % KG), minderjährige Mütter (18.7 % TG, 6.2 % KG). Die Dropout-Rate vom ersten bis zum dritten Messzeitpunkt lag insgesamt bei 5.5 % (7.7 % in der TG vs. 3.3 % in der KG); der Dropout war nicht selektiv. Die Studie wurde durch die Ethikkommission des Universitätsklinikums Heidelberg bewilligt. Die Studienteilnahme erfolgte auf freiwilliger Basis. Alle deskriptiven Daten stammen vom ersten Erhebungszeitpunkt zu Beginn der Intervention. Die Charakteristika der Stichprobe finden sich in Tabelle 1 und 2. Alle Familien erhielten zum ersten und dritten Messzeitpunkt eine Aufwandsentschädigung von 50 Euro, zum zweiten Messzeitpunkt betrug sie 20 Euro. Die beiden Substichproben unterscheiden sich bezüglich Alter der Mütter, Schulabschluss, Einkommen sowie tendenziell Familienstand und Nationalität. Die Mütter der Kontrollgruppe sind älter als die Mütter der Treatmentgruppe, verfügen über einen höheren Schulabschluss, ein höheres Einkommen und sind häufiger verheiratet, wobei sich der Altersunterschied zu einem gewissen Teil
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13
© 2016 Hogrefe Verlag
A. Sidor et al., Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN)
5
Tabelle 2. Angaben über die teilnehmenden Kinder nach der Geburt und zum ersten Messzeitpunkt in der Saarland-KfdN Stichprobe und der Kontrollgruppe Variable
Geburt in Schwangerschaftswoche Geburtsgewicht (g) Alter (Wochen) nach der Korrekturen der Frühgeburtlichkeit
Treatmentgruppe
Kontrollgruppe
M (SD)
M (SD)
Signifikanz
37.97 (3.14)
38.64 (2.21)
t = -1.65 p = .10
3033.4 (789.1)
3153.8 (592.8)
t = -1.16 p = .25
19.5 (3.84)
18.7 (2.39)
t = 1.34 p = .19
f (f%)
f (f%)
Geschlecht/Jungen
46 (50.5 %)
49 (53.8 %)
w² = 0.20 p = .66
Frühgeburtlichkeit (< 37 SSW)
19 (21.6 %)
10 (11.2 %)
w² = 3.46 p = .06
durch den niedrigeren Bildungsstand und damit verbundene Einkommensverhältnisse der Treatmentgruppe erklären dürfte. Die Kinder aus der Treatmentgruppe sind tendenziell häufiger Frühgeborene. Die Erhebungszeitpunkte wurden nach dem korrigierten Alter geplant.
Messinstrumente Zur Erfassung der mütterlichen Feinfühligkeit wurde der CARE-Index (Crittenden, 2005) eingesetzt, ein Verfahren, das feinfühliges Verhalten im dyadischen Kontext erfasst und auf Videoaufzeichnungen von dreiminütigen Spiel-Interaktionen basiert. Die Auswertung schließt sieben Verhaltensaspekte des Erwachsenen und des Kindes gesondert ein: affektive Aspekte (Gesichtsausdruck, Tonfall, Körperhaltung und Körperkontakt, Gefühlsausdruck) und „Kognition“ (abwechselndes Handeln, Steuerung der Aktivität, entwicklungsangemessene Aktivität). Die Werte werden summiert und sieben Skalenwerte gebildet. Das Verhalten des Erwachsenen wird auf den Skalen „Feinfühligkeit“, „Kontrolle“ und „Unresponsivität“ eingeschätzt, das kindliche hinsichtlich „kooperativ“, „zwanghaft“, „schwierig“ und „passiv“. Die Werte reichen dabei von 0 bis 14. Sämtliche Videos wurden von den ersten beiden Autorinnen ausgewertet. Folgende gemittelte Reliabilitätswerte („screening–level“ Reliabilität nach Crittenden – zu mindestens zwei Skalen über .70) wurden nach Fisher Z‐Transformationen erreicht: Feinfühligkeit r = .65, Kontrolle r = .77, Unresponsivität r = .84, Kooperation r = .56, Zwanghaftigkeit r = .15, Schwierigkeit r = .61 und Passivität r = .58. Aufgrund unzureichender Reliabilität der Kindsskalen wurden diese aus den statistischen Analysen ausgeschlossen. Der Entwicklungsstand der Kinder wurde mit dem Ages & Stages Questionnaire (ASQ; Squires, Potter & Bricker, 1999, deutsche Version Frey & Cierpka, in Vorb.) erhoben. Er erfasst die kindliche Entwicklung über die Spanne der ersten fünf Lebensjahre (ab dem 2. bis zum 60. Lbm.) © 2016 Hogrefe Verlag
und soll Entwicklungsdefizite, insbesondere in Risiko-Familien, aufdecken. Die Fragebögen werden von den Eltern ausgefüllt und bestehen aus je 30 Items (Antwortmodus: „ja“ (10), „manchmal“ (5) und „noch nicht“ (0)). Folgende Entwicklungsbereiche werden erfasst: Kommunikation, Grobmotorik, Feinmotorik, Problemlösungskompetenzen sowie soziale Entwicklung. Die Test-Retest Reliabilität beträgt .90, die Interraterreliabilität zwischen einem Elternteil und einem Psychologen liegt bei .89 bzw. bei Eltern mit niedrigem Einkommen bei .85 und ist damit als sehr gut einzustufen. Der ASQ weist eine gute konkurrente Validität mit den Bayley-Skalen auf (Bayley, 1993). Die Sensitivität der ASQ-Skalen liegt zwischen 38 und 90 %, für die Spezifität zwischen 81 und 91 %. Die postpartal-depressive Symptomatik der Mütter wurde mit dem Screening-Instrument „Edinburgh Postnatal Depression Scale“ (EPDS) (Cox, Holden & Sagovsky, 1987, deutsche Fassung Bergant, Nguyen, Heim, Ulmer & Dapunt, 1998), erfasst, einem Instrument mit 10 Items mit einem maximalen Wert von 30. Werte von 10 bis 12 stehen für eine mittlere Ausprägung der Symptomatik, der Cut-off Wert für eine klinisch relevante depressive Störung liegt bei 13. Die interne Konsistenz mit a = .87 gilt als gesichert, ebenso wie die prädiktive Validität. Zur Erfassung der mütterlichen Belastung wurde der PSI‐SF („Parental Stress Index Shortform“, Abidin, 1995, deutsche Übersetzung der Autoren) verwendet. Diese Kurzform besteht aus 36 Items, die auf einer fünfstufigen Skala von „trifft sehr zu“ bis „trifft gar nicht zu“ eingeschätzt werden und ist in drei Subskalen untergliedert: „parental distress“ („Elterliche Belastung“, a = .87), „dysfunctional parent-child-interaction“ („Dysfunktionale Eltern-Kind-Interaktion“, a = .80) und „difficult child („Schwieriges Kind“, a = .85). Die allgemeine Risikobelastung der Familien wurde mit der „Heidelberger Belastungsskala“ (HBS) erhoben (Sidor, Eickhorst & Stasch, 2012). Sie erfasst die Belastung in folgenden Bereichen: Belastung auf Seiten des Kindes, Belastung der Eltern bzw. familiäre Belastung, soziale und materielle Belastung. Die Werte liegen im Bereich 0 (kei-
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13
6
A. Sidor et al., Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN)
ne Belastung) bis 100 (sehr hohe Belastung). Die HBS weist eine exzellente Interraterreliabilität innerhalb der homogenen Gruppe der Psychologie Studenten auf (ICC = .92) und zeigt mit mütterlicher Feinfühligkeit schwach signifikante und mit mütterlicher Stressbelastung tendenzielle Zusammenhänge (Konstruktvalidität). Bei einem hohen HBS-Belastungswert war das Risiko der Inobhutnahme des Kindes im ersten Lebensjahr um das 4,5fache erhöht (Vorhersagevalidität).
Durchführung Stichprobenbildung. Folgende Auswahlkriterien wurden herangezogen: Bei der Interventions- wie auch bei der Kontrollgruppe musste eine Belastung durch psychosoziale Risikofaktoren vorliegen, ebenso ausreichende Deutschkenntnisse für das Verständnis der Fragebögen. Vorgehen in der TG: Die Probandinnen der Treatmentgruppe mussten im Projektgebiet Saarland wohnen und von einer KfdN-Familienhebamme betreut werden. Sie wurden während des ersten Besuches über die freiwillige Teilnahme an der Begleitforschung mündlich und schriftlich in Kenntnis gesetzt. Waren sie mit der Teilnahme einverstanden, wurden die Kontaktdaten an das Universitätsklinikum Heidelberg weitergeleitet. Vorgehen in der KG: Diese Familien durften nicht im Interventionsgebiet leben, da belastete Familien dort flächendeckend erreicht werden sollten. Des Weiteren durften sie nicht in eine mit KfdN vergleichbare Intervention eingebunden sein. Die Art der kontaktierten Institutionen richtete sich nach den Institutionen, die im „Netzwerk für Familien“ in den KfdN-Gebieten teilnahmen (Geburtskliniken, Schwangerschaftsberatungsstellen, etc.). Damit wurde eine Vergleichbarkeit der Belastung der Familien aus den beiden Subgruppen angestrebt. Datenerhebung. Die teilnehmenden Mütter wurden von geschulten studentischen Mitarbeiterinnen aufgesucht und über die Studie und die Datenschutzvorgaben informiert. Lagen in der anschließend durchgeführten HBS alle Voraussetzungen für eine Teilnahme vor (Belastung von über 20 sowie ausreichende Sprachkenntnisse), wurde zum ersten Messzeitpunkt (Alter des Kindes vier bis fünf Monate) erneut kontaktiert. Die genannten Selbstauskunftsbögen wurden den Familien einige Wochen vor dem Termin zugeschickt und
2
zu t1 eingesammelt. Die CARE-Index-Aufnahmen sowie die Durchführung des ASQ erfolgten bei den Hausbesuchen. Im Kindsalter von ca. sechs Monaten wurde erneut kontaktiert und ein zweiter Messzeitpunkt vereinbart, an dem der ASQ erneut auszufüllen war. Zum Kindsalter von einem Jahr nahmen studentische Mitarbeiterinnen Kontakt mit den Familien auf, um einen Termin für den dritten Messzeitpunkt zu vereinbaren, welcher analog zu t1 durchgeführt wurde.
Statistische Methoden Zur Überprüfung der zwei Haupthypothesen wurden mit den Outcome-Variablen (CARE-Index „Mütterliche Feinfühligkeit“ und ASQ-Skalen nach z-Transformation) ANCOVAs mit Messwiederholung (t1 und t3) mit der Gruppe als Faktor (Treatmentgruppe vs. Kontrollgruppe) durchgeführt. Als Kovariaten wurden Alter der Mutter, NettoHaushaltseinkommen, Schulbildung sowie Gesamtrisikobelastung (HBS) berücksichtigt. Die Nebenhypothesen wurden mittels ANOVAs mit Messwiederholung getestet (PSI-Skalen, EPDS). Um eine ausreichende Teststärke zu gewährleisten, wurde bei den Nebenhypothesen aufgrund der niedrigeren Stichprobengröße auf die Kovarianzanalyse verzichtet. Für jeden Parameter wurden zu t3 die Mittelwerte der beiden Subgruppen mittels Cohens Effektstärken verglichen. Es wurde ein Signifikanzniveau von .05 festgelegt. Die statistische Auswertung erfolgte mit SPSS für Windows, Version 21.0.
Ergebnisse Deskriptive Statistiken Tabelle 3 zeigt deskriptive Statistiken zu t1 bezüglich aller verwendeten Variablen. Die KfdN- und die Kontrollgruppe sind zum Beginn der Intervention (t1) bezüglich der meisten Parameter vergleichbar. Lediglich auf der Skala ASQ „Kommunikation“ erzielen die Kinder aus der Treatmentgruppe signifikant höhere Werte als die Kinder aus der Kontrollgruppe. Die Normalverteilung der abhängigen Variablen ist nicht gegeben (alle Kolmogorov-Smirnov-Tests sind signifikant)2.
Wir haben uns trotz der Verletzung der Annahme der Normalverteilung für die Varianzanalyse als statistische Methode entschlossen, weil die Varianzanalyse als robust gegenüber der Verletzung der Annahmen gilt.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13
© 2016 Hogrefe Verlag
A. Sidor et al., Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN)
7
Tabelle 3. Deskriptive Statistiken zu CARE-Index, EPDS, PSI- und ASQ-Skalen (sowie HBS-Gesamtbelastung zum ersten Messzeitpunkt (Kindesalter 19 Wochen) Variable
Treatmentgruppe M (SD)
Kontrollgruppe M (SD)
T-Test
K-S-Test
Sensitivität CARE-Index Mütter t1
5.74 (2.41) N = 89
5.97 (2.54) N = 90
p = .85
p < .001
EPDS Mütter t1
7.00 (6.14) N = 61
6.90 (5.52) N = 83
p = .94
p < .001
PSI „parental distress“ Mütter t1
2.10 (0.73) N = 69
2.30 (0.79) N = 90
p = .11
p = .017
PSI „dysfunktional interaction“ Mütter t1
1.41 (0.48) N = 64
1.36 (0.40) N = 89
p = .46
p < .001
PSI „difficult child“ Mütter t1
1.64 (0.63) N = 56
1.57 (0.46) N = 89
p = .48
p < .001
ASQ Kommunikation Kind t1
53.89 (5.55) N = 86
51.60 (7.44) N = 91
p = .021
p < .001
ASQ Grobmotorik Kind t1
55.81 (5.87) N = 85
56.48 (6.43) N = 91
p = .47
p < .001
ASQ Feinmotorik Kind t1
46.51 (12.46) N = 86
47.36 (11.01) N = 91
p = .63
p < .001
ASQ Problem-lösungskompetenzen Kind t1
54.26 (7.29) N = 86
53.57 (7.24) N = 91
p = .53
p < .001
ASQ soziale Entwicklung Kind t1
50.79 (10.57) N = 85
51.65 (8.20) N = 91
p = .55
p < .001
HBS familiäre Gesamtbelastung t1
42.93 (13.07) N = 80
47.79 (14.87) N = 91
p = .025
p = .003
Anmerkungen: EPDS: Edinburgh Postnatal Depression Scale; PSI: Parental Stress Index; ASQ: Ages & Stages Questionnaire; HBS: Heidelberger Belastungsskala; K-S-Test: Kolmogorov-Smirnov-Test der Normalverteilung.
Haupthypothesen Ergebnisse zur mütterlichen Feinfühligkeit. Zur Überprüfung der ersten Haupthypothese erbrachte die ANCOVA für die UV „mütterliche Feinfühligkeit in einer Spielinteraktion (CARE-Index)“ mit Messwiederholung (t1 und t3) und der Gruppe als Faktor (TG vs. KG) und mit den Kovariaten Alter der Mutter, monatliches Haushaltseinkommen, Schulbildung und Risikobelastung weder einen signifikanten Interaktionseffekt (Zeit x Gruppe, F (1.122) = 0.81, p = .37, g²p = .027) noch einen signifikanten Haupteffekt der Zeit (F (1.122) = 0.72, p = .40, g²p = .006). Alle Interaktionseffekte zwischen der Zeit und den Kovariaten waren ebenfalls nicht signifikant (Alter der Mutter p = .84, Schulbildung der Mutter p = .82, Haushaltseinkommen p = .43, HBS-Gesamtbelastung p = .55). Die zusätzlichen Analysen für die emotionalen (Gesichtsausdruck, Tonfall, Körperhaltung und Körperkontakt, Gefühlsausdruck) und kognitiven Verhaltensaspekte (abwechselndes Handeln, Steuerung der Aktivität, entwicklungsangemessene Aktivität) der mütterlichen Feinfühligkeit erbrachten ebenfalls keine signifikanten Zeitoder Gruppeneffekte. © 2016 Hogrefe Verlag
Ergebnisse zum Entwicklungsstand der Kinder. Zur Überprüfung der zweiten Haupthypothese wurde ebenfalls eine Kovarianzanalyse mit Messwiederholung durchgeführt. Alle ASQ-Werte, die zu t1 und t3 z-transformiert und somit vergleichbar gemacht wurden, wurden anhand einer Varianzanalyse mit Messwiederholung analysiert. Die ANCOVA für die ASQ Skala „Soziale Entwicklung“ (UV) mit Messwiederholung (t1 und t3), der Gruppe als Faktor (TG vs. KG) und den Kovariaten (s. o.) erbrachte einen signifikanten Interaktionseffekt (Zeit x Gruppe, F (1.127) = 5.28, p = .02, g²p = .042), aber keine Signifikanz für den Haupteffekt der Zeit (F (1.127) = 0.07, p = .70, g²p = .001). Während die Werte der Kinder aus der TG auf dieser Skala zu t3 anstiegen, gingen die Werte der Kinder aus der KG zurück (siehe Abbildung 2). Die Effektstärke betrug Cohens d = 0.53. Alle Interaktionseffekte zwischen der Zeit und den Kovariaten waren nicht signifikant (Alter der Mutter p = .46, Schulbildung der Mutter p = .54, Haushaltseinkommen p = .75, HBS-Gesamtbelastung p = .84). In allen anderen ASQ-Skalen zeigten sich keine signifikanten Unterschiede zwischen den Gruppen.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13
8
A. Sidor et al., Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN)
Tabelle 4. Varianzanalysen mit Messwiederholung zum ersten und dritten Messzeitpunkt für CARE-Index „mütterliche Feinfühligkeit“, ASQ „soziale Entwicklung“, PSI-Skalen und EPDS TG M (SD) (t1)
KG M (SD) (t1)
TG M (SD) (t3)
KG M (SD) (t3)
F Gruppe x Zeit
Feinfühligkeit CARE-Index
5.68 (2.40)
5.81 (2.34)
5.64 (2.07)
6.40 (2.50)
n.s. N = 122
ASQ soziale Entwicklung (z-Wert)
0.22 (0.86)
0.24 (0.82)
0.36 (0.73)
-0.14 (1.11)
5.82* N = 127
PSI “parental distress”
2.06 (0.72)
2.31 (0.80)
2.06 (0.74)
2.35 (0.83)
n.s. N = 150
PSI “dysfunctional interaction”
1.39 (0.47)
1.36 (0.42)
1.35 (0.38)
1.44 (0.40)
n.s. N = 141
PSI “difficult child”
1.63 (0.64)
1.57 (0.47)
1.77 (0.61)
1.87 (0.59)
3.60+ N = 138
EPDS
6.80 (6.09)
6.86 (5.50)
7.04 (5.37)
7.64 (5.62)
n.s. N = 134
Anmerkungen : ASQ: Ages & Stages Questionnaire ; PSI: Parental Stress Index; EPDS: Edinburgh Postnatal Depression Scale; *p ≤ .05; + p ≤ .10; n.s.: nicht signifikant.
Abbildung 2. Z-transformierte Mittelwerte der ASQ-Skala „Soziale Entwicklung“ zu Messzeitpunkten t1 und t3 für die KfdN-Saarland Gruppe und die Kontrollgruppe (N = 127).
Untergeordnete Hypothesen Ergebnisse zur EPDS. Um zu überprüfen, ob die Mütter aus der Treatmentgruppe niedrigere Ausprägungen der depressiven Symptomatik aufweisen als die Mütter aus der Kontrollgruppe, wurde eine Varianzanalyse mit Messwiederholung durchgeführt. Eine ANOVA für postpartale depressive Symptomatik als UV mit Messwiederholung (t1 und t3) und der Gruppe als Faktor erbrachte keinen signifikanten Interaktionseffekt (Zeit x Gruppe, F (1.134) = 0.48, p = .54, g²p = .003) und auch keinen Haupteffekt der Zeit (F (1.134) = 1.12, p = .26, g²p = .010).
Bezüglich des Anteils der Mütter, die zu t3 über dem klinisch relevanten cut-off Wert von 12 lagen, konnten zwischen den beiden Gruppen keine Häufigkeitsunterschiede festgestellt werden. Im Vergleich zu 18.8 % der Mütter aus der Kontrollgruppe lagen 17.6 % der Mütter aus der KfdN-Gruppe über dem cut-off (w² (1.134) = 0.42, p = .81). Ergebnisse zu den PSI-Skalen. Um zu überprüfen, ob die Mütter aus der Treatmentgruppe niedrigere Ausprägungen der Stressbelastung aufweisen als die Mütter aus der Kontrollgruppe, wurde eine Varianzanalyse mit Messwie-
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13
© 2016 Hogrefe Verlag
A. Sidor et al., Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN)
9
Abbildung 3. Mittelwerte der PSI-Skala “Difficult child“ zum Messzeitpunkt t1 und t3 für die KfdN-Saarland-Gruppe und die Kontrollgruppe (N = 138).
derholung durchgeführt. Eine ANOVA für die UV PSISkala „Parental Distress“ mit Messwiederholung und der Gruppe als Faktor erbrachte weder einen signifikanten Interaktionseffekt (Zeit x Gruppe, F (1.150) = 0.21, p = .72, g²p = .001) noch einen signifikanten Haupteffekt der Zeit (F (1.150) = 0.13, p = .65, g²p = .001). Für die Skala „Dysfunctional Interaction“ erbrachte die ANOVA mit Messwiederholung ebenfalls keine signifikanten Interaktionseffekte (F (1.143) = 1.94, p = .12, g²p = .018) und keinen signifikanten Effekt der Zeit (F (1.143) = 0.49, p = .61, g²p = .002). Für die Skala „Difficult Child“ erbrachte eine Varianzanalyse mit Messwiederholung einen tendenziell signifikanten Interaktionseffekt (F (1.138) = 3.60, p = .060, g²p = .023) und einen höchst signifikanten Zeiteffekt (F (1.138) = 22.69, p = .001, g²p = .146). Die Mittelwerte in der KfdN-Gruppe waren zu t3 niedriger als in der Kontrollgruppe (M = 1.76, SD = 0.61 vs M = 1.87, SD = 0.59); die Effektstärke betrug d = 0.18 (siehe Abbildung 3).
Diskussion Mütterliche Feinfühligkeit Wir konnten die erwarteten Effekte im Bereich der mütterlichen Feinfühligkeit nicht bestätigen. Die Mütter der Treatmentgruppe schnitten nach dem Ende des Interventionsprojekts ähnlich ab wie die Mütter aus der Kontrollgruppe. Dieses Ergebnis kann vor dem Hintergrund der Metaanalyse von Bakermans-Kranenburg und Mitar© 2016 Hogrefe Verlag
beitern (2003) so interpretiert werden, dass Programme, die ausschließlich auf elterliche Feinfühligkeit fokussierten, insbesondere mit Video-Feedback, effizienter waren als Programme, die in verschiedenen Kombinationen Unterstützung anboten. Die ausbleibenden Effekte auf die Feinfühligkeit könnten daher durch die Vielschichtigkeit des KfdN-Unterstützungsangebotes erklärt werden, welches nicht nur spezifisch die Erhöhung der Sensibilität, sondern ein breites Spektrum an Unterstützungsthemen umfasst. Die bisherigen Ergebnisse zu den Arbeitsinhalten der Familienhebammen (Eickhorst et al., 2012) zeigen, dass die Sensibilisierung für Signale des Säuglings nur knapp ein Fünftel der Inhalte ausmachte und nur etwa 13 % auf die Stärkung der elterlichen Kompetenz entfiel. Im Vergleich dazu machten Themen der medizinischen Vorsorge (28 %) und der Selbstfürsorge (27 %) den größten Anteil aus. Stärkere Effekte sind von feinfühligkeits-fokussierten Programmen mit Videofeedback zu erwarten (z. B. Programm VIPP, Klein-Velderman, Bakermans-Kranenburg, Juffer & IJzendoorn, 2006). Dies wirft die Frage auf, ob mütterliche Feinfühligkeit bei KfdN noch mehr Berücksichtigung finden sollte, z. B. durch zusätzliche Schulung der Familienhebammen oder die Einführung von Video-Feedback.
Entwicklungstand der Kinder Unsere Hypothese zum Entwicklungsstand der Kinder konnte bestätigt werden. Während die ASQ-Werte der Kinder aus der Treatmentgruppe in der Post-Erhebung
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13
10
A. Sidor et al., Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN)
anstiegen, gingen die Werte der Kinder aus der Kontrollgruppe zurück (d = 0.53; mittlere Effektstärke). Dieser Befund steht in Übereinstimmung mit den Ergebnissen der Metanalyse von Layzer und Mitarbeitern (2001), die von positiven Effekten früher Unterstützungsangebote auf die sozial-emotionale Entwicklung der Kinder berichten. Zum Wirkungsmodell des erzielten robusten positiven Effekts auf die kindliche soziale Entwicklung stellt sich die Frage, ob es sich hier um einen vermittelten Effekt über die Mütter handelt, die durch die Unterstützung durch die Familienhebammen die soziale Entwicklung der Kinder besser fördern konnten. Ein direkter Effekt der Intervention auf die Kinder könnte eine weitere Rolle spielen. Hier würden die Familienhebammen als weitere Bezugspersonen der Kinder fungieren, die deren soziale Entwicklung auch unmittelbar fördern. Im Bereich der sprachlichen Entwicklung (ASQ Skala „Kommunikation“) wurde hingegen kein Effekt erzielt. In Übereinstimmung mit der Metanalyse von Nores und Barnett (2010) wurden die stärksten positiven Effekte auf die kognitive Entwicklung (zu der auch die Sprachentwicklung gehört) von denjenigen Programmen erzielt, die einen gezielt auf Kinder zugeschnittenen, edukativen Ansatz aufweisen. Das KfdN-Arbeitskonzept umfasst – auch aufgrund des Alters der Kinder – keine spezifische Frühförderung. Zudem ist davon auszugehen, dass der negative Einfluss eines belasteten Umfeldes erst ab dem Kindergartenalter feststellbar wird (Squires et al., 1999) und umgekehrt, dass weitere positive Effekte der Intervention erst in der 1-Jahres-Katamnese nachweisbar werden. Im Einklang mit dem aktuellen Forschungsstand (Laucht, Esser & Schmidt, 2000) steht die besorgniserregende Verschlechterung (vom 4. Lebensmonat bis zum 12. Lebensmonat) der sozial-emotionalen Entwicklungsdaten der Kinder der Kontrollgruppe, obwohl die Kontrollfamilien zu Beginn der Intervention soziodemographisch etwas weniger belastet schienen als die Interventionsfamilien. Diese Ergebnisse unterstreichen die Wichtigkeit früher Interventionen für die Prävention von Auswirkungen eines belastenden Umfeldes auf die Entwicklung der Kinder.
Mütterliche depressive Symptomatik Im Hinblick auf die depressive Symptomatik unterschied sich die Treatmentgruppe nach einem Jahr nicht signifikant von der Kontrollgruppe. In beiden Gruppen lag die Anzahl der von einer klinisch relevanten Symptomatik Betroffenen leicht über der Prävalenzrate für postpartale Depressionen von 10 – 15 % (17.6 % TG, 18.8 % KG). Dies
entspricht Befunden zu erhöhten Prävalenzraten in Risikopopulationen (Tronick & Reck, 2009). Die Daten deuten darauf hin, dass die depressive Symptomatik schwer durch präventive familienunterstützende Maßnahmen beeinflusst werden kann. Dies stimmt mit Befunden überein, die keine oder klinisch irrelevante Effekte derartiger Interventionen auf die seelische Gesundheit der Mütter aufweisen. Beispielsweise konnte Gomby (2007) beim Vergleich zweier Standorte des Programms „Healthy Families America“, keine Auswirkungen auf die mütterliche seelische Gesundheit feststellen. Layzer und Mitarbeiter (2001) ermittelten in ihre Metaanalyse eine Effektstärke von d = 0.14 auf die elterliche seelische Gesundheit und einen sehr geringen Langzeiteffekt von d = 0.17. Reynolds und Mitarbeiter (2009) konnten in nur 8 von 15 Studien einen Effekt früher Interventionen auf mütterliche Depression feststellen. Durlak und Wells (1997) führen an, dass bei Familieninterventionen im Bereich der Kompetenzen größere Effekte erzielt werden als bei der Reduktion von Problembereichen. Positive Effekte auf Einstellungen und Verhalten der Eltern werden weit häufiger berichtet und auch die Ergebnisse der vorliegenden Studie, die für die Treatmentgruppe eine tendenziell signifikante Verbesserung hinsichtlich der Wahrnehmung des kindlichen Temperaments als „schwierig“ nachweist, lassen sich in dieser Richtung interpretieren.
PSI-Skalen Für die PSI-Skala „parental distress“ konnten keine signifikanten Interventions- und Zeiteffekte aufgedeckt werden. Die Befunde lassen sich in den aktuellen Forschungsstand einordnen, welcher ein widersprüchliches Bild ergibt. Einige Arbeiten zur konkreten Reduktion von elterlichem Stresserleben durch Interventionsprogramme ermittelten kleine Effekte (Pinquart & Teubert, 2010, d = 0.20). Kaaresen, Rønning, Ulvund und Dahl (2006) erzielten mit einem Training für Eltern frühgeborener Kinder überwiegend kleine positive Effekte in den PSISkalen, die auch beim Follow-up nach einem Jahr noch messbar waren (bei höher gebildeten Teilnehmerinnen). McDowell, Saylor, Taylor, Boyce und Stokes (1995) konnten für Teilnehmer eines Interventionsprogramms abnehmende Stressraten feststellen, dies traf jedoch nicht für Teilnehmer mit niedrigem sozio-ökonomischen Status zu. Nair, Schuler, Black, Kettinger und Harrington (2003) belegten bei Müttern mit Drogenabusus, dass elterlicher Stress positiv mit der Anzahl der Risikofaktoren assoziiert ist.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13
© 2016 Hogrefe Verlag
A. Sidor et al., Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN)
Die Ergebnisse weisen insgesamt darauf hin, dass eine sozio-ökonomische Belastung Interventionseffekte verdrängen bzw. die Familien behindern kann, sich in vollem Umfang auf das Programm einzulassen und zu profitieren. Für die PSI-Skala „dysfunctional parent-child-interaction“ konnten ebenfalls keine signifikanten Interventionsund Zeiteffekte aufgedeckt werden. Die enge Verknüpfung zwischen elterlichem Stress und Depression, die möglicherweise die Effizienz der Maßnahme bei Risikofamilien geschmälert hat, könnte auch hier zum Tragen kommen. Sidor, Kunz, Schweyer, Eickhorst und Cierpka (2011) wiesen nach, dass dysfunktionale Eltern-Kind-Interaktionen (PSI) stark mit elterlichem Stress (PSI) und mütterlicher depressiver Symptomatik assoziiert sind. Die negativen Auswirkungen von beeinträchtigter seelischer Gesundheit der Eltern auf die kindliche emotionale Entwicklung und das kindliche Verhalten sind inzwischen gut belegt (Bronte-Tinkew, Moore, Matthews & Carrano, 2007). In beiden Subgruppen wurde ein Anstieg der Wahrnehmung des kindlichen Temperaments als „schwierig“ (PSI-Skala „Schwieriges Kind“) von t1 zu t3 festgestellt, wobei der Anstieg in der Kontrollgruppe stärker war. Die erzielte Effektstärke (d = 0.18) überschritt allerdings nicht die Grenze der klinischen Relevanz. Diese Skala erfasst laut Abidin (1995) temperamental bedingte bzw. in Selbstregulationsschwierigkeiten verankerte Probleme der Kinder. Demnach verfügten die Kinder aus der Treatmentgruppe mit 12 Monaten über bessere Anpassungs- und Regulationsfähigkeiten als die Kinder aus der Kontrollgruppe. Es ist davon auszugehen, dass auch hier frühe Interventionen sowohl einen direkten positiven Einfluss auf die Kindesmerkmale ausüben als auch die Wahrnehmung oder Einstellung der Mütter gegenüber den Verhaltensweisen ihres Kindes positiv beeinflussen. Bemerkenswert ist, dass die mütterliche Wahrnehmung des kindlichen Temperaments als „schwierig“ vom ersten bis zum dritten Messzeitpunkt in beiden Gruppen angestiegen ist. Eine solche Entwicklung vom 4. bis zum 12. Lebensmonat könnte für ein in unserer belasteten Stichprobe spezifisches Phänomen sprechen. So ist es vorstellbar, dass für die sozio-ökonomisch belasteten Eltern die rasche psychomotorische und Autonomieentwicklung des Kindes im ersten Lebensjahr eine starke Herausforderung für ihre Anpassungsfähigkeiten darstellt.
Einschränkungen / Hinweise für die weitere Forschung Es sind methodologische Einschränkungen dieser Studie zu benennen. Zunächst war die Kontrollgruppe in der Ba© 2016 Hogrefe Verlag
11
seline zumindest bezüglich der demographischen Daten etwas weniger belastet. Zwischen den Gruppen ergaben sich darüber hinaus weitere statistisch signifikante Unterschiede in den sozio-ökonomischen Variablen, was eine Vergleichbarkeit und Interpretation der Ergebnisse erschwert. Ein naturalistisches Design ohne Randomisierung ist ein wissenschaftlicher Nachteil, der hier zu einer positiven Selektion innerhalb der belasteten Kontrollgruppe führte: Die sozioökonomisch am stärksten Belasteten haben an der Studie nicht teilgenommen, während die am stärksten belasteten Interventionsfamilien durch die Teilnahme an dem Programm mehr für die Teilnahme an der Begleitforschung motiviert waren. Ein naturalistisches Design ist andererseits ein Vorteil hinsichtlich der Intention von KfdN, wirklich allen sozial stark belasteten Familien in den beteiligten Landkreisen Unterstützung anzubieten. Durch die begrenzte Studiendauer und Schwierigkeiten bei der Rekrutierung der Familien war es nicht möglich, weitere Kontrollfamilien zu gewinnen und ein Matchingverfahren durchzuführen, um den sozioökonomischen Vorteil der Kontrollgruppe auszugleichen. Auch erhielten 46 % der Familien der Kontrollgruppe im ersten Lebensjahr ihres Kindes soziale Hilfen (andere und weniger intensive als in KfdN), z. B. vom Jugendamt, was eine Störgröße darstellen könnte. Anzumerken ist auch, dass die Anzahl der Hausbesuche von minimal 2 bis maximal 62 stark variierte, was der Intention entsprach, die Besuchsintensität nach dem Bedarf der Familien zu richten. Methodologisch bedeutet dies aber eine Einschränkung, da besonders intensive Interventionen nicht vergleichbar mit den Interventionen am anderen Ende der Bandbreite sind. Für die weitere Forschung böten sich Extremgruppenanalysen zur Identifizierung der Subgruppen an, die von der Intervention am besten oder am wenigsten profitieren. Angesichts der fehlenden Effekte auf die Feinfühligkeit könnten die Befunde von Bakermans-Kranenburg und Kollegen (2003) als Hinweis auf die mangelnde Aussagekraft der Postmessung zum ersten Geburtstag des Kindes gewertet werden. MacLeod und Nelson (2000) und Layzer und Mitarbeiter (2001) stellten höhere Effektstärken bei einer Follow-up- als bei der Postmessung fest. Für Effekte, die erst in Follow-up-Untersuchungen auftreten, spricht die Überlegung, dass Eltern im ersten Lebensjahr umfangreiche Anpassungsleistungen bewältigen müssen, die sie hindern könnten, von einer Maßnahme in vollem Umfang zu profitieren. Dadurch könnten Interventionseffekte geschmälert werden. „Sleeper“Effekte wären plausibel, da die „Aufwärtsspirale“ für spätere Erfolge durch die Intervention erst einmal in Gang gesetzt werden muss.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13
12
A. Sidor et al., Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN)
Fazit Die Ergebnisse weisen auf die punktuelle Wirksamkeit von „Keiner fällt durchs Netz“ hin. Die Effektstärken lagen literaturkonform im kleinen bis mittleren Bereich. Die Intervention hat sowohl einen direkten positiven Einfluss auf Kindesmerkmale wie die sozial-emotionale Entwicklung und die elterliche Wahrnehmung der temperamentalen „Schwierigkeit“ des Kindes ausgeübt als auch die Wahrnehmung der Mütter zu den Verhaltensweisen ihres Kindes positiv beeinflusst. Es wurden keine Effekte auf die Feinfühligkeit, die depressive Symptomatik oder Stressbelastung der Mütter gefunden. Der ausbleibende Effekt auf die Feinfühligkeit legt eine stärkere Berücksichtigung dieses Aspektes in der Projektkonzeption nahe, z. B. durch zusätzliche Schulung der Familienhebammen und eine Einführung des Videofeedbacks. Die fehlenden Interventionseffekte im Bereich der Stressbelastung können als Hinweis darauf gewertet werden, dass sozio-ökonomische Risikofaktoren Effekte unterdrücken. Längere Beobachtungszeiträume sind für die Identifizierung von Langzeit- und möglichen „Sleeper“Effekten unabdingbar. Sie bieten die Chance, mehr über die praktische Bedeutsamkeit der kleinen bis mittleren Effekte der frühen Interventionen in Erfahrung zu bringen.
Literatur Abidin, R. R. (1995). Parenting Stress Index. Professional manual. Third Edition. Lutz, FL: Psychological Assessment Resources. Bakermans-Kranenburg, M. J., IJzendoorn, M. H. van & Bradley, R. H. (2005). Those who have, receive: The Matthew Effect in early childhood intervention in the home environment. Review of Educational Research, 75 (1), 1 – 26. Bakermans-Kranenburg, M. J., IJzendoorn, M. H. van & Juffer, F. (2003). Less is more: Meta-analysis of sensitivity and attachment interventions in early childhood. Psychological Bulletin, 129, 195 – 215. Bayley, N. (1993). Manual for the Bayley Scales of Infant Development. 2nd Edition. San Antonio, TX: The Psychological Corporation. Beelmann, A. (2006). Wirksamkeit von Präventionsmaßnahmen bei Kindern und Jugendlichen: Ergebnisse und Implikationen der integrativen Forschung. Zeitschrift für Klinische Psychologie und Psychotherapie, 35, 151 – 162. Bergant, A. M., Nguyen, T., Heim, K., Ulmer, H. & Dapunt, O. (1998). Deutsche Version und Validierung der Edinburgh Postnatal Depression Scale. Deutsche Medizinische Wochenschrift, 123 (3), 35 – 40. Bronte-Tinkew, J., Moore, K. A., Matthews, G. & Carrano, J. (2007). Symptoms of major depression in a sample of fathers of infants: Sociodemographic correlates and links to father involvement. Journal of Family Issues, 28 (1), 61 – 99.
Cierpka, M. (2009a). Das Baby verstehen. Praxismanual für die aufsuchende Arbeit. Moers: Focus-Familie GmbH. Cierpka, M. (2009b). „Keiner fällt durchs Netz“ – Wie hoch belastete Familien unterstützt werden können. Familiendynamik, 34 (2), 36 – 47. Cierpka, M., Franz, M. & Egle, U. T. (2011). Früherkennung und Prävention. In R. H. Adler, W. Herzog, P. Joraschky, K. Köhle, W. Langewitz, W. Söllner & W. Wesiack (Eds.), Uexküll-Psychosomatische Medizin. Theoretische Modelle und klinische Praxis (S. 389 – 398). München: Elsevier. Cohen, J. (1969). Statistical Power Analysis for the Behavioral Sciences. New York: Academic Press. Cox, J. L., Holden, J. M., Sagovsky, R. (1987). Detection of postnatal depression: development of the 10 item Edinburgh Postnatal Depression Scale. British Journal of Psychiatry, 150, 782 – 786. Crittenden, P. (2005). Der CARE-Index als Hilfsmittel für die Früherkennung, Intervention und Forschung. Frühförderung interdisziplinär, 3, 99 – 106. Durlak, J. A. & Wells, A. M. (1997). Primary prevention mental health programs for children and adolescents: A meta-analytic review. American Jouranl of Community Psychology, 25, 115 – 152. Eickhorst, A., Sidor, A., Frey, B. & Cierpka, M. (2012). Frühe Hilfen mit “Keiner fällt durchs Netz”. Ein Modellprojekt zur psychosozialen Prävention für Familien mit Kindern im ersten Lebensjahr. Psychologie in Erziehung und Unterricht, 59, 290 – 302. Frey B. & Cierpka, C. (in Vorbereitung). Ages und Stages Questionnaires (ASQ-3) für den deutschen Sprachraum. Göttingen: Hogrefe. Gomby, D. S. (2007). The promise and limitations of home visiting: Implementing effective programs. Child Abuse & Neglect, 31, 793 – 799. Kaaresen, P. I., Rønning, J. A., Ulvund, S. E. & Dahl, L. B. (2006). A randomized, controlled trial of the effectiveness of an early-intervention program in reducing parenting stress after preterm birth. Pediatrics, 118, e9. doi: 10.1542/peds.2005 – 1491 Klein-Velderman, M., Bakermans-Kranenburg, M. J., Juffer, F. & IJzendoorn, M. H. van (2006). Effects of attachment-based interventions on maternal sensitivity and infant attachment: Differential susceptibility of highly reactive infants. Journal of Family Psychology, 20, 266 – 274. Laucht, M., Esser, G. & Schmidt, M. (2000). Längsschnittforschung zur Entwicklungsepidemiologie psychischer Störungen: Zielsetzung, Konzeption und zentrale Befunde der Mannheimer Risikokinderstudie. Zeitschrift für Klinische Psychologie und Psychotherapie, 29, 246 – 262. Layzer, J. I., Goodson, B. B., Bernstein, L., & Price, C. (2001). National evaluation of family support programs. Volume A: The meta-analysis. Cambridge, MA: Abt Associates. MacLeod, J. & Nelson, G. (2000). Programs for the promotion of family wellness and the prevention of child maltreatment: A meta-analytic review. Child Abuse & Neglect, 24, 1127 – 1149. McDowell, A. D., Saylor, C. F., Taylor, M. J., Boyce, G. C. & Stokes, S. J. (1995). Ethnicity and parenting stress change during early intervention. Early Child Development and Care, 111, 131 – 140. Nair, P., Schuler, M. E., Black, M. M., Kettinger, L. & Harrington, D. (2003). Cumulative environmental risk in substance abusing women: early intervention, parenting stress, child abuse potential and child development. Child Abuse & Neglect, 27, 997 – 1017. Nievar, M. A., Van Egeren, L. A. & Pollard, S. (2010). A meta analysis of home visiting programs: Moderators of improvements in maternal behavior. Infant Mental Health Journal, 31, 499 – 520. Nores, M. & Barnett, W. S. (2010). Benefits of early childhood interventions across the world: (under) investing in the very young. Economics of Education Review, 29, 271 – 282.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13
© 2016 Hogrefe Verlag
A. Sidor et al., Wirksamkeit des Präventionsprojekts „Keiner fällt durchs Netz“ (KfdN)
Olds, D., Kitzman, H., Cole, R., Robinson, J., Sidora, K., Luckey, D. W. & Holmberg, J. (2004). Effects of Nurse Home-Visiting on Maternal Life Course and Child Development: Age 6 Follow-Up Results of a Randomized Trial. Pediatrics, 114, 1550 – 1559. Olds, D., Kitzman, H., Hanks, C., Cole, R., Anson, E., Sidora-Arcoleo, K. & Bondy, J. (2007). Effects of nurse home visiting on maternal and child functioning: Age-9 follow-up of a randomized trial. Pediatrics, 120, e832-e845. Pinquart, M. & Teubert, D. (2010). Effects of parenting education with expectant and new parents: A meta-analysis. Journal of Family Psychology, 24, 316 – 327. Reynolds, A. J., Mathieson, L. C. & Topitzes, J. W. (2009). Do early childhood interventions prevent child maltreatment? Child Maltreatment, 14, 182 – 206. Sann, A. (2012). Frühe Hilfen. Entwicklung eines neuen Praxisfeldes in Deutschland. Psychologie in Erziehung und Unterricht, 59, 256 – 274. Sidor, A., Kunz, E., Schweyer, D., Eickhorst, A. & Cierpka, M. (2011). Links between maternal postpartum depressive symptoms, maternal distress, infant gender and sensitivity: a quasi-experimental study. Child and Adolescent Psychiatry and Mental Health, 5. doi: 10.1186/1753-2000-5-7 Sidor, A., Eickhorst, E. & Stasch, M. (2012). Einschätzung der Risikobelastung in Familien im Rahmen von Frühen Hilfen: Die
13
Heidelberger Belastungsskala (HBS) und ihre Gütekriterien. Praxis der Kinderpsychologie und Kinderpsychiatrie, 61, 766 – 780. Squires, J., Potter, L. & Bricker, D. (1999). Ages & Stages Questionnaire (ASQ) user‘s guide. 2nd Edition. Chicago: Brookes. Tronick, E. & Reck, C. (2009). Infants of depressed mothers. Harvard Review Psychiatry, 17, 147 – 156.
Dr. Anna Sidor Dr. Elisabeth Kunz Prof. Dr. Manfred Cierpka Institut für Psychosomatische Kooperationsforschung und Familientherapie Universitätsklinikum Heidelberg Bergheimerstraße 54 69115 Heidelberg E-Mail: anna_sidor@yahoo.com Dr. Andreas Eickhorst Deutsches Jugendinstitut Nockherstraße 2 81541 München
Sigrun Schmidt-Traub
Kinder liebevoll und konsequent erziehen
Ein Ratgeber für Eltern und Erzieher 2015, 167 Seiten, Kleinformat, € 17,95 / CHF 24,50 ISBN 978-3-8017-2663-8 Auch als E-Book erhältlich In diesem Ratgeber werden wirkungsvolle, lernpsychologisch untermauerte Erziehungsmethoden für Kinder aller Altersgruppen beschrieben. Eltern leben ihren Kindern bestimmte Wertvorstellungen, soziale Fähigkeiten und Bewältigungsmöglichkeiten in Krisen und bei Alltagsproblemen vor. Durch einen liebevollen Umgang und verläss-
lichen Austausch mit ihren Eltern können Kinder emotionale Sicherheit und Stärke entwickeln. Anhand zahlreicher Beispiele werden verschiedene effektive Erziehungsmethoden dargestellt. Eltern und Erzieher erhalten eine detaillierte Anleitung, wie sie diese im Alltag umsetzen können. Zudem wird auf besondere pädagogische Problembereiche, wie z.B. Geschwisterrivalität, Ordnung und Medienkonsum, eingegangen und erläutert, wie diese Erziehungsprobleme bewältigt werden können. Ziel ist es, Eltern und Erziehern pädagogisch-psychologische Anstöße zu geben, ihnen das Erziehen zu erleichtern, das Familienleben freundlicher zu gestalten und ihr Selbstvertrauen in die eigene Erziehungsfähigkeit zu stärken.
www.hogrefe.de
© 2016 Hogrefe Verlag
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 1–13
Originalarbeit
Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn? Zusammenhänge zwischen optimistischen, realistischen und pessimistischen Selbstkonzepten und der Leistungsentwicklung von Grundschulkindern Anna-Katharina Praetorius1, Claudia Kastens2, Johannes Hartig1 und Frank Lipowsky3 1
Deutsches Institut für Internationale Pädagogische Forschung (DIPF), 2Universität Wuppertal, 3Universität Kassel Zusammenfassung. In der pädagogisch-psychologischen Selbstkonzeptliteratur findet sich vielfach die Forderung nach optimistischen Fähigkeitsselbstkonzepten. Längsschnittstudien, die dezidiert den Auswirkungen von Selbstüber- und -unterschätzungen auf die Leistungsentwicklung nachgehen, existieren bislang jedoch kaum. In der vorliegenden Studie wurde mittels Residualscores das Ausmaß an Selbstüber- und -unterschätzungen in Bezug auf das Fach Mathematik von 925 Erstklässler/-innen bestimmt und über Cross-LaggedPanel-Analysen mit der mathematischen Leistungsentwicklung über die gesamte Grundschulzeit in Zusammenhang gesetzt. Es zeigte sich, dass die Residualscores lediglich zu Beginn der Grundschulzeit positive Effekte auf die Leistungen aufwiesen. Die Befunde werden vor dem Hintergrund der theoretischen Annahme einer positiven Auswirkung von optimistischen Fähigkeitsselbstkonzepten und der Selbstkonzeptentwicklung im Grundschulalter diskutiert. Schlüsselwörter: Selbstkonzept, Leistung, Optimisten, Entwicklung, Grundschule
Are Students With Optimistic Self-Concepts One Step Ahead? Relations Between Optimistic, Realistic, and Pessimistic Self-Concepts and the Achievement Development of Primary School Children Abstract. In educational research, optimistic self-concepts are often characterized as preferable. However, there are very few longitudinal studies investigating the effects of positive versus negative self-evaluation bias on achievement development. In the present study, the amount of self-evaluation bias of 925 first-graders was calculated via residual scores and related to students’ mathematical achievement development from Grade 1 to 4 using cross-lagged panel analyses. The results showed that the residual scores had an effect on achievement only at the beginning of primary school. The results are discussed with regard to the theoretical assumptions of positive effects of optimistic self-concepts. Keywords: self-concept, achievement, optimism, development, primary school
Dem Fähigkeitsselbstkonzept von Schülern/-innen wird für den schulischen Kontext eine hohe Bedeutung zugemessen. Weitaus weniger eindeutig ist, welche Ausprägung Selbstkonzepte aufweisen sollten, um optimale Lern- und Leistungsentwicklungen zu ermöglichen: Je nach Publikation finden sich Forderungen nach realistischen Ausprägungen (das Selbstkonzept entspricht der Leistung), optimistischen Ausprägungen (das Selbstkonzept ist höher als die entsprechende Leistung) und vereinzelt auch pessimistischen Ausprägungen (das Selbstkonzept ist niedriger als die entsprechende Leistung). Empirische Untersuchungen zu den Effekten realistischer, optimistischer oder pessimistischer Ausprägungen von Fähigkeitsselbstkonzepten existieren bislang jedoch nur vereinzelt. Das An-
liegen der vorliegenden Studie ist eine längsschnittliche Untersuchung der Auswirkungen solcher Fähigkeitsselbstkonzeptausprägungen auf die Leistungsentwicklung von Grundschulkindern.
Bedeutung des Fähigkeitsselbstkonzepts Das Fähigkeitsselbstkonzept von Schülern/-innen gilt als eines der bedeutendsten motivationalen Schülermerkmale im schulischen Kontext. Die hohe Bedeutung, die dem Fähigkeitsselbstkonzept in der pädagogisch-psychologischen Forschungsliteratur zugemessen wird, wird mit den folgenden drei Punkten begründet: a) Hohe Über-
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26 DOI: 10.1026/0049-8637/a000140
© 2016 Hogrefe Verlag
A.-K. Praetorius et al., Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn?
15
zeugungen in Bezug auf die eigenen Fähigkeiten haben einen pädagogischen Eigenwert (Dickhäuser & Galfe, 2004; Einsiedler, Martschinke & Kammermeyer, 2007; Möller, Pohlmann, Köller & Marsh, 2009). b) Das Fähigkeitsselbstkonzept steht in Zusammenhang mit einer Reihe von motivationalen sowie emotionalen lernrelevanten Merkmalen (z. B. Erfolgserwartungen; Dickhäuser, Schöne, Spinath & Stiensmeier-Pelster, 2002; Lüdtke & Köller, 2002). c) Fähigkeitsselbstkonzept und Leistung sind positiv korreliert (z. B. Arens, Yeung, Craven & Hasselhorn, 2011; Chapman, Tunmer & Prochnow, 2000; Marsh, 1990). Die hohe Bedeutung von Fähigkeitsselbstkonzepten wird dabei vielfach insbesondere auch in Bezug auf den Grundschulbereich herausgestellt, unter anderem da die Lern- und Leistungsentwicklung im Grundschulalter die Basis für die weitere Entwicklung von Schülern/-innen darstellt und dabei gerade auch für Übergangsempfehlungen und somit die weitere Schullaufbahn von Schülern/-innen von nicht zu unterschätzender Bedeutung ist (siehe Guay, Marsh & Boivin, 2003; Helmke, 1991; Kammermeyer & Martschinke, 2006; Maaz & Nagy, 2010; Schrader, Helmke & Hosenfeld, 2008). Da Selbstkonzept und Leistungen in der Grundschule noch nicht so eng verbunden sind wie in den weiterführenden Schulen, bieten sich zudem mehr Möglichkeiten zur Beeinflussung des Selbstkonzepts in der Grundschule (Guay et al., 2003).
zeau, 2003; Cole, Martin, Lachlan, Seroczynski & Fier, 1999; Pajares, 2001). Helmke (1998) fasst diese Aspekte so zusammen, dass „eine optimistische Selbsteinschätzung … wie ein Zusatzmotor [wirkt]“ (S. 130). Neben Forderungen nach positiven bzw. optimistischen Selbstkonzepten finden sich in der Literatur auch Aussagen dahingehend, dass Realismus in Bezug auf die Einschätzungen eigener Fähigkeiten erstrebenswert ist (z. B. Dickhäuser, 2006; Dunlosky, Hertzog, Kennedy & Thiede, 2005; Lüdtke & Köller, 2002). Argumentiert wird dabei u. a. mit lebenslangem Lernen: Eine Voraussetzung für gelingendes lebenslanges Lernen mit positiven psychosozialen Folgen sind den Autoren zufolge realistische Einschätzungen der eigenen Fähigkeiten. Einige wenige Autoren vermuten zudem, dass auch Pessimismus in Bezug auf die eigenen Fähigkeiten positive Auswirkungen haben kann (z. B. Blanton, Buunk, Gibbons & Kuyper, 1999): Schüler/-innen mit niedrigen Fähigkeitsselbstkonzepten investieren unter Umständen mehr Anstrengung in ein Fach. Zusätzlich zu den drei oben genannten Positionen finden sich Forderungen, die eine Kombination dieser Positionen darstellen, so z. B. nach realistisch bis optimistischen Ausprägungen (z. B. Dresel, Fasching, Steuer & Berner, 2010), nach adäquaten, zugleich aber positiv ausgeprägten Selbstkonzepten (z. B. Möller & Trautwein, 2009) oder aber nach moderat optimistischen Selbstkonzepten (Helmke, 1998).
Optimalausprägungen von Fähigkeitsselbstkonzepten: Theoretische Annahmen
Empirische Effekte optimistischer, realistischer und pessimistischer Fähigkeitsselbstkonzepte
In einem Großteil der Veröffentlichungen wird angenommen, dass hohe, positive oder optimistische Selbstkonzepte1 wünschenswert sind (z. B. Chapman & Tunmer, 1997; Helmke, 1998; O’Mara, Marsh, Craven & Debus, 2006). Argumentiert wird dabei damit, dass niedrig ausgeprägte Fähigkeitsselbstkonzepte sich nachteilig auf den Lernerfolg auswirken und mit ungünstigen psychosozialen Folgen einhergehen (z. B. Eckert, Schilling & Stiensmeier-Pelster, 2006; Helmke, 1998; Möller & Trautwein, 2009). Positive bzw. optimistische Selbstkonzepte hingegen sollten dazu führen, dass Personen eine höhere Lernmotivation aufweisen, ihre Anstrengung zur Erreichung von Zielen erhöhen sowie bei deren Verfolgung mehr Persistenz aufweisen (z. B. Bouffard, Boisvert & Ve-
1
Eine empirische Untersuchung der Auswirkungen von optimistischen, realistischen und pessimistischen Fähigkeitsselbstkonzepten setzt das Vorhandensein eines Kriteriums zur Bestimmung des Realitätsgrades von Fähigkeitsselbstkonzepten voraus. Als Kriterium dienen in der Regel standardisierte Schulleistungstests. In einigen Untersuchungen (z. B. Gresham, Lane, MacMillan, Bocian & Ward, 2000; Helmke, 1998; Stipek, 1981) werden auch Noten oder Lehrereinschätzungen zur Erfassung der Leistungen verwendet, was jedoch aus messmethodischer Sicht kritisch zu sehen ist, da diese den Hauptgütekriterien nicht genügen (siehe auch Dupeyrat, Escribe, Huet & Régner, 2011).
Publikationen unterscheiden sich darin, ob die entsprechenden Selbstkonzeptausprägungen als hoch, positiv oder optimistisch bezeichnet werden. Oft wird nicht genauer spezifiziert, ob mit den Begrifflichkeiten relative Ausprägungen (d. h. im Vergleich zur Leistung) oder aber absolute Ausprägungen (d. h. je höher, desto besser) gemeint sind.
© 2016 Hogrefe Verlag
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26
16
A.-K. Praetorius et al., Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn?
In Bezug gesetzt werden das Fähigkeitsselbstkonzept und das entsprechende Leistungskriterium je nach Untersuchung mittels deskriptiver Vergleiche, mittels korrelativer oder regressionsanalytischer Verfahren, aber auch mittels Differenzmaßen. Der viel zitierte Beitrag von Helmke (1998) stellt ein Beispiel für einen deskriptiven Vergleich von Selbstkonzepten und Kriterium (hier: Schulnoten) dar. Helmke stellt in diesem Beitrag die Ausprägungen der Selbstkonzepte sowie der Schulnoten als Balkendiagramme nebeneinander und schließt von den beiden schief verteilten Ausprägungen darauf, dass „die Schüler mit ihrer (…) Selbsteinschätzung im großen und ganzen also tatsächlich gar nicht einmal so ganz schief liegen“ (S. 91). Aussagekräftiger sind korrelative Untersuchungen. Diese zeigen, dass Selbstkonzepte und Leistungen – je nach Klassenstufe – einen niedrigen bis mittleren positiven Zusammenhang aufweisen (zsf. Huang, 2011). Dies kann zum einen als Anzeichen dafür gedeutet werden, dass Selbstkonzepte Leistungen positiv beeinflussen (und umgekehrt). Zum anderen zeigen diese korrelative Studien, dass Schülerinnen und Schüler mit zunehmendem Alter Selbstkonzepte ausbilden, die in engerem Zusammenhang zu den tatsächlichen Leistungen stehen (siehe Guay et al., 2003). Der Vorteil regressionsanalytischer Ansätze gegenüber rein korrelativen Analysen liegt darin, dass vorherige Leistungen kontrolliert und damit Effekte der Selbstkonzeptausprägungen auf die Leistungsentwicklung besser untersucht werden können. Etliche diesbezügliche Untersuchungen zeigen, dass Selbstkonzepte einen positiven Effekt auf die Leistungsentwicklung aufweisen (siehe z. B. die Metaanalyse von Valentine, DuBois & Cooper, 2004). Der Fokus der bislang berichteten Studien lag auf dem Zusammenhang zwischen den Verteilungen der Merkmale Selbstkonzept und Leistung – und damit auf einem interindividuellen Vergleich. Interessiert man sich für die Frage nach den Auswirkungen des Realitätsbezugs von Selbstkonzepten, müssen Selbstkonzept und Leistung jedoch direkt – und damit intraindividuell – miteinander verrechnet werden. Dies wird auch als personenzentrierte Vorgehensweise beschrieben (Magnusson, 1998; Niemivirta, 2002; Schmiedek & Lindenberger, 2007). Eine querschnittliche Untersuchung, in der eine solche Verrechnung von Selbstkonzept und Leistung stattfand, stammt von Chiu und Klassen (2010). Die Autoren verwendeten einen mittels Differenzmaß gebildeten Index, der das Ausmaß der Kalibrierung des Selbstkonzepts an
2
die entsprechenden Leistungen angibt. Dazu wurde die Differenz aus dem z-standardisierten Selbstkonzept und der z-standardisierten sowie am Landesmittelwert adjustierten Mathematikleistung gebildet und anschließend der negative Betrag dieser Differenz in den Analysen verwendet. Für die deutsche Teilstichprobe der analysierten PISA-Daten zeigt sich kein Effekt des Differenzmaßes auf die Leistung der Schüler/-innen; die Genauigkeit der Selbsteinschätzung steht demnach nicht per se mit der Leistung in Zusammenhang. Um zwischen sich selbst unter- und überschätzenden Schülern unterscheiden zu können, verwendeten Chiu und Klassen (2010) ein weiteres Differenzmaß. Dazu kategorisierten sie alle Schüler/-innen, die einen höheren z-standardisierten Selbstkonzeptwert aufwiesen als es dem z-standardisierten Leistungswert entsprach, als sich überschätzende Schüler/-innen und solche Schüler/-innen mit niedrigeren Selbstkonzeptwerten im Vergleich zu den Leistungswerten als sich unterschätzende Schüler/-innen. Knapp die Hälfte der deutschen Teilstichprobe wurde basierend auf dieser Unterscheidung als sich selbst überschätzend kategorisiert. Von diesen Schüler/-innen wiederum verfügten circa ein Drittel über mathematische Leistungen, die über dem Landesdurchschnitt lagen und zwei Drittel über mathematische Leistungen, die unter dem Landesdurchschnitt lagen. Da Chiu und Klassen (2010) die Aufteilung der Schüler/-innen in unter- vs. überschätzende Schüler am Mittelwert vorgenommen haben, führen kleinste Abweichungen zwischen Selbstkonzept und Leistung bereits zu einer Kategorisierung als über- bzw. unterschätzend. Die Bildung einer Gruppe sich realistisch einschätzender Schüler/-innen wurde im Rahmen dieser Untersuchung nicht vorgenommen. Eine solche Gruppe wurde in der Studie von Dupeyrat und Kollegen (2011) zusätzlich gebildet. Die Autorinnen und Autoren untersuchten Selbsteinschätzungen von Sekundarstufenschülern/-innen in Bezug auf deren mathematische Fähigkeiten. Selbsteinschätzungen und Mathematiknoten wurden zum Ende des zweiten Trimesters jeweils in drei Gruppen eingeteilt2 und anschließend anhand eines Vergleichs der beiden Gruppenzugehörigkeiten als optimistisch, realistisch oder pessimistisch kategorisiert (z. B. wurden Schüler/-innen, die über hohe Selbsteinschätzungen verfügten und deren Leistungen im mittleren Bereich lagen, als optimistisch eingestuft). Die optimistischen Schüler/-innen (14 %) und die realistischen Schüler/-innen (72 %) wiesen einer MANOVA zufolge im Vergleich zu den pessimistischen Schüler/-innen (14 %) eine positivere Leistungsentwicklung vom Ende des zweiten bis zum Ende des dritten Trimesters auf.
So wurden z. B. die fünfstufig erfassten Selbsteinschätzungen mit den Werten 1 und 2 als niedrig, in Bezug auf den Wert 3 als mittel und die Selbsteinschätzungen mit den Werten 4 und 5 als hoch eingestuft.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26
© 2016 Hogrefe Verlag
A.-K. Praetorius et al., Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn?
Einen wiederum anderen methodischen Zugang zur Verrechnung von Selbstkonzepten und Leistungen wählten Robins und Beer (2001). Robins und Beer (2001) erfassten Selbstkonzepte und tatsächliche Fähigkeiten von Studierenden in den USA zu Beginn ihres Studiums und untersuchten die Auswirkungen von Selbstüberschätzungen zu diesem ersten Messzeitpunkt über vier Jahre hinweg. Selbstüberschätzungen wurden dabei über einen kontinuierlichen Residualscore erfasst, der denjenigen Anteil des Selbstkonzepts darstellt, der durch die korrespondierenden Leistungen nicht erklärt werden kann. Positive Variablenausprägungen stellen dabei Selbstüberschätzungen dar, negative Ausprägungen Selbstunterschätzungen. Mittels hierarchischer multipler Regressionen zeigte sich, dass das Ausmaß an Selbstüberschätzung und der Durchschnitt aller Noten der Studierenden in keinem Zusammenhang standen. Zusammengenommen lässt sich also zum einen feststellen, dass zur Beantwortung der Frage nach den Auswirkungen von korrekten Selbsteinschätzungen verschiedenste methodische Zugänge gewählt wurden. Zum anderen ist auffällig, dass die Ergebnisse der vorhandenen Studien nicht einheitlich ausfallen und die Studien insbesondere Selbstkonzeptentwicklungen älterer Schüler/-innen oder Studierender in den Blick nahmen. Butler (2011) betont auf Basis der aktuellen Befundlage daher die Notwendigkeit weiterer Studien, in denen Ursachen, Korrelate und Auswirkungen von (in‐)akkuraten Selbsteinschätzungen untersucht werden. Dies gilt insbesondere für Studien, die ein längsschnittliches Design umfassen (Butler, 2011), Auswirkungen von Selbsteinschätzungen auf Leistungsmaße untersuchen (Bouffard & Narciss, 2011) und im Grundschulbereich angesiedelt sind (Bouffard, Vezeau, Roy & Lengelé, 2011).
Selbstkonzepte von Grundschulkindern Ergänzende Untersuchungen für den Grundschulbereich sind deswegen von hoher Bedeutung, weil nicht davon ausgegangen werden kann, dass sich die Befunde aus dem Sekundar- und Tertiärbereich unmittelbar auf Grundschulkinder übertragen lassen. Etliche Autoren weisen darauf hin, dass insbesondere junge Kinder dazu tendieren, ihre eigenen Fähigkeiten zu überschätzen (z. B. Bouffard, Markovits, Vezeau, Boisvert, & Dumas, 1998; Chapman & Tunmer, 1995; Jacobs, Lanza, Osgood, Eccles, & Wigfield, 2002). Auch bei diesen Untersuchungen wurden Selbstkonzept und Leistung jedoch lediglich interund nicht intraindividuell in Beziehung gesetzt. Die laut bisherigen Untersuchungen existierende Tendenz zu optimistischen Selbsteinschätzungen junger Kin© 2016 Hogrefe Verlag
17
der wird unterschiedlich erklärt (zsf. Bouffard et al., 2011). Eine der am weitesten verbreiteten Erklärungen bezieht sich darauf, dass junge Kinder Anstrengung und Fähigkeit noch gleichsetzen und bei hoher Anstrengung daher auch ihre Fähigkeiten als hoch ausgeprägt einschätzen (Nicholls, 1978). Ebenfalls prominent ist die Erklärung, dass junge Kinder kaum soziale Vergleiche nutzen um ihre eigenen Fähigkeiten einzuschätzen (Ruble, 1983). Aber auch Erklärungen, dass Kinder erst mit steigendem Alter lernen, Erfolge und Misserfolge in ihre Selbsteinschätzungen einzubeziehen (Bouffard et al., 1998) oder dass Kinder dazu tendieren ihre Fähigkeiten in Einklang mit ihren Wünschen einzuschätzen (Ruble, Grosouvsky, Frey, & Cohen, 1992), werden zur Erklärung der positiv überhöhten Selbsteinschätzungen von jungen Kindern herangezogen.
Stabilität von optimistischen, realistischen und pessimistischen Fähigkeitsselbstkonzepten Bouffard und Kollegen (2011) kritisieren an bisherigen Studien, dass das Ausmaß an Selbstüber- bzw. -unterschätzungen lediglich zu einem einzelnen Zeitpunkt bestimmt wurde und so die Überprüfung der Stabilität dieser Über- und Unterschätzungen nicht möglich ist. Den Autorinnen und Autoren zufolge sollten vor allem solche Selbstüberschätzungen bedeutsame Folgen haben, die stabil über einen längeren Zeitraum vorliegen. Dies kann damit erklärt werden, dass Einschätzungen der eigenen Fähigkeiten nicht per se Auswirkungen auf die leistungsbezogene und motivational-emotionale Entwicklung haben, sondern lediglich vermittelt über das Verhalten der jeweiligen Personen. Es ist daher davon auszugehen, dass sich deutliche Auswirkungen vor allem dann einstellen, wenn die Einschätzungen der eigenen Fähigkeiten sich nicht ständig verändern. Bouffard und Kollegen (2011) untersuchten Selbstkonzepte und Intelligenzwerte beginnend ab der dritten bzw. vierten Klassenstufe über fünf Jahre hinweg mittels Residualwerten. Durch multinomiale, latente Class-GrowthAnalysen konnten die Autorinnen und Autoren fünf Gruppen identifizieren: eine stabil optimistische Gruppe (15 %), eine stabil moderat optimistische Gruppe (49 %), eine stabil pessimistische Gruppe (27 %), eine über die Zeit deutlich pessimistischer werdende Gruppe (6 %) und eine sehr pessimistisch beginnende und über die Zeit weniger pessimistisch werdende Gruppe (4 %). Stabil optimistische Selbsteinschätzungen hingen multivariaten Varianzanalysen zufolge positiv mit der durch die Lehrkräfte eingeschätzten durchschnittlichen Schulleistung in Bezug
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26
18
A.-K. Praetorius et al., Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn?
auf das vergangene Schuljahr in den Fächern Sprache und Mathematik zusammen. Pessimistische Selbsteinschätzungen stellten den Autorinnen und Autoren zufolge einen bedeutsamen Risikofaktor für niedrige Leistungen dar.
Ableitung der Fragestellungen Insgesamt ist die Evidenz zum Zusammenhang zwischen Selbstüber- bzw. -unterschätzungen und der Leistungsentwicklung von Schüler/-innen noch sehr begrenzt. Bisherige Untersuchungen deuten darauf hin, dass das Ausmaß an Verschätzungen bei Einschätzung der eigenen Fähigkeiten entweder keinen Effekt (Chiu & Klassen, 2010; Robins & Beer, 2001) oder aber einen Effekt zugunsten der optimistischen und z. T. auch der realistischen Selbsteinschätzungen (Bouffard et al., 2011; Dupeyrat et al., 2011) aufweist. Untersuchungen über den gesamten Grundschulzeitraum zu dieser Thematik liegen unseres Wissens bislang nicht vor. Ergänzende Untersuchungen für den Grundschulbereich sind deswegen von hoher Bedeutung, weil nicht davon ausgegangen werden kann, dass sich die Befunde aus dem Sekundar- und Tertiärbereich unmittelbar auf Grundschulkinder übertragen lassen. Dies ist daher Gegenstand der vorliegenden Untersuchung. Bouffard und Kollegen (2011) zufolge sollten stabile Selbstüber- und -unterschätzungen mit stärkeren Auswirkungen auf die leistungsbezogene und motivational-emotionale Entwicklung verbunden sein als instabile. Bislang existieren noch keine empirischen Untersuchungen zur Stabilität von Selbstüber- vs. -unterschätzungen über die gesamte Grundschulzeit. Fragestellung 1 lautet dementsprechend: Wie stabil sind Selbstüber- bzw. -unterschätzungen der eigenen mathematischen Fähigkeiten über die Grundschulzeit? Anschließend soll anhand eines Cross-Lagged-PanelModells längsschnittlich untersucht werden, inwiefern das Ausmaß an Selbstüber- und -unterschätzungen Auswirkungen auf die Leistungsentwicklung von Grundschulkindern hat. Fragestellung 2 lautet daher: Lassen sich mathematische Fähigkeiten – unter Kontrolle vorheriger Leistungen – durch die Selbstüber- und -unterschätzungen zu einen früheren Zeitpunkt vorhersagen? Einige Autoren (z. B. Helmke, 1998) vermuten positive Auswirkungen von Selbstüberschätzungen insbesondere bei moderaten Ausprägungen derselben. Daher wurde im Rahmen der Cross-Lagged-Panel-Analysen zusätzlich ein quadratischer Effekt eingeführt, um diese Vermutung empirisch zu überprüfen (Fragestellung 3).
Methode Stichprobe Die Daten der vorliegenden Studie stammen aus dem Projekt „Persönlichkeits- und Lernentwicklung von Grundschulkindern“ (PERLE). Im Rahmen des Projekts wurden über einen Zeitraum von vier Jahren Daten von insgesamt 42 Klassen und deren 964 Schüler/-innen (52 % weiblich) aus 25 Schulen in Sachsen, Thüringen, Berlin und Mecklenburg-Vorpommern erfasst. Für weiterführende Informationen zu Studiendesign und -durchführung sei an dieser Stelle auf Lipowski, Faust und Kastens (2013), verwiesen. An den Erhebungen nahmen zu Beginn des ersten Schuljahres (September – November 2006) 735 Schüler/-innen, am Ende des ersten Schuljahres (Juni 2007) 740 Schüler/-innen, am Ende des zweiten Schuljahres (Juni 2008) 832 Schüler/-innen, am Ende des dritten Schuljahres (Juni 2009) 573 Schüler/-innen und am Ende des vierten Schuljahres (Juni 2010) 595 Schüler/-innen teil. Bei Schuleintritt waren die Schüler/-innen im Mittel 6 Jahre und 6 Monate alt (SD = 4 Monate). Die Schüler/-innen stammen zu einem überdurchschnittlichen Teil aus Familien mit mittlerem bis hohem sozioökonomischem Status (MHISEI = 62.5 Punkte, SD = 15.8); es handelt sich demnach um eine sozial selektive Stichprobe.
Durchführung Das mathematische Fähigkeitsselbstkonzept und die mathematischen Leistungen wurden zu allen Messzeitpunkten zeitgleich erhoben. Lediglich für den ersten Messzeitpunkt war dies aufgrund der geringen Aufmerksamkeitsspanne der Schüler/-innen nicht möglich, so dass beim ersten Messzeitpunkt das Selbstkonzept sechs bis acht Wochen nach den mathematischen Leistungen erhoben wurde. Der Einsatz klassischer Fragebögen im Klassenverband war aufgrund gering ausgeprägter Lesefähigkeiten erst zum Ende des dritten und vierten Schuljahres möglich. Im ersten Schuljahr wurden die Schüler/-innen einzeln, im zweiten Schuljahr in Kleingruppen getestet (siehe Lipowski et al., 2013). Die Items wurden dabei durch geschulte Testleiter/-innen vorgelesen, um zu vermeiden, dass das Antwortverhalten der Schüler/-innen durch geringe Lesefähigkeiten und eine geringe Aufmerksamkeitsspanne der Schüler/-innen verfälscht werden. Aufgabe der Testleiter/-innen war es zudem, darauf zu achten, dass die Schüler/-innen sich nicht gegenseitig in ihrem Antwortverhalten beeinflussen.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26
© 2016 Hogrefe Verlag
A.-K. Praetorius et al., Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn?
Zur Erfassung des Selbstkonzepts wurden im ersten und zweiten Schuljahr Piktogramme verwendet um die Antworten der Schüler/-innen zu erfassen. Im dritten und vierten Schuljahr hatten die Testleiter/-innen dafür Sorge zu tragen, dass alle Schüler/-innen zu bestimmten, vorher im Testheft durch ein Stop-Schild markierten Stellen, auf demselben Bearbeitungsstand waren und erst dann fortzufahren, wenn auch langsame Schüler/-innen mit der Beantwortung der Items fertig waren.
Instrumente Mathematisches Fähigkeitsselbstkonzept Im Rahmen der Studie wurde ein neu entwickeltes Instrument mit sechs Items zur Erfassung des mathematischen Selbstkonzepts eingesetzt (siehe Poloczek, Karst, Praetorius & Lipowsky, 2011), um Selbstkonzepte bereits im ersten Schuljahr valide und reliabel erfassen zu können. Ein Beispielitem lautet: „Wie gut bist du beim Rechnen?“. Das Antwortformat der Items war dreistufig und an das jeweilige Item angepasst (in Bezug auf das Beispielitem: 1 = nicht so gut; 2 = gut; 3 = sehr gut). Höhere Ausprägungen stellten dabei für alle Items höhere Selbstkonzeptausprägungen dar. Die Skala wurde zu allen fünf Messzeitpunkten (Anfang Klasse 1, Ende Klasse 1, Ende Klasse 2, Ende Klasse 3 und Ende Klasse 4) eingesetzt. Die interne Konsistenz war zufriedenstellend (t1: a = .82; t2: a = .82; t3: a = .87; t4: a = .88; t5: a = .90). Hinweise zur konvergenten und diskriminanten Validität ergeben sich durch Korrelationen zwischen den mathematischen Selbstkonzepten und den zeitgleich erfassten Leistungen in Mathematik, im Lesen und im Rechtschreiben. Die entsprechenden Zusammenhänge des mathematischen Selbstkonzepts fallen für die mathematischen Leistungen enger aus (t1: r = .31, t2: r = .47, t3: r = .51, t4: r = .57; t5: r = .51) als für die Leistungen im Lesen (t1: r = .10, t2: r = .25, t3: r = .17, t4: r = .23; t5: r = .25) und im Rechtschreiben (t1: r = .10; t2: r = .20, t3: r = .20, t4: r = .22; t5: r = .20). Die Invarianz über die Zeit ist hinreichend gesichert (partielle strenge Invarianz, vgl. Meredith, 1993: CFI = .98, RMSEA = .02, SRMR = .04; DCFI = .005 im Vergleich zu einem Modell mit metrischer Invarianz). Im Rahmen der Invarianzanalysen wurden die Faktorwerte ausgelesen und für die nachfolgenden Analysen verwendet. Mathematische Leistung Die mathematischen Leistungen der Schüler wurden mittels eines standardisierten Schulleistungstests jeweils zeitgleich zu den mathematischen Selbstkonzepten erfasst. Die Testentwicklung erfolgte induktiv und in Anlehnung an curriculare Inhalte der Lehrpläne. Dazu wurden © 2016 Hogrefe Verlag
19
Aufgaben aus bestehenden Schultests (DEMAT-Versionen 1 bis 4, Krajewski, Küspert & Schneider, 2002; TEDIMATH, Kaufmann, Nuerk, Graf, Krinzinger, Delazer & Willmes, 2009; LEst 4 – 7, Moser, Berweger & LüchingerHutter, 2004) im Original oder leicht verändert übernommen sowie ergänzend neue Aufgaben entwickelt. Der inhaltliche Fokus der Testentwicklung lag zu allen Messzeitpunkten auf arithmetischen Aufgaben zur Addition, Subtraktion, Division und Multiplikation in Form von Rechenaufgaben (z. B. Lückenaufgaben, Tauschaufgaben) sowie Textaufgaben. In Klassenstufe eins wurden zudem Zählaufgaben, in den Klassenstufen drei und vier u. a. einzelne Schätzaufgaben bzw. Aufgaben zur Wahrscheinlichkeit gestellt. Die Tests bestanden zu den jeweiligen Messzeitpunkten aus einer unterschiedlichen Anzahl von Items (n Items t1 = 25, t2 = 25, t3 = 27, t4 = 25, t5 = 25). Um eine längsschnittliche Vergleichbarkeit der Messwerte zu gewährleisten, wurden außerdem zu jedem Messzeitpunkt Ankeritems für die Datenerhebung und Skalierung verwendet (n Items t1 = 8, t2 = 16, t3 = 20, t4 = 20, t5 = 16). Für jede Schülerin und jeden Schüler wurde für jeden Messzeitpunkt ein Personenfähigkeitsparameter (WLE) im Rahmen eines mehrdimensionalen Rasch-Modells geschätzt, in dem jede Dimension einen Messzeitpunkt abbildet. Einer Simulationsstudie von Hartig und Kühnbach (2006) zufolge führt dies zu unverzerrten Schätzungen der Varianz der Veränderungsmaße sowie der Zusammenhänge mit anderen Variablen, während dies bei einer Modellierung über virtuelle Personen (einem oft gewählten Ansatz bei Längsschnittstudien) nicht der Fall ist. Da ConQuest bei mehrdimensionalen Modellen WLE‐Schätzer nur für diejenigen Fälle berechnet, für die zu allen Messzeitpunkten Daten vorliegen, wurde in zwei Schritten vorgegangen: In Schritt 1 wurden die Itemschwierigkeiten über alle Fälle und Messzeitpunkte hinweg geschätzt. In Schritt 2 wurden die WLE-Personenfähigkeitsschätzer pro Messzeitpunkt unter Vorgabe der in Schritt 1 ermittelten Item-Schwierigkeiten bestimmt. Die EAP-/PV-Reliabilität betrug zu t1 = .80, zu t2 = .81, zu t3 = .83, zu t4 = .76 und zu t5 = .70, die WMNSQ-Werte für die Aufgaben lagen in einem akzeptablen Bereich (0.81 – 1.26) (siehe Wilson, 2005).
Bestimmung von Selbstüber- bzw. -unterschätzungen und deren Auswirkungen Entsprechend den Empfehlungen aus der Literatur (siehe Bouffard et al., 2011; Gonida & Leondari, 2011; Paulhus & John, 1998; Robins & Beer, 2001; Robins & John, 1997) wurden in der vorliegenden Untersuchung für alle Mess-
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26
20
A.-K. Praetorius et al., Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn?
zeitpunkte standardisierte Residualscores zur Bestimmung des Ausmaßes an Selbstüber- bzw. -unterschätzungen berechnet. Dazu wurden die Fähigkeitsselbstkonzeptausprägungen der Schüler/-innen im Fach Mathematik auf die mathematischen Leistungen zum gleichen Messzeitpunkt regrediert und die so gebildeten Residualscores anschließend z-standardisiert. Werte über Null können so interpretiert werden, dass sie auf positivere Einschätzungen der eigenen mathematischen Fähigkeiten hinweisen als dies auf Basis der tatsächlichen Leistungen zu erwarten gewesen wäre. Werte unter Null deuten auf negativere Einschätzungen der eigenen Fähigkeiten hin als in Bezug auf die Leistungen zu erwarten wäre.
Datenanalyse Um zu überprüfen, ob sich Schüler/-innen mit Selbstübervs. -unterschätzungen im Hinblick auf ihre Leistungsentwicklung unterscheiden, wurden Cross-Lagged-PanelAnalysen durchgeführt. Dazu wurden neben den autoregressiven Pfaden der mathematischen Leistungen sowie der Residualscores zeitverzögerte Pfade der Leistungen auf die Residualscores sowie der Residualscores auf die Leistungen modelliert. Alle Variablen gingen dabei als manifest in die Analysen ein. Die Analysen wurden mit Mplus 7.11 durchgeführt (Muthén & Muthén, 1998 – 2012). Für die Schätzungen wurde der Restricted-Maximum-Likelihood-Schätzer eingesetzt. Da bei dessen Einsatz auch Werte für diejenigen Schüler/innen geschätzt werden, für die nicht zu allen Messzeitpunkten Daten vorliegen, basieren die Analysen auf Daten von 964 Schüler/-innen. Um die hierarchische Struktur der Daten (Schachtelung von Schüler/-innen in Klassen) zu berücksichtigen, wurden die Standardfehler durch die Verwendung der in Mplus implementierten Pseudo-Maximum-Likelihood-Schätzung (PML) für komplexe Stichproben (Asparouhov & Muthén 2005) korrigiert.
Ergebnisse Deskriptive Statistiken Tabelle 1 gibt eine Übersicht über die Mittelwerte, Standardabweichungen und Perzentilverteilungen des mathematischen Fähigkeitsselbstkonzepts, der mathematischen Leistung sowie der gebildeten Residualscores zu den einzelnen Messzeitpunkten. Wie an den entsprechenden Perzentilen zu erkennen ist, weist das Fähigkeitsselbstkonzept zu allen Messzeit-
punkten eine rechtssteile Verteilung auf. Zudem zeigt sich deskriptiv der häufig beschriebene Befund, dass das mathematische Fähigkeitsselbstkonzept im Laufe der Grundschulzeit abnimmt. An der Verteilung der Residualscores des Fähigkeitsselbstkonzepts sieht man, dass Über- und Unterschätzungen der eigenen mathematischen Fähigkeiten zu allen Messzeitpunkten festzustellen sind, es zu jedem Messzeitpunkt aber auch einen erheblichen Anteil an Schüler/innen gibt, die ihre Fähigkeiten korrekt einschätzen.
Stabilität der Selbstunter- vs. -überschätzungen über die Zeit Korreliert man die Residualscores der fünf untersuchten Messzeitpunkte, finden sich nach den Cohen’schen Konventionen (Cohen, 1992) niedrige bis mittlere Korrelationen (siehe Tabelle 2; siehe auch die autoregressiven Pfade in Tabelle 3). Das Ausmaß an Selbstunter- bzw. -überschätzungen ist demnach gering bis mäßig stabil über die Grundschulzeit (siehe Fragestellung 1).
Auswirkungen von Selbstüber- bzw. -unterschätzungen auf die Leistungsentwicklung Die Auswirkungen von Selbstüber- bzw. -unterschätzungen auf die mathematische Leistungsentwicklung über die Grundschulzeit (Fragestellung 2) wurden mittels Cross-Lagged-Panel-Analysen überprüft. In einem ersten Schritt wurden für die Autoregressionen der mathematischen Leistung bzw. der Residualscores nur benachbarte Messzeitpunkte (Autoregression erster Ordnung) einbezogen. Da dies zu keinem zufriedenstellenden Modellfit (w2 = 148.78, df = 25, p < .001; CFI = 0.94; RMSEA = .07; SRMR = .06) führte, wurden in einem nächsten Schritt auch die jeweils vorangehenden Messzeitpunkte in das Modell integriert (Autoregression zweiter Ordnung, siehe auch Abbildung 1). Dieses Modell passt signifikant besser zu den Daten und verfügt über einen sehr guten Modellfit (w2 = 26.61, df = 19, p = .11; CFI = 1.00; RMSEA = .02; SRMR = .02). Es zeigt sich, dass alle kreuzverzögerten Pfade der Mathematikleistung auf die Residualscores zum darauffolgenden Messzeitpunkt signifikant werden (.10 ≤ b ≤ .27), Effekte der Residualscores des Selbstkonzepts auf die folgende Mathematikleistung hingegen nur für den ersten und zweiten Messzeitpunkt festzustellen sind (.06 ≤ b ≤ .10; siehe Tabelle 3).
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26
© 2016 Hogrefe Verlag
A.-K. Praetorius et al., Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn?
21
Tabelle 1. Deskriptive Statistiken der verwendeten Maße Perzentile M
SD
0
25
50
75
100
Anfang Klasse 1 (t1)
2.44
Ende Klasse 1 (t2)
2.38
0.47
1.00
2.17
2.50
2.83
3.00
0.44
1.00
2.00
2.33
2.67
Ende Klasse 2 (t3)
3.00
2.33
0.48
1.00
2.00
2.33
2.67
3.00
Ende Klasse 3 (t4)
2.24
0.47
1.00
2.00
2.17
2.67
3.00
Ende Klasse 4 (t5)
2.23
0.48
1.00
2.00
2.17
2.67
3.00
Anfang Klasse 1 (t1)
-4.89
2.16
-10.30
-6.22
-5.08
-3.77
1.36
Ende Klasse 1 (t2)
-1.16
1.82
-7.02
-2.39
-1.31
-0.08
3.98
Ende Klasse 2 (t3)
0.72
1.81
-3.96
-0.34
0.80
1.81
6.41
Ende Klasse 3 (t4)
3.44
1.34
-1.40
2.74
3.52
4.38
7.48
Ende Klasse 4 (t5)
4.53
1.18
-0.61
3.84
4.69
5.15
9.12
Anfang Klasse 1 (t1)
0.00
1.00
-3.00
-0.68
0.07
0.78
1.87
Ende Klasse 1 (t2)
0.00
1.00
-3.49
-0.65
0.02
0.69
2.32
Ende Klasse 2 (t3)
0.00
1.00
-3.78
-0.62
0.03
0.66
2.96
Ende Klasse 3 (t4)
0.00
1.00
-3.16
-0.68
-0.04
0.73
2.71
Ende Klasse 4 (t5)
0.00
1.00
-2.85
-0.65
-0.00
0.72
2.41
Mathem. Selbstkonzept
Mathematikleistung
Residualscore
Tabelle 2. Korrelationen der Residualscores über alle Messzeitpunkte t1
t2
t3
t2
.26**
t3
.16**
.35***
t4
.26**
.25***
.44***
t5
.16**
.14**
.37***
.47***
Anmerkungen: *** p ≤ .001; ** p ≤ .01.
Positive Auswirkungen moderater Selbstüberschätzungen? Um überprüfen zu können, ob lediglich bestimmte Ausprägungen von Optimismus (z. B. moderat optimistische Selbsteinschätzungen) positive Auswirkungen auf die Leistungsentwicklung aufweisen (Fragestellung 3), wurde jeweils zusätzlich zu dem linearen Effekt ein quadratischer Term der Residualscores auf die darauffolgende Leistung in das Modell mit aufgenommen. Auch dieses Modell weist einen guten Fit auf (w2 = 103.29, df = 44, p = < .001; CFI = .97; RMSEA = .04; SRMR = .04). Der Effekt der quadrierten Residualscores wird jedoch zu keinem der Messzeitpunkte signifikant (bt12 = -.01, p = .82; bt23 = .02, p = .59; bt34 = .02, p = .56; bt45 = .01, p = .79). © 2016 Hogrefe Verlag
Diskussion
t4
Optimistische Fähigkeitsselbstkonzepte werden in vielen Publikationen – und dies insbesondere für den Grundschulbereich – als wünschenswert dargestellt (z. B. Chapman & Tunmer, 1997; Helmke, 1998; O’Mara et al., 2006). Empirische Untersuchungen, die für die gesamte Grundschulzeit überprüfen, in welchem Ausmaß Grundschulkinder optimistische Fähigkeitsselbstkonzepte aufweisen, wie stabil diese Selbsteinschätzungen sind und wie sie sich auf nachfolgende Leistungen auswirken, existierten bislang jedoch nicht. Dies war daher Gegenstand der vorliegenden Studie.
Stabilität von Selbstüberschätzungen? Die vorliegenden Analysen zeigen, dass Schüler/-innen, die zu einem Messzeitpunkt optimistische Selbsteinschätzungen aufwiesen, dies nicht unbedingt auch zu einem anderen Messzeitpunkt taten. Betrachtet man die Zusammenhänge zwischen den Residualscores über die Zeit (siehe auch Tabelle 2 und 3), kann allerdings vermutet werden, dass die Stabilität der Selbstüber- bzw. -unterschätzungen im Laufe der Grundschulzeit zunimmt. Vertiefende Analysen zur Entwicklung von Selbstüber- bzw.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26
22
A.-K. Praetorius et al., Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn?
Abbildung 1. Cross-Lagged-Panel-Modell für fünf Messzeitpunkte.
Tabelle 3. Standardisierte Regressionskoeffizienten bei der Vorhersage der mathematischen Leistung und des Residualscores durch die zeitlich vorgeordneten Messungen derselben Variablen AVs zu Messzeitpunkt (t) AV
Leistung
Residualscore SK
Effekt
2
3
4
5
AR1 Leistung (t-1) → Leistung (t)
.71***
.57***
.44***
.44***
AR2 Leistung (t-2) → Leistung (t)
–
.24***
.32***
.30*** .06 n.s.
Residualscore (t-1) → Leistung (t)
.10**
.06*
.04 n.s.
AR1 Residualscore (t-1) → Residualscore (t)
.26***
.35***
.42***
.40***
AR2 Residualscore (t-2) → Residualscore (t)
–
.07 n.s.
.11*
.18***
.14**
.27***
.27***
Leistung (t-1) → Residualscore (t)
.10*
Anmerkungen: AV = abhängige Variable; AR1 = Autoregression 1. Ordnung (z. B. t2 → t1); AR2 = Autoregression 2. Ordnung (z. B. t3 → t1); *** p ≤ .001; ** p ≤ .01; * p ≤ .05; n.s. p > .05.
-unterschätzungen über die Zeit wären daher sehr aufschlussreich. Folgt man den Annahmen von Helmke (1998), so könnte man vermuten, dass Schüler/-innen mit anfänglichen Selbstüberschätzungen über die Zeit realistischere Selbsteinschätzungen aufweisen. Bouffard und Kollegen (2011) konnten in ihrer Längsschnittstudie jedoch keine Entwicklung „Vom Optimisten zum Realisten“ feststellen; allerdings untersuchten sie lediglich Schüler/innen ab der dritten Jahrgangsstufe. Empirische Überprüfungen über die gesamte Grundschulzeit stehen bislang aus. Dies liegt sicherlich unter anderem daran, dass die aktuell übliche Erfassung von Selbstkonzepten eine entsprechende Überprüfung nur sehr begrenzt ermöglicht (siehe hierzu auch den Abschnitt „Limitationen und Ausblick“).
Sind optimistische Fähigkeitsselbstkonzepte mit positiven Folgen verbunden? Die Analysen zu den Auswirkungen von optimistischen Selbsteinschätzungen zeigen, dass sich lediglich für die Residualscores Anfang und Ende Klasse 1 ein Effekt auf die jeweils darauffolgenden Leistungen fand. Was sich hingegen konsistent über alle Messzeitpunkte nachweisen ließ, war ein Effekt der mathematischen Leistungen auf die darauffolgenden Residualscores des Selbstkonzepts; dieser Effekt wird im Laufe der Grundschulzeit zudem stärker. Verschätzungen in Bezug auf die eigenen Fähigkeiten scheinen demnach nur zu Beginn der Grundschulzeit einen Effekt auf die darauffolgenden Leistungen aufzuweisen, während in der restlichen Grundschulzeit vielmehr die Leistungen beeinflussen, in welchem Ausmaß Schüler/-innen sich zum darauffolgenden Messzeitpunkt
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26
© 2016 Hogrefe Verlag
A.-K. Praetorius et al., Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn?
über- oder unterschätzen. Diese Befunde erinnern an die klassischen Befunde der Selbstkonzeptforschung (z. B. Helmke, 1991), denen zufolge Selbstkonzepte vor allem in Übergangsphasen Effekte auf Leistungen aufweisen (self enhancement), während in Konsolidierungsphasen eher die Leistungen einen Effekt auf die Selbstkonzepte zeigen (skill development). Die Aussage Helmkes (1998), dass optimistische Selbsteinschätzungen wie ein Zusatzmotor wirken, scheint demnach nur für einen geringen Teil der Grundschulzeit zuzutreffen. Dass sich in diesen ersten Monaten der Schulzeit ein solcher Effekt zeigt, könnte daran liegen, dass der Glaube in die eigenen Fähigkeiten dazu führt, dass Schüler/-innen eine höhere Ausdauer bei der Bearbeitung von Aufgaben zeigen und/ oder eine stärkere Partizipation am Unterricht aufweisen und sich dadurch besonders positiv entwickeln. Bereits nach dem ersten Schuljahr jedoch scheint der Glaube in die eigenen Fähigkeiten weniger verursachende Variable als vielmehr eine Folge bzw. Begleiterscheinung der eigenen Leistungen zu werden. In der vorliegenden Studie zeigte sich zudem kein Effekt des quadratischen Residualscore-Terms. Auch die Annahme Helmkes (1998), dass sich vor allem moderate Selbstüberschätzungen positiv auswirken sollten, lässt sich demnach auf Basis der Längsschnittdaten nicht bestätigen. Ein möglicher Grund für die Änderung der Wirkrichtung von Selbstverschätzungen und Leistungen ist die im Unterricht oftmals vorherrschende soziale Bezugsnormorientierung von Lehrkräften (Rheinberg & Krug, 1999). Schüler/-innen mit guten Leistungen erhalten dadurch im Vergleich zu ihren Klassenkameraden regelmäßig positives Feedback, während Schüler/-innen mit niedrigen Leistungen negatives Feedback erhalten. Die Differenzierung zwischen exzellenten und sehr guten Leistungen bzw. extrem niedrigen und eher niedrigen Leistungen wird vielen Schüler/-innen aufgrund des klasseninternen Leistungsvergleichs eher schwer fallen. Dies wiederum kann dazu führen, dass Schüler/-innen mit guten Leistungen diese im Vergleich zu einem kriterialen Maßstab überschätzen, während Schüler/-innen mit niedrigen Leistungen diese eher unterschätzen. Da die vorliegenden Daten eine Überprüfung der vermuteten Mechanismen nicht erlauben, sollte dies in zukünftigen Studien thematisiert werden. Dabei wären zudem ergänzende längsschnittliche Analysen im motivational-emotionalen Bereich aufschlussreich (siehe für diese Forderung z. B. auch Gonida & Leondari, 2011), um zu überprüfen, ob sich hier ein analoges Befundmuster zeigt. Interessant wären in diesem Zusammenhang auch weiterführende Analysen dazu, wie es kommt, dass sich Schüler/-innen zu Schulbeginn über- oder aber unterschätzen. Da Eltern vor Schuleintritt die zentrale Quelle fähigkeitsbezogener Informationen darstellen, liegt es © 2016 Hogrefe Verlag
23
nahe, das elterliche Verhalten in Bezug auf die Frage nach der Ausbildung von Über- oder Unterschätzungen der eigenen Fähigkeiten näher in den Blick zu nehmen.
Pädagogische Implikationen Die Befunde der vorliegenden Studie geben einen ersten Hinweis dahingehend, dass eine Überschätzung der eigenen Leistungen bei Grundschulkindern zu Beginn der Schulzeit nicht besorgniserregend, sondern sogar funktional ist, während dies für den verbleibenden Zeitraum der Grundschule eine untergeordnete Rolle zu spielen scheint. Handlungsbedarf scheint es daher eher in Bezug auf Unterschätzungen der eigenen Leistungen zu Beginn der Grundschulzeit zu geben, da sich dies negativ auf die Leistungen auswirkt (vgl. den Effekt des Residualscores auf die Leistungen: je niedriger der Residualscorewert, desto niedriger die Leistung zum darauffolgenden Messzeitpunkt). Allerdings lassen die bislang ungeklärten Mechanismen, die hinter der gegenseitigen Beeinflussung von Verschätzungen in Bezug auf die eigenen Leistungen und die tatsächlichen Leistungen stehen, Schlussfolgerungen in Bezug auf unterrichtspraktische Konsequenzen der Befunde nur in sehr begrenztem Ausmaß zu. Dies gilt umso mehr, da es sich bei den untersuchten Schülern/innen um eine sozial selektive Stichprobe handelt, bei der Schüler/-innen mit mittlerem bis hohem sozioökonomischen Status überrepräsentiert sind.
Limitationen und Ausblick Eine erste Limitation der Befunde ergibt sich aus dem analysierten Gegenstand: Betrachtet wurde die mathematische Leistungsentwicklung von Grundschulkindern. Aussagen über andere Fächer sowie andere Bereiche (z. B. zur Entwicklung motivationaler Merkmale) können daher nicht getroffen werden. Von zentraler Bedeutung für die vorliegende Untersuchung ist die Bestimmung von Selbstüber- bzw. -unterschätzungen. Auf zwei kritische diesbezügliche Aspekte soll im Folgenden eingegangen werden. Zunächst einmal setzt ein Abgleich von Leistungen und Selbstkonzepten voraus, dass beide Variablen so operationalisiert werden, dass sie sinnvoll zueinander in Beziehung gesetzt werden können. Die Erfassung von Selbstkonzepten im Rahmen der vorliegenden Untersuchung muss für den Zweck eines Abgleichs zwischen Leistungen und Selbstkonzept kritisch hinterfragt werden: Damit ein solcher Abgleich in eindeutiger Art und Weise möglich ist, muss das Selbstkonzept mit einem klaren Bezugsrahmen (z. B. sozialer Bezugsrahmen innerhalb der Klasse oder direkter Bezug
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26
24
A.-K. Praetorius et al., Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn?
zu den Aufgaben des Leistungstests) erhoben worden sein, da absolut erfasste Selbstkonzepte auf Basis unterschiedlicher Vergleiche und Bezüge gebildet werden und demnach nicht unmittelbar mit der entsprechenden Leistung in Beziehung stehen müssen (siehe auch Möller & Trautwein, 2009). Soziale und absolute Selbstkonzepte weisen jedoch zum Teil hohe Zusammenhänge auf (siehe z. B. Sparfeldt, Schilling, Rost & Müller, 2003). In der vorliegenden Untersuchung korrelieren die Residuen der Regressionen von sozialen3 vs. absoluten Selbstkonzepten auf Leistungen in der vierten Jahrgangsstufe zu r = .65, sodass vermutet werden kann, dass der vorgenommene Leistungsabgleich hinreichend aussagekräftig ist.4 Nichtsdestotrotz sollte in zukünftigen Studien ein eindeutiger Abgleich zwischen Selbstkonzepten und Leistungen anvisiert werden. Dazu bieten sich unter anderem Ansätze aus der Metakognitionsforschung an (siehe z. B. Schraw, Kuch & Gutierrez, 2013), in denen Personen aufgabenspezifisch einschätzen, ob sie die entsprechende Aufgabe lösen können oder nicht. Über die Erfassung des Selbstkonzepts hinaus ist auch die Erfassung der Leistungen zentral für die vorliegende Fragestellung. So ist es beispielsweise kritisch zu sehen, dass in einigen Studien Lehrereinschätzungen (u. a. auch in Form von Noten) als Schülerleistungen operationalisiert wurden (z. B. Gresham et al., 2000; Helmke, 1998; Stipek, 1981). Diese Einschätzungen stellen kein objektives Maß dar und sind daher als Leistungsmaß für einen Abgleich mit Selbsteinschätzungen nur sehr eingeschränkt nutzbar (siehe auch Dupeyrat et al. 2011). In der vorliegenden Untersuchung wurden daher standardisierte Schülerleistungstests verwendet. Allerdings kann auch dieses Maß kritisiert werden: „In the absence of a perfect criterion for reality, we can never know whether self-enhancers simply have more knowledge about reality than is captured by our criteria” (Robins & Beer, 2001, S. 348). Auch der Abgleich zwischen Selbstkonzepten und Leistung kann kritisch in den Blick genommen werden. In der vorliegenden Studie wurden Residualscores gebildet. Die Verwendung von Residualscores ist allerdings, ebenso wie die Verwendung anderer Abgleichmöglichkeiten (u. a. Differenzvariablen, ANCOVA), mit diversen Nachteilen verbunden (siehe z. B. Kisbu-Sakarya, MacKinnon & Aiken, 2013). Ein zentraler Nachteil von Residualscores ist, dass Optimisten über die Abweichungen der Individuen von der Regressionsgeraden der Gesamtstichprobe bestimmt wurden und somit eine rein statistische Gruppierung darstellen. Die Charakterisierung als Optimist ist 3
4
somit immer auch von der einbezogenen Stichprobe abhängig. Zudem wurden die Residualscores aus zeitgleich erhobenen Werten des mathematischen Selbstkonzepts und der mathematischen Leistung gebildet. Es kann jedoch kritisch hinterfragt werden, ob ein solcher Abgleich sinnvoll ist, da Selbsteinschätzungen sich vermutlich in hohem Ausmaß auch auf vorangegangene Leistungen beziehen. Ein weiterer Kritikpunkt bezieht sich auf die Operationalisierung von Optimismus. In der pädagogisch-psychologischen Forschungsliteratur wird Optimismus in der Regel über die Relation von Selbstkonzept und Leistung definiert. In der Optimismusforschung wird Optimismus hingegen als positives Denken sowie eine positive Einstellungen gegenüber der Zukunft verstanden (Pajares, 2001; Renner & Weber, 2005). Beide Operationalisierungen erfassen unterschiedliche Konstrukte: So weisen beispielsweise in der vorliegenden Untersuchung die Residualscores und eine entsprechende Optimismusskala (Beispielitem: „Ich glaube normalerweise, dass die Dinge gut ausgehen“) in den Jahrgangsstufen 3 und 4 lediglich geringe Korrelationen auf (jeweils r = .19, p < .001). In Bezug auf zukünftige Untersuchungen erscheint es daher von zentraler Bedeutung, das Verständnis von auf den ersten Blick so intuitiv verständlichen Begriffen wie „optimistisches Selbstkonzept“ dezidiert zu durchdenken und entsprechend zu operationalisieren. Eine mögliche Denkrichtung hierfür sind beispielsweise Ansätze aus der Sozialpsychologie, in denen zwischen Wunschvorstellungen über die Zukunft und positiven Erwartungen – bei denen ein Abgleich zwischen Wunsch und Realität vorgenommen wird – unterschieden wird (siehe Oettingen & Mayer, 2002; Oettingen, 2012). Während sich Wunschvorstellungen für zukünftige Leistungen eher schädlich auswirken, können Erwartungen positive Auswirkungen haben.
Literatur Arens, A. K., Yeung, A. S., Craven, R. G. & Hasselhorn, M. (2011). The twofold multidimensionality of academic self-concept: domain specificity and separation between competence and affect components. Journal of Educational Psychology, 103, 970 – 981. doi: 10.1037/a0025047 Asparouhov, T. & Muthén, B. (2005). Multivariate statistical modeling with survey data. Proceedings of the Federal Committee on Statistical Methodology (FCSM) Research Conference. Retrieved January 10, 2015 from http://statmodel2.com/down load/AsparouhovMuthen_MultivariateModeling3.pdf
Das soziale Selbstkonzept wurde mittels des SESSKO (siehe Schöne, Dickhäuser, Spinath & Stiensmeier-Pelster, 2002) erfasst. Die Itemformulierungen der Skala beinhalten einen direkten Bezug zu den Klassenkameraden der befragten Schüler/-innen. Das soziale Selbstkonzept wurde in den ersten beiden Schuljahren nicht erhoben, so dass es nicht zur Bestimmung der Residuen verwendet werden konnte.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26
© 2016 Hogrefe Verlag
A.-K. Praetorius et al., Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn?
Blanton, H., Buunk, B., Gibbons, F. X. & Kuyper, H. (1999). When better-than-others compare upward: Choice of comparison and comparative-evaluation as independent predictors of academic performance. Journal of Personality and Social Psychology, 76, 420 – 430. Bouffard, T., Boisvert, M. & Vezeau, C. (2003). Illusion of incompetence and school functioning among elementary school children. Learning and Individual Differences, 14, 31 – 46. Bouffard, T., Markovits, H., Vezeau, C., Boisvert, M. & Dumas, C. (1998). The relation between accuracy of self-perception and cognitive development. British Journal of Educational Psychology, 68, 321 – 330. doi: 10.1111/j.2044-8279.1998.tb01294.x Bouffard, T. & Narciss, S. (2011). Benefits of positive biases in self-evaluation of academic competence: Introduction. International Journal of Educational Research, 50, 205 – 208. doi: 10.1016/j.ijer.2011.08.001 Bouffard, T., Vezeau, C., Roy, M. & Lengelé, A. (2011). Stability of biases in self-evaluation and relations to well-being among elementary school children. International Journal of Educational Research, 50, 221 – 229. doi: 10.1016/j.ijer.2011.08.003 Butler, R. (2011). Are positive illusions about academic competence always adaptive under all circumstances: New results and future directions. International Journal of Educational Research, 50, 251 – 256. doi: 10.1016/j.ijer.2011.08.006 Chapman, J. W. & Tunmer, W. E. (1995). Development of young children’s reading self-concepts: An examination of emerging subcomponents and their relationship with reading achievement. Journal of Educational Psychology, 87, 154 – 167. Chapman, J. W. & Tunmer, W. E. (1997). A longitudinal study of beginning reading achievement and reading self-concept. British Journal of Educational Psychology, 67, 279 – 291. Chapman, J. W., Tunmer, W. E. & Prochnow, J. E. (2000). Early reading-related skills and performance, reading self-concept, and the development of academic self-concept: A longitudinal study. Journal of Educational Psychology, 92, 703 – 708. Chiu, M. M. & Klassen, R. M. (2010). Relations of mathematics self-concept and its calibration with mathematics achievement: Cultural differences among fifteen-year-olds in 34 countries. Learning and Instruction, 20, 2 – 17. doi: 10.1016/j.learninstruc.2008.11.002 Cohen, J. (1992). A power primer. Psychological Bulletin, 112, 155 – 159. Cole, D. A., Martin, J. M., Lachlan, A. P., Seroczynski, A. D. & Fier, J. (1999). Children’s over- and underestimation of academic competence: a longitudinal study of gender differences, depression, and anxiety. Child Development, 70, 459 – 473. Dickhäuser, O. (2006). Fähigkeitsselbstkonzepte: Entstehung, Auswirkung, Förderung. Zeitschrift für Pädagogische Psychologie, 20, 5 – 8. Dickhäuser, O. & Galfe, E. (2004). Besser als …, schlechter als … . Leistungsbezogene Vergleichsprozesse in der Grundschule. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 36, 1 – 9. Dickhäuser, O., Schöne, C., Spinath, B. & Siensmeier-Pelster, J. (2002). Die Skalen zum akademischen Selbstkonzept. Konstruktion und Überprüfung eines neuen Instruments. Zeitschrift für Differentielle und Diagnostische Psychologie, 23, 393 – 405. Dresel, M., Fasching, M., Steuer, G. & Berner, V. (2010). The role and the interplay of classroom goal structures, individual motivation and general intelligence for (excellent) school achievement in elementary school classrooms. Talent Development and Excellence, 1, 63 – 81. Dunlosky, J., Hertzog, C., Kennedy, M. & Thiede, K. (2005). The selfmonitoring approach for effective learning. Cognitive Technology, 10, 4 – 11. © 2016 Hogrefe Verlag
25
Dupeyrat, C., Escribe, C., Huet, N. & Régner, I. (2011). Positive biases in self-assessment of mathematics competence, achievement goals, and mathematics performance. International Journal of Educational Research, 50, 241 – 250. doi: 10.1016/j. ijer.2011.08.005 Eckert, C., Schilling, D. & Stiensmeier-Pelster, J. (2006). Einfluss des Fähigkeitsselbstkonzepts auf die Intelligenz- und Konzentrationsleistung. Zeitschrift für pädagogische Psychologie, 20, 41 – 48. Einsiedler, W., Martschinke, S. & Kammermeyer, G. (2007). Die Grundschule zwischen Heterogenität und gemeinsamer Bildung. Berichte und Arbeiten aus dem Institut für Grundschulforschung Nr. 105. Universität Erlangen-Nürnberg. Gonida, E. N. & Leondari, A. (2011). Patterns of motivation among adolescents with biased and accurate self-efficacy beliefs. International Journal of Educational Research, 50, 209 – 220. doi: 10.1016/j.ijer.2011.08.002 Gresham, F. M., Lane, K. L., MacMillan, D. L., Bocian, K. M. & Ward, S. L. (2000). Effects of positive and negative illusory biases: Comparisons across social and academic self-concept domains. Journal of School Psychology, 38, 151 – 175. Guay, F., Marsh, H. W. & Boivin, M. (2003). Academic self-concept and academic achievement: Developmental perspectives on their causal ordering. Journal of Educational Psychology, 95, 124 – 136. Hartig, J. & Kühnbach, O. (2006). Schätzung von Veränderung mit Plausible Values in mehrdimensionalen Rasch-Modellen. In A. Ittel & H. Merkens (Hrsg.), Veränderungsmessung und Längsschnittstudien in der Erziehungswissenschaft (S. 27 – 44). Wiesbaden: VS. Helmke, A. (1991). Entwicklung des Fähigkeitsselbstbildes vom Kindergarten bis zur dritten Klasse. In R. Pekrun & H. Fend (Hrsg.), Schule und Persönlichkeitsentwicklung. Ein Resümee der Längsschnittforschung (S. 83 – 99). Stuttgart: Ferdinand Enke. Helmke, A. (1998). Vom Optimisten zum Realisten? Zur Entwicklung des Fähigkeitsselbstkonzeptes vom Kindergarten bis zur 6. Klassenstufe. In F. E. Weinert (Hrsg.), Entwicklung im Kindesalter (S. 115 – 132). Weinheim: Beltz. Huang, C. (2011). Self-concept and academic achievement: a meta-analysis of longitudinal relations. Journal of School Psychology, 49, 505 – 528. doi: 10.1016/j.jsp.2011.07.001 Jacobs, J. E., Lanza, S., Osgood, D. W., Eccles, J. S. & Wigfield, A. (2002). Changes in children’s self-competence and values: Gender and domain differences across grades one through twelve. Child Development, 73, 509 – 527. Kammermeyer, G. & Martschinke, S. (2006). Selbstkonzept- und Leistungsentwicklung in der Grundschule: Ergebnisse aus der KILIA-Studie. Empirische Pädagogik, 20, 245 – 259. Kaufmann, L., Nuerk, H.-C., Graf, M., Krinzinger, H., Delazer, M. & Willmes, K. (2009). TEDI-MATH: Test zur Erfassung numerischrechnerischer Fertigkeiten vom Kindergarten bis zur 3. Klasse. Zürich: Hans Huber. Kisbu-Sakarya, Y., MacKinnon, D. P. & Aiken, L. S. (2013). A Monte Carlo comparison study of the power of the analysis of covariance, simple difference, and residual change scores in testing two-wave data. Educational and Psychological Measurement, 73, 47 – 62. doi: 10.1177/0013164412450574 Krajewski, K., Küspert, P. & Schneider, W. (2002). Deutscher Mathematiktest für erste Klassen (DEMAT 1+). Göttingen: Hogrefe. Lipowsky, F., Faust, G. & Kastens, C. (Hrsg.). (2013). Persönlichkeits- und Lernentwicklung an staatlichen und privaten Grundschulen. Ergebnisse der PERLE-Studie zu den ersten beiden Schuljahren. Münster: Waxmann. Lüdtke, O. & Köller, O. (2002). Individuelle Bezugsnormorientierung und soziale Vergleiche im Mathematikunterricht. Zeitschrift für
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26
26
A.-K. Praetorius et al., Haben Schüler mit optimistischen Selbsteinschätzungen die Nase vorn?
Entwicklungspsychologie und Pädagogische Psychologie, 34, 156 – 166. Maaz, K. & Nagy, G. (2010). Der Übergang von der Grundschule in die weiterführenden Schulen des Sekundarschulsystems: Definition, Spezifikation und Quantifizierung primärer und sekundärer Herkunftseffekte. In K. Maaz, J. Baumert, C. Gresch & N. McElvany (Hrsg.), Der Übergang von der Grundschule in die weiterführende Schule – Leistungsgerechtigkeit und regionale, soziale und ethnisch-kulturelle Disparitäten. Berlin: BMBF. Magnusson, D. (1998). The logic and implications of a person approach. In R. B. Cairns, L. R. Bergman & J. Kagan (Eds.), Methods and models for studying the individual (S. 3 – 62). Newbury Park, CA: Sage. Marsh, H. W. (1990). Causal ordering of academic self-concept and academic achievement: a multiwave, longitudinal panel analysis. Journal of Educational Psychology, 82, 646 – 656. Meredith, W. (1993). Measurement invariance, factor analysis, and factorial invariance. Psychometrika, 58, 525 – 542. Möller, J. & Trautwein, U. (2009). Selbstkonzept. In E. Wild & J. Möller (Hrsg.). Pädagogische Psychologie (S. 179 – 204). Berlin: Springer. Möller, J., Pohlmann, B., Köller, O. & Marsh, H. W. (2009). A metaanalytic path analysis of the internal/external frame of reference model of academic achievement and academic self-concept. Review of Educational Research, 79, 1129 – 1167. Moser, U., Berweger, S. & Lüchinger-Hutter, L. (2004). LEst 4 – 7: Lern- und Entwicklungsstand bei 4- bis 7-Jährigen. Unveröffentlichtes Testinstrument. Zürich: Kompetenzzentrum für Bildungsevaluation und Leistungsmessung an der Universität Zürich. Muthén, L. K. & Muthén, B. O. (1998 – 2012). Mplus user’s guide (7th ed.). Los Angeles, CA: Muthén & Muthén. Nicholls, J. (1978). The development of the concepts of effort and ability, perception of academic attainment, and the understanding that difficult tasks require more ability. Child Development, 49, 800 – 814. Niemivirta, M. (2002). Individual differences and developmental trends in motivation: Integrating person-centered and variablecentered methods. In P. R. Pintrich & M. L. Maehr (Eds.), Advances in Motivation and Achievement (Vol. 12, S. 241 – 275). Amsterdam: JAI Press. Oettingen, G. (2012). Future thought and behaviour change. European Review of Social Psychology, 23, 1 – 63. doi: 10.1080/ 10463283.2011.643698 Oettingen, G. & Mayer, D. (2002). The motivating function of thinking about the future: expectations versus fantasies. Journal of Personality and Social Psychology, 83, 1198 – 1212. doi: 10.1037//0022-3514.83.5.1198 O’Mara, A., Marsh, H. W., Craven, R. G. & Debus, R. L. (2006). Do self-concept interventions make a difference? A synergistic blend of construct validation and meta-analysis. Educational Psychologist, 41, 181 – 206. doi: 10.1207/s15326985ep4103_4 Pajares, F. (2001). Toward a positive psychology of academic motivation. The Journal of Educational Research, 95, 27 – 35. Paulhus, D. L. & John, O. P. (1998). Egoistic and moralistic bias in self-perception: The interplay of self-deceptive styles with basic traits and motives. Journal of Personality, 66, 1025 – 1060. Poloczek, S., Karst, K., Praetorius, A.-K. & Lipowsky, F. (2011). Generalisten oder Spezialisten? Bereichsspezifität und leistungsbezogene Zusammenhänge des schulischen Selbstkonzepts von Schulanfängern. Zeitschrift für Pädagogische Psychologie, 25, 173 – 183. Renner, B. & Weber, H. (2005). Optimismus. In H. Weber & T. Rammsayer (Hrsg.), Handbuch der Persönlichkeitspsychologie und Differentiellen Psychologie (S. 446 – 453). Göttingen: Hogrefe. Rheinberg, F. & Krug, S. (1999). Motivationsförderung im Schulalltag (2. Aufl.). Göttingen: Hogrefe.
Robins, R. W. & Beer, J. S. (2001). Positive illusions about the self: Short-term benefits and longterm costs. Journal of Personality and Social Psychology, 80, 340 – 352. Robins, R. W. & John, O. P. (1997). The quest for self-insight: Theory and research on the accuracy of self-perception. In H. Hogan, J. Johnson & S. Briggs (Eds.), Handbook of personality psychology (pp. 649 – 679). New York: Academic Press. Ruble, D. N. (1983). The development of social-comparison processes and their role in achievement-related self-socialization. In E. T. Higgins, D. N. Ruble & W. W. Hartup (Eds.), Social cognition and social development: A sociocultural perspective (S. 134 – 157). Cambridge, MS: Cambridge University Press. Ruble, D. N., Grosouvsky, E. H., Frey, K. S. & Cohen, R. (1992). Developmental changes in competence assessment. In A. K. Boggiano & T. S. Pittman (Eds.), Achievement and motivation: A social-developmental perspective (S. 138 – 164). Cambridge University Press: New York. Schmiedek, F., & Lindenberger, U. (2007). Methodologische Grundlagen. In J. Brandtstädter & U. Lindenberger (Eds.), Entwicklungspsychologie der Lebensspanne: Ein Lehrbuch (S. 67 – 96). Stuttgart: Kohlhammer. Schöne, C., Dickhäuser, O., Spinath, B. & Stiensmeier-Pelster, J. (2002). Skalen zur Erfassung des schulischen Selbstkonzepts (SESSKO). Manual. Göttingen: Hogrefe. Schrader, F.-W., Helmke, A. & Hosenfeld, I. (2008). Stichwort: Kompetenzentwicklung im Grundschulalter. Zeitschrift für Erziehungswissenschaft, 11, 7 – 29. Schraw, G., Kuch, F. & Gutierrez, A. P. (2013). Measure for measure: Calibrating ten commonly used calibration scores. Learning and Instruction, 24, 48 – 57. doi: 10.1016/j.learninstruc.2012.08.007 Sparfeldt, J. R., Schilling, S. R., Rost, D. H. & Müller, C. (2003). Bezugsnormorientierte Selbstkonzepte? – Zur Eignung der SESSKO. Zeitschrift für Differentielle und Diagnostische Psychologie, 24, 325 – 335. Stipek, D. J. (1981). Children’s perceptions of their own and their classmates’ ability. Journal of Educational Psychology, 73, 404 – 410. Valentine, J. C., DuBois, D. L. & Cooper, H. (2004). The relation between self-beliefs and academic achievement: a meta-analytic review. Educational Psychologist, 39, 111 – 133. Wilson, M. (2005). Constructing measures: an item response modeling approach. Mahwah, NJ: Lawrence Erlbaum Associates.
Dr. Anna-Katharina Praetorius Prof. Dr. Johannes Hartig Deutsches Institut für Internationale Pädagogische Forschung (DIPF) Schloßstr. 29 60486 Frankfurt am Main praetorius@dipf.de hartig@dipf.de Prof. Dr. Claudia Kastens Institut für Bildungsforschung in der School of Education der Bergischen Universität Wuppertal Grundschulforschung Gaußstraße 20 42119 Wuppertal Prof. Dr. Frank Lipowsky Universität Kassel Fachgebiet Empirische Schul- und Unterrichtsforschung Nora-Platiel-Straße 1 34109 Kassel
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 14–26
© 2016 Hogrefe Verlag
Birgit Spinath / Roland Brünken
Pädagogische Psychologie – Diagnostik, Evaluation und Beratung
rbu leh ch
s plu
psych
Birgit Spinath Roland Brünken
hogrefe.de
Pädagogische Psychologie – Diagnostik, Evaluation und Beratung
Bachelorstudium Psychologie
(Reihe: „Bachelorstudium Psychologie“, Band 22). 2016, 330 Seiten, € 29,95 / CHF 39.90 ISBN 978-3-8017-2222-7 Das Lehrbuch behandelt zentrale Anwendungsfelder der Pädagogischen Psychologie. Einleitend werden Grundlagen und Methoden behandelt, wie Skalenniveaus und verschiedene Arten von Bezugsnormen. Die weiteren Kapitel betrachten typische Anwendungsfelder individueller Diagnostik, wie Hochbegabung, Lese-Rechtschreibschwäche und ADHS. Neben Begriffs-
bestimmungen und theoretischen Konzepten werden jeweils Möglichkeiten des diagnostischen Vorgehens und der Förderung beschrieben. Weitere Fragestellungen im Bereich der psychologisch-pädagogischen Diagnostik betreffen Entscheidungen entlang der Schullaufbahn, die in den anschließenden Kapiteln thematisiert werden. Dazu gehören Fragen zu Schuleintritt und beim Grundschulübergang, die Diagnose spezifischer Förderbedarfe, aber auch der schulischen Leistungsbeurteilung. Als Beispiele pädagogisch-psychologischer Systemdiagnostik werden Evaluationen in Schule und Hochschule sowie deren Folgen behandelt. Den Abschluss bildet ein Überblick über pädagogische-psychologische Handlungsfelder, bei denen Diagnostik, Evaluation und Beratung zentrale Rollen einnehmen.
www.hogrefe.de
Gustav Keller
Gustav Keller
Professionelle Kommunikation im Schulalltag Praxishilfen für Lehrkräfte
Professionelle Kommunikation im Schulalltag Praxishilfen für Lehrkräfte 2014, 99 Seiten, Kleinformat, € 14,95 / CHF 21.90 ISBN 978-3-8017-2598-3 Auch als eBook erhältlich
Gut mit Kollegen, Schülern und Eltern kommunizieren zu können ist eine wichtige Fähigkeit für die schulische Praxis. Dieser Ratgeber informiert darüber, welche Aspekte zu einer gelungenen Kommunikation im Schulalltag gehören und gibt konkrete Anleitungen und Tipps für verschiedene Gesprächssituationen. Die Kapitel zeigen beispielsweise, wie man Beratungs- und Konfliktgespräche führt, Konferenzen und Besprechungen moderiert sowie Dialogrunden durchführt.
www.hogrefe.de
Gustav Keller
Lerncoaching in der Schule Gustav Keller
Lerncoaching in der Schule Praxishilfen für Lehrkräfte
Praxishilfen für Lehrkräfte 2015, 135 Seiten, Kleinformat, € 16,95 / CHF 21.90 ISBN 978-3-8017-2638-6 Auch als eBook erhältlich
Lerncoaching ist eine spezielle Form der Lernförderung, bei der Motivations- und Lernstrategien vermittelt werden. Der Ratgeber erklärt, wie Lerncoaching funktioniert und gibt Anleitungen, wie Schülerinnen und Schüler individuell über die Wissensvermittlung hinaus beim Lernen unterstützt und gefördert werden können.
SVF-KJ
ProsA
Stressverarbeitungsfragebogen nach Janke und Erdmann angepasst für Kinder und Jugendliche
Prosodie-Analyse Ein computergestütztes Verfahren zur Erfassung rezeptiver prosodischer Fähigkeiten
2., vollständig überarbeitet und neu normierte Auflage
W. Walther / M. Otten Unter Mitarbeit von K. Schulz
P. Hampel / F. Petermann Unter Mitarbeit von B. Dickow
Einsatzbereich: Kinder zwischen 4;0 und 8;11 Jahren.
Einsatzbereich: Kinder und Jugendliche zwischen 8 und 16 Jahren. Zustands- und Verlaufsdiagnostik.
Das Verfahren: Mit neun Subtests erfasst der SVF-KJ Aspekte der dispositionellen Stressverarbeitung. Es wird zwischen stressreduzierenden (günstigen) und stressvermehrenden (ungünstigen) Strategien unterschieden, die jeweils durch vier Items erhoben werden. Die Items werden in Bezug auf eine fiktive soziale und schulische Belastungssituation erfragt. Insgesamt resultieren 72 Items. Folgende stressreduzierende Strategien werden erfasst: „Bagatellisierung“, „Ablenkung/Erholung“, „Situationskontrolle“, „Positive Selbstinstruktionen“ und „Soziales Unterstützungsbedürfnis“. Als stressvermehrende Strategien werden „Passive Vermeidung“, „Gedankliche Weiterbeschäftigung“, „Resignation“ und „Aggression“ erhoben. Die neun Subtests lassen sich zu drei Sekundärtests verdichten, die als „Emotionsregulierende Bewältigung“, „Problemlösende Bewältigung“ und „Negative Stressverarbeitung“ interpretiert werden können. Diese Sekundärtests lassen sich theoretisch von der Einteilung der Bewältigungsfunktionen von R.S. Lazarus ableiten. Die Stressverarbeitungstendenzen können situationsspezifisch und situationsübergreifend bestimmt werden. Bearbeitungsdauer: Es werden etwa 10 bis 25 Minuten benötigt.
Das Verfahren: Die ProsA ist ein computergestütztes Verfahren zur Erfassung rezeptiv-prosodischer Fähigkeiten. Das Instrument besteht aus fünf separaten Untertests (ein Formtest mit 15 Items und vier Funktionstests mit je 13 Items). Alle Items werden akustisch vorgegeben. Der „Formtest“ dient der Überprüfung der auditiven Diskriminationsfähigkeit für prosodische Merkmale (Tonhöhen, Pausen, Betonungen). Mit dem Funktionstest „Satzmodus“ wird die Fähigkeit bestimmt, den Äußerungstyp (Frage versus Aussage) korrekt zu bestimmen. Mit dem Funktionstest „Wortgrenzen“ wird die Fähigkeit untersucht, Wortgrenzen anhand prosodischer Merkmale zu erkennen. Der Funktionstest „Satzfokus“ ermöglicht die Untersuchung der Fähigkeit, anhand prosodischer Elemente den Fokus eines Satzes korrekt zu erkennen. Mit dem Funktionstest „Emotionen“ kann untersucht werden, inwieweit ein Kind anhand prosodischer Elemente den emotionalen Gehalt einer Äußerung erfassen kann. Bei allen Untertests antwortet das untersuchte Kind, in dem es ein visuell dargebotenes Symbol auf dem Bildschirm anklickt. Der Untersucher sitzt während der Testdurchführung neben dem Kind.
Bearbeitungsdauer: Die Durchführungszeit beträgt je nach Alter, Mitarbeit und Konzentrationsfähigkeit des untersuchten Kindes ca. 20 Minuten.
H5 196 01 01 513 01
Test komplett
www.testzentrale.de
99,00 €
Test komplett (HTS5)*
360,00 €
* PC-Version benötigt Programmoberfläche HTS. Nähere Informationen erhalten Sie in unserer Software-Abteilung: (0551) 99950 880.
www.testzentrale.de
Das gesamte Spektrum psychischer Störungen und Therapieverfahren
Franz Petermann et al. (Hrsg.)
Dorsch – Lexikon der Psychotherapie und Psychopharmakotherapie 2016. 1048 S., Gb € 59.95 / CHF 69.00 ISBN 978-3-456-85572-1
Das Lexikon der Psychotherapie und Psychopharmakotherapie präsentiert kompakt und aktuell das Wissen für das gesamte Spektrum psychischer Störungen und Therapieverfahren. Grundlagen, Konzepte, Definitionen und therapeutische Methoden werden systematisch und zuverlässig in über 4500 Beiträgen von mehr als 400 renommierten Expertinnen und Experten der Psychologie und Psychopharmakologie dargestellt. Eine systematische Darstellung psychischer Störungen: Symptomatik, Psychopathologie, Ätiologie, Klassifikation orientiert an ICD-10 und DSM-5, Prävalenz und Verlauf, Diagnostik sowie psychotherapeutische und psychopharmakotherapeutische Behandlungsstandards
www.hogrefe.com
«Hier kann der Fachmann nur applaudieren. Was in diesem knapp 1050 Seiten umfassenden Buch zusammengetragen wurde, ist gigantisch. Ob als Student oder Arzt, das Buch bietet für jeden die richtigen Informationen. Allein die 350 Testverfahren sind ein genialer Praxisleitfaden. Ein Buch, welches man sicher immer mal wieder zum Nachschlagen nutzen wird. Hinzu kommt, dass der Band mit knapp 60 Euro in einem sehr guten Preis-/Leistungsverhältnis steht.» (www.fachbuchkritik.de)
BUEVA-III
MOT 4-6
Basisdiagnostik Umschriebener Entwicklungsstörungen im Vorschulalter – Version III
Motoriktest für vier- bis sechsjährige Kinder
G. Esser / A. Wyschkon
R. Zimmer
Einsatzbereich: Kinder zwischen 4;0 und 6;5 Jahren.
Das Verfahren: Ziel der Vorschultestbatterie ist es, Kinder mit Umschriebenen Entwicklungsstörungen und allgemeinen Entwicklungsrückständen bzw. solche mit dem Risiko für die spätere Entwicklung von Lese-Rechtschreiboder Rechenstörungen bereits vor Schulbeginn zu erkennen und einer frühzeitigen Förderung zuzuführen. Das diagnostische Vorgehen zeichnet sich durch eine hohe Durchführungsökonomie und einen breiten Anwendungsbereich aus. Bei 4- bis 6;5-Jährigen werden die nonverbale Intelligenz, die verbale Intelligenz, die rezeptive und expressive Sprache, die Visuomotorik und Körperkoordination, das Zahlen- und Mengenverständnis, die phonologische Bewusstheit, die Artikulation, die Aufmerksamkeit sowie das Arbeitsgedächtnis erfasst. Zudem besteht die Möglichkeit des Einsatzes einer Kurzform des Gesamtverfahrens, die aus sechs Untertests zusammengesetzt ist (Nonverbale und Verbale Intelligenz, Expressive Sprache, Zahlen- und Mengenverständnis, Aufmerksamkeit und Arbeitsgedächtnisses). Die Testbatterie kann auch im Rahmen von Schuleingangsuntersuchungen verlässlich verwendet werden. Normen: Die Normen beruhen auf einer sehr umfangreichen Stichprobe von 3875 Kindergartenkindern zwischen 4;0 und 6;5 Jahren. Die Eichung erfolgte in Vierteljahresschritten. Bearbeitungsdauer:
3., überarbeitete und neu normierte Auflage
Einsatzbereich: Der MOT 4-6 erfasst den motorischen Entwicklungsstand von Kindern im Vorschulalter (4 bis 6 Jahre). Für Kinder mit Behinderungen oder Entwicklungsverzögerungen kann über diesen Altersbereich hinaus das motorische Entwicklungsalter ermittelt werden. Der Test ermöglicht eine quantitative Auswertung der Ergebnisse, er kann darüber hinaus aber auch als prozessbegleitendes Beobachtungsverfahren verwendet werden. Das Verfahren: Der MOT 4-6 besteht aus 17 Testaufgaben (und einer Aufwärmaufgabe), die in spielerischer, kindgerechter Weise den motorischen Entwicklungsstand des Kindes erfassen und sich sieben motorischen Bereichen zuordnen lassen (z.B. gesamtkörperliche Gewandtheit und Koordinationsfähigkeit, feinmotorische Geschicklichkeit, Gleichgewichtsvermögen). Neben der Ermittlung eines Normwertes (Gesamttestwert), der die Einordnung des Testergebnisses im Vergleich zur durchschnittlichen Leistung in der betreffenden Altersgruppe ermöglicht, gibt der Test dem Praktiker zusätzlich nützliche Hilfen zur qualitativen Beobachtung und Beurteilung der motorischen Performanz des Kindes an die Hand. Bearbeitungsdauer: Für die Durchführung des Tests müssen 20 bis 30 Minuten veranschlagt werden.
04 082 01
Test komplett
Die Durchführung der Kurzform dieses Testverfahrens beansprucht in Abhängigkeit vom Alter und der Leistungsfähigkeit des Kindes zwischen 20 und 25 Minuten. Bei Verwendung aller Untertests der BUEVA-III sind 40 bis 45 Minuten zu veranschlagen. 01 492 01
Test komplett
www.testzentrale.de
678,00 €
www.testzentrale.de
628,00 €
Originalarbeit
Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern deutscher und nicht-deutscher Familiensprache Jennifer Paetsch, Susanne Radmann, Anja Felbrich, Rainer Lehmann und Petra Stanat Humboldt-Universität zu Berlin, Institut zur Qualitätsentwicklung im Bildungswesen (IQB) Zusammenfassung. Das Ziel des vorliegenden Beitrages bestand darin, anhand der längsschnittlich angelegten Studie Erhebungen zum Lese- und Mathematikverständnis–Entwicklungen in den Jahrgangsstufen 4 bis 6 in Berlin (ELEMENT) den Einfluss von Lesekompetenz auf die Kompetenzentwicklung in Mathematik bei Schülerinnen und Schülern von der 4. bis zur 6. Jahrgangsstufe (N = 3 169) zu analysieren. Darüber hinaus wurde untersucht, ob Kinder nicht-deutscher Familiensprache unter Kontrolle des sozioökonomischen Status (SES) und der allgemeinen kognitiven Grundfähigkeiten geringere Lernzuwächse in Mathematik erzielen als Kinder deutscher Familiensprache. Der Entwicklungsverlauf der Mathematikkompetenz wurde dabei anhand eines Wachstumskurvenmodells analysiert. Erwartungskonform zeigte sich, dass die Lesekompetenz, auch unter Kontrolle des SES und der allgemeinen kognitiven Grundfähigkeiten, nicht nur signifikant mit der mathematischen Ausgangskompetenz zusammenhing, sondern darüber hinaus auch einen signifikanten Beitrag zur Vorhersage der mathematischen Lernzuwachsraten aller Schülerinnen und Schüler leistete. Obwohl die bestehenden Kompetenzunterschiede in Mathematik zwischen Kindern nicht-deutscher Familiensprache und deutscher Familiensprache größtenteils auf die Lesekompetenz zurückführbar waren, vergrößerten sich die Disparitäten zwischen Kindern deutscher und Kindern nicht-deutscher Familiensprache nicht. Schlüsselwörter: Deutsch als Zweitsprache, Mathematik, Sprachkompetenz, Längsschnittstudie
Students’ Growth Trajectories in Mathematics: The Role of Language Proficiency Abstract. The aim of the present study was to investigate whether reading comprehension predicts learning gains in mathematics from the fourth to the sixth grade. The study also examined whether second-language learners show smaller learning gains in mathematics than students whose first language is German when socioeconomic status and basic cognitive abilities are controlled for. Learning gains in mathematics (N = 3,169) were modeled using a latent growth model. The findings indicate that the reading comprehension of children predicts not only their mathematical competence in Grade 4, but also their learning gains in mathematics from Grades 4 to 6. Further analyses revealed that differences in mathematical competence between second-language learners and students whose first language is German disappear when controlling for reading comprehension. However, no differences were found in mathematical learning gains between second-language learners and students whose first language is German. Keywords: German as a second language, mathematics, language proficiency, longitudinal study
Sprachliche Fähigkeiten sind für einen erfolgreichen schulbezogenen Kompetenzerwerb von zentraler Bedeutung. Auch für den Erwerb von Mathematikkompetenz sind sie erforderlich, etwa um die Inhalte im Mathematikunterricht zu verstehen oder sich mit anderen darüber auszutauschen. Es ist daher anzunehmen, dass unzureichende sprachliche Fähigkeiten den Kompetenzerwerb in Mathematik beeinträchtigen (Prediger, 2013).
1
Lernende, deren Familiensprache nicht der Instruktionssprache entspricht (Zweitsprachlernende1), verfügen häufig über geringere Sprachfähigkeiten als ihre Mitschülerinnen und Mitschüler (Schwippert, Wendt & Tarelli, 2012). Daher bilden die sprachlichen Anforderungen in Mathematik eine besondere Hürde für ihr fachliches Lernen. Dies legen die Befunde verschiedener Schulleistungsstudien nahe (z. B. Trends in International Mathe-
Im Weiteren werden Lernende, deren Familiensprache nicht der Instruktionssprache entspricht und Zweitsprachlernende synonym verwendet.
© 2016 Hogrefe Verlag
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41 DOI: 10.1026/0049-8637/a000142
28
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
matics and Science Study, TIMSS), die darauf hinweisen, dass Zweitsprachlernende auch unter Kontrolle des sozioökonomischen Status (SES) geringere mathematische Leistungen aufweisen als ihre Mitschülerinnen und Mitschüler, die in ihrer Familie die Instruktionssprache sprechen (Tarelli, Schwippert & Stubbe, 2012). Ob sich die gefundenen Unterschiede im Laufe der Schulzeit aufgrund der geringeren Sprachkompetenz der Zweitsprachlernenden weiter vergrößern, ist bislang allerdings unklar. Auch Lernende, deren Familiensprache der Instruktionssprache entspricht, weisen oft eingeschränkte Sprachkompetenzen auf. So erreichten in der IGLU-Studie 2011 fast 10 % der Kinder ohne Zuwanderungshintergrund nicht die Kompetenzstufe III im Lesen und verfügten somit über eine geringe Lesekompetenz (Bos, BremerichVos, Tarelli & Valtin, 2012). Auch für diese Kinder ist anzunehmen, dass sie im schulischen Kompetenzerwerb mit erheblichen Schwierigkeiten konfrontiert sein werden. Der vorliegende Beitrag knüpft an diesem Ausgangspunkt an und widmet sich zum einen der Frage, welche Rolle sprachliche Fähigkeiten für den mathematischen Kompetenzerwerb spielen. Zum anderen wird untersucht, ob differentielle Leistungsentwicklungen in Mathematik in Abhängigkeit von der Familiensprache zu beobachten sind, d. h. ob sich Leistungsunterschiede zwischen Kindern deutscher und nicht-deutscher Familiensprache nach Kontrolle des SES und der allgemeinen kognitiven Grundfähigkeiten im Laufe der Schulzeit vergrößern.
Die Rolle sprachlicher Fähigkeiten beim Erwerb von Mathematikkompetenz Sprachliche Fähigkeiten sind für den Erwerb von Mathematikkompetenz in mehrfacher Hinsicht von zentraler Bedeutung. Einerseits ist Sprache im Mathematikunterricht, wie in anderen Fächern auch, ein wichtiges Lernmedium: Der Kommunikation über mathematische Inhalte kommt im Unterricht eine zentrale Funktion zu. So wird bspw. das konzeptuelle Verständnis mathematischer Begriffe, Operationen und Prinzipien in der Schule überwiegend sprachlich vermittelt (Ellerton & Clarkson, 1996; Prediger, 2013). Andererseits ist Sprache im mathematischen Kontext aber auch Lerngegenstand: Die in dieser Domäne verwendete Sprache ist durch eine Vielzahl zu erlernender Fachwörter und spezifischer Redemittel gekennzeichnet, deren Kenntnis eine wichtige Vorausset-
zung für den weiteren Wissenserwerb bildet (Pimm, 1987; Verboom, 2008). Dies spiegelt sich auch in den Bildungsstandards der Kultusministerkonferenz für den Primarbereich wider, welche Kompetenzen beschreiben, die am Ende von Bildungsabschnitten erreicht werden sollen (KMK, 2004). Sprachbezogene Kompetenzen werden in den Bildungsstandards als integraler Bestandteil der Mathematikkompetenz betrachtet. Demnach sollten Kinder bereits in der Grundschule in der Lage sein, in Mathematik eigene Vorgehensweisen zu beschreiben und zu reflektieren, mathematische Fachwörter adäquat zu verwenden und Vermutungen zu formulieren. Sprachkompetenz ist dabei als übergeordnetes Konstrukt zu verstehen, das als Befähigung zur Bewältigung von sprachlichen Anforderungen in unterschiedlichen Situationen definiert ist (Klieme, 2004) und verschiedene produktive und rezeptive Teilkompetenzen umfasst (Jude, 2008). Zur erfolgreichen Bewältigung sprachlicher Anforderungen des mathematischen Kompetenzerwerbs sind verschiedene sprachliche Teilkompetenzen von Relevanz, wie etwa rezeptive Fähigkeiten, um Erklärungen und Texte zu verstehen, oder produktive Fähigkeiten, um mathematische Sachverhalte zu beschreiben. In Abhängigkeit von der konkreten Unterrichtsgestaltung können die Anforderungen an verschiedene Teilkompetenzen variieren, etwa wenn in kommunikativ orientierten Lehransätzen die Bedeutung produktiver Sprachkompetenz hervorgehoben wird (Elbers, 2003). Eine zum Verstehen der Unterrichtsinhalte ausreichende Beherrschung rezeptiver Sprachkompetenz, wie Hör- und Leseverstehen, ist allerdings in jedem Fall eine zentrale Voraussetzung für erfolgreiche Teilhabe an Lehr-Lernsituationen (OECD, 2002). Dabei wird davon ausgegangen, dass beides, Hör- und Leseverstehen, Indikatoren eines übergeordneten Verstehensfaktors sind (Leucht, Retelsdorf, Möller & Köller, 2010), denen wiederum ihrerseits Wortschatzkenntnisse und Grammatikkompetenz zugrunde liegen (vgl. Lundberg, 2002). Zusammenfassend lässt sich feststellen, dass angesichts der vielfältigen sprachlichen Anforderungen des mathematischen Kompetenzerwerbs zu erwarten ist, dass Sprachkompetenz ein wichtiger Prädiktor für die mathematische Kompetenzentwicklung ist. Insbesondere gute rezeptive Fähigkeiten sind dabei unerlässlich: Lernende, die nicht in der Lage sind, den Erklärungen der Lehrkraft zu folgen oder Fachtexte und Aufgaben nicht verstehen, können die Lerngelegenheiten des Unterrichts nicht optimal nutzen (Prediger, 2013).
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
© 2016 Hogrefe Verlag
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung – empirische Befundlage Der enge Zusammenhang zwischen Sprach- und Mathematikkompetenz ist durch zahlreiche empirische Studien für unterschiedliche Altersgruppen (Leutner, Klieme, Meyer & Wirth, 2004; Vilenius-Tuohimaa, Aunola & Nurmi, 2008), und auch speziell für Zweitsprachlernende (Beal, Adams & Cohen, 2010; Gut, Reimann & Grob, 2012; Heinze, Herwartz-Emden & Reiss, 2007; Mücke, 2007), gut belegt. Dabei unterscheiden sich die Studien im Hinblick auf die Operationalisierung von Sprachkompetenz. In einigen Untersuchungen wurde diese durch die Lesekompetenz operationalisiert (Leutner et al., 2004; Vilenius-Tuohimaa et al., 2008); in anderen Studien, insbesondere solchen, die Kinder im Vorschulalter oder in der Schulanfangsphase untersuchten, wurden hingegen verschiedene sprachliche Teilkompetenzen als Indikatoren für Sprachkompetenz verwendet. So erfassten bspw. Heinze et al. (2007) den Sprachstand mit einem Verfahren, das auf Wortschatzkenntnisse und die Beherrschung ausgewählter grammatischer Strukturen abzielt, während in der Studie von Gut et al. (2012) der allgemeine Sprachstand anhand des Satzverständnisses und korrekter Wortstellungen erfasst wurde. Neben diesen Befunden aus querschnittlichen Untersuchungen, die Zusammenhänge zwischen Sprachkompetenz (mit unterschiedlicher Operationalisierung) und Mathematikkompetenz bestätigen, weisen Ergebnisse aus Längsschnittuntersuchungen darauf hin, dass Sprachkompetenz ein bedeutsamer Prädiktor späterer Mathematikkompetenz ist. So kamen Duncan et al. (2007) in einer Reanalyse von Daten aus sechs Längsschnittstudien zu dem Ergebnis, dass Facetten vorschulischer Sprachkompetenz, wie Wortschatz- und Buchstabenkenntnisse, auch noch nach Kontrolle der allgemeinen kognitiven Grundfähigkeiten, des SES und der vorschulischen Mathematikkompetenz die spätere Mathematikkompetenz von Schülerinnen und Schülern vorhersagten. Die Höhe des meta-analytisch ermittelten Regressionskoeffizienten betrug ß = .10 (p = .02). Mit dem von Duncan et al. (2007) gewählten (auto‐) regressionsanalytischen Verfahren wird die Veränderung der Mathematikkompetenz jedoch nur indirekt modelliert (zu Einschränkungen von autoregressiven Modellen vgl. Curran & Hussong, 2002). Um individuelle Unterschiede in den Entwicklungsverläufen berücksichtigen zu können, haben sich in den letzten Jahren alternative Verfahren der Veränderungsmessung, wie bspw. latente Wachs© 2016 Hogrefe Verlag
29
tumskurvenmodelle, etabliert. Diese schätzen jeweils die mittlere Veränderung sowie gleichzeitig interindividuelle Unterschiede in den Veränderungsraten. Da die individuellen Veränderungen der Kompetenzen anhand eigener Variablen modelliert werden, lassen sich diese mit anderen Variablen in Beziehung setzen. Die Methode ermöglicht somit nicht nur die Modellierung von mittleren Veränderungsverläufen bei gleichzeitiger Berücksichtigung interindividueller Unterschiede, sondern auch die Analyse von Prädiktoren intraindividueller Veränderungsprozesse (Schmiedek & Wolff, 2010). Mit Längsschnittstudien, die den Lernzuwachs in Mathematik unter Berücksichtigung von individuellen Unterschieden analysieren, lassen sich somit Erkenntnisse über Einflussfaktoren der mathematischen Kompetenzentwicklung generieren. Die Ergebnisse dieser Untersuchungen zeigen, dass die allgemeinen kognitiven Grundfähigkeiten und einige soziodemografische Faktoren, insbesondere der SES sowie solche Kontextfaktoren, wie die besuchte Schulform, einen bedeutsamen Einfluss auf die mathematische Lernentwicklung haben (Becker, Lüdtke, Trautwein & Baumert, 2006; Fan, 2001; Lee, Moon & Hegar, 2011; Morgan, Farkas & Wu, 2011). In Hinblick auf die Annahme, dass die mathematische Kompetenzentwicklung darüber hinaus auch durch die Sprachkompetenz der Lernenden beeinflusst wird, ist die Befundlage hingegen inkonsistent. Morgan et al. (2011) untersuchten anhand von Daten der Early Childhood LongitudinalKindergarten Studie (ECLS-K) die Entwicklung der Mathematikkompetenz bei Kindern von der 1. bis zur 5. Jahrgangsstufe. Anhand von Wachstumskurvenmodellen analysierten sie den Einfluss von Vorläuferfähigkeiten der Lesekompetenz im Vorschulalter (erfasst wurden z. B. Buchstabenkenntnis, Dekodierfähigkeit, Wortschatzkenntnisse) auf die Entwicklung der Mathematikkompetenz. Die Vorläuferfähigkeiten der Lesekompetenz wurden zu einem Faktor zusammengefasst, der sich, unter Kontrolle des SES, als signifikanter Prädiktor der Mathematikkompetenz in der 1. Jahrgangsstufe, nicht jedoch der individuellen Wachstumsraten von der 1. bis zur 5. Jahrgangsstufe erwies. Im Gegensatz dazu wiesen die Ergebnisse einer Studie von Grimm (2008) darauf hin, dass die Lesekompetenz in der 3. Jahrgangsstufe, unter Kontrolle des SES, ein signifikanter Prädiktor der Wachstumsrate der Mathematikkompetenz von der 3. bis zur 8. Jahrgangsstufe ist. Einschränkend muss festgestellt werden, dass in beiden Studien die allgemeinen kognitiven Grundfähigkeiten nicht als Kontrollvariable einbezogen wurden, was die Interpretierbarkeit der Ergebnisse einschränkt, da gefundene Zusammenhänge auf diese Drittvariable zurückzuführen sein könnten (vgl. Grimm, 2008). Darüber hinaus können die widersprüchlichen Befunde beider Studien auf
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
30
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
verschiedene Faktoren, die mit Unterschieden in den Stichproben der beiden Studien zusammenhängen, zurückzuführen sein. So wurde die mathematische Kompetenzentwicklung von Morgan et al. (2011) in den ersten Schuljahren und von Grimm (2008) erst ab der 3. Jahrgangsstufe untersucht. Aufgrund des Altersunterschiedes der Kinder unterscheidet sich die Operationalisierung der Sprachkompetenz in den Studien. So erfasste Morgan et al. (2011) Vorläuferfähigkeiten der Lesekompetenz, Grimm (2008) hingegen die als Indikator für rezeptive Sprachkompetenz geltende Lesekompetenz (vgl. Leucht et al., 2010; Marx & Jungmann, 2000). Darüber hinaus unterscheiden sich die Studien im Hinblick auf Herkunftsmerkmale der teilnehmenden Schülerinnen und Schüler: In der Studie von Grimm (2008) stammte ein überproportional großer Anteil der Lernenden aus Familien mit geringem SES. Außerdem lassen die Angaben zum ethnischen Hintergrund auf überproportional viele Zweitsprachlernende in dieser Studie schließen. Bei der Interpretation empirisch ermittelter Zusammenhänge zwischen Sprach- und Mathematikkompetenz ist zwar generell einschränkend zu beachten, dass die in den Studien eingesetzten Mathematikaufgaben häufig sprachlich basierte Aufgabenformate enthalten, sodass die Zusammenhänge teilweise auf die sprachlichen Merkmale der Mathematikaufgaben zurückzuführen sein könnten (Abedi & Lord, 2001). Insgesamt weisen die vorliegenden Studien jedoch darauf hin, dass die Effekte, die auf sprachliche Anforderungen von Testaufgaben zurückzuführen sind, vergleichsweise gering sind (Abedi & Lord, 2001; Haag, Heppt, Stanat, Kuhl & Pant, 2013; Haag, Heppt, Roppelt & Stanat, 2014; Kieffer, Lesaux, Rivera & Francis, 2009). Es ist daher anzunehmen, dass die empirisch ermittelten Zusammenhänge zwischen Sprach- und Mathematikkompetenz nicht allein durch die sprachlichen Merkmale der Testaufgaben zu erklären sind, sondern auch Erwerbs- und Abrufprozesse mathematischer Inhalte und Konzepte reflektieren.
Unterschiede zwischen Zweitsprachlernenden und Lernenden, deren Familiensprache der Instruktionssprache entspricht Internationale Schulleistungsstudien haben wiederholt erhebliche Disparitäten im Schulerfolg von Heranwachsenden mit und ohne Zuwanderungshintergrund identifiziert (Baumert & Schümer, 2001; Stanat, Rauch & Segeritz, 2010). Als wesentliche Erklärungsfaktoren der Leis-
tungsunterschiede werden neben den geringeren sozioökonomischen Ressourcen, die zugewanderte Familien in die Bildung ihrer Kinder investieren können, sprachliche Schwierigkeiten der Lernenden mit Zuwanderungshintergrund angenommen (Stanat, 2006). In einigen Studien werden deshalb Informationen über den Sprachgebrauch in der Familie als Ergänzung bzw. als Alternative zum Zuwanderungshintergrund, der anhand des Geburtsorts der Eltern bestimmt wird, herangezogen (z. B. TIMSS 2011, siehe Tarelli et al., 2012). Diese Untersuchungen ermöglichen einen Vergleich zwischen Lernenden, deren Familiensprache der Instruktionssprache entspricht, und Zweitsprachlernenden. Um Rückschlüsse auf die Bedeutung von Sprachkompetenz ziehen zu können, ist die Unterscheidung von Schülerinnen und Schülern anhand ihres familiären Sprachgebrauches besser geeignet als eine Unterscheidung nach ihrem Zuwanderungshintergrund (Chlosta & Ostermann, 2005). Die Befundlage hierzu ist eindeutig: Kinder und Jugendliche, die mit ihren Eltern zu Hause die Instruktionssprache sprechen, weisen auch nach Kontrolle des SES und des Bildungshintergrundes der Eltern nicht nur im Lesen, sondern auch in Mathematik höhere Kompetenzen auf als Zweitsprachlernende (Pöhlmann, Haag & Stanat, 2013; Tarelli et al., 2012). Es wird deshalb angenommen, dass die sprachlichen Anforderungen des Mathematikunterrichts für Zweitsprachlernende aufgrund ihrer durchschnittlich geringer ausgeprägten Kompetenzen in der Instruktionssprache eine Hürde beim Erwerb der mathematischen Inhalte darstellen (Heinze et al., 2007; Stanat, 2006). Dieser Nachteil im Lernprozess sollte sich allerdings nicht nur in vergleichsweise weniger stark ausgeprägten Mathematikkompetenzen, sondern darüber hinaus auch in geringeren Kompetenzzuwächsen von Zweitsprachlernenden widerspiegeln, was dazu führen würde, dass sich die Disparitäten im Laufe der Schulzeit weiter vergrößern (DiPrete & Eirich, 2006). Bislang ist noch unklar, ob sich die Leistungsdifferenzen in Mathematik zwischen Zweitsprachlernenden und Lernenden, die in ihrer Familie die Instruktionssprache sprechen, im Laufe der Schulzeit tatsächlich weiter vergrößern. Ergebnisse aus Längsschnittstudien, die eine Differenzierung der Schülergruppen nach ihrem Zuwanderungshintergrund (also nach dem Geburtsort der Eltern) vornehmen, deuten zwar darauf hin, dass sich die individuellen Lernzuwachsraten in Mathematik zwischen Kindern mit und Kindern ohne Zuwanderungshintergrund nicht unterscheiden (Baumert, Nagy & Lehmann, 2012); allerdings vergleichen nur sehr wenige Studien die Entwicklungsverläufe in Mathematik zwischen Lernenden, deren Familiensprache der schulischen Instruktionssprache entspricht und Zweitsprachlernenden. Die Ergebnisse dieser Studien sind zudem nicht eindeutig inter-
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
© 2016 Hogrefe Verlag
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
pretierbar. Roberts und Bryant (2011) verglichen anhand von Daten der ECLS-K Studie die mathematische Entwicklung vom Vorschulalter bis zur 5. Jahrgangsstufe von Zweitsprachlernenden und Lernenden, die in ihrer Familie die Instruktionssprache sprechen. Sie berücksichtigten in ihrer Studie allerdings nur Zweitsprachlernende mit spanischer bzw. asiatischer Familiensprache, die bis zur Einschulung ausreichende Kenntnisse in der Instruktionssprache aufwiesen, wobei die Autoren nicht angeben, wie dies bestimmt wurde. Unter Kontrolle des SES fanden sie keine signifikanten Unterschiede in den Zuwachsraten zwischen den beiden Gruppen. Da gerade für die von den Analysen ausgeschlossenen Kinder mit schwach ausgeprägten Sprachkompetenzen geringe Lernzuwachsraten in Mathematik zu erwarten gewesen wären, ist das Ergebnis dieser Studie jedoch wenig aufschlussreich. Die Autoren einer weiteren Untersuchung, die sich auch auf Daten der ECLS-K Studie stützt (Chang, Singh & Filer, 2009), unterschieden hingegen zwischen zweisprachigen Lernenden mit ausreichenden Sprachkompetenzen in der Instruktionssprache, zweisprachigen Lernenden mit Schwierigkeiten in der Instruktionssprache und Lernenden, deren Familiensprache der Instruktionssprache entspricht. In dieser Analyse konnten unter Kontrolle des SES für die Gruppe der zweisprachigen Lernenden mit Schwierigkeiten in der Instruktionssprache geringere Lernzuwachsraten in den mathematischen Kompetenzen nachgewiesen werden als für Lernende, deren Familiensprache der Instruktionssprache entspricht. Die Befunde von Chang et al. (2009) deuten also darauf hin, dass unter Kontrolle des SES nur Zweitsprachlernende, die unzureichende Fähigkeiten in der Instruktionssprache aufweisen, geringere Kompetenzzuwächse in Mathematik erzielen. Dieses Ergebnis ist konsistent mit anderen Studien, die belegen, dass zweisprachige Schülerinnen und Schüler, die ausreichende Kompetenzen in der Instruktionssprache aufweisen, über keine geringeren mathematischen Kompetenzen verfügen als ihre Mitschülerinnen und Mitschüler (Kempert, Saalbach & Hardy, 2008; Ufer, Reiss & Mehringer, 2013).
Unterschiede zwischen verschiedenen Herkunftsgruppen Untersuchungen der Kompetenzen von Kindern und Jugendlichen aus zugewanderten Familien beziehen sich häufig auf die Gesamtgruppe dieser Schülerinnen und Schüler. Angesichts der Heterogenität dieser Gruppe wird jedoch die Notwendigkeit betont, diese nicht als eine einheitliche Gruppe zu betrachten, sondern eine Differen© 2016 Hogrefe Verlag
31
zierung nach dem jeweiligen Herkunftsland bzw. der jeweiligen Herkunftssprache vorzunehmen (Müller & Stanat, 2006). Tatsächlich konnten Untersuchungen zeigen, dass Heranwachsende mit Zuwanderungshintergrund, deren Familien aus verschiedenen Herkunftsländern stammen, Leistungsunterschiede in Mathematik aufwiesen, die sich nicht allein durch Unterschiede im SES und im Bildungshintergrund der Familien erklären ließen. In Deutschland zeigten sich dabei wiederholt die größten Kompetenznachteile für Schülerinnen und Schüler mit türkischem Zuwanderungshintergrund (Pöhlmann et al., 2013; Segeritz, Walter & Stanat, 2010).
Fragestellungen Aufgrund der vielfältigen sprachlichen Anforderungen des mathematischen Kompetenzerwerbs ist zu erwarten, dass Sprachkompetenz ein wichtiger Prädiktor für die mathematische Kompetenzentwicklung aller Schülerinnen und Schüler ist. Da die empirische Befundlage zu dieser Frage inkonsistent ist, wird in vorliegendem Beitrag anhand einer Längsschnittstudie untersucht, ob die Lesekompetenz (als wichtige Facette von Sprachkompetenz) einen signifikanten Beitrag zur Vorhersage des mathematischen Lernzuwachses in der Grundschule liefert. Da Zweitsprachlernende über durchschnittlich geringer ausgeprägte Sprachkompetenzen verfügen, stellt sich zudem die Frage, ob sich die mathematische Kompetenzentwicklung zwischen Kindern nicht-deutscher Familiensprache und Kindern deutscher Familiensprache unterscheidet. In vorliegendem Beitrag wird deshalb untersucht, ob differentielle Leistungsentwicklungen in Mathematik in Abhängigkeit von der Familiensprache (deutsch/nicht-deutsch) zu beobachten sind, d. h. ob sich die Kompetenzunterschiede zwischen den Gruppen im Laufe der Schulzeit vergrößern. Des Weiteren wird der Frage nachgegangen, inwieweit sich die Kompetenzunterschiede in Mathematik zwischen Kindern deutscher Familiensprache und Kindern nicht-deutscher Familiensprache durch Unterschiede in den Lesekompetenzen erklären lassen. Es werden folgende Hypothesen überprüft: 1. a) Unter Kontrolle des SES und der allgemeinen kognitiven Grundfähigkeiten besteht ein signifikanter (querschnittlicher) Zusammenhang zwischen Leseund Mathematikkompetenz. b) Unter Kontrolle des SES und der allgemeinen kognitiven Grundfähigkeiten ist Lesekompetenz ein signifikanter Prädiktor der Lernzuwachsraten in Mathematik.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
32
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
2. a) Die Mathematikkompetenz von Kindern deutscher Familiensprache ist, unter Kontrolle des SES und der allgemeinen kognitiven Grundfähigkeiten, signifikant höher als die Mathematikkompetenz von Kindern nicht-deutscher Familiensprache. b) Die Lernzuwachsraten in Mathematik von Kindern deutscher Familiensprache sind, unter Kontrolle des SES und der allgemeinen kognitiven Grundfähigkeiten, signifikant größer als die Lernzuwachsraten von Kindern nicht-deutscher Familiensprache. 3. Die Kompetenzunterschiede in Mathematik zwischen Kindern deutscher und Kindern nicht-deutscher Familiensprache verringern sich bei zusätzlicher Berücksichtigung der Lesekompetenz signifikant, d. h. der Zusammenhang zwischen der Familiensprache (deutsch/ nicht-deutsch) und der Mathematikkompetenz wird durch die Lesekompetenz mediiert. Da für Kinder türkischer Familiensprache besonders ausgeprägte Kompetenznachteile zu erwarten sind (vgl. Segeritz et al., 2010), werden die Hypothesen 2a und 2b zusätzlich für diese Schülerinnen und Schüler untersucht.
Methode
4. Jahrgangsstufe auf ein grundständiges Gymnasium wechseln. In ELEMENT wurde an Gymnasien eine Vollerhebung und an Grundschulen eine Stichprobenziehung durchgeführt (Lehmann & Lenkeit, 2008). Daher lag der Stichprobenanteil der Schülerinnen und Schüler an Gymnasien bei 35.7 % (N = 1 757). Die vorliegende Untersuchung basiert auf den Daten der 3 169 Grundschülerinnen und Grundschülern mit einem Mädchenanteil von 48 %. Mit einem Elternfragebogen wurde erhoben, welche Sprache in der Familie der Kinder überwiegend gesprochen wird („Welche Sprache sprechen Sie überwiegend zu Hause?“). Für Kinder, die zu Hause überwiegend Deutsch sprechen, erfolgte eine Zuweisung zu der Gruppe der Kinder deutscher Familiensprache. Für Kinder, die zu Hause überwiegend eine andere Sprache sprechen, erfolgte eine Zuweisung zu der Gruppe der Kinder nichtdeutscher Familiensprache. Kinder nicht-deutscher Familiensprache, die zu Hause überwiegend Türkisch sprechen, wurden zudem der Gruppe der Kinder türkischer Familiensprache zugeteilt. Bei den Kindern türkischer Familiensprache handelt es sich also um eine Subgruppe der Kinder nicht-deutscher Familiensprache. Insgesamt sprechen 2 179 Kinder (69 %) zu Hause überwiegend Deutsch, während 990 Kinder (31 %) zu Hause überwiegend eine andere Sprache sprechen. Die vier größten Sprachgruppen in der Stichprobe bilden die Kinder, die zu Hause Türkisch (13 %), Arabisch (4 %), eine ost- bzw. südostasiatische Sprache (je 3 %) oder Polnisch sprechen (2 %).
Stichprobe Die Datengrundlage der vorliegenden Untersuchung stammt aus der Studie Erhebungen zum Lese- und Mathematikverständnis – Entwicklungen in den Jahrgangsstufen 4 bis 6 in Berlin (ELEMENT) (Lehmann & Lenkeit, 2008). Es wurde der für Reanalysen zur Verfügung stehende Datensatz des Forschungsdatenzentrums des Instituts zur Qualitätsentwicklung im Bildungswesen (IQB, o. J.) verwendet, der skalierte und imputierte Daten enthält. Die Leistungsentwicklung wurde in ELEMENT in den Fächern Deutsch und Mathematik vom Ende der 4. bis zum Ende der 6. Jahrgangsstufe an Grundschulen und grundständigen Gymnasien im Zeitraum von 2003 bis 2005 jährlich jeweils am Schuljahresende erfasst. Um Schulformeffekte auszuschließen, wurden die Daten der Kinder, die ab der 5. Jahrgangsstufe ein Gymnasium besuchten, von den Analysen ausgeschlossen. In Berlin beträgt die Grundschuldauer sechs Jahre, weshalb insgesamt nur sehr wenige Schülerinnen und Schüler bereits nach der
2
Instrumente Die Lesekompetenz wurde anhand von Aufgaben zum Leseverständnis zu Prosa-, Sach- und Gebrauchstexten aus der Internationalen Grundschul-Lese-Untersuchung und der Untersuchung Aspekte der Lernausgangslage und der Lernentwicklung (LAU) erhoben2. Die eingesetzten LAUTexte stammten ursprünglich teilweise aus dem standardisierten Hamburger Schulleistungstest für 4. und 5. Klassen (HST 4/5; Mietzel & Willenberg, 2000). Eine Auflistung der eingesetzten Texte kann dem Skalenhandbuch der ELEMENT-Studie entnommen werden (Institut zur Qualitätsentwicklung im Bildungswesen, o. J.). Die Erhebung der Mathematikkompetenz erfolgte in ELEMENT am Ende der 4., 5. und 6. Jahrgangsstufe. Die Mathematikleistung wurde mit Algebra-, Arithmetik- und Geometrieaufgaben aus den LAU- und IGLU-Untersuchungen sowie der Qualitätsuntersuchung an Schulen zum
IGLU Beispielaufgaben für das Leseverständnis finden sich bei Bos et al. (2003, S. 86 ff). LAU Beispielaufgaben für Leseverständnis finden sich bei der Behörde für Schule und Berufsbildung (2011).
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
© 2016 Hogrefe Verlag
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
Unterricht in Mathematik (QuaSUM) erfasst3. Eine genauere Beschreibung der Testkonstruktion findet sich bei Lehmann und Nikolova (2005) sowie bei Lehmann und Lenkeit (2008). Eine Rasch-Skalierung der Tests erfolgte in ELEMENT auf Grundlage der Daten der Gesamtstichprobe. Als Schätzer für die Fähigkeitsparameter wurden (über alle Aufgaben) Warm’s Mean Weighted Likelihood Estimates (WLE) jeweils für Lese- und Mathematikkompetenz gebildet und anschließend linear auf einen Mittelwert von 100 und eine Standardabweichung von 15 für den ersten Messzeitpunkt transformiert (Lehmann & Lenkeit, 2008). Die Reliabilität (Kuder-Richardson-Formula 20) des Lesetests zum ersten Messzeitpunkt beträgt r = .85, die des Mathematiktests variiert zu den einzelnen Erhebungszeitpunkten zwischen r = .84 und r = .93 (Baumert, Becker, Neumann & Nikolova, 2009). Die allgemeinen kognitiven Grundfähigkeiten wurden in ELEMENT mit den Untertests zur Erfassung figuralen und sprachlichen Denkens aus dem Kognitiven Fähigkeitstest für 4. bis 12. Klassen (KFT 4 – 12 R) (Heller & Perleth, 2000) erhoben. Um zu gewährleisten, dass in den Analysen die nonverbalen kognitiven Fähigkeiten und nicht auch die Sprachkompetenz kontrolliert wird, wurde in die vorliegende Untersuchung nur die sprachfreie Skala figurales Denken einbezogen (Cronbachs a = .94). Für die Analysen wurde der Summenscore verwendet. Die Erfassung des SES erfolgte mit dem International Socio-Economic Index of Occupational Status (ISEI; Ganzeboom & Treiman, 2003). Als Indikator des sozialen Status der Familie wurde jeweils der höchste ISEI des Elternpaares verwendet (HISEI). Fehlende Daten wurden mit dem Programm Norm (Schafer, 1999) imputiert. Dabei wurden fünf vollständige Datensätze erzeugt (weiterführende Informationen zur multiplen Imputation der ELEMENT-Daten finden sich bei Lehmann und Lenkeit, 2008). Das Ersetzen fehlender Werte für die Skala figurales Denken erfolgte analog zu dem für ELEMENT beschrieben Vorgehen mit dem R-Paket Norm (Novo, 2013).
Analysestrategie Die Entwicklung der mathematischen Kompetenzen wurde anhand von latenten Wachstumskurvenmodellen (Latent Growth Curve models, LGC; Bollen & Curran, 2006) mit der Software Mplus 6.1 (Muthén & Muthén, 1998 – 2010) analysiert. LGC-Modelle ermöglichen es, Veränderungsprozesse auf latenter Ebene, d. h. unter Berücksichtigung zufälliger Messfehler, zu untersuchen. Zudem kön-
3
33
nen interindividuelle Unterschiede in den Wachstumsraten berücksichtigt werden. Auf Grundlage der Wiederholungsmessungen wird in LGC-Modellen für jede Person eine Wachstumskurve über alle Messzeitpunkte hinweg geschätzt. LGC-Modelle bilden somit die individuellen Entwicklungsverläufe ab, die durch den Ausgangswert (Intercept) und die Wachstumsrate (Slope) beschrieben werden. Der mittlere Intercept und der mittlere Slope sowie die Varianz der Intercepts und Slopes bilden den Entwicklungsverlauf der untersuchten Stichprobe insgesamt ab. Durch die Aufnahme von Prädiktoren in das Modell kann weiterhin geprüft werden, inwieweit diese die interindividuellen Unterschiede im Ausgangswert oder in der Wachstumsrate erklären. Die Interpretation der gerichteten Pfadkoeffizienten in LGC-Modellen kann zwar durch die zeitliche Ordnung der berücksichtigten Variablen eine Grundlage für kausale Interpretationen liefern, es lässt sich jedoch nicht ausschließen, dass nicht erfasste Variablen Alterativerklärungen bieten (Schmiedek & Wolff, 2010). In der vorliegenden Studie wurden Modelle spezifiziert, in denen die WLE-Schätzer der Mathematikkompetenzen zu drei Messzeitpunkten die manifesten Indikatoren bilden. Die Ladungen der Indikatoren auf dem InterceptFaktor wurden auf 1 und die Intercepts der Indikatoren auf 0 fixiert. Für das Wachstum der Mathematikkompetenz wurde ein linearer Trend angenommen, d. h. die Ladungen auf dem Slope-Faktor zu Testzeitpunkt 1 (T1) wurden auf 0, zu Testzeitpunkt 2 (T2) auf 1 und zu Testzeitpunkt 3 (T3) auf 2 fixiert. Zur Überprüfung der Hypothese 1 wurde ein konditionales Wachstumskurvenmodell mit der Lesekompetenz der 4. Jahrgangsstufe als Prädiktorvariable (WLE-Schätzer) und den allgemeinen kognitiven Grundfähigkeiten sowie dem SES als manifeste Kovariaten spezifiziert (Modell 1). Um den Hypothesen 2a – b entsprechend zu überprüfen, ob sich die Entwicklungen zwischen den Schülerinnen und Schülern deutscher und nicht-deutscher (Modell 2.1) bzw. deutscher und türkischer Familiensprache (Modell 2.2) unterscheiden, wurde jeweils ein konditionales Wachstumskurvenmodell mit der Familiensprache (deutsch/nicht-deutsch bzw. deutsch/türkisch) als Prädiktorvariable sowie den allgemeinen kognitiven Grundfähigkeiten und dem SES als manifeste Kontrollvariablen spezifiziert. In einem weiteren Schritt wurden in Modell 3 Lesekompetenz und Familiensprache (deutsch/nichtdeutsch) gleichzeitig als Prädiktoren aufgenommen. Um der Mehrebenenstruktur der vorliegenden Daten gerecht zu werden, war es erforderlich in allen Analysen in Mplus Prozeduren zu verwenden, die den aus der Da-
IGLU Beispielaufgaben für Mathematik finden sich bei Bos et al. (2003, S. 200 f).
© 2016 Hogrefe Verlag
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
Anmerkungen: Die Leistungen in Mathematik und Lesen wurden auf Grundlage der Daten der Gesamtstichprobe (inkl. Gymnasialkinder) skaliert (WLE-Schätzer), LK4 = Lesekompetenz in der 4. Jahrgangsstufe, MK4 = Mathematikkompetenz in der 4. Jahrgangsstufe, MK5 = Mathematikkompetenz in der 5. Jahrgangsstufe, MK6 = Mathematikkompetenz in der 6. Jahrgangsstufe, KFT = allgemeine kognitive Grundfähigkeiten, HISEI = sozioökonomischer Hintergrund, M = Mittelwert, SD = Standardabweichung, Min = Minimum, Max = Maximum, N = Anzahl. Für die Mehrebenenstruktur der Daten wurde statistisch kontrolliert (Mplus type = complex).
25.0 0.0 0.2 6.8
392
0.4 11.8 25.0 0.0 0.1 7.2
990
0.3 13.2 25.0 0.0 0.1 7.0
2179
0.2 15.8 25.0 0.0 0.1 7.2
3169
0.2 15.0 KFT
N
121.7
85.0 16.0
36.6 0.5
0.4 13.1
13.8 0.8
0.7 37.0
84.9 127.0
85.0 16.0
36.6 0.4
0.4 14.3
14.7 0.8
0.7 38.7
89.2 150.9
85.0 16.0
36.5 0.3
0.3 15.0
13.8 0.5
0.6 50.0
101.0 150.9
85.0 16.0
36.5 0.3
0.3 15.7
15.1
46.5 HISEI
0.6
97.3 LK4
0.6
136.9
151.8 69.4 0.5 12.1 0.8 105.1 164.0 69.4 0.4 14.2 0.8 109.1 179.1 70.8 0.3 15.0 0.7 117.1 179.1 69.4 0.3 15.2 114.6 MK6
0.7
59.2
69.4 0.5
0.5 10.9
11.4 0.8
0.7 88.6
97.4 169.1
134.8 39.6
63.9 0.4
0.4 12.9
13.5 0.8
0.6 91.0
100.9 169.1
150.2 49.4
63.9 0.3
0.3 13.4
13.7 0.5
0.5 98.6
108.5 169.1
150.2 39.6
63.9 0.2
0.2 13.7
14.1 0.6
0.5 96.2
106.1
SD SEM M
MK5
SESD SD SESD
Min
Max
M
SEM
SD
SESD
Min
Max
M
SEM
nicht Deutsch
Familiensprache
Deutsch Gesamt
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
Konstrukt
Tabelle 1. Deskriptive Maße nach Familiensprache
Tabelle 1 zeigt die Mittelwerte, Standardabweichungen sowie Minima und Maxima der erfassten Variablen zu den drei Messzeitpunkten für die Gesamtgruppe aller Grundschülerinnen und -schüler, sowie getrennt für Kinder deutscher, nicht-deutscher und türkischer Familiensprache. In Mathematik erreichten Kinder nicht-deutscher Familiensprache signifikant geringere Leistungen als Kinder deutscher Familiensprache (Gruppenunterschiede wurden anhand von T-Tests inferenzstatistisch abgesichert, vgl. Tabelle 2). In der 4. und 5. Jahrgangsstufe betrug der Unterschied zwischen den Gruppen 7.6 Punkte, in der 6. Jahrgangsstufe 8 Punkte. Die deskriptiven Leistungsunterschiede zwischen den Gruppen vergrößerten sich in den zwei Jahren also nur geringfügig und entsprachen in ihrer Höhe ungefähr dem Lernzuwachs, den Schülerinnen und Schülern deutscher und nicht-deutscher Familiensprache innerhalb eines Schuljahres (vgl. Tabelle 1) erreichten. Noch deutlicher ausgeprägt als in Mathematik waren die Unterschiede in den Lesekompetenzen der 4. Jahrgangsstufe. Hier unterschieden sich Kinder deutscher und nicht-deutscher Familiensprache um 11.8 Punkte. Signifikante Unterschiede zeigten sich auch im mittleren SES zwischen den Gruppen: die Differenz betrug 11.3 Punkte zwischen Kindern deutscher und nicht-deutscher Familiensprache und 13 Punkte zwischen deutschsprachigen und türkischsprachigen Kindern. Die Leistungen der Kinder türkischer Familiensprache lagen im Leseverständnis und in Mathematik zu allen Messzeitpunkten deutlich unter denen der Kinder deutscher Familiensprache (vgl. Tabellen 1 und 2). Der Kompetenzunterschied in Mathematik zwischen den türkischsprachigen und den deutschsprachigen Kindern vergrößerte sich von 10 Punkten in der 4. Klasse auf 12 Punkte in der 6. Klasse. Um zu prüfen, ob Sprachkompetenz ein bedeutsamer Prädiktor für die Mathematikkompetenz bzw. für die Zu-
Min
Ergebnisse
MK4
SESD Max
M
SEM
Türkisch
Min
Max
tenstruktur resultierenden Designeffekt bei der Schätzung von Standardfehlern und Signifikanzprüfungen berücksichtigen (type = complex). Alle Berechnungen wurden mit dem robusten Maximum-Likelihood-Verfahren (MLR) durchgeführt. Zur Beurteilung der Modellgüte wurden zwei Fitindizes herangezogen: Comparative Fit Index (CFI) und Root-Mean-Square Error of Approximation (RMSEA). Für den CFI gelten Werte größer .90 als akzeptabel, Werte größer .95 deuten auf einen sehr guten Fit des Modells hin. Der RMSEA-Wert sollte (für einen guten Fit) maximal bei .05 liegen (Hu & Bentler, 1999). Außerdem wird der w2-Wert angegeben.
134.8
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
SD
34
© 2016 Hogrefe Verlag
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
35
Tabelle 2. Ergebnisse der T-Tests zur inferenzstatistischen Absicherung der Gruppenunterschiede Konstrukt
Familiensprache Deutsch/Familiensprache nicht Deutsch t
df
p
d
Familiensprache Deutsch/Familiensprache Türkisch t
df
p
d
MK4
15.18
3167
< .001
0.57
16.06
2569
< .001
0.77
MK5
14.76
3167
< .001
0.56
17.25
2569
< .001
0.83
MK6
14.46
3167
< .001
0.54
17.40
2569
< .001
0.83
LK4
21.42
3167
< .001
0.84
21.29
2569
< .001
1.17
HISEI
20.43
3167
< .001
0.77
17.86
2569
< .001
0.90
Anmerkungen: LK4 = Lesekompetenz in der 4. Jahrgangsstufe, MK4 = Mathematikkompetenz in der 4. Jahrgangsstufe, MK5 = Mathematikkompetenz in der 5. Jahrgangsstufe, MK6 = Mathematikkompetenz in der 6. Jahrgangsstufe, HISEI = sozioökonomischer Hintergrund, d = Effektstärke nach Cohen (1992).
Tabelle 3. Latente Mittelwerte, Varianzen und Model-Fit Indices der konditionalen Wachstumskurvenmodelle Modell 1 Parameter
Modell 3
Koeffizient
SE
p
Koeffizient
SE
p
48.63
1.31
≤ .001
49.08
1.33
≤ .001
5.43
0.77
≤ .001
5.22
0.78
≤ .001
65.01
3.80
≤ .001
64.85
3.86
≤ .001
9.85
1.92
≤ .001
9.82
1.92
≤ .001
0.82
1.91
.670
4.22
2.41
.080
Mittelwert Intercept Slope Residualvarianz Intercept Slope Kovarianzen Intercept-Slope Model-Fit Indices
w2 df
20.48
21.52
4
5
CFI
.999
.999
RMSEA
.036
.032
Anmerkungen: Berücksichtigt wurden die Kovariaten allgemeine kognitive Grundfähigkeiten und SES sowie in Modell 1 die Lesekompetenz als Prädiktor und in Modell 3 die Prädiktoren Lesekompetenz und Familiensprache. Koeffizient = unstandardisierte Werte. Für die Mehrebenenstruktur der Daten wurde statistisch kontrolliert (Mplus, type = complex).
wachsraten der Mathematikkompetenz aller Lernenden ist, wurde die Lesekompetenz als Prädiktor in das LGCModell aufgenommen. Als Kontrollvariablen wurden die allgemeinen kognitiven Grundfähigkeiten und der SES berücksichtigt (Modell 1). Die zentralen Modellparameter sind in Tabelle 3 aufgeführt. Die mathematische Ausgangskompetenz wird durch den Intercept und der mathematische Lernzuwachs durch den Slope repräsentiert. Das Modell wies einen guten Modellfit auf (w2(N = 3 169) = 20.48; df = 4; p < .001; CFI = .999; RMSEA = .036). Erwartungskonform war die Lesekompetenz, unter Kontrolle des SES und der allgemeinen kognitiven Grundfähigkeiten, als Prädiktor der mathematischen Ausgangskompetenz (Intercept) signifikant (b = .50, p < .001; Hypothese 1a, vgl. Tabelle 4). Zudem erwies sich die Lesekompetenz als signifikanter Prädiktor des mathematischen Kompetenzzuwachses (Slope, b = .09, p = .02; Hypothese 1b). Die Kontrollvariablen SES und allgemeine © 2016 Hogrefe Verlag
kognitiven Grundfähigkeiten erwiesen sich als signifikante Prädiktoren der mathematischen Ausgangskompetenz sowie des mathematischen Lernzuwachses (vgl. Tabelle 4). Zur Prüfung der Unterschiede zwischen Kindern deutscher und nicht-deutscher Familiensprache in den Lernzuwachsraten in Mathematik wurde die Familiensprache als Prädiktor in das LGC-Modell aufgenommen. Auch hier wurden die allgemeinen kognitiven Grundfähigkeiten und der SES als Kontrollvariablen berücksichtigt (Modell 2.1). Die zentralen Modellparameter sind in Tabelle 5 aufgeführt. Dieses Modell wies ebenfalls einen guten Modellfit auf (w2(N = 3 169) = 20.73; df = 4; p < .001; CFI = .999; RMSEA = .036). Die allgemeinen kognitiven Grundfähigkeiten sowie der SES waren erwartungsgemäß als Prädiktoren sowohl der mathematischen Ausgangskompetenz als auch der Zuwachsraten signifikant (vgl. Tabelle 4). Die Familiensprache erwies sich zudem als si-
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
.06 ≤ .001 .52 .049 .06 ≤ .001 .36 .017 .05 ≤ .001 .35 .007 .05 .51 R2
≤ .001
.11
-.07 .042
≤ .001 .49
.04 .330
– –
.05 ≤ .001
– –
.16 .308
– –
-.04 ≤ .001
– –
.15 –
.016 .09
– – – Familiensprache
≤ .001 .50 LK4
Anmerkungen: Fett = signifikant von null verschieden (p < .05). Koeffizient = standardisierte Werte. KFT = allgemeine kognitive Grundfähigkeiten, HISEI = sozioökonomischer Hintergrund. LK4 = Lesekompetenz in der 4. Jahrgangsstufe. Familiensprache: Modell 1, Modell 2.1 und Modell 3 (0 = nicht-deutsche Familiensprache, 1 = deutsche Familiensprache), Modell 2.2 (0 = türkische Familiensprache, 1 = deutsche Familiensprache). Für die Mehrebenenstruktur der Daten wurde statisstisch kontrolliert (Mplus, type = complex).
.004
.109
.005
.004
.002 .12
.12 ≤ .001
≤ .001 .28
.11 .008
.002 .15
.14 ≤ .001
≤ .001 .43
.23 .001
≤ .001 .16
.15 ≤ .001
≤ .001 .44
.22 .012
.002 .12
.10 ≤ .001 .12 HISEI
≤ .001 .28 KFT
p p
Slope b p
Intercept
b p p b
Intercept
Modell 1
b
Slope
p
b
Intercept
b
Modell 2.1
Slope
p
Modell 2.2 (nur Kinder deutscher und türkischer Familiensprache)
b
Intercept
Modell 3
b
Slope
p
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
Tabelle 4. Standardisierte Pfadkoeffizienten der konditionalen Wachstumskurvenmodelle. Regression des Intercept und des Slope auf die allgemeinen kognitiven Grundfähigkeiten, den sozioökonomischen Status, die Lesekompetenz und die Familiensprache.
36
gnifikanter Prädiktor der mathematischen Ausgangskompetenz (b = .15, p < .01; Hypothese 2a), nicht jedoch der Zuwachsraten (b = -.04, p = .31; Hypothese 2b). Demnach wiesen Kinder deutscher Familiensprache, unter Kontrolle der allgemeinen kognitiven Grundfähigkeiten und des SES, erwartungsgemäß eine höhere durchschnittliche mathematische Ausgangskompetenz auf als Kinder nichtdeutscher Familiensprache, die Gruppen unterschieden sich jedoch nicht in den Lernzuwachsraten. Die Kontrollvariablen SES und allgemeine kognitive Grundfähigkeiten waren auch in Modell 2.1 signifikante Prädiktoren der mathematischen Ausgangskompetenz sowie des mathematischen Lernzuwachses (vgl. Tabelle 4). Die Ergebnisse des Modells 2.2, in dem nur die Kinder deutscher und türkischer Familiensprache berücksichtigt wurden, zeigten ein ähnliches Bild (vgl. Tabelle 4). Die Familiensprache war ein signifikanter Prädiktor der mathematischen Ausgangskompetenz (b = .16, p < .01), nicht jedoch der Zuwachsraten (b = .05, p = .33), d. h. auch die Zuwachsraten der Kinder deutscher und türkischer Familiensprache unterschieden sich unter Kontrolle der allgemeinen kognitiven Grundfähigkeiten und des SES nicht signifikant voneinander. Um zu prüfen, ob sich die Disparitäten zwischen Kindern nicht-deutscher Familiensprache und Kindern deutscher Familiensprache durch Kontrolle der Lesekompetenz verringern, wurden die Familiensprache (deutsch/ nicht-deutsch) und die Lesekompetenz in Modell 3 gleichzeitig als Prädiktoren berücksichtigt. Die zentralen Modellparameter sind in Tabelle 3 aufgeführt. Das Modell wies einen guten Modellfit auf (w2(N = 3 169) = 21.52; df = 5; p < .001; CFI = .999; RMSEA = .032). Erwartungskonform war die Lesekompetenz auch unter Berücksichtigung der Familiensprache als Prädiktor sowohl der mathematischen Ausgangskompetenz (b = .49, p < .01) als auch des mathematischen Kompetenzzuwachses (b = .11, p = .01) signifikant. Darüber hinaus verringerten sich in Modell 3 erwartungsgemäß die in Modell 2.1 identifizierten Disparitäten (vgl. Tabelle 4). Es waren jedoch weiterhin signifikante Leistungsunterschiede zwischen den Gruppen zu erkennen (vgl. Tabelle 4, b = .04, p = .04). Um die Hypothese zu überprüfen, dass der Zusammenhang zwischen der Familiensprache (deutsch/nichtdeutsch) und der Mathematikkompetenz durch die Lesekompetenz mediiert wird, wurde eine Mediatorenanalyse nach Baron und Kenny (1986) berechnet. Es müssen vier Bedingungen erfüllt sein, damit einer Variablen (hier: Lesekompetenz) ein mediierender Effekt zwischen der Prädiktorvariablen (hier: Familiensprache) und der abhängigen Variable (hier: mathematische Ausgangskompetenz) zugesprochen werden kann: 1. Die Mediatorvariable muss signifikant mit der Prädiktorvariable zusammenhängen: Es zeigte sich, dass die Familiensprache signifikant mit
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
© 2016 Hogrefe Verlag
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
37
Tabelle 5. Latente Mittelwerte, Varianzen und Model-Fit Indices der konditionalen Wachstumskurvenmodelle für Kinder deutscher und nichtdeutscher (Modell 2.1) bzw. deutscher und türkischer Familiensprache (Modell 2.2). Modell 2.1 Parameter
Modell 2.2 (nur Kinder deutscher und türkischer Familiensprache)
Koeffizient
SE
p
Koeffizient
SE
p
75.88
.86
≤ .001
74.67
1.03
≤ .001
6.90
.45
≤ .001
6.50
0.55
≤ .001
86.41
4.33
≤ .001
82.36
4.42
≤ .001
9.28
2.15
≤ .001
7.73
2.49
≤ .001
2.83
2.13
.180
4.22
2.41
.080
Mittelwert Intercept Slope Residualvarianz Intercept Slope Kovarianzen Intercept-Slope Model-Fit Indices
w2 df
20.73
13.90
4
4
CFI
.999
.999
RMSEA
.036
.031
Anmerkungen: Als Prädiktor wurde die Familiensprache, als Kontrollvariablen allgemeine kognitive Grundfähigkeiten und SES berücksichtigt. Koeffizient = unstandardisierte Werte. Modell 2.1 (0 = nicht-deutsche Familiensprache, 1 = deutsche Familiensprache), Modell 2.2 (0 = türkische Familiensprache, 1 = deutsche Familiensprache). Für die Mehrebenenstruktur der Daten wurde statistisch kontrolliert (Mplus, type = complex).
der Lesekompetenz zusammenhängt (b = .23, p < .01). 2. Die Mediatorvariable muss signifikant mit der abhängigen Variable zusammenhängen: Es zeigte sich, dass die Lesekompetenz signifikant mit der mathematischen Ausgangskompetenz zusammenhängt (vgl. Tabelle 4, Modell 1, b = .50, p < .01). 3. Die Prädiktorvariable muss signifikant mit der abhängigen Variable zusammenhängen: Es zeigte sich, dass die Familiensprache signifikant mit der mathematischen Ausgangskompetenz zusammenhängt (vgl. Tabelle 4, Modell 2.1, b = .15, p < .01). 4. Der Zusammenhang zwischen Prädiktor und abhängiger Variable muss vermindert sein, wenn die Mediatorvariable ins Modell einbezogen wird. Ob der Zusammenhang durch Einbezug der Mediatorvariablen signifikant vermindert wird, lässt sich mit dem Test nach Sobel (Sobel, 1982) überprüfen. Die Differenz der standardisierten Regressionskoeffizienten betrug bDiff = .11 (vgl. Tabelle 4, Modell 2.1. und Modell 3). Unter Anwendung der in Mplus implementierten Funktion model indirect konnte gezeigt werden, dass der indirekte Effekt (b = .11) signifikant ist (Sobel-Test, Z = 9.82, p < .01).
Diskussion Ein zentrales Ziel des vorliegenden Beitrags war es, anhand einer Längsschnittanalyse zu prüfen, ob Lesekom© 2016 Hogrefe Verlag
petenz ein bedeutsamer Prädiktor für die mathematische Kompetenzentwicklung von der 4. bis zur 6. Jahrgangsstufe ist. Während bereits viele Studien zeigen konnten, dass ein Zusammenhang zwischen Lese und Mathematikkompetenz besteht (Leutner et al., 2004; Vilenius-Tuohimaa et al., 2008), wurde in vorliegendem Beitrag untersucht, inwieweit Lesekompetenz auch einen Beitrag zur Vorhersage interindividueller Unterschiede des mathematischen Lernzuwachses liefern kann. Dabei wurden die allgemeinen kognitiven Grundfähigkeiten und der SES als Kontrollvariablen in die Analysen einbezogen. Die Daten der Untersuchung stammten aus einer für Berlin repräsentativen Stichprobe (Lehmann & Lenkeit, 2008). Da die Grundschuldauer in Berlin sechs Jahre beträgt, konnte die Entwicklung von der 4. bis zur 6. Jahrgangsstufe untersucht werden, ohne dass Schulformeffekte berücksichtigt werden mussten. Ein weiterer Fokus der vorliegenden Studie lag zudem in einem Vergleich der mathematischen Lernzuwachsraten von Kindern deutscher und nicht-deutscher Familiensprache. Während viele Querschnittstudien zeigen konnten, dass Zweitsprachlernende über geringere Mathematikkompetenzen verfügen als Lernende, deren Familiensprache der Instruktionssprache entspricht (Pöhlmann et al., 2013; Tarelli et al., 2012), wurde in vorliegendem Beitrag untersucht, wie sich die Disparitäten im Laufe der Zeit entwickeln. Dabei wurde erwartet, dass sich die sprachlichen Schwierigkeiten von Zweitsprachlernenden beim mathematischen Kompetenzerwerb (vgl. Stanat, 2006; Ufer, Reiss & Mehringer, 2013)
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
38
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
in geringeren mathematischen Lernzuwachsraten dieser Schülerinnen und Schüler widerspiegeln, was eine Vergrößerung der Disparitäten zur Folge hätte. Darüber hinaus wurde untersucht, ob sich Kompetenzunterschiede in Mathematik zwischen Kindern nicht-deutscher Familiensprache und Kindern deutscher Familiensprache durch die Lesekompetenz erklären lassen. Um interindividuelle Unterschiede in den Lernzuwachsraten abbilden zu können, wurde die Entwicklung der Mathematikkompetenz der Kinder anhand eines Wachstumskurvenmodells analysiert (vgl. Bollen & Curran, 2006). Es konnte gezeigt werden, dass die Lesekompetenz der Kinder nicht nur mit ihren mathematischen Ausgangskompetenzen zusammenhing, sondern darüber hinaus auch einen Einfluss auf den mathematischen Lernzuwachs hatte. Während es sich bei dem unter Kontrolle des SES und der allgemeinen kognitiven Grundfähigkeiten gefundenen Zusammenhang zwischen Lesekompetenz und mathematischer Ausgangskompetenz um einen großen Effekt handelt, ist der Effekt von Lesekompetenz auf den mathematischen Lernzuwachs als klein zu bewerten4 (Cohen, 1988). Dieser Befund ist konsistent mit den Ergebnissen von Grimm (2008), der ebenfalls einen kleinen Effekt der Lesekompetenz auf den mathematischen Lernzuwachs identifiziert hat. Der Vergleich zwischen Kindern deutscher und Kindern nicht-deutscher Familiensprache zeigte zwar, dass unter Kontrolle des SES und der allgemeinen kognitiven Grundfähigkeiten Kinder deutscher Familiensprache über höhere mathematische Ausgangskompetenzen (in der 4. Jahrgangsstufe) verfügten als Kinder nicht-deutscher Familiensprache, es waren jedoch keine Unterschiede in den mathematischen Lernzuwachsraten zwischen den beiden Gruppen zu verzeichnen. Zugleich konnte der aus anderen Studien gut belegte Einfluss des SES und der allgemeinen kognitiven Grundfähigkeiten (Becker et al., 2006; Fan, 2001; Lee et al., 2011; Morgan et al., 2011) auf die mathematischen Ausgangskompetenzen und den mathematischen Lernzuwachs bestätigt werden. Es vergrößerten sich also die Nachteile in Mathematik von Kindern aus sozial schwächeren Familien und von Kindern mit geringeren allgemeinen kognitiven Grundfähigkeiten zwischen der 4. und der 6. Jahrgangsstufe, die Familiensprache (deutsch/nicht-deutsch) hatte darüber hinaus jedoch keinen Effekt auf die mathematische Kompetenzentwicklung. Dies bedeutet, dass sich die in der 4. Jahrgangsstufe bestehenden Disparitäten zwischen Kindern deutscher Familiensprache und Kindern nicht-deutscher Familiensprache bis zur 6. Jahrgangstufe entgegen den Erwartungen nicht vergrößerten, sondern konstant blie-
4
ben. Weiterhin konnte gezeigt werden, dass sich die Unterschiede in den mathematischen Ausgangskompetenzen zwischen Kindern nicht-deutscher Familiensprache und Kindern deutscher Familiensprache nach Kontrolle der Lesekompetenz signifikant verringerten, d. h. der Zusammenhang zwischen Familiensprache (deutsch/nichtdeutsch) und mathematischer Ausgangskompetenz wurde durch die Lesekompetenz teilweise mediiert. Demnach wird ein Teil der gefundenen Disparitäten in den Mathematikkompetenzen zwischen Kindern deutscher und Kindern nicht-deutscher Familiensprache durch die sprachliche Kompetenz vermittelt. Da für Kinder türkischer Familiensprache in bisherigen Studien besonders ausgeprägte Kompetenznachteile beobachtet werden konnten (z. B. Segeritz et al., 2010), wurde diese Subgruppe in der vorliegenden Studie gesondert betrachtet. Erwartungsgemäß wiesen die Kinder türkischer Familiensprache im Vergleich zur Gruppe der Kinder deutscher Familiensprache deutlich geringere mathematische Kompetenzen zu allen Messzeitpunkten auf. Es zeigte sich jedoch auch hier, dass nach Kontrolle des SES und der allgemeinen kognitiven Grundfähigkeiten keine Unterschiede in den mathematischen Lernzuwachsraten zwischen Schülerinnen und Schülern türkischer und deutscher Familiensprache zu verzeichnen waren, d. h. die Unterschiede in den Mathematikkompetenzen wurden auch hier über die Zeit hinweg nicht größer, sondern blieben konstant. In der vorliegenden Studie wurde mit Lesekompetenz eine wichtige Facette von Sprachkompetenz untersucht, da einerseits angenommen wird, dass Lesekompetenz eine zentrale Voraussetzung für den schulischen Kompetenzerwerb ist (Bos et al., 2012) und sie anderseits als ein sehr guter Indikator für allgemeine Verständnisleistungen gilt (Marx & Jungmann, 2000). Beim mathematischen Kompetenzerwerb spielen neben rezeptiven Fähigkeiten, wie Hör- oder Leseverstehen, jedoch auch produktive Fähigkeiten, etwa bei der Kommunikation über mathematische Inhalte, eine wichtige Rolle (Prediger, 2013). Die in der vorliegenden Studie gewählte Operationalisierung umfasst demzufolge nicht das ganze Spektrum relevanter Facetten von Sprachkompetenz, was zu einer Unterschätzung der Zusammenhänge geführt haben könnte. Ob die Berücksichtigung von Hörverstehen oder produktiver Sprachkompetenz tatsächlich einen zusätzlichen Beitrag zur Erklärung individueller Unterschiede in mathematischen Kompetenzverläufen liefert, sollte in weiteren Untersuchungen überprüft werden. Einschränkend ist zudem zu berücksichtigen, dass die gefundenen Zusammenhänge zwischen Lese- und Ma-
Nach Cohen (1988) wird ein Effekt ab d = 0.2 als klein, ab d = 0.5 als mittel und ab d = 0.8 als groß eingeschätzt.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
© 2016 Hogrefe Verlag
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
thematikkompetenz teilweise auf sprachliche Anforderungen der Testaufgaben zurückzuführen sein könnten (Abedi & Lord, 2001). Allerdings zeigten bisherige Studien, dass die Effekte, die auf die sprachlichen Anforderungen von Testaufgaben zurückzuführen sind, vergleichsweise gering sind (Abedi & Lord, 2001; Haag et al., 2014; Kieffer et al., 2009). Obwohl die Analysen der vorliegenden Studie gezeigt haben, dass Lesekompetenz ein signifikanter Prädiktor der mathematischen Kompetenzentwicklung aller Kinder ist, und die bestehenden Kompetenzunterschiede in Mathematik zwischen Kindern nicht-deutscher Familiensprache und deutscher Familiensprache größtenteils auf Lesekompetenz zurückführbar waren, vergrößerten sich die Disparitäten zwischen Kindern deutscher und Kindern nicht-deutscher Familiensprache nicht, sondern blieben über die Zeit hinweg konstant. Diese Befunde sind insgesamt konsistent mit den Ergebnissen von Chang et al. (2009), die zeigen konnten, dass unter Kontrolle des SES nur solche Zweitsprachlernende, die über gering ausgeprägte Kompetenzen in der Instruktionssprache verfügen, tatsächlich auch geringere Lernzuwächse in Mathematik erzielten. Gleichzeitig verdeutlichen die Ergebnisse der vorliegenden Studie auch, dass Kinder nicht-deutscher Familiensprache einer Kombination aus Risikofaktoren für ihre mathematische Kompetenzentwicklung ausgesetzt sind, da ihr durchschnittlicher SES und ihre durchschnittliche Lesekompetenz deutlich geringer ausgeprägt sind als die der Kinder deutscher Familiensprache. Für die schulische Praxis lässt sich aus den Befunden einerseits ableiten, dass kompensatorische Maßnahmen der Sprachförderung erfolgversprechend sein könnten, um die Leistungsunterschiede zwischen Kindern nichtdeutscher und Kinder deutscher Familiensprache in Mathematik zu reduzieren, anderseits lässt sich schlussfolgern, dass auch Kinder deutscher Familiensprache mit nicht ausreichenden Sprachkompetenzen von einer solchen Förderung profitieren könnten. Unklar bleibt jedoch weiterhin, welche Rolle die Gestaltung des Mathematikunterrichtes spielt (z. B. sog. sprachsensibler Unterricht) bzw. wie Sprachförderung gestaltet sein muss, um zu besseren Mathematikkompetenzen der Schülerinnen und Schüler beizutragen. Um diese Frage zu klären, wäre es notwendig, die sprachlichen Anforderungen in Mathematik genauer zu identifizieren, um sie in der didaktischen Ausgestaltung des Unterrichts berücksichtigen zu können (Prediger, 2013). Welche Maßnahmen tatsächlich geeignet sind, um Lernende mit geringen Sprachkompetenzen in ihrem mathematischen Kompetenzerwerb zu unterstützen, sollte anhand von kontrollierten Interventionsstudien untersucht werden.
© 2016 Hogrefe Verlag
39
Literatur Abedi, J. & Lord, C. (2001). The language factor in mathematics tests. Applied Measurement in Education, 14, 219 – 234. Baron, R. & Kenny, D. (1986). The Moderator – Mediator Variable Distinction in Social Psychological Research: Conceptual, Strategic, and Statistical Considerations. Journal of Personality and Social Psychology, 51, 1173 – 1182. Baumert, J., Becker, M., Neumann, M. & Nikolova, R. (2009). Frühübergang in ein grundständiges Gymnasium–Übergang in ein privilegiertes Entwicklungsmilieu? Ein Vergleich von Regressionsanalyse und Propensity Score Matching. Zeitschrift für Erziehungswissenschaft, 12, 189 – 215. Baumert, J., Nagy, G. & Lehmann, R. (2012). Cumulative advantages and the emergence of social and ethnic inequality: Matthew effects in reading and mathematics development within Elementary Schools? Child Development, 83, 1347 – 1367. Baumert, J. & Schümer, G. (2001). Familiäre Lebensverhälnisse, Bildungsbeteiligung und Kompetenzerwerb. In Deutsches PISAKonsortium (Hrsg.), PISA 2000: Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich (S. 323 – 410). Opladen: Leske + Budrich. Beal, C. R., Adams, N. M. & Cohen, P. R. (2010). Reading proficieny and mathematics problem solving by High School English language learners. Urban Education, 45 (1), 58 – 74. Becker, M., Lüdtke, O., Trautwein, U. & Baumert, J. (2006). Leistungszuwachs in Mathematik: Evidenz für einen Schereneffekt im mehrgliedrigen Schulsystem? Zeitschrift für pädagogische Psychologie, 20, 233 – 242. Behörde für Schule und Berufsbildung (Hrsg.). (2011), LAU–Aspekte der Lernausgangslage und der Lernentwicklung. Klassenstufe 5, 7 und 9. Münster: Waxmann. Bollen, K. A. & Curran, P. J. (2006). Latent curve models: a structural equation perspective. Hoboken, N. J.: Wiley-Interscience. Bos, W., Bremerich-Vos, A., Tarelli, I. & Valtin, R. (2012). Lesekompetenzen im internationalen Vergleich. In W. Bos, I. Tarelli, A. Bremerich-Vos & K. Schwippert (Hrsg.), IGLU 2011. Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich (S. 91 – 136). Münster: Waxmann. Bos, W., Lankes, E. M., Prenzel, M. Schwippert, K., Valtin, R. & Walther, G. (Hrsg.). (2003). Erste Ergebnisse aus IGLU. Schülerleistungen am Ende der vierten Jahrgangsstufe im internationalen Vergleich. Münster: Waxmann. Chang, M., Singh, K. & Filer, K. (2009). Language factors associated with achievement grouping in math classrooms: A crosssectional and longitudinal study. School Effectiveness and School Improvement, 20 (1), 27 – 45. Chlosta, C. & Ostermann, T. (2005). Warum fragt man nach der Herkunft, wenn man die Sprache meint? In BMBF (Hrsg.), Migrationshintergrund von Kindern und Jugendlichen: Wege zur Weiterentwicklung der amtlichen Statistik (S. 55 – 65). Bonn, Berlin. Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale; New Jersey u. a.: Lawrence Erlbaum Associates. Curran, P. J. & Hussong, A. M. (2002). Structural equation modeling of repeated measures data. In D. Moskowitz & S. Hershberger (Eds.), Modeling intraindividual variability with repeated measures data: Methods and applications (pp. 59 – 86). New York: Lawrence Erlbaum. DiPrete, T. A. & Eirich, G. M. (2006). Cumulative advantage as a mechanism for inequality: A review of theoretical and empirical developments. Annual Reviews, 32, 271 – 297. Duncan, G. J., Claessensa, A., Huston, A. C., Pagani, L. S., Engel, M., Sexton, H. et al. (2007). School readiness and later achievement. Developmental Psychology, 43, 1428 – 1446.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
40
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
Elbers, E. (2003). Classroom interaction as reflection: Learning and teaching mathematics in a community of inquiry. Educational Studies in Mathematics, 54 (1), 77 – 99. Ellerton, N. F. & Clarkson, P. C. (1996). Language factors in mathematics teaching and learning. In A. J. Bishop (Hrsg.), International handbook of mathematics education (S. 987 – 1033). Dordrecht: Kluwer academic publishers. Fan, X. (2001). Parental involvement and students’ academic achievement: A growth modeling analysis. The Journal of Experimental Education, 70 (1), 27 – 61. Ganzeboom, H. B. G. & Treiman, D. J. (2003). Three internationally standardised measures for comparative research on occupational status. In J. H. P. Hoffmeyer-Zlotnik & C. Wolff (Eds.), Advances in cross-national comparison: A European working book for demographic und socio-economic variables (pp. 159 – 193). New York: Kluwer. Grimm, K. J. (2008). Longitudinal associations between reading and mathematics. Developmental Neuropsychology, 33, 410 – 426. Gut, J., Reimann, G. & Grob, A. (2012). Kognitive, sprachliche, mathematische und sozial-emotionale Kompetenzen als Prädiktoren späterer schulischer Leistungen: Können die Leistungen eines Kindes in den IDS dessen Schulleistungen drei Jahre später vorhersagen? Zeitschrift für Pädagogische Psyvhologie, 26, 213 – 220. Haag, N., Heppt, B., Roppelt, A. & Stanat, P. (2014). Lingustic simplification of matematics items: Effects for language minority students in Germany. European Journal of Psychology of Education, Advance online publication. doi: 10.1007/s10212014-0233-6 Haag, N., Heppt, B., Stanat, P., Kuhl, P. & Pant. H. A. (2013). Second language learners performance in mathematics: Disentangling the effects of academic language features. Learning and Instruction, 1 – 40. Heinze, A., Herwartz-Emden, L. & Reiss, K. (2007). Mathematikkenntnisse und sprachliche Kompetenz bei Kindern mit Migrationshintergrund zu Beginn der Grundschulzeit. Zeitschrift für Pädagogik, 53, 562 – 581. Heller, K. A. & Perleth, C. (2000). Kognitiver Fähigkeitstest für 4. – 12. Klassen, Revision (KFT 4 12+ R). Göttingen: Hogrefe. Hu, L. T. & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling, 6 (1), 1 – 55. Institut zur Qualitätsentwicklung im Bildungswesen (o. J.). ELEMENT. Erhebung zum Lese- und Mathematikverständnis – Entwicklungen in den Jahrgangsstufen 4 bis 6 in Berlin. Skalenhandbuch. Zugriff am 07. 03. 2015 unter https://www.iqb.huberlin.de/fdz/studies/Element Jude, N. (2008). Zur Struktur von Sprachkompetenz. Dissertation. Johann Wolfgang Goethe-Universität Jena. Kempert, S., Saalbach, H. & Hardy, I. (2008). Der Zusammenhang zwischen mathematischer Kompetenz und Zweisprachigkeit bei türkisch-deutschen Grundschulkindern. In J. Ramseger & M. Wagener (Hrsg.), Chancenungleichheit in der Grundschule (S. 219 – 222). Wiesbaden: VS Verlag für Sozialwissenschaften. Kieffer, M. J., Lesaux, N. K., Rivera, M. & Francis, D. J. (2009). Accommodations for English language learners taking large-scale assessments: A meta-analysis on effectiveness and validity. Review of Educational Research, 79, 1168 – 1201. Klieme, E. (2004). Was sind Kompetenzen und wie lassen sie sich messen? Pädagogik, 56 (6), 10 – 13. KMK (2004). Beschlüsse der Kultusministerkonferenz: Bildungsstandards im Fach Mathematik für den Primarbereich. München: Luchterhand. Lee, J., Moon, S. & Hegar, R. L. (2011). Mathematics Skills in Early Childhood: Exploring Gender and Ethnic Pattern. Child Indicators Research, 4, 353 – 368.
Lehmann, R. H. & Lenkeit, J. (2008). Element. Erhebung zum Leseund Mathematikverständnis. Entwicklung in den Jahrgangsstufen 4 bis 6 in Berlin: Abschlussbericht über die Untersuchungen 2003, 2004 und 2005 an Berliner Grundschulen und grundständigen Gymnasien. Berlin: Humboldt-Universität zu Berlin. Lehmann, R. H. & Nikolova, R. (2005). Erhebung zum Lese- und Mathematikverständnis: Entwicklungen in den Jahrgangstufen 4 bis 6 in Berlin: Bericht über die Untersuchung 2003 an den Berliner Grundschulen und grundständigen Gymnasien. Berlin: Senatsverwaltung für Bildung, Jugend und Sport. Leucht, M., Retelsdorf, J., Möller, J. & Köller, O. (2010). Zur Dimensionalität rezeptiver englischsprachiger Kompetenzen. Zeitschrift für Pädagogische Psychologie, 24, 123 – 138. Leutner, D., Klieme, E., Meyer, K. & Wirth, J. (2004). Problemlösen. In M. Prenzel, J. Baumert, W. Blum, R. Lehmann, D. Leutner, M. Neubrand et al. (Hrsg.), PISA 2003: Der Bildungsstand der Jugendlichen in Deutschland – Ergebnisse des zweiten internationalen Vergleichs (S. 147 – 175). Münster: Waxmann. Lundberg, I. (2002). The child’s route into reading and what can go wrong. Dyslexia, 8, 1 – 13. Marx, H. & Jungmann, T. (2000). Abhängigkeit der Entwicklung des Leseverstehens von Hörverstehen und grundlegenden Lesefertigkeiten im Grundschulalter. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 32, 81 – 93. Mietzel, G. & Willenberg, H. (2000). HST 4/5. Hamburger Schulleistungstest für 4. und 5. Klassen. Göttingen: Hogrefe. Morgan, P. L., Farkas, G. & Wu, Q. (2011). Kindergarten children’s growth trajectories in reading and mathematics: Who falls increasingly behind? Journal of Learning Disabilities,44, 472 – 488. Muthén, B. O. & Muthén, L. K. (1998 – 2010). Mplus (Version 6.1) [Computer software]. Los Angeles, CA: Muthén & Muthén. Mücke, S. (2007). Einfluss personeller Eingangsvoraussetzungen auf Schülerleistungen im Verlauf der Grundschulzeit. In K. Möller et al. (Hrsg.), Qualität von Grundschulunterricht: Entwickeln, erfassen und bewerten (S. 277 – 280). Wiesbaden: VS Verlag für Sozialwissenschaften. Müller, A. & Stanat, P. (2006). Schulischer Erfolg von Schülerinnen und Schülern mit Migrationshintergrund: Analysen zur Situation von Zuwanderern aus der ehemaligen Sowjetunion und aus der Türkei. In J. Baumert, P. Stanat & R. Watermann (Hrsg.), Herkunftsbedingte Disparitäten im Bildungswesen. Vertiefende Analysen im Rahmen von PISA 2000 (S. 221 – 255). Wiesbaden: VS Verlag für Sozialwissenschaften. Novo, A. A. (2013). Analysis of multivariate normal datasets with missing values (Version 1.0 – 9.5). OECD (Ed.). (2002). Reading for change. Performance and engagement across countries. Results from PISA 2000. Retrieved September 17, 2014, from http://www.oecd.org/edu/school/pro grammeforinternationalstudentassessmentpisa/33690904.pdf Pimm, D. (1987). Speaking mathematically. Communication in mathematics classroom. London: Routledge & Kegan Paul. Pöhlmann, C., Haag, N. & Stanat, P. (2013). Zuwanderungsbezogene Disparitäten. In H. A. Pant, P. Stanat, U. Schroeders, A. Roppelt, T. Siegle & C. Pöhlmann (Hrsg.), IQB-Ländervergleich 2012: Mathematische und naturwissenschaftliche Kompetenzen am Ende der Sekundarstufe I (S. 297 – 329). Münster u. a.: Waxmann. Prediger, S. (2013). Darstellungen, Register und mentale Konstruktion von Bedeutungen und Beziehungen – mathematikspezifische sprachliche Herausforderungen identifizieren und bearbeiten. In M. Becker-Mrotzek, K. Schramm, E. Thürmann & H. J. Vollmer (Hrsg.), Sprache im Fach: Sprachlichkeit und fachliches Lernen (S. 167 – 182). Münster u. a.: Waxmann. Roberts, G. & Bryant, D. (2011). Early Mathematics Achievement Trajectories: English Language Learner and Native English-
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
© 2016 Hogrefe Verlag
J. Paetsch et al., Sprachkompetenz als Prädiktor mathematischer Kompetenzentwicklung von Kindern
Speaker Estimates, Using the Early Childhood Longitudinal Survey. Developmental Psychology, 47, 916 – 930. Schafer, J. L. (1999). NORM for Windows 95/98/NT: Multiple imputation of incomplete data under a normal model (Version 3.02) [Software]. Schmiedek, F. & Wolff, J. K. (2010). Latente Wachstumskurvenmodelle. In C. Wolf & H. Best (Hrsg.), Handbuch der sozialwissenschaftlichen Datenanalyse (S. 1017 – 1029). Wiesbaden: VS Verlag für Sozialwissenschaften. Schwippert, K., Wendt, H. & Tarelli, I. (2012). Lesekompetenzen von Schülerinnen und Schülern mit Migrationshintergrund. In W. Bos, I. Tarelli, A. Bremerich-Vos & K. Schwippert (Hrsg.), IGLU 2011: Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich (S. 191 – 207). Münster: Waxmann. Segeritz, M., Walter, O. & Stanat, P. (2010). Muster des schulischen Erfolgs von jugendlichen Migranten in Deutschland: Evidenz für segmentierte Assimilation? Kölner Zeitschrift für Soziologie und Sozialpsychologie, 62, 113 – 138. Sobel, M. E. (1982). Asymptotic confidence intervals for indirect effects in structural equation models. Sociological Methodology, 13, 290 – 312. Stanat, P. (2006). Disparitäten im schulischen Erfolg: Analysen zur Rolle des Migrationshintergrunds. Unterrichtswissenschaft, 34 (2), 98 – 124. Stanat, P., Rauch, D. & Segeritz, M. (2010). Schülerinnen und Schüler mit Migrationshintergrund. In E. Klieme, C. Artelt, J. Hartig, N. Jude, O. Köller, M. Prenzel et al. (Hrsg.), PISA 2009. Bilanz nach einem Jahrzehnt (S. 200 – 230). Münster: Waxmann. Tarelli, I., Schwippert, K. & Stubbe, T. C. (2012). Mathematische und naturwissenschaftliche Kompetenzen von Schülerinnen und Schülern mit Migrationshintergrund. In W. Bos, H. Wendt, O. Köller & C. Selter (Hrsg.), TIMSS 2011: Mathematische und
41
naturwissenschaftliche Kompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich (S. 247 – 267). Münster: Waxmann. Ufer, S., Reiss, K. & Mehringer, V. (2013). Sprachstand, soziale Herkunft und Bilingualität: Effekte auf Facetten mathematischer Kompetenz. In M. Becker-Mrotzek, K. Schramm, E. Thürmann & H. J. Vollmer (Hrsg.), Sprache im Fach: Sprachlichkeit und fachliches Lernen (S. 185 – 201). Münster: Waxmann. Verboom, L. (2008). Mit dem Rhombus nach Rom. Aufbau einer fachgebundenen Sprache im Mathematikunterricht der Grundschule. In C. Bainski & M. Krüger-Potratz (Hrsg.), Handbuch Sprachförderung (S. 95 – 112). Essen: Neue Deutsche Schule Verlag. Vilenius-Tuohimaa, P. M., Aunola, K. & Nurmi, J. (2008). The association between mathematical word problems and reading comprehension. Educational Psychology, 28, 409 – 426.
Jennifer Paetsch Dr. Anja Felbrich Prof. Dr. Rainer Lehmann Prof. Dr. Petra Stanat Humboldt-Universität zu Berlin Institut zur Qualitätsentwicklung im Bildungswesen (IQB) Unter den Linden 6 10099 Berlin Jennifer.Paetsch@hu-berlin.de Susanne Radmann Deutsches Institut für Internationale Pädagogische Forschung Warschauer Str. 34 – 38 10243 Berlin
Hogre efe Seminare Nutzen Sie unsere Kompeten nz! Ne N eben en Fa ach chli chli l te tera ratu tur bi bieten wir Ihnen ein ne br b eiite Pa Pale alle ett tte an an sta t nd dar ardi ard disi sierten Testverfahre en so sowi wie e Semi Se Sem mina nare re zu fo follg gen ende de d en Themen:
•
Intelllig igen en e nzdiagnostik
•
Pe Pers er ön önllichkeitsdiagno osttiik os ost
•
Sch Schu Sc hu ulllleiistungsdiagno no n os sttik ik
•
Pe errs son o al a auswahl und d Po Potte enz nzia iale lent len ntwi wic ck klu lung ng
www.hogrefe.de/seminare/ www ww
© 2016 Hogrefe Verlag
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 27–41
Originalarbeit
Stereotype Threat in der Grundschule Johanna Maria Hermann und Regina Vollmeyer Universität Frankfurt Zusammenfassung. Das Ziel der Studie war es zu untersuchen, ob bereits Grundschulkinder von Stereotype-Threat- beziehungsweise LiftEffekten in ihrer Mathematikleistung beeinflusst werden. Dazu wurde auf eine implizite Manipulation zurückgegriffen, um Geschlechtsstereotype zu aktivieren, bevor ein Mathematiktest absolviert wurde. Bei Mädchen sollte die Aktivierung zu einer schlechteren Leistung führen, während für Jungen ein Leistungsvorsprung erwartet wurde. An der Untersuchung nahmen 120 Viertklässler teil (66 männlich, 54 weiblich, Alter M = 9.24, SD = 0.61). Hypothesenkonform ergab sich eine signifikante Interaktion zwischen Geschlecht und Stereotypaktivierung bei schwierigen Aufgaben. Während Mädchen in der Stereotypgruppe schlechter abschnitten als Mädchen in der Kontrollgruppe, konnte bei den Jungen kein Leistungsunterschied beobachtet werden. Die Ergebnisse bestätigen, dass Geschlechtsstereotype implizit bereits in der Grundschule die Mathematikleistung von Mädchen beeinträchtigen können. Schlüsselwörter: Stereotype Threat, Mathematik, Grundschule, Geschlechtsstereotype, implizite Manipulation
Stereotype Threat in Primary School Abstract. The present study tested whether stereotype threat or stereotype lift effects can already be found in primary school children in their mathematics performance. An implicit manipulation was used to activate gender stereotypes before a math test was performed. We assumed that for girls this activation would lead to lower math test performance, whereas for boys we expected a performance boost compared with a control group. We included 120 fourth-grade students (66 male, 54 female, age M = 9.24 years, SD = 0.61) from three primary schools in the study. In accordance with our expectations, a significant interaction between gender and stereotype activation for difficult tasks was found. Girls in the stereotype group performed significantly lower than girls in the control group, whereas no difference was observed for the boys. The results indicate that gender stereotypes can have detrimental effects on girls’ mathematics performance even in primary school. Keywords: stereotype threat, mathematics, primary school, gender stereotypes, implicit manipulation
Ob ein T-Shirt für Mädchen bei einem Versandhaus mit der Aufschrift „In Mathe bin ich Deko“ oder eine Barbiepuppe, die den Satz sagt „Math is tough, let‘s rather go shopping“ – das Verhältnis der Mädchen zur Mathematik ist immer noch ein Thema, das Diskussionsstoff bietet. Auch wenn sich die Leistungen der Mädchen denen der Jungen mittlerweile angeglichen haben und diese in ihren gesamtschulischen Leistungen sogar übertreffen (Hannover & Kessels, 2011), zeigen sich in Mathematik bei internationalen Vergleichsstudien in Deutschland immer noch Geschlechtsunterschiede zu Gunsten der Jungen (Klieme et al., 2010), was sich später auch in der Wahl der beruflichen Karrieren widerspiegelt (QuaiserPohl, 2012). Diese Leistungsdiskrepanz wurde in einer aktuellen Studie sogar schon zu Beginn der Grundschule gefunden, während vor dem Schuleintritt noch keinerlei Leistungs- und Selbstkonzeptdifferenzen in Mathematik beobachtet werden konnten (Niklas & Schneider, 2012).
Für die Entwicklung dieser Leistungsunterschiede in Mathematik wurden verschiedene Erklärungen herangezogen, die von biologischen Modellen über psychosoziale Modelle, bis hin zu einer Kombination dieser beiden Ansätze reichen (Keller, 2002). Eine weitere Möglichkeit, diese Differenzen zu erklären, bietet das Phänomen des Stereotype Threat (Steele & Aronson, 1995), bei dem die Ursache für solche Leistungsunterschiede stärker in situativen Einflussfaktoren vermutet wird. Existiert in der Gesellschaft ein negatives Stereotyp über die Fähigkeiten einer bestimmten Gruppierung, wie zum Beispiel die eingangs erwähnte Annahme über die geringe mathematische Fähigkeit von Frauen, so sehen sich Mädchen ab dem ersten Kontakt mit dieser Domäne mit negativen Erwartungen konfrontiert. Diese Konfrontation kann zum einen zu der Befürchtung führen, auf Basis dieses negativen Stereotyps beurteilt zu werden und/oder dieses durch die eigenen Handlungen zu bestätigen. So entsteht eine situative Bedrohung, die insbesondere in Situationen, in
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 42–49 DOI: 10.1026/0049-8637/a000143
© 2016 Hogrefe Verlag
J. M. Hermann & R. Vollmeyer, Stereotype Threat in der Grundschule
denen Personen an ihre Leistungsgrenze stoßen, dazu führt, dass die Betroffenen schlechter abschneiden als sie eigentlich könnten (Keller, 2007), da notwendige Ressourcen des Arbeitsgedächtnisses an aufgabenirrelevante Kognitionen gebunden sind (Schmader, Johns & Forbes, 2008). Wie diese erhöhte mentale Belastung im Einzelnen zu Stande kommt, wird aktuell noch viel diskutiert, wobei davon auszugehen ist, dass kognitive, affektive und motivationale Prozesse dabei ineinander greifen. Neben der erhöhten kognitiven Arbeitsgedächtnisbelastung, erwiesen sich unter anderem erhöhte Ängstlichkeit (Spencer, Steele & Quinn, 1999) und Frustration (Keller & Dauenheimer, 2003) sowie eine höhere Tendenz zum self-handycapping (Keller, 2002) als vermittelnde Variablen des Stereotype Threat. Eine Langzeitfolge solcher situativen Misserfolge in Mathematik kann dann jedoch auch die langfristige Distanzierung von dieser Domäne sein (Steele, 1997), was sowohl Geschlechtsunterschiede im mathematischen Selbstkonzept (Schilling, Sparfeldt & Rost, 2006) stabilisieren als auch die geringere Zahl der Frauen in den entsprechenden Berufsfeldern erklären könnte. Stereotype haben allerdings nicht nur negative Auswirkungen auf die Leistungsfähigkeit. Sind Personen durch die negative Stereotypisierung anderer indirekt positiv betroffen, kann daraus eine Steigerung der Leistungsfähigkeit folgen, was Walton und Cohen (2003) als Stereotype Lift bezeichneten. So impliziert die Abwertung der Mädchen in Mathematik indirekt, dass Jungen begabter sind und folglich von diesem Stereotyp profitieren können. Der Stereotype-Threat-Effekt in Mathematik erscheint in der Literatur als stabiles Phänomen (mittlere Effektstärke d = 0.36, nach einer Metaanalyse von Nguyen & Ryan, 2008). Domänenübergreifend konnten StereotypeThreat-Effekte in über 300 experimentellen Studien nachgewiesen werden (Appel, Kronberger & Aronson, 2011), während der Stereotype-Lift-Effekt weitaus seltener und auch mit geringerer Effektstärke (d = 0.24) gefunden wurde (Walton & Cohen, 2003). Sowohl Stereotype-Threat- als auch Lift-Effekte wurden bislang allerdings überwiegend im Labor in Einzeltestungen untersucht, während nur wenige Studien im realen Klassenkontext erfolgten (z.B. Huguet & Régner, 2007; Keller, 2007; Keller & Dauenheimer, 2003). Dabei erscheint dieser Aspekt gerade bei Kindern und Jugendlichen von besonderer Bedeutung zu sein, da sie an ihrer Peergroup orientiert sind, um ihre Persönlichkeit, Interessen und Kompetenzen weiter auszubilden (Krüger & Grunert, 2008). Zudem wurden die meisten Studien mit älteren Schülern (ab Sekundarstufe I) durchgeführt, sodass die Frage offen bleibt, ab welchem Alter Kinder in ihrer Leistungsfähigkeit von Stereotypen beeinflusst werden. © 2016 Hogrefe Verlag
43
Entwicklungspsychologisch wird vermutet, dass schon Säuglinge in einem Alter von zehn Monaten über primitive Stereotype verfügen, da sie einfache Assoziationen zwischen geschlechtstypischen Objekten und den entsprechenden Gesichtern herstellen können (Levy & Haaf, 1994). Die ersten rudimentären Geschlechtsstereotype werden dann im zweiten Lebensjahr gebildet (Kuhn, Nash & Brucken, 1978) und entwickeln sich im Alter von drei Jahren zu basalen Stereotypen weiter, die sich vorwiegend noch auf äußere, offensichtliche Geschlechtsmerkmale, wie Aussehen, typische Rollenverhaltensweisen oder Berufe beziehen (Martin & Ruble, 2004). Mit zunehmendem Alter erweitern sich Anzahl und Bereiche, in denen Kinder über Stereotype verfügen (Sinno & Killen, 2009). Gleichzeitig werden die Stereotype im Entwicklungsverlauf aber auch flexibler, nachdem sie den Höhepunkt der Rigidität am Beginn der Grundschulzeit überwunden haben (Trautner et al., 2005). Trotz dieser Flexibilisierung kann jedoch noch bis in die frühe Adoleszenz ein positiver Bias zu Gunsten des eigenen Geschlechts beobachtet werden (Yee & Brown, 1994), insbesondere wenn emotionale Aspekte der Einstellung gegenüber den Geschlechtern fokussiert werden (Martin & Ruble, 2009; Zosuls et al., 2011). Auf der anderen Seite entwickelt sich in diesem Alter aber auch zunehmend ein Bewusstsein darüber, dass beide Geschlechter in der Gesellschaft unterschiedlich angesehen werden (Halim, Ruble & Amodio, 2011), was einen entscheidenden Entwicklungsschritt für den Einfluss der Stereotype auf das eigene Verhalten darstellt. Trotz dieser rasanten Entwicklungsschritte hinsichtlich der Differenzierung der kognitiven Stereotyprepräsentationen, die als Voraussetzung für einen Stereotype-Threat betrachtet werden, existieren bislang nur wenige Studien zu dem Phänomen bei Grundschülern im Bereich Mathematik (Ambady, Shih, Kim & Pittinsky, 2001; Muzzatti & Agnoli, 2007; Neuville & Croizet, 2007; Tomasetto, Alaparone & Cadinu, 2011). Ambady et al. (2001) untersuchten als erste, wie sich das negative Stereotyp mathematischer Unterlegenheit von Mädchen auf die Leistungsfähigkeit von Kindern unterschiedlicher Altersstufen (5-7, 810 und 11-13 Jahre) auswirkt. Im Gegensatz zu den meisten Studien mit Erwachsenen, in denen Stereotype zumeist explizit über die Erwähnung vermeintlicher Geschlechtsunterschiede in Mathematik manipuliert werden, wurde in dieser Studie auf eine implizite Manipulation zurückgegriffen. Dabei sollten die Kinder entweder eine stereotype Zeichnung ausmalen (5-7 Jahre) oder einen Fragebogen ausfüllen, der Items zum Geschlecht enthielt und damit zum Nachdenken über Stereotype anregen sollte (8–13 Jahre). Die Ergebnisse zeigten, dass diese implizite Aktivierung der Geschlechtsstereotype bei den Jungen aller drei Altersstufen zu dem erwarteten
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 42–49
44
Leistungsvorsprung gegenüber der Kontrollgruppe führte, während sich der prognostizierte Leistungseinbruch bei den Mädchen nur für die jüngsten und ältesten Mädchen zeigte. Die Mädchen der mittleren Altersgruppe profitierten hingegen von der Aktivierung ihres Geschlechtsstereotyps, sodass ihre Leistung die der Kontrollgruppe übertraf. Im Gegensatz dazu konnten Muzzatti und Agnoli (2007) auch in dieser Altersstufe, also bei zehnjährigen Mädchen, einen Stereotype-Threat-Effekt nachweisen. Neuville und Croizet (2007) replizierten teilweise den Befund von Ambady et al. (2001) für Kinder der jüngsten Altersstufe in einem realen Klassenkontext. Zudem konnten sie zusätzlich zeigen, dass Stereotype-Threat, ähnlich wie bei älteren Probanden, nur bei schwierigen Aufgaben auftritt (Keller, 2007; Spencer et al., 1999), da fehlende Arbeitsgedächtnisressourcen hier vermutlich besonders stark ins Gewicht fallen. Während die Mädchen bei den schweren Aufgaben durch die Aktivierung ihres Geschlechtsstereotyps bei dem Mathematiktest signifikant schlechter abschnitten, erzielten sie bei den einfachen Aufgaben sogar bessere Ergebnisse als die Kontrollgruppe. Als vermittelnden Prozess betrachten die Autoren dabei ein erhöhtes Arousal, das bei leichten Aufgaben zwar förderlich, bei schweren Aufgaben aber leistungshemmend wirkt (O’Brien & Crandall, 2003). Auf die Leistung der Jungen hatte die Manipulation in dieser Studie unabhängig von der Aufgabenschwierigkeit keinen Einfluss. Da die Befundlage nicht eindeutig ist, besteht das Ziel der vorliegenden Studie darin zu überprüfen, ob sich Stereotype-Threat- beziehungsweise Stereotype-Lift-Effekte auch bei deutschen Grundschulkindern niederschlagen. Dabei gehen wir in Übereinstimmung mit bisherigen Befunden (Keller, 2007; Neuville & Croizet, 2007; Spencer et al., 1999) davon aus, dass diese Effekte bei einer höheren Aufgabenschwierigkeit zu beobachten sind, während bei einfachen Aufgaben kein Stereotype-Threat-Effekt auftritt. Zudem fokussiert diese Untersuchung Kinder am Ende der Primarstufe, da die Befundlage insbesondere in diesem Altersbereich unklar ist. In allen bisherigen Studien mit Grundschülern wurden implizite Manipulationsmethoden eingesetzt, deren Erfolg allerdings in keiner der Studien (Ambady et al., 2001; Muzzatti & Agnoli, 2007; Neuville & Croizet, 2007) belegt werden konnte. Während zum Teil kein Manipulationscheck berichtetet wurde (Muzzatti & Agnoli, 2007; Neuville & Croizet, 2007), ergab sich bei Ambady et al. (2001) ein unklares Bild. Die Manipulation wurde in dieser Studie zum einen implizit über die Auswertung der Personalpronomen überprüft, die zur Nacherzählung einer Geschichte über ein mathematisch begabtes Kind verwendet wurden. Zum anderen erfolgte eine explizite Überprüfung der Manipulation, bei der die Kinder gefragt
J. M. Hermann & R. Vollmeyer, Stereotype Threat in der Grundschule
wurden, ob Jungen oder Mädchen besser in Mathematik, beziehungsweise beide Geschlechter gleich gut seien. Während die Jungen aller Altersstufen beim impliziten Manipulationscheck signifikant häufiger einen Jungen beschrieben, waren dies bei den Mädchen in allen Altersstufen nur knapp die Hälfte. Bei expliziter Befragung gaben hingegen die meisten Kinder beider Geschlechter an, dass Mädchen und Jungen gleich gut in Mathematik seien – ein Befund, den auch Tomasetto et al. (2011) in ihrer Studie fanden. Daher soll in dieser Studie ein zusätzlicher Fokus auf die Überprüfung der impliziten Manipulation gelegt werden, indem eine neue Methode zum Einsatz kommt, die das Ausmaß der geschlechtsstereotypen Aktivierung indirekt erfassen soll, bevor folgende Hypothesen überprüft werden: Für schwere Mathematikaufgaben wird eine Interaktion zwischen Experimentalgruppe und Geschlecht erwartet. Stereotype-Threat-Hypothese: Mädchen in der Stereotypgruppe schneiden bei den schweren Mathematikaufgaben schlechter ab als Mädchen in der Kontrollgruppe. Stereotype-Lift-Hypothese: Jungen in der Stereotypgruppe schneiden bei den schweren Mathematikaufgaben besser ab als Jungen in der Kontrollgruppe.
Methode Stichprobe und Design. An der Untersuchung nahmen N = 120 Viertklässler (55% Jungen) aus drei Grundschulen teil, die sich auf neun verschiedene Klassen verteilten. Die Probanden waren im Alter von 8-12 Jahren (M = 9.24, SD = 0.61). Die aktive Einverständniserklärung der Lehrer und Eltern wurde vor der Untersuchung eingeholt. Im Klassenkontext bearbeiteten die Kinder zwei unterschiedliche Aufgaben, wobei erstere der Manipulation, also der Aktivierung der Geschlechtsstereotype, diente, während mit der zweiten Aufgabe die abhängige Variable Mathematikleistung erfasst wurde. Für das Experiment ergab sich somit ein 2 (Geschlecht) x 2 (Stereotyp; aktiviert vs. nicht aktiviert) Design. Die Zuteilung zu der Stereotypaktivierung erfolgte dabei innerhalb jeder einzelnen Klasse zufällig, sodass 65 Kinder der Experimentalgruppe (Jungen n = 35; Mädchen n = 30) und 55 Kinder der Kontrollgruppe (Jungen n = 31; Mädchen n = 24) zugeordnet wurden. Unabhängige Variablen. Bei den unabhängigen Variablen handelte es sich zum einen um das Geschlecht (männlich, weiblich), zum anderen um die Experimentalbedingung, in der entweder Geschlechtsstereotype aktiviert wurden (Stereotypgruppe; SG) oder nicht (KontrollGruppe; KG). Die Manipulation erfolgte dabei in Anleh-
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 42–49
© 2016 Hogrefe Verlag
J. M. Hermann & R. Vollmeyer, Stereotype Threat in der Grundschule
45
Abbildung 1. Manipulationsmaterialien. Folgende Eigenschaften, die in gemischter Reihenfolge unter den Bildern aufgeführt waren, konnten den Figuren zugeordnet werden: gefühlvoll, romantisch, fleißig, verständnisvoll, einfühlsam (♀ positiv); kameradschaftlich, humorvoll, mutig, sportlich, stark (♂ positiv); zickig, nachtragend, eitel, hinterlistig, lästernd (♀ negativ); unordentlich, faul, angeberisch, gewaltfreudig, aggressiv (♂ negativ), entnommen aus dem Geschlechtsrollen-Selbstkonzept-Inventar für Jugendliche (Krahé, Berger & Möller, 2007).
nung an andere Studien mit Kindern indirekt über visuelles Material (z.B. Ambady et al., 2001), das in Abbildung 1 dargestellt wird. Während die Experimentalgruppe eine geschlechtsstereotype Manga-Figur hinsichtlich ihrer potentiellen Eigenschaften zu beurteilen hatte, erhielt die Kontrollgruppe eine geschlechtsneutrale Manga-Figur, die sie hinsichtlich der gleichen Eigenschaften einschätzen sollte. Bezüglich der stereotypen Figuren handelte es sich bei den Mädchen um ein „verliebtes Schulmädchen“ und bei den Jungen um einen „aktiven Kämpfer“, während die Kontrollgruppe das geschlechtsneutrale Fabelwesen „Pikachu“ beurteilte. Die 20 Eigenschaften, die dafür unter dem Bild zur Auswahl standen, wurden dem Geschlechtsrollen-Selbstkonzept-Inventar für Jugendliche (Krahé, Berger & Möller, 2007) entnommen, in dem sowohl positive als auch negative weibliche (einfühlsam, zickig) und männliche Attribute (stark, faul) aufgeführt sind. Manipulationscheck. Die Überprüfung der Manipulation erfolgte über die Eigenschaften, die den Figuren von den Kindern zugeordnet wurden. Die relative Anzahl männlicher und weiblicher Eigenschaften fungierte dabei als Indikator für die Aktivierungsstärke der Geschlechtsstereotype. Abhängige Variable. Der Mathematiktest bestand aus 18 Aufgaben, die vier mathematische Themenbereiche abdeckten (Addition: 4 Items, Subtraktion: 4 Items, Multiplikation: 4 Items und Sachrechnungen: 6 Items). Da die Erhebung im ersten Schulhalbjahr erfolgte, wurde auf Aufgaben aus dem DEMAT 3+ (Roick, Gölitz & Hasselhorn, 2004) zurückgegriffen, der für das Ende der dritten Klasse beziehungsweise den Beginn der vierten Klasse konzipiert ist. Aufgrund der vorwiegend mittleren Aufgabenschwierigkeit in diesem Test wurden zusätzlich drei weitere Aufgaben aus dem Känguru-Mathematikwettbewerb und den VERA-Schulvergleichsaufgaben für die entsprechende Altersstufe ergänzt, um die Testschwierigkeit zu erhöhen. Eine Aufgabe galt als gelöst, wenn das richtige Ergebnis errechnet war. Lösungswege wurden bei © 2016 Hogrefe Verlag
der Auswertung nicht berücksichtigt. Der für diese Untersuchung zusammengestellte Rechentest verfügte über eine gute Reliabilität (Cronbachs a = .78). Versuchsablauf. Nach einer kurzen Begrüßung durch die Versuchsleiterin wurde den Kindern einer Schulklasse angekündigt, dass sie im Folgenden zwei Aufgaben zu bearbeiten hätten. Im Anschluss daran wurden die Testhefte mit den Stereotyp-Manipulationsmaterialien randomisiert an die Kinder ausgeteilt, wobei Jungen entweder „Pikachu“ oder den „aktiven Kämpfer“ und Mädchen entweder „Pikachu“ oder das „verliebte Schulmädchen“ erhielten. Als erstes wurde die Manipulationsaufgabe bearbeitet, bei der die Kinder durch Unterstreichen entscheiden konnten, welche Eigenschaften ihre jeweilige Figur am besten charakterisieren. Unklare Begriffe wurden vorab in einem kurzen Klassengespräch geklärt, sodass das Verständnis der Adjektive sichergestellt werden konnte. Für die Bearbeitung dieser Aufgabe standen den Kindern fünf Minuten zur Verfügung. Wer vor Ablauf der Zeit schon fertig war, durfte das Bild ausmalen. Danach erfolgte die Durchführung des Mathematiktests entsprechend der zeitlichen und instruktionalen Vorgaben im Testmanual. Insgesamt ergab sich daraus eine Gesamtbearbeitungszeit von 18 Minuten. Zum Abschluss wurden die demographischen Daten erfasst und jedes Kind erhielt eine Süßigkeit als Belohnung für seine Teilnahme.
Ergebnisse Manipulationscheck. Bevor die Hypothesen getestet wurden, erfolgte zunächst die Überprüfung der Manipulation. Dafür wurde die Anzahl maskuliner und femininer Eigenschaften bestimmt, die den jeweiligen Figuren zugeschrieben wurden. Im Anschluss daran wurde ein Differenzwert gebildet, für den die Anzahl maskuliner Eigenschaften von der Anzahl femininer abgezogen wurde, um den relativen Wert geschlechtsstereotyper Aktivierung zu
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 42–49
46
J. M. Hermann & R. Vollmeyer, Stereotype Threat in der Grundschule
Tabelle 1. Aufteilung der Mathematikaufgaben in leichte und schwere Aufgaben entsprechend der ermittelten Aufgabenschwierigkeit Aufgabenbereich
Aufgabenschwierigkeit P N = 120
Quelle
Addition Item 1
.95
Item 2
.77
Item 3
.66
Item 4
.54
DEMAT 3+
Subtraktion Item 1
.70
Item 2
.72
Item 3
.74
Item 4
.41
DEMAT 3+
Multiplikation Item 1
.93
Item 2
.74
Item 3
.75
Item 4
.66
DEMAT 3+
Sachrechnungen Item 1
.85
DEMAT 3+
Item 2
.68
Item 3
.57
Item 4
.38
VERA (2011) Aufgabe Fotoalbum*
Item 5
.01
VERA (2011) Aufgabe Reißzwecken*
Item 6
.21
Känguru-Wettbewerb (2013) Aufgabe B3*
Anmerkungen: Grau hinterlegt = schwere Aufgaben. * Vorgabe ohne Antwortalternativen.
berechnen und zu überprüfen, ob das jeweilige Manipulationsmaterial die entsprechenden Stereotype aktiviert. Positive Werte repräsentieren somit die Aktivierung femininer Geschlechtsstereotype und negative Werte die Aktivierung maskuliner Geschlechtsstereotype. In der einfaktoriellen Varianzanalyse mit den Differenzwerten als abhängige Variable zeigten sich signifikante Unterschiede zwischen den vier Experimentalbedingungen, F (3,116) = 39.75, p < .001: In den gezielten Kontrastanalysen wurde deutlich, dass Mädchen in der Stereotypgruppe ihre Figur signifikant femininer (M = 1.90, SD = 2.26) beurteilten als Mädchen in der Kontrollgruppe (M = -1.63, SD = 1.88), t (116) = 6.77, p = .005, während Jungen in der Stereotypgruppe (M = -3.11, SD = 1.97) ihrer Figur im Vergleich zur männlichen Kontrollgruppe (M = -1.77, SD = 1.38) signifikant mehr maskuline Eigenschaften zuordneten, t (116) = -2.86, p < .001. Zwischen der männlichen und weiblichen Kontrollgruppe bestand hingegen kein signifikanter Unterschied in der Auswahl der Adjektive, t (116) = 0.29, p = .77. Hypothesenprüfung. Um die Stereotype-Threat- und Lift-Hypothese zu testen, wurden zunächst die schwierigeren Aufgaben des Mathematiktests anhand der Lösungswahrscheinlichkeiten identifiziert. In Anlehnung an vorherige Studien (Keller, 2007; Tomasetto et al., 2011)
wurden dazu die leichten Aufgaben mit einer Lösungswahrscheinlichkeit ab 70% ausgeschlossen, sodass die verbliebenen Items des Mathematiktests zu einem neuen Score zusammengefasst wurden. Wie in Tabelle 1 ersichtlich, konnten mit diesem Kriterium genau 50% der schwierigsten Aufgaben ermittelt werden, wobei zudem auch beachtet wurde, dass noch alle mathematischen Themenbereiche enthalten waren. Die Ergebnisse der Varianzanalyse mit den schwereren Mathematikaufgaben als abhängige Variable sind in Abbildung 2 ersichtlich. Hypothesenkonform ergab sich eine signifikante Interaktion zwischen Geschlecht und Stereotyp-Aktivierung, F (1,116) = 3.78, p = .05, y2 = .03: In den fokussierten Kontrastanalysen zeigte sich, dass Mädchen, bei denen Geschlechtsstereotype aktiviert wurden, im Sinne eines Stereotype-Threat bei den schweren Aufgaben signifikant schlechter abschnitten (M = .43, SD = .21) als Mädchen in der Kontrollgruppe (M = .55, SD = .18), t (116) = 2.09, p = .04, d = 0.61. Bei den Jungen bestätigte sich dagegen die Lift-Effekt-Hypothese nicht, t (116) = .58, p = .56, d = 0.14. Bei den leichten Aufgaben zeigte sich hingegen keine signifikante Geschlecht x Stereotyp-Aktivierung Interaktion, F (1,116) = 1.34, p = .25, y2 = .01, was die Annahme
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 42–49
© 2016 Hogrefe Verlag
J. M. Hermann & R. Vollmeyer, Stereotype Threat in der Grundschule
Abbildung 2. Leistung der Kinder bei den schweren Mathematikaufgaben getrennt nach Geschlecht und Experimentalgruppe mit Angabe der jeweiligen Standardabweichungen.
bestätigt, dass die Leistung nur bei schwierigen Aufgaben beeinträchtigt wurde. Die Mädchen der Kontrollgruppe schnitten bei den leichten Aufgaben zwar ebenfalls besser ab (M = .88, SD = .21) als die Mädchen in der Stereotypgruppe (M = .78, SD = .22), was sich in den Kontrastanalysen jedoch nicht als signifikanter Leistungsunterschied erwies, t (116) = 1.17, p = .08, d = .50, wenn auch eine mittlere Effektstärke zu beobachten war. Bei den Jungen waren die Leistungen bei den leichten Aufgaben nahezu identisch, t (116) = .18, p = .96. Haupteffekte für das Geschlecht und die Experimentalgruppe konnten weder in der Varianzanalyse mit den einfachen, noch mit den schwereren Aufgaben gefunden werden.
Diskussion Ziel der vorliegenden Untersuchung war es, im Klassenkontext zu überprüfen, ob Stereotype bereits im Grundschulalter Einfluss auf die mathematische Leistungsfähigkeit haben. Ausgehend von dem StereotypeThreat-Ansatz (Steele & Aronson, 1995) wurde angenommen, dass Mädchen durch die Aktivierung femininer Geschlechtsstereotype schlechtere mathematische Leistung erbringen als eine weibliche Kontrollgruppe. Im Gegensatz dazu wurde bei den Jungen ein Leistungsvorsprung gegenüber der männlichen Kontrollgruppe durch die Aktivierung maskuliner Stereotype erwartet. Beide Effekte wurden dabei nur für die schwierigen Mathematikaufgaben angenommen. Im Einklang mit bisherigen Studien (Ambady et al., 2001; Muzzatti & Agnoli, 2007; Neuville & Croizet, 2007; Tomasetto et al., 2011) konnte gezeigt werden, dass Ste© 2016 Hogrefe Verlag
47
reotype-Threat-Effekte auch schon bei Grundschülern beobachtet werden können. Im Gegensatz zu Ambady et al. (2001), die nur für junge Kinder und Jugendliche in der Präpubertät einen Stereotype-Threat-Effekt bei Mädchen nachweisen konnten, stellte sich in dieser Studie im Einklang mit den Befunden von Muzzatti und Agnoli (2007) auch bei Mädchen der mittleren Altersgruppe ein leistungsmindernder Effekt ein. Die Effektstärke für diesen Befund lag zudem deutlich über der mittleren Effektstärke, die in der Metaanalyse von Nguyen und Ryan (2008) berichtet wird. Ambady et al. (2001) begründen den abweichenden Befund in der mittleren Altersgruppe mit der entwicklungspsychologischen Besonderheit, dass Mädchen diesen Alters vorübergehend eine starke Identifikation mit maskulinen Attributen entwickeln, wenn sie sich des geringeren gesellschaftlichen Status von Frauen gewahr werden (Halim et al., 2011) – ein Phänomen, das aber vermutlich nicht auf alle Mädchen zutrifft. Zudem ist es auch möglich, dass methodische Unterschiede in den Studien zu den diskrepanten Befunden geführt haben. Während die Untersuchung von Ambady et al. (2001) in einem Einzelsetting mit einer weiblichen Versuchsleiterin stattfand, erfolgten die Erhebung von Muzzatti und Agnoli (2007) und das vorliegende Experiment im Klassenkontext, sodass die Anwesenheit der Jungen den Stereotype Threat verstärkt haben könnte (Stangor, Carr & Kiang, 1998). Zudem wurden in allen Studien unterschiedliche Manipulationsmethoden verwendet, was ebenfalls zu der heterogenen Befundlage beigetragen haben könnte. Abgesehen davon erfolgte in keiner der beiden Studien eine differenzierte Berücksichtigung der Aufgabenschwierigkeit, die in der vorliegenden Studie einen entscheidenden Einfluss hatte. Hypothesenkonform und in Übereinstimmung mit bisherigen Befunden (Keller, 2007; Neuville & Croizet, 2007; Spencer et al., 1999) ergab sich ein Stereotype Threat nur bei schweren Aufgaben, während sich bei leichten Aufgaben zwar auch ein Unterschied in die gleiche Richtung zeigte, der jedoch nicht signifikant war. Eine Überlegenheit der negativ stereotypisierten Mädchen bei leichten Aufgaben (Neuville & Croizet, 2007) konnte demnach nicht bestätigt werden. Entgegen der Erwartung zeigte sich durch die Konfrontation mit maskulinen Stereotypen kein Lift-Effekt bei den Jungen (Neuville & Croizet, 2007). Dieser wird jedoch auch bei erwachsenen Probanden wesentlich seltener gefunden und die in der Literatur berichtete Effektstärke weist auf einen schwachen Effekt (d = .24; Walton & Cohen, 2003) hin, der nur leicht über der in unserer Studie gefundenen Effektstärke liegt (d = .14). Hinsichtlich der gemischten Befundlage bezüglich der leistungssteigernden Wirkung von Stereotypen wird mittlerweile auch diskutiert, ob die positiven Erwartungen auf die Betroffenen in manchen Fällen auch Druck ausüben könn-
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 42–49
48
ten, der eher negative Effekte auf die Leistung ausüben würde (Tagler, 2012). Dabei beziehen sich die Autoren auf ein Phänomen, das als „choking under pressure“ bezeichnet wird und Leistungseinbrüche von Personen beschreibt, von denen besonders Exzellentes erwartet wird (Baumeister, 1984). Zudem konnte gezeigt werden, dass männliche Probanden in einer Stereotype-Threat-Bedingung bessere Leistungen erzielen als in einer Lift-Bedingung, während Frauen eher versagten, wenn ihnen Fähigkeiten abgesprochen wurden und durch positiven Zuspruch in ihren Leistungen profitierten (Johnson, Barnard-Brak, Saxon & Johnson, 2012). Im Vergleich zu den bisherigen Studien ist der Versuch gelungen, die implizite Manipulation, also die Aktivierung geschlechtsstereotyper Eigenschaften, aufzuzeigen. Dass automatische Assoziationen in einer stereotypen Situation das mathematische Leistungsvermögen verändern, konnte mit dem Implicit Association Test (IAT; Greenwald, McGhee & Schwarz, 1998) sogar schon bei Erstklässlern in einem Einzelsetting nachgewiesen werden (Galdi, Cadinu & Tomasetto, 2013). Diese geschlechtsspezifischen Auswirkungen der Stereotype und deren impliziter Einfluss auf das Leistungspotential sollten insbesondere im Hinblick auf mögliche Interventionen berücksichtigt werden, da auch schon die Nivellierung von Geschlechtsunterschieden automatische Assoziationen über diese anregen. Erschwerend kommt hinzu, dass selbst Personen, die das negative Stereotyp nicht für wahr halten, in ihrer Leistungsfähigkeit beeinträchtigt werden können (Ambady et al., 2001; Bargh, Chen & Burrows, 1996; Galdi et al., 2013). Abgesehen davon gibt es relativ wenige Studien, die sich explizit damit beschäftigen, welche Auswirkungen Interventionen, wie zum Beispiel die Aufklärung über Stereotype (Johns, Schmader & Martens, 2005) oder ein gegenstereotypes Rollenmodell (McIntyre, Paulsen & Lord, 2003), auf die Gruppe haben, die nicht von dem negativen Stereotyp betroffen ist. Zwar konnte gezeigt werden, dass auch Jungen von einem positiven weiblichen Rollenmodell in ihren räumlichen Fähigkeiten profitieren, allerdings hatte die Intervention keinen leistungssteigernden Effekt auf die Mädchen (Neuburger, Ruthsatz, Jansen, Heil & Quaiser-Pohl, 2013). Aus diesem Grund wäre es wichtig, die geschlechtsspezifischen Effekte der unterschiedlichen Interventionsformen, die dem Stereotype Threat entgegen wirken sollen, in Zukunft genauer zu erforschen und dabei auch vermittelnde Prozesse zu berücksichtigen. Dazu werden aktuell sehr viele verschiedene Mediatoren, nämlich physiologische, kognitive und motivationale Prozesse postuliert (Schmader et al., 2008), bei denen noch zu klären bleibt, inwiefern diese Mechanismen auf Kinder übertragbar sind und auf Jungen und Mädchen gleichermaßen
J. M. Hermann & R. Vollmeyer, Stereotype Threat in der Grundschule
zutreffen. Zusätzlich müsste auch untersucht werden, ob Stereotype-Threat-Effekte bei allen mathematischen Aufgabenstellungen gleichermaßen auftreten. Zwar wurde in der vorliegenden Untersuchung darauf geachtet, Aufgaben aus allen Bereichen (Addition, Subtraktion, Multiplikation und Sachrechnungen) zu berücksichtigen, der Schwerpunkt verschob sich jedoch durch die Berücksichtigung der Aufgabenschwierigkeit auf die Sachrechnungen. Dennoch verdeutlichen die Ergebnisse dieser Studie, wie wichtig es ist, angehende Lehrkräfte für den Einfluss von Stereotypen auf Leistung zu sensibilisieren. Ebenso sollten diese Erkenntnisse in die Gestaltung der Lernmaterialien einfließen, die zum Teil auch heute noch maskuline Konnotationen tragen (Bal, 2010; Sheldon, 2004), damit Mädchen nicht schon früh in der Entfaltung ihres Leistungspotentials behindert werden. Ob dabei die Veränderungen im mathematischen Selbstkonzept zu Beginn der Grundschulzeit als Ursache erhöhter Empfänglichkeit für Stereotype Threat oder als Folge davon betrachtet werden müssen, sollte in zukünftigen Längsschnittstudien genauer geklärt werden.
Literatur Ambady, N., Shih, M., Kim, A. & Pittinsky, T. L. (2001). Stereotype susceptibility in children: Effects of identity activation on quantitative performance. Psychological Science, 12, 385–390. Appel, M., Kronberger, N. & Aronson, J. (2011). Stereotype threat impairs ability building: Effects on test preparation among women in science and technology. European Journal of Social Psychology, 41, 904–913. Bal, M. (2010). Mädchen und Mathematik. Untersuchungen aktueller Schulbücher zum Mathematikunterricht nach Geschlechtsstereotypen. Master-Thesis, Freie Universität. Berlin. Bargh, J., Chen, M. & Burrows, L. (1996). Automaticity of social behavior: Direct effects of trait construct and stereotype activation on action. Journal of Personality and Social Psychology, 71, 230–244. Baumeister, R. (1984). Choking under pressure: Self-consciousness and paradoxical effects of incentives on skillful performance. Journal of Personality and Social Psychology, 46, 610– 620. Galdi, S., Cadinu, M. & Tomasetto, C. (2013). The roots of stereotype threat: When automatic associations disrupt girls’ math performance. Child Development, 85, 250–263. Greenwald, A. G., McGhee, G. & Schwartz, J. (1998). Measuring individual differences in implicit cognition: The implicit association test. Journal of Personality and Social Psychology, 74, 1464–1480. Halim, M. L., Ruble, D. N. & Amodio, D. M. (2011). From pink frilly dresses to ‘one of the boys’: A social-cognitive analysis of gender identity development and gender bias. Social and Personality Psychology Compass, 5, 933–949. Hannover, B. & Kessels, U. (2011). Sind Jungen die neuen Bildungsverlierer? Empirische Evidenz für Geschlechterdisparitäten zuungunsten von Jungen und Erklärungsansätze. Zeitschrift für Pädagogische Psychologie, 25, 89–103.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 42–49
© 2016 Hogrefe Verlag
J. M. Hermann & R. Vollmeyer, Stereotype Threat in der Grundschule
Huguet, P. & Régner, I. (2007). Stereotype threat among schoolgirls in quasi-ordinary classroom circumstances. Journal of Educational Psychology, 99, 545–560. Johns, M., Schmader, T. & Martens, A. (2005). Knowing is half the battle: Teaching stereotype threat as a means of improving women’s math performance. Psychological Science, 16, 175– 179. Johnson, H. J., Barnard-Brak, L., Saxon, T. F. & Johnson, M. K. (2012). An experimental study of the effects of stereotype threat and stereotype lift on men and women’s performance in mathematics. The Journal of Experimental Education, 80 (2), 137–149. Keller, J. (2002). Blatant stereotype threat and women’s math performance: Self-handicapping as a strategic means to cope with obtrusive negative performance expectations. Sex Roles, 47, 193–198. Keller, J. (2007). Stereotype threat in classroom settings: The interactive effect of domain identification, task difficulty and stereotype threat on female students’ maths performance. British Journal of Educational Psychology, 77, 323–338. Keller, J. & Dauenheimer, D. (2003). Stereotype threat in the classroom: Dejection mediates the disrupting threat effect on women’s math performance. Personality and Social Psychology Bulletin, 29, 371–381. Klieme, E., Artelt, C., Hartig, J., Jude, N., Köller, O., Prenzel, M. et al. (Hrsg.). (2010). PISA 2009. Bilanz nach einem Jahrzehnt. Münster, New York, München, Berlin: Waxmann. Krahé, B., Berger, A. & Möller, I. (2007). Entwicklung und Validierung eines Inventars zur Erfassung des GeschlechtsrollenSelbstkonzepts im Jugendalter. Zeitschrift für Sozialpsychologie, 38, 195–208. Krüger, H.-H. & Grunert, C. (2008). Peergroups. In T. Coelen & H.-U. Otto (Hrsg.), Grundbegriffe Ganztagsbildung. Das Handbuch (S. 382–391). Wiesbaden: VS Verlag für Sozialwissenschaften. Kuhn, D., Nash, S. & Brucken, L. (1978). Sex role concepts of twoand three-year-olds. Child Development, 49, 445–451. Levy, G. & Haaf, R. (1994). Detection of gender-related categories by 10-month-old infants. Infant Behaviour and Development, 17, 457–459. Martin, C. & Ruble, D. (2004). Children’s search for gender cues: Cognitive perspectives on gender development. Current Directions in Psychological Science, 13, 67–70. Martin, C. L. & Ruble, D. N. (2009). Patterns of gender development. Annual Review of Psychology, 61, 353–381. McIntyre, R., Paulson, R. & Lord, C. (2003). Alleviating women’s mathematics stereotype threat through salience of group achievements. Journal of Experimental Social Psychology, 39, 83–90. Muzzatti, B. & Agnoli, F. (2007). Gender and mathematics: Attitudes and stereotype threat susceptibility in Italian children. Developmental Psychology, 43, 747–759. Neuburger, S., Ruthsatz, V., Jansen, P., Heil, M. & Quaiser-Pohl, C. (2013). Acceptance and effect of role models in the spatial domain: A storytelling experiment with fourth graders. Frontiers in Psychological and Behavioral Science, 2 (3), 73–88. Neuville, E. & Croizet, J.-C. (2007). Can salience of gender identity impair math performance among 7–8 years old girls? The moderating role of task difficulty. European Journal of Psychology of Education, 22, 307–316. Nguyen, H.-H. D. & Ryan, A. M. (2008). Does stereotype threat affect test performance of minorities and women? A meta-analysis of experimental evidence. Journal of Applied Psychology, 93, 1314–1334. Niklas, F. & Schneider, W. (2012). Die Anfänge geschlechtsspezifischer Leistungsunterschiede in mathematischen und schriftsprachlichen Kompetenzen. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 44, 123–138. © 2016 Hogrefe Verlag
49
O’Brien, L. & Crandall, C. S. (2003). Stereotype threat and arousal: Effects on women’s math performance. Personality and Social Psychology Bulletin, 29, 782–789. Quaiser-Pohl, C. (2012). Mädchen und Frauen in MINT. Ein Überblick. In H. Stöger, A. Ziegler & M. Heilemann (Hrsg.), Lehr-und Lernforschung. Mädchen und Frauen in MINT. Bedingungen von Geschlechtsunterschieden und Interventionsmöglichkeiten (S. 13–41). Münster: LIT Verlag. Roick, T., Gölitz, D. & Hasselhorn, M. (2004). DEMAT 3+. Deutscher Mathematiktest für dritte Klassen. Göttingen: Beltz. Schilling, S. R., Sparfeldt, J. R. & Rost, D. H. (2006). Facetten schulischen Selbstkonzepts: Welchen Unterschied macht das Geschlecht? Zeitschrift für Pädagogische Psychologie, 20, 9–18. Schmader, T., Johns, M. & Forbes, C. (2008). An integrated process model of stereotype threat effects on performance. Psychological Review, 115, 336–356. Sheldon, J. P. (2004). Gender stereotypes in educational software for young children. Sex Roles, 51, 433–444. Sinno, S. M. & Killen, M. (2009). Moms at work and dads at home: Children’s evaluations of parental roles. Applied Developmental Science, 13 (1), 16–29. Spencer, S. J., Steele, C. M. & Quinn, D. M. (1999). Stereotype threat and women’s math performance. Journal of Experimental Social Psychology, 35, 4–28. Stangor, C., Carr, C. & Kiang, L. (1998). Activating stereotypes undermines task performance expectations. Journal of Personality and Social Psychology, 75, 1191–1197. Steele, C. M. (1997). A threat in the air: How stereotypes shape intellectual identity and performance. American Psychologist, 52, 613–629. Steele, C. M. & Aronson, J. (1995). Stereotype threat and the intellectual test performance of African Americans. Journal of Personality and Social Psychology, 69, 797–811. Tagler, M. J. (2012). Choking under the pressure of a positive stereotype: Gender identification and self-consciousness moderate men’s math test performance. The Journal of Social Psychology, 152, 401–416. Tomasetto, C., Alparone, F. R. & Cadinu, M. (2011). Girls’ math performance under stereotype threat: The moderating role of mothers’ gender stereotypes. Developmental Psychology, 47, 943–949. Trautner, H. M., Ruble, D. N., Cyphers, L., Kirsten, B., Behrendt, R. & Hartmann, P. (2005). Rigidity and flexibility of gender stereotypes in childhood: Developmental or differential? Infant and Child Development, 14, 365–381. Walton, G. M. & Cohen, G. L. (2003). Stereotype lift. Journal of Experimental Social Psychology, 39, 456–467. Yee, M. & Brown, R. (1994). The development of gender differentiation in young children. British Journal of Social Psychology, 33, 183–196. Zosuls, K. M., Martin, C. L., Ruble, D. N., Miller, C. F., Gaertner, B. M., England, D. E. et al. (2011). ‘It’s not that we hate you’: Understanding children’s gender attitudes and expectancies about peer relationships. British Journal of Developmental Psychology, 29, 288–304.
Dipl.-Psych Johanna Maria Hermann Prof. Dr.Regina Vollmeyer Goethe Universität Frankfurt Institut für Psychologie PEG-Gebäude Theodor-W.-Adorno-Platz 6 60629 Frankfurt am Main hermann@psych.uni-frankfurt.de
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 42–49
Testbesprechung RIAS Gerolf Renner P. Hagmann-von Arx & A. Grob (2014) RIAS. Reynolds Intellectual Assessment Scales and Screening. Deutschsprachige Adaptation der Reynolds Intellectual Assessment Scales (RIAS™) & des Reynolds Intellectual Screening Test (RIST™) von Cecil R. Reynolds und Randy W. Kamphaus. Bern: Hans Huber, Testkoffer komplett: EUR 682,00, Verbrauchsmaterial je Anwendung: EUR 6,45
Die „Reynolds Intellectual Assessment Scales“ (RIAS; Reynolds & Kamphaus, 2003) wurden von amerikanischen Rezensenten (Andrews, 2007; Dombrowski & Mrazik, 2008; Elliott, 2004) sehr positiv aufgenommen. Hervorgehoben wurden u.a. eine ökonomische Testdurchführung, die einfache Handhabung, die gründliche Testentwicklung, der breite Einsatzbereich und überzeugende Daten zu den Gütekriterien. Nun liegt eine deutsche Bearbeitung der RIAS vor, die eine Intelligenzeinschätzung bei Kindern, Jugendlichen und Erwachsenen im Altersbereich von 3 bis 99 Jahren ermöglichen will. Als Einsatzgebiete der RIAS werden alle diagnostischen Fragestellungen genannt, bei denen kognitive Leistungen eine Rolle spielen, z. B. Schulplatzierungen, die Abklärung von Entwicklungsstörungen, von Lern- und geistigen Behinderungen, von Hochbegabung und von neuropsychologischen Beeinträchtigungen.
genztests mit hoher g-Sättigung die beste prognostische Validität im Hinblick auf Kriterien wie Schulleistungen und beruflichen Erfolg aufweisen. In Anlehnung an die Unterscheidung zwischen fluider und kristalliner Intelligenz, den beiden Faktoren mit den höchsten Ladungen auf g, wird in der Teststruktur der RIAS zwischen verbaler und nonverbaler Intelligenz unterschieden. Die terminologische Abweichung von der Cattell-Horn-Theorie wird nicht näher erläutert. Es bleibt bei der vagen Aussage, dass die Konstrukte „in engem Zusammenhang“ stehen, aber „zweifellos nicht identisch sind“ (Manual, S. 23). Mit den RIAS sollte ein ökonomisches, über einen weiten Altersbereich einsetzbares, kulturfaires und prognostisch valides Messinstrument entwickelt werden, dessen Bearbeitung nur in geringem Maß von motorischen Fähigkeiten abhängig ist.
Theoretischer Hintergrund
Testaufbau, Material und Durchführung
Die RIAS wurden zur Erfassung der Allgemeinintelligenz (g-Faktor) unter Bezug auf die Cattell-Horn-Intelligenztheorie (Horn & Cattell, 1966) und Carrolls (1993) DreiSchichten-Theorie entwickelt. Im Sinne einer hierarchischen Intelligenztheorie wird g als Faktor höherer Ordnung verstanden, der in weitere Faktoren gegliedert werden kann. Die Autoren gehen davon aus, dass Intelli-
Die RIAS bestehen aus insgesamt sechs Untertests, aus denen drei Intelligenzwerte und ein Gedächtniswert abgeleitet werden: Verbaler Index (VIX): Raten Sie (62 Items). Anhand von zwei oder mehr verbal dargebotenen Hinweisreizen soll ein Begriff erkannt wer-
Verantwortlich für die Testbesprechungen sind Frau Ass.-Prof. Dr. Pia Deimann und Frau Ass.-Prof. Dr. Ursula Kastner-Koller. Es werden nur angeforderte Rezensionen veröffentlicht. Rückfragen bezüglich Testbesprechungen richten Sie direkt an: Ass.-Prof. Dr. Pia Deimann, Ass.-Prof. Dr. Ursula Kastner-Koller, Fakultät für Psychologie der Universität Wien, Liebiggasse 5/1, 1010 Wien, Österreich. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 50–55
© 2016 Hogrefe Verlag
Testbesprechung
51
den. Inhaltlich erfasst der Untertest vor allem Wortschatz und allgemeines Wissen. Itembeispiel: „Was ist rund, springt und wird oft geworfen oder getreten?“ Sätze ergänzen (48 Items). Zu einem Satz mit einer unvollständigen Analogie, der mündlich dargeboten wird, soll eine passende Ergänzung gefunden werden. Der Untertest erfasst verbales Schlussfolgern und erfordert bei höheren Aufgabenschwierigkeiten einen differenzierten Wortschatz und breites Allgemeinwissen. Itembeispiel: „Ein Elefant ist groß und eine Maus ist …?“ Nonverbaler Index (NIX): Unpassendes Ausschließen (51 Items). Aus jeweils sechs auf Bildkarten präsentierten Objekten oder Mustern soll dasjenige ausgewählt werden, das nicht zu den anderen passt. Die zugrundlegende Regel muss selbst erkannt werden. Bei einem Fehler kann die Testperson einen zweiten Versuch unternehmen, der im Fall einer korrekten Lösung mit einem statt mit zwei Punkten bewertet wird. Erfasst werden vor allem das logische Schlussfolgern und das Erkennen von Ordnungsprinzipien. Itembeispiel: Eine Abbildung mit fünf rechtwinkligen Kreuzen und einem Kreis. Was fehlt? (38 Items). Auf Bildkarten soll gezeigt werden, welcher Bestandteil eines Objektes fehlt. Gemessen werden sollen „nonverbale Denkfähigkeiten“ (Manual, S. 22) und die Fähigkeit zur visuellen Analyse. Auch hier ist nach einem Fehler ein zweiter Lösungsversuch mit abgestufter Bewertung möglich. Itembeispiel: Die Abbildung eines Tisches, an dem ein Bein fehlt. VIX und NIX werden zum Gesamtintelligenz Index (GIX) zusammengefasst. Gesamtgedächtnis Index (GGX): Verbales Gedächtnis (je nach Alter 5 bis 6 Items). Der Testleiter spricht einen sinnhaltigen und grammatikalisch korrekten Satz oder eine kleine Geschichte vor, die unmittelbar im Anschluss wiedergegeben werden soll. Für jedes richtig reproduzierte Element (Worte, bei Komposita Wortteile) wird ein Punkt vergeben. Die Artikulationsgenauigkeit und die Reihenfolge bei der Wiedergabe werden nicht bewertet, zusätzlich wiedergegebene Worte führen zu keinem Punktabzug, sofern sie den Inhalt der Geschichte nicht verändern. Für vier Altersstufen (3 – 4 Jahre, 5 – 8 Jahre, 9 – 10, 11 – 99 Jahre) werden unterschiedliche Itemsets verwendet. Inhaltlich wird die Fähigkeit zum unmittelbaren Behalten und Abrufen von verbalem Material erfasst. Itembeispiel (mit Kennzeichnung der wertbaren Elemente): „Der / Lehrer / stand / vor / der / Wand / tafel“. Nonverbales Gedächtnis (46 Items). Der Proband soll ein fünf Sekunden lang präsentiertes konkretes oder abstraktes Bild anschließend auf einer Bildkarte zeigen, auf © 2016 Hogrefe Verlag
der sich auch fünf weitere, ähnlich aussehende Abbildungen befinden. Erfasst wird die Fähigkeit, visuelle Stimuli kurzfristig zu behalten und wiederzuerkennen. Itembeispiel: Ein roter Kreis soll nach der Präsentation auf einer Bildkarte unter andersfarbigen Dreiecken und Vierecken gezeigt werden. Die RIAS werden stets im Einzelsetting durchgeführt. Parallelformen liegen nicht vor. Eine Kurzform, der „Reynolds Intellectual Screening Test“ (RIST), umfasst die Untertests Raten Sie und Unpassendes Ausschließen. Da es sich um die ersten beiden Untertests der RIAS handelt, kann im Bedarfsfall problemlos zur Durchführung des gesamten Tests übergegangen werden. Ebenso kann bei einem nicht geplanten Testabbruch nach zwei Untertests, z. B. bei hoher Belastung der Probanden, noch der RISTGesamtwert bestimmt werden. Die Durchführungsdauer der vier Untertests des GIX beträgt laut Manual 20 bis 25 Minuten, die der Gedächtnistests weitere 10 bis 15 Minuten. Der Zeitbedarf für den RIST beträgt 10 bis 15 Minuten. Für die Untertests sind weitgehend einheitlich – mit Abweichungen nur beim Untertest Verbales Gedächtnis – altersabhängige Testeinstiege, Umkehrregeln und Abbruchkriterien definiert. Bei fünf Untertests (Ausnahme wiederum Verbales Gedächtnis) erleichtern Beispielaufgaben die Sicherung des Instruktionsverständnisses. Die Instruktionen sind durchgehend knapp und klar formuliert. Die Testbögen, die für die RIAS 20 und für den RIST acht Seiten umfassen, sind übersichtlich gegliedert, bieten hinreichend Platz für die Protokollierung der verbalen Antworten und enthalten in Kurzform die wichtigsten Durchführungsregeln. Die Bewertung der einzelnen Items wird durch Angabe der richtigen Lösungen erleichtert. Die Bildkarten für die visuell präsentierten Items werden in drei stabilen, spiralgebundenen DIN-A5 Stimulusbüchern vorgelegt, die sich problemlos handhaben lassen. Mit wenigen Ausnahmen sind die bildlichen Darstellungen ansprechend und eindeutig erkennbar. Ein mitgelieferter, aber instabiler Sichtschutz kann eingesetzt werden, falls der Testanwender während der Untersuchung noch auf die Konsultation des Manuals angewiesen ist.
Testanalyse und Normierung Zur Testentwicklung und den Gütekriterien werden im Manual vor allem für das amerikanische Original umfassende Daten vorgestellt. Im Folgenden werden die Spezifika der deutschen Adaptation im Vordergrund stehen. Aufgrund der eindeutigen Testinstruktionen und der standardisierten Reizdarbietung ist die Durchführungsobjektivität bei kooperativen Probanden gesichert. Dazu
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 50–55
52
Testbesprechung
tragen auch die weitgehend einheitliche Gestaltung der Durchführungsregeln und die insgesamt unkomplizierte Handhabung bei. Hinweise zum Umgang mit schwierigen Testsituationen fehlen weitgehend, die allgemeinen Hinweise zur Testdurchführung gehen nicht auf Besonderheiten bei sehr jungen und sehr alten Probanden ein. Die Auswertungsobjektivität ist ebenfalls gegeben. Einen gewissen Ermessenspielraum haben die Testleiter bei der Bewertung der verbalen Untertests. In einer kleinen amerikanischen Untersuchung lagen die Korrelationen zwischen zwei unabhängig vorgenommenen Auswertungen von Testprotokollen zwischen .95 und 1.00. Als Reliabilitätsschätzungen werden interne Konsistenzen (Cronbachs a) berichtet (Tab. 1). Die Werte für die Untertests fallen in 16 Altersgruppen vereinzelt befriedigend, überwiegend jedoch gut bis sehr gut aus. Für die Intelligenzwerte ergeben sich überwiegend sehr gute, für den Gesamtgedächtnis Index gute Werte. Auch die RetestStabilitäten in einer altersgemischten Stichprobe (N = 66) mit einem mittleren Retest-Intervall von 18 Tagen sprechen für eine hohe Zuverlässigkeit der RIAS. Übungseffekte für die Indexwerte betragen ca. 0.3 Standardabweichungen. Tabelle 1. Aufbau und Reliabilität der RIAS Index/Untertest Gesamtintelligenz Index (GIX)
Interne Konsistenza
Retestb
.93 – .97
.88
.89 – .96
.89
Raten Sie
.84 – .93
.93
Sätze ergänzen
.81 – .94
.88
Verbaler Index (VIX)
Nonverbaler Index (NIX)
.91 – .94
.81
Unpassendes Ausschließen
.85 – .93
.76
Was fehlt?
.82 – .90
.77
.76 – .87
.73
.76 – .85
.73
.82 – .92
.82
.90 – .94
.87
Gesamtgedächtnis Index (GGX) Verbales Gedächtnis Nonverbales Gedächtnis RIST-Gesamtwert
Anmerkungen: a Spannbreite der Reliabilitätsschätzungen (Cronbachs a) in den Altersjahrgängen. b Altersgemischte Stichprobe, Retest-Intervall 6 – 65 Tage.
Die inhaltliche Validität als Intelligenzmaß wird im Manual sehr gründlich diskutiert und kann durch die Verwendung von bewährten Aufgabentypen, die anerkanntermaßen kognitive Leistungen abbilden, als gesichert gelten. Daten zur konvergenten Validität zeigen eine Korrelation von .71 zwischen GIX und dem Gesamt-IQ der „Wechsler Intelligence Scale for Children – IV“ (WISC-IV; Petermann & Petermann, 2012), von .79 mit dem Ge-
samt-IQ des „Wechsler Intelligenztests für Erwachsene“ (WIE; Horn, Neubauer & Aster, 2006) und von .69 mit dem IQ-Wert der „Intelligence and Development Scales“ (IDS; Grob, Meyer & Hagmann-von Arx, 2009), bei Mittelwertsunterschieden von 1.1 bis 2.6 IQ-Punkten. Zum Zusammenhang mit Schulleistungen werden nur amerikanische Daten dargestellt. Für verschiedene Leistungsbereiche (z. B. Lesen, Mathematik) fanden sich hohe Korrelationen zwischen den RIAS und dem „Wechsler Individual Achievement Test“ (WIAT; Wechsler, 1992), die für GIX und VIX zwischen .60 und .73 lagen. Für NIX und GGX fanden sich niedrigere Korrelationen zwischen .35 und .59. Ebenfalls nur für das amerikanische Original werden umfangreiche Daten zu verschiedenen klinischen Gruppen berichtet. Angaben zur divergenten und prognostischen Validität sind nicht zu finden. In exploratorischen Faktorenanalysen fand sich bei einfaktoriellen Lösungen übereinstimmend in den deutschen und amerikanischen Daten ein starker Generalfaktor, bei zweifaktoriellen Lösungen mit vier Untertests ließ sich die Testgliederung in die beiden Indexwerte abbilden. Bei Analysen, die auch die Gedächtnistests berücksichtigten, zeigte sich ebenfalls eine zweifaktorielle Struktur, bei der Verbales Gedächtnis auf dem verbalen und Nonverbales Gedächtnis auf dem nonverbalen Faktor luden. Die Bewertung dieser Analysen wird erschwert durch das Fehlen von Angaben zum Eigenwertverlauf. Konfirmatorische Faktorenanalysen der amerikanischen Daten legen ebenfalls nahe, dass ein zweifaktorielles Modell statistisch auch dann angemessen ist, wenn die Gedächtnistests berücksichtigt werden. Die entsprechenden Analysen der deutschen Adaptation fallen wesentlich knapper aus, alternative Modelle zur zweifaktoriellen Struktur von vier Untertests werden nicht berichtet. Die Normierung erfolgte von Juni 2011 bis September 2012 in Deutschland und der deutschsprachigen Schweiz. Die Rekrutierung des deutschen Teils der Stichprobe erfolgte auf einem ungewöhnlichen Weg: Kunden des Hogrefe-Verlags wurden postalisch befragt, ob sie bereit wären, die Normierung zu unterstützen. Interessenten erhielten den Testkoffer und führten die Untersuchungen ohne Einweisung durch die Testautoren durch. Es finden sich im Manual keinerlei Hinweise, ob und ggf. welche Vorgaben für die Rekrutierung der Probanden gemacht wurden. Die Qualitätskontrolle beschränkte sich auf die Durchsicht der eingereichten Testbögen. Bei den Testleitern handelte es sich u. a. um Psychologen, Sozialpädagogen und Lehrer sowie um Personen ohne Angabe des Grundberufs. Anscheinend wurde auch eine große Anzahl von Studierenden einer Fachhochschule eingesetzt. Beteiligte Institutionen waren freie Praxen, Kliniken, Beratungsstellen, ein berufliches Bildungs- und Eingliederungszentrum, eine Justizvollzugsanstalt, Schulen u. a.m.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 50–55
© 2016 Hogrefe Verlag
Testbesprechung
53
Tabelle 2. Testböden und Testdecken in Untertests der RIAS für ausgewählte Altersgruppen Untertest
3;0 – 3;3
4;0 – 4;3
5:0 – 5;3
6;0 – 6;3
10;0 – 10;3
18;0 – 18;11
60;0 – 69;11
90;0 – 99;11
Raten Sie
100 39
100 39
100 29
100 19
84 0
73 0
66 0
79 0
Sätze ergänzen
100 40
100 35
100 22
100 16
93 9
67 11
70 6
90 0
Unpassendes Ausschließen
100 37
100 28
100 19
100 11
77 0
67 0
73 0
80 16
Was fehlt?
100 38
100 33
100 25
95 19
77 7
71 0
80 0
100 0
80 32
70 27
76 16
66 14
67 2
70 2
75 9
92 0
100 38
100 27
100 15
88 7
65 0
63 0
70 0
86 0
Verbales Gedächtnis Nonverbales Gedächtnis
Anmerkungen: Angegeben sind die T-Werte, die für den maximalen Testrohwert (obere Zahl) und den Testrohwert 1 (untere Zahl) abgelesen werden können. Fettdruck bezeichnet Werte von T > 20 als Indikator für Boden- und von T < 80 als Indikator für Deckeneffekte.
Aus insgesamt 1.099 Datensätzen wurde eine nach Alter, Geschlecht und Bildungsabschluss geschichtete Stichprobe von 931 Personen zusammengestellt. In der Schweiz wurden 1.364 Probanden von vorab geschulten Studierenden der Psychologie untersucht. Die Rekrutierung erfolgte über verschiedene Institutionen, Telefonbücher und private Kontakte. Eine wiederum nach Alter, Geschlecht und Bildungsabschluss geschichtete Stichprobe von 1.214 Personen ging in die Normstichprobe ein. Die Gesamtstichprobe umfasst somit 2.145 Personen. Die Größe der einzelnen Normgruppen kann dem Manual nicht entnommen werden. Nach einer Verlagsauskunft sind die beiden ältesten Normgruppen nur schwach besetzt (N = 22 – 27). Die Stichprobenbeschreibung liefert Daten zu Alter, Geschlecht, Muttersprache und höchstem Bildungsabschluss (bei Kindern und Jugendlichen dem höchsten Bildungsabschluss der Eltern). Die besuchten Schulformen der Kinder werden nicht angegeben. Probanden mit klinischen Diagnosen seien nur in dem Umfang in die Stichprobe aufgenommen worden, wie sie deren Anteil in der Normalbevölkerung entspricht. Allerdings lässt sich dem Manual nicht entnehmen. ob Diagnosen bei allen Personen systematisch und nach einheitlichen Methoden erfasst wurden. Es bleibt auch unklar, ob allgemeine oder alterstypische Prävalenzraten als Maßstab gedient haben (hier können, z. B. bei Depressionen, ganz erhebliche Unterschiede in den Altersgruppen bestehen). Angesichts der vielen klinischen Institutionen, die an der Stichprobenrekrutierung beteiligt waren, würden detailliertere Angaben zum Vorgehen das Vertrauen in die Normierung erhöhen. Im Altersbereich von 3 bis 14 Jahren umfasst eine Normgruppe vier Monate, im Altersbereich von 15 bis 19 Jahren zwölf Monate und danach zehn Jahre. Die Be© 2016 Hogrefe Verlag
stimmung der Normwerte erfolgt manuell, ein Auswertungsprogramm steht nicht zur Verfügung. Für die Untertests werden T-Werte, für die Indexwerte zusätzlich Prozentränge, IQ- und z-Werte sowie 95 %-Konfidenzintervalle in übersichtlichen Normtabellen bereitgestellt. Tabelliert wurde für die Untertests der T-Wertbereich von Null bis 100 (€ 5 SD), für die Indexwerte der IQ-Bereich von 40 bis 160 (€ 4 SD). Allerdings wird dieser Wertebereich aufgrund von Boden- und Deckeneffekten nicht durchgehend ausgeschöpft (Tab. 2). Bei den 3- und 4Jährigen können auch auf Ebene der Indexwerte weit unterdurchschnittliche, teilweise auch unterdurchschnittliche Leistungen nicht differenziert abgebildet werden. Im Jugend- und Erwachsenenalter verhindern Deckeneffekte auf Untertestebene eine Erfassung von weit bis extrem überdurchschnittlichen Fähigkeiten. Problematische Itemgradienten zeigen sich durchgehend nicht. Ergänzend zu den Standardnormen können auch Altersäquivalente (Entwicklungsalter von 3;0 bis 14;11 Jahren) bestimmt werden. Zur Beurteilung von Differenzwerten zwischen den Untertests und den Indexwerten werden kritische Differenzwerte angegeben. Die für die klinische Beurteilung relevante ergänzende Angabe der empirischen Häufigkeit solcher intraindividuellen Differenzwerte in der Normstichprobe fehlt.
Plus/Minus Intelligenzdiagnostik erfolgt oft mit umfangreichen und komplexen Testbatterien, die mit einer Vielzahl von Untertests unterschiedliche Facetten des Intelligenzkonzeptes erfassen wollen und zum Teil ausgefeilte Strategien
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 50–55
54
zur normativen und ipsativen Interpretation von Testprofilen anbieten. Andere Verfahren beschränken sich dagegen bei der Erfassung der Allgemeinintelligenz auf die Vorgabe eines einzigen Aufgabentyps. Die RIAS nehmen hier eine Zwischenstellung ein und realisieren eine reliable und ökonomische Erfassung der Allgemeinintelligenz (g-Faktor) unter Berücksichtigung wichtiger Intelligenzkomponenten. Im Manual sind vor allem für das amerikanische Original umfangreiche Validitätsdaten dokumentiert, die durch erste Untersuchungen zur konvergenten und faktoriellen Validität der deutschen Fassung ergänzt wurden. Das von den Autoren vorgeschlagene Vorgehen bei der Testinterpretation ist klar strukturiert und betont die Bedeutung einer gründlichen Anamnese sowie die Notwendigkeit, Intelligenztestdaten evidenzbasiert zu interpretieren, mit anderen Informationsquellen zu integrieren und dabei alternative Hypothesen zu bedenken. Eine Überinterpretation von Intelligenztestprofilen wird von den Autoren der RIAS nicht unterstützt. Allerdings werden die vier illustrativen Falldarstellungen den selbstformulierten Ansprüchen nicht ganz gerecht und wirken stellenweise doch etwas vereinfachend. Eine gewisse Skepsis ist gegenüber dem Begriff der nonverbalen Intelligenz angebracht. Er wird weder in der Cattell-Horn-Theorie noch in anderen bedeutenden Intelligenztheorien verwendet. Selbst bei Testaufgaben, die keine expressiven oder rezeptiven Sprachleistungen verlangen, können sprachliche Vermittlungsprozesse eine bedeutende Rolle spielen. Dies gilt auch für die entsprechenden Subtests der RIAS, für die zudem keine komplett sprachfreie Instruktionen vorliegen. In der Weiterentwicklung der Cattell-Horn-Theorie, dem Cattell-HornCarroll-Modell (Schneider & McGrew, 2012; deutschsprachige Darstellung in Mickley & Renner, 2010), können die beiden Subtests des VIX der kristallinen Intelligenz und die des NIX der fluiden Intelligenz (Unpassendes Ausschließen) und der visuellen Verarbeitung (Was fehlt?) zugeordnet werden. Außerdem kann mit dem Subtest Verbales Gedächtnis der CHC-Faktor Kurzzeitgedächtnis erfasst werden. Aufgabenstellungen wie im Subtest Nonverbales Gedächtnis werden CHC-theoretisch meist der visuellen Verarbeitung zugeordnet. Weitere Intelligenzkomponenten, darunter die ebenfalls schulrelevanten Faktoren auditive Verarbeitung, Verarbeitungsgeschwindigkeit und Langzeitspeicherung und -abruf, werden in den RIAS nicht berücksichtigt und müssen nötigenfalls durch andere Verfahren ergänzend abgeklärt werden. Wie die Autoren der Originalfassung empirisch gestützt argumentieren, erlaubt eine reliable Erfassung des g-Faktors im Allgemeinen gute Prognosen, die durch Betrachtung des Testprofils nur geringfügig verbessert werden können. Dies schließt jedoch nicht aus, dass im Einzelfall weitere spezifische kognitive
Testbesprechung
Beeinträchtigungen vorliegen, die für die Beantwortung der diagnostischen Fragestellung relevant sein können. Bei der Interpretation des GGX sollte beachtet werden, dass dieser nicht, wie die Skalenbezeichnung nahelegt, die gesamten Gedächtnisleistungen erfasst. Die zugehörigen Untertests berücksichtigen nur das Kurzzeitgedächtnis, weder Arbeits- noch Langzeitgedächtnis werden angesprochen. Die faktorielle Validität des GGX erscheint nach den vorgelegten Analysen fraglich. Die RIAS können fast über die gesamte menschliche Lebensspanne eingesetzt werden. Die angemessene Gestaltung der Testsituation bei Menschen im hohen Alter wird im Manual leider nicht behandelt. Zu bedenken wären z. B. Besonderheiten bei der Beziehungsgestaltung, Beeinträchtigungen der Hör- und Sehfähigkeit und eine begrenzte Belastbarkeit. Auch die vorliegenden Validitätsdaten berücksichtigen Personen im hohen Alter nur am Rande. Aufgrund der weit erhöhten Prävalenz von körperlichen Erkrankungen in diesem Lebensabschnitt ist zudem denkbar, dass es bei der Rekrutierung der Normstichprobe bei den 80- bis 99-Jährigen zu deutlichen Selektionseffekten gekommen ist. Am unteren Rand des Altersspektrums ist der Einsatz der RIAS bei 3- bis 4-jährigen Kindern mit kognitiven Entwicklungsstörungen wegen der bestehenden Bodeneffekte weniger zu empfehlen. Kleine Kinder dürften auch durch Aufgabenstellungen, die ihnen mehr aktive Handlungsmöglichkeiten einräumen, besser zu motivieren sein. Ab dem Schulalter können auch leichte bis mittelgradige Intelligenzminderungen erfasst werden. Aufgrund der kurzen Durchführungszeit bietet sich der Einsatz der RIAS immer dann an, wenn die untersuchten Personen aus körperlichen oder psychischen Gründen wenig belastbar sind. Wie auch im Manual ausgeführt, sind drei Untertests der RIAS weniger geeignet für die Untersuchung von Menschen mit Sehbeeinträchtigungen. Deutliche Hör-und Sprechstörungen erschweren eine faire Untersuchung mit den drei verbalen Untertests. Die erforderlichen handmotorischen Zugangsfertigkeiten werden nur bei schwer körperbehinderten Menschen nicht vorliegen. Hinweise auf mögliche Testadaptionen finden sich im Manual nicht. Die RIAS erlauben keine testbegleitende Beobachtung komplexerer aktivsprachlicher Leistungen. Bei Probanden mit Sprach-, Sprech- und Redeflussstörungen wird die geringe sprachliche Beanspruchung jedoch die Testdurchführung erleichtern. Das Vorgehen bei der Rekrutierung der Normstichprobe ist ungewöhnlich und lässt befürchten, dass eine nicht repräsentative Stichprobe gezogen wurde. Die Verteilung der Bildungsabschlüsse und die Vergleichsdaten mit etablierten intelligenzdiagnostischen Verfahren sprechen allerdings gegen gravierende Normverzerrungen. Hinsicht-
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 50–55
© 2016 Hogrefe Verlag
Testbesprechung
55
lich der Qualität der Normen ist kein abschließendes Urteil möglich, da die Stichprobenbeschreibung sich nicht an den in der Normierung verwendeten Altersgruppen orientiert. Gegenüber den detaillierten und differenzierten Darstellungen zu den Gütekriterien der Originalfassung fallen die entsprechenden Ausführungen zur deutschen Bearbeitung etwas ab. Angaben zur Stichprobengröße der einzelnen Normierungsgruppen, zu den von Kindern und Jugendlichen besuchten Bildungseinrichtungen, zur Altersentwicklung der Testrohwerte, zur Häufigkeit von intraindividuellen Untertest- und Skalendifferenzen sowie ausführlichere Darstellungen der Faktorenanalysen sollten durch eine Nachlieferung oder Internetveröffentlichung und spätestens bei einer Neuauflage des Manuals ergänzt werden. Zusammenfassend bietet sich der Einsatz der RIAS vor allem dann an, wenn eine wenig belastende und/oder ökonomische Untersuchung der Allgemeinintelligenz mit geringen motorischen Anforderungen angestrebt wird und die Fragestellung keine umfassende und differenzierte Beschreibung möglichst vieler Intelligenzfaktoren verlangt.
Literatur Andrews, J. J. W. (2007). Test Reviews. Reynolds, C. R., & Kamphaus, R. W. (2003). RIAS: Reynolds Intellectual Assessment Scales. Journal of Psychoeducational Assessment, 25, 402 – 408.
Carrolls, J. B. (1993). Human cognitive abilities. A survey of factoranalytic studies. Cambridge: Cambridge University Press. Dombrowski, S. C. & Mrazik, M. (2008). Test review. Reynolds, C. R., & Kamphaus, R. W. (2003). RIAS: Reynolds Intellectual Assessment Scales. Canadian Journal of School Psychology, 23, 223 – 230. Elliott, R. (2004). Test review. Reynolds Intellectual Assessment Scales. By Cecil R. Reynolds, Randy W. Kamphaus. Archives of Clinical Neuropsychology, 19, 325 – 328. Grob, A., Meyer, C. S. & Hagmann-von Arx, P. (2009). Intelligence and Development Scales (IDS). Intelligenz- und Entwicklungsskalen für Kinder von 5 – 10 Jahren. Bern: Hans Huber. Horn, J. L. & Cattell, R. B. (1966). Refinement and test of the theory of fluid and crystallized general intelligences. Journal of Educational Psychology, 57, 253 – 270. Horn, R., Neubauer, A. & Aster, M. von. (2006). Wechsler Intelligenztest für Erwachsene (WIE). Frankfurt a.M.: Pearson. Mickley, M. & Renner, G. (2010). Intelligenztheorie für die Praxis: Auswahl, Anwendung und Interpretation deutschsprachiger Testverfahren für Kinder und Jugendliche auf Grundlage der CHC-Theorie. Klinische Diagnostik und Evaluation, 3, 447 – 466. Petermann, F. & Petermann, U. (2012). WISC-IV. Wechsler Intelligence Scale for Children. Frankfurt: Pearson Assessment. Reynolds, C. R. & Kamphaus, R. W. (2003). Reynolds Intellectual Assessment Scales and Reynolds Intellectual Screening Test (RIAS). Odessa, FL: PAR. Schneider, W. J. & McGrew, K. S. (2012). The Cattell-Horn-Carroll model of intelligence. In D. P. Flanagan & P. L. Harrison (Hrsg.), Contemporary intellectual assessment. Theories, tests, and issues, 3. Aufl. (S. 99 – 144). New York: Guilford Press. Wechsler, D. (1992). Wechsler Individual Achievement Test. San Antonio, TX: The Psychological Corporation. Rezensent: Gerolf Renner, Pädagogische Hochschule Ludwigsburg, Reuteallee 46, 71634 Ludwigsburg, renner@ph-ludwigsburg.de DOI: 10.1026/0049-8637/a000147
Hogrefe Tagungsplaner Alle Tagungen im Überblick Der Hogrefe Tagungsplaner bietet Ihnen ein umfassendes Verzeichnis von Tagungen, Kongressen und Symposien im Bereich der Psychologie und Psychiatrie. Sie können sich nach verschiedenen Suchkriterien die passende Tagung oder den passenden Kongress anzeigen lassen.
• Tagungsübersicht • Tagung beantragen und bearbeiten • Veranstaltungen eintragen
www.hogrefe.de/service
© 2016 Hogrefe Verlag
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 50–55
Mitteilungen Ausschreibung der Herausgeber-/Mitherausgeberschaft der Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie Aufruf zur Nomination Der Vorstand der Deutschen Gesellschaft für Psychologie (DGPs) hat in seinen Sitzungen vom 23. 09. 2000 und 27. 01. 2001 festgelegt, dass bei Zeitschriften mit Organstatus eine öffentliche Ausschreibung der Herausgeberbzw. Mitherausgeberschaft (Call for Nominations) erfolgen soll, um das Wahlverfahren möglichst transparent zu gestalten. Bei der Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (ZEPP) ist ein/e neue/r Herausgeber/in zu nominieren. Mit Ablauf des Jahres 2016 endet die reguläre Amtszeit der Mitherausgeberin, Frau Prof. Dr. Tina Seidel. Ausgeschrieben wird somit eine Herausgeberschaft für die Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie für die Jahre 2017 – 2022. Die Kandidatinnen und Kandidaten sollten in den Bereichen Ent-
wicklungspsychologie und/oder Pädagogische Psychologie gut ausgewiesen sein und sie sollten bereit sein, ab 2017 Manuskripte in Empfang zu nehmen. Selbstnominationen sind erwünscht. Die Mitglieder der DGPs sind hiermit aufgerufen, Vorschläge für Nominationen oder Selbstnomination zu machen und diese in zweifacher Ausfertigung bis spätestens zum 15. 06. 2016 an den Schriftführer der DGPs, E-Mail: Schriftfuehrer@dgps.de, zu senden. Die Auswahl der neuen Mitglieder des Herausgeberkollegiums erfolgt durch den Vorstand der DGPs im Einvernehmen mit den verbleibenden Herausgebern der ZEPP und dem Verlag.
DOI: 10.1026/0049-8637/a000148
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 56–57
© 2016 Hogrefe Verlag
Mitteilungen
57
Konsultantenliste der ZEPP 2015 Durch die Beurteilung eingereichter Manuskripte und Revisionsvorschläge haben im Jahr 2015 (Oktober 2014 bis September 2015) folgende Konsultantinnen und Konsultanten das Herausgeber-Kollegium der Zeitschrift für Entwicklungspsychologie und Pädagögische Psychologie unterstützt: Prof. Dr. Dorothee Alfermann, Leipzig PD Dr. Alp Aslan, Halle/Saale Dr. Michael Becker, Berlin Prof. Dr. Susanne Buch, Wuppertal Prof. Dr. Heike Buhl, Paderborn Prof. Dr. Ulrike Burrmann, Dortmund Prof. Dr. Gerhard Büttner, Frankfurt Dr. Theresa Dicke, Essen Dr. Katharina Eckstein, Jena Dr. Benjamin Fauth, Frankfurt Dr. Andrea Frick, Fribourg Prof. Dr. Caterina Gawrilow, Tübingen Dr. Robert Grassinger, Augsburg Dr. Claudia Haase, Evanston Prof. Dr. Ilonca Hardy, Frankfurt Prof. Dr. Martin Heil, Düsseldorf Prof. Dr. Kurt A. Heller (em.), München Prof. Dr. Anne Henning, Gera Prof. Dr. Holger Horz, Frankfurt Prof. Dr. Petra Jansen, Regensburg Dr. Florian Juen, München Prof. Dr. Tanja Jungmann, Rostock Dr. Karina Karst, Mannheim Prof. Dr. Uta Klusmann, Kiel Dr. Mareike Kobarg, Kiel Dr. Judith Köhne, Bochum Dr. Alexander Korte, München Dr. Olga Kunina-Habenicht, Frankfurt Prof. Dr. Karin Landerl, Graz Prof. Dr. Arnold Lohaus, Bielefeld Dr. Hendrik Lohse-Bossenz, Berlin Dr. Jan Lonnemann, Frankfurt am Main Prof. Dr. Claudia Mähler, Hildesheim
Dr. Peter Marx, Würzburg Prof. Dr. Jörn Munzert, Gießen Prof. Urs Nater, Marburg Prof. Dr. Gerhild Nieding, Würzburg Dr. Frank Niklas, Würzburg Jennifer Paetsch, Berlin Dr. Maximilian Pfost, Bamberg Prof. Dr. Claudia Quaiser-Pohl, Koblenz Prof. Dr. Jan Retelsdorf, Kiel Dr. Dirk Richter, Berlin Prof. Dr. Heiner Rindermann, Chemnitz Dr. Sebastian Schmid, Regensburg Prof. Dr. Florian Schmiedek, Frankfurt am Main Prof. Dr. Nadja Schott, Stuttgart Prof. Dr. Ulrich Schroeders, Bamberg Dr. Kattinka Schweizer, Hamburg Prof. Dr. Jörn Sparfeldt, Saarbrücken Dr. Marion Spengler, Tübingen Prof. Dr. Ricarda Steinmayr, Dortmund Dr. Cora Titz, Frankfurt am Main Prof. Dr. Detlef Urhahne, Passau Prof. Dr. Stefanie van Ophuysen, Münster Dr. Marc Vierhaus, Bielefeld Dr. Antje von Suchodoletz, Freiburg Dr. Wolfgang Wagner, Tübingen Dr. Jenny Wagner, Kiel Prof. Dr. Petra Wagner, Linz Sabrina Wiescholek, Paderborn Prof. Dr. Oliver Wilhelm, Ulm Prof. Dr. Joachim Wirth, Bochum Dr. Lysann Zander, Berlin Prof. Dr. Friederike Zimmermann, Kiel Dr. Christof Zoelch, Eichstätt
An dieser Stelle sei den Konsultantinnen und Konsultanten für Ihre Unterstützung gedankt. DOI: 10.1026/0049-8637/a000149
© 2016 Hogrefe Verlag
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 56–57
Hinweise für Autoren Die Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (ZEPP) veröffentlicht deutsch- und englischsprachige Originalarbeiten, Kurzartikel und kritische Übersichtsreferate aus dem gesamten Gebiet der Entwicklungspsychologie und der Pädagogischen Psychologie. Als Originalarbeiten und Kurzartikel kommen vor allem theoriegeleitete empirische Forschungsbeiträge in Frage, in besonderen Fällen aber auch Beiträge zur Methodenentwicklung und zur Theoriebildung einschließlich Computermodellierung. Unter einer besonderen Rubrik werden Testrezensionen veröffentlicht. Einsendung von Manuskripten. Alle Manuskripte sind in elektronischer Form im Editorial Manager unter http://www.editori almanager.com/zepp einzureichen. Detaillierte Hinweise für Autoren finden Sie unter http://www. hogrefe.de/produkte/zeitschriften/zepp Urheber- und Nutzungsrechte. Der Autor bestätigt und garantiert, dass er uneingeschränkt über sämtliche Urheberrechte an seinem Beitrag einschließlich eventueller Bildvorlagen, Zeichnungen, Pläne, Karten, Skizzen und Tabellen verfügt, und dass der Beitrag keine Rechte Dritter verletzt. Der Autor räumt – und zwar auch zur Verwertung seines Beitrages außerhalb der ihn enthaltenen Zeitschrift und unabhängig von deren Veröffentlichung – dem Verlag räumlich und mengenmäßig unbeschränkt für die Dauer des gesetzlichen Urheberrechts das ausschließliche Recht der Vervielfältigung und Verbreitung bzw. der unkörperlichen Wiedergabe des Beitrags ein. Der Autor räumt dem Verlag ferner die folgenden ausschließlichen Nutzungsrechte am Beitrag ein: a) Das Recht zum ganzen oder teilweisen Vorabdruck oder Nachdruck – auch in Form eines Sonderdrucks, zur Übersetzung in
andere Sprachen, zu sonstiger Bearbeitung und zur Erstellung von Zusammenfassungen (Abstracts); b) das Recht zur Veröffentlichung einer Mikrokopie-, Mikroficheund Mikroformausgabe, zur Nutzung im Weg von Bildschirmtext, Videotext und ähnlichen Verfahren, zur Aufzeichnung auf Bildund/oder Tonträger und zu deren öffentlicher Wiedergabe – auch multimedial – sowie zur öffentlichen Wiedergabe durch Radiound Fernsehsendungen; c) das Recht zur maschinenlesbaren Erfassung und elektronischen Speicherung auf einem Datenträger (z. B. Diskette, CDRom, Magnetband) und in einer eigenen oder fremden OnlineDatenbank, zum Download in einem eigenen oder fremden Rechner, zur Wiedergabe am Bildschirm – sei es unmittelbar oder im Wege der Datenfernübertragung – sowie zur Bereithaltung in einer eigenen oder fremden Online-Datenbank zur Nutzung durch Dritte; d) das Recht zu sonstiger Vervielfältigung, insbesondere durch fotomechanische und ähnliche Verfahren (z. B. Fotokopie, Fernkopie) und zur Nutzung im Rahmen eines sogenannten Kopienversands auf Bestellung; e) das Recht zur Vergabe der vorgenannten Nutzungsrechte an Dritte in In- und Ausland sowie die von der Verwertungsgesellschaft WORT wahrgenommenen Rechte einschließlich der entsprechenden Vergütungsansprüche. Online-Rechte für Zeitschriftenbeiträge. Hinweise für Autoren zur Online-Archivierung einer elektronischen Version Ihres Manuskriptes finden Sie unter den Autorenhinweisen auf unserer Homepage www.hogrefe.de/produkte/zeitschriften/zepp.
Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie (2016), 48 (1), 58
Januar 2016
© 2016 Hogrefe Verlag
SI-KJ
SEKJ
Schlafinventar für Kinder und Jugendliche
Selbstwertinventar für Kinder und Jugendliche
M. G. Lehmkuhl / A. Agache / D. Alfer L. Fricke-Oerkermann / Ch. Tielsch A. Mitschke / E. Schäfermeister J. van der Stouwe / A. Wiater
C.Schöne / J. Stiensmeier-Pelster
Einsatzbereich: Kinder und Jugendliche. Die vier Instrumente des SI-KJ umfassen unterschiedliche Altersbereiche, insgesamt wird der Altersbereich von 5 bis 18 Jahren abgedeckt. Das Verfahren kommt im Bereich der klinischen Psychologie, Kinder- und Jugendpsychiatrie, Pädiatrie und in Erziehungsberatungsstellen zum Einsatz. Das Verfahren: Das Schlafinventar für Kinder und Jugendliche (SIKJ) beinhaltet vier verschiedene Instrumente zur Diagnostik von Schlafproblemen und Schlafstörungen bei Kindern und Jugendlichen. Zwei Fragebögen dienen der orientierenden Diagnostik aus Selbstsicht (Fragebogen für Kinder und Jugendliche) und Fremdsicht (Elternfragebogen). Es handelt sich um Screening-Instrumente, aus denen sich erste Hinweise für das Vorliegen von Schlafstörungen sowie von belastenden Schlafbedingungen ableiten lassen. Der Fragebogen für Kinder und Jugendliche enthält 28 Items, der Elternfragebogen umfasst 33 Items. Bearbeitungsdauer: Die Bearbeitung eines Fragebogens dauert etwa 10 bis 15 Minuten. Der zeitliche Aufwand der Interviews ist davon abhängig, ob Schlafprobleme vorhanden sind. Insgesamt muss hier von einer Dauer zwischen 15 und 45 Minuten ausgegangen werden.
Artikel-Nr. 01 397 01
€ Test komplett
112,00
Einsatzbereich: Das SEKJ ist für Schüler der Klassenstufen 5-10 aller allgemeinbildenden Regelschulen normiert. Dies entspricht einem Altersbereich von ungefähr 10–16 Jahren. Das Verfahren: Das SEKJ erfasst über drei Skalen Selbstwerthöhe, Selbstwertstabilität und Selbstwertkontingenz die drei wichtigsten Selbstwertfassetten. Die Skalen bestehen jeweils aus 10 bis 12 Aussagen (insgesamt 32 Items), zu denen auf einer 5-stufigen Antwortskala das Ausmaß der Zustimmung oder Ablehnung ausgedrückt werden soll. Die erfassten Werte geben Auskunft über die Höhe des Selbstwerts, über das Ausmaß an zeitlicher Stabilität sowie Sicherheit/Robustheit des Selbstwerts sowie über das Ausmaß der Unabhängigkeit des Selbstwerts von Ereignissen im Kompetenzund Leistungsbereich. Die Fassetten des Selbstwerts (Höhe, Stabilität und Kontingenz) sind an der Entstehung vielfältiger klinischer wie auch pädagogisch-psychologischer Auffälligkeiten beteiligt, wie beispielsweise Depression, Ängsten, Aggressivem Verhalten und Problemen im Lern- und Leistungsverhalten. Ein präzises und differenziertes Bild vom Selbstwert zu haben, ermöglicht daher die Erstellung zielgenauer und effektiver therapeutischer sowie pädagogischer Interventionen. Die Anwendung des SEKJ ist angezeigt bei (1) Verdacht auf eine Selbstwertproblematik, insbesondere bei Verdacht auf einen geringen, zerbrechlichen und stark schwankenden und/oder vom Erreichen selbstoder fremdgesetzter Standards abhängigen Selbstwert; (2) bei klinisch-psychologischen Auffälligkeiten (z. B. depressive Störungsbilder, affektive Störungen, Aggression, Essstörungen, riskantes oder selbstdestruktives Verhalten, Substanzmissbrauch, narzisstischen Tendenzen) sowie (3) bei Auffälligkeiten im Lern- und Leistungsverhalten (z. B. Self-handicapping und Prokrastination, übertriebener Perfektionismus, selbstwertdienliche Verzerrungen, Leistungs- und Prüfungsangst, Schwierigkeiten bei der Selbst- und Motivationsregulation, Underachievement). Bearbeitungsdauer: Die Bearbeitungsdauer beträgt ca. 20 Minuten inklusive Instruktion. Die Auswertung nimmt in etwa 5 Minuten in Anspruch. 01 513 01
www.testzentrale.de
Test komplett
www.testzentrale.de
99,00 €
Das DSM® aus Sicht der ICD
Horst Dilling / Klaus Reinhardt
Überleitungstabellen ICD-10/DSM-5® 2016. 120 S., Kt € 19.95 / CHF 26.90 ISBN 978-3-456-85559-2 AUCH ALS E-BOOK
Das Diagnostische und Statistische Manual Psychischer Störungen (DSM®) der American Psychiatric Association ist ein weltweit etabliertes Klassifikationssystem für psychische Störungen. Die neue, 2014 auf Deutsch erschienene Ausgabe DSM-5® bietet auch deutschsprachigen Benutzer tiefergehende Anregungen zu einer differenzierten und prozeduralen Diagnostik psychischer Störungen. Jedoch wird die Benutzung des DSM-5® für den mit der ICD-10 Vertrauten dadurch erschwert, dass zwar viele einzelne Diagnosen, nicht jedoch Struktur und
www.hogrefe.com
Reihenfolge der beiden Klassifikationssysteme übereinstimmen. Zudem verwendet DSM-5® als Diagnoseziffern diejenigen der amerikanischen Modifikation ICD-10-CM, die vielfach von der in den deutschsprachigen Ländern zur Diagnosenverschlüsselung und Abrechnung gebrauchten ICD-10-GM (German Modification) abweicht. Die Tabellen in diesem Buch erschließen die neue DSM-5®-Klassifikation aus der Sicht der vertrauten ICD-10 und erhöhen damit wesentlich die Benutzbarkeit des DSM-5® für deutschsprachige Leser.
SET 3-5
SETK-2
Sprachstandserhebungstest für Kinder im Alter zwischen 3 und 5 Jahren
Sprachentwicklungstest für zweijährige Kinder (2;0-2;11 Jahre)
F. Petermann Unter Mitarbeit von J.-K. Rißling / J. Melzer
Diagnose rezeptiver und produktiver Sprachverarbeitungsfähigkeiten
Einsatzbereich: Der SET 3-5 ermöglicht eine an den Entwicklungsstand angepasste, umfassende Beurteilung des Sprachstands für Kinder im Vorschulalter. Neben den zentralen Sprachbereichen können mit dem SET 3-5 wichtige Vorläuferfertigkeiten des Spracherwerbs erfasst werden. Das Verfahren: Es liegen insgesamt zwölf Untertests vor, die die folgenden Bereiche überprüfen: • Wortschatz • Phonetik/Phonologie • Semantische Relationen • Verarbeitungsgeschwindigkeit • Grammatik/Morphologie • auditive Merkfähigkeit • Emotionserkennung und Empathiefähigkeit • Pragmatik. Normen: Die Normierung wurde bundesweit an insgesamt N = 1.095 Kindern durchgeführt. Es liegen separate Normen (T-Werte und Prozentränge) für sechs Altersgruppen vor. Bearbeitungsdauer: Die Durchführung erfolgt im Einzelsetting und nimmt, je nach Alter und Störungsausprägung, etwa 15 bis 20 Minuten (für die Dreijährigen) bzw. 30 bis 45 Minuten (für die Vier- und Fünfjährigen) in Anspruch.
2., überarbeitete und neu normierte Auflage H. Grimm unter Mitarbeit von M. Aktas / S. Frevert Das Verfahren: Der SETK-2 erfasst mit vier Untertests, anhand von kindgerechtem Testmaterial, die rezeptive und produktive Sprachverarbeitungsfähigkeit. Mit Hilfe einer Kurzform des Verfahrens kann, im Sinne eines Screeninginstrumentes, eine Identifikation von Risikokindern erfolgen. Seit seinem Erscheinen vor 15 Jahren hat der SETK-2 eine breite Anwendung in der Praxis und auch in der Forschung erfahren. Nach wie vor ist er im deutschsprachigen Raum der einzige standardisierte und normierte Individualtest, der für eine genaue und prognostisch valide Einschätzung des Sprachentwicklungsstandes bei zweijährigen Kindern geeignet ist. Die vorliegende zweite Auflage ist nicht nur äußerlich verändert und besser lesbar, sondern weist auch wichtige inhaltliche Änderungen auf. Wesentlich ist die Neunormierung anhand einer aktuellen Stichprobe von 374 Kindern. Auf der Grundlage der langen Erfahrung mit dem Test wurden zudem neben einer Aktualisierung der einleitenden Kapitel insbesondere die Testdurchführung und die Auswertung um Ergänzungen und ganz konkrete Hilfestellungen (wie z.B. „Tipps und Fallstricke“) erweitert. Die Bewertungskriterien wurden überarbeitet und systematisiert. Dabei hat der Untertest Produktion II: Sätze eine grundsätzliche Überarbeitung und Vereinfachung erfahren. Im neuen Kapitel 6 „Häufig gestellte Fragen“ werden ganz konkret Fragen zur Durchführung, Auswertung und Anwendung beantwortet. Bearbeitungsdauer: Die Bearbeitungsdauer beträgt etwa 15 bis 20 Minuten.
01 543 01
Test komplett
678,00 € 01 270 01
www.testzentrale.de
Test komplett
www.testzentrale.de
498,00 €
Nadine Spörer / Helvi Koch / Nina Schünemann / Vanessa A. Völlinger
Thorsten Macha / Franz Petermann
Fallbuch ET 6-6-R
Das Lesetraining mit Käpt'n Carlo für 4. und 5. Klassen Nadine Spörer Helvi Koch Nina Schünemann Vanessa A.Völlinger
Das Lesetraining mit Käpt’n Carlo für 4. und 5. Klassen Ein Lehrermanual mit Unterrichtsmaterialien zur Förderung des verstehenden und motivierten Lesens
Ein Lehrermanual mit Unterrichtsmaterialien zur Förderung des verstehenden und motivierten Lesens
Der Entwicklungstest für Kinder von sechs Monaten bis sechs Jahren in der Praxis Thorsten Macha Franz Petermann
Fallbuch ET 6-6-R Der Entwicklungstest für Kinder von sechs Monaten bis sechs Jahren in der Praxis
Mit CD-ROM
2016, 103 Seiten, Großformat, inkl. CD-ROM, € 34,95 / CHF 45.50 ISBN 978-3-8017-2723-9 Auch als eBook erhältlich
2016, 166 Seiten, € 24,95 / CHF 32.50 ISBN 978-3-8017-2554-9 Auch als eBook erhältlich
Das Lesetraining mit Käpt‘n Carlo vermittelt praxisorientiert, wie das verstehende und motivierte Lesen von Sachtexten nachhaltig gefördert werden kann.
Der ET 6-6-R eignet sich für ein EntwicklungsScreening, für die Darstellung eines umfassenden Entwicklungsstatus sowie zur Beschreibung von Entwicklungsverläufen. Das Fallbuch veranschaulicht den Einsatz des Entwicklungstests vom Säuglings- bis in das Schulalter.
Emotionale Kompetenz bei Kindern
Franz Petermann Silvia Wiedebusch
Franz Petermann / Silvia Wiedebusch
Anja Görtz-Dorten / Manfred Döpfner
Emotionale Kompetenz bei Kindern
Soziales computerunterstütztes Training für Kinder mit aggressivem Verhalten (ScouT)
3., überarbeitete Auflage Anja Görtz-Dorten Manfred Döpfner
Soziales computerunterstütztes Training für Kinder mit aggressivem Verhalten (ScouT)
Klinische Kinderpsychologie
(Reihe: „Klinische Kinderpsychologie“, Band 7) 3., überarb. Auflage 2016, 297 Seiten, € 29,95 / CHF 39.90 ISBN 978-3-8017-2710-9 Auch als eBook erhältlich
2016, 134 Seiten, Großformat, inkl. DVD, € 59,95 / CHF 75.– ISBN 978-3-8017-2574-7
Die 3., überarbeitete Auflage stellt aktuelle Befunde und Entwicklungen zum Thema „emotionale Kompetenz“ bei Kindern vor.
ScouT ist ein computerunterstütztes soziales Problemlöse- und Kompetenztraining, mit dem aggressive Kinder im Alter von 6 bis 12 Jahren neue Lösungen für Gleichaltrigenkonfl ikte erlernen können.
www.hogrefe.de