Leseprobe Z. f. Päd. Psychologie 2018

Page 1

Jahrgang 31 / Heft 1 / 2017

Zeitschrift für

Pädagogische Psychologie German Journal of Educational Psychology

Herausgeber Andreas Knapp Detlef H. Rost Assoziierte Herausgeber Tina Hascher Samuel Greiff Beirat Roland Brünken, Martin Brunner, Joachim C. Brunstein, Susanne R. Buch, Oliver Dickhäuser, Roland Grabner, Michael Grosche, Hans Gruber, Regina Jucks, Detlev Leutner, Jens Möller, Jan Retelsdorf, Tina Seufert, Jörn Sparfeldt, Birgit Spinath, Nadine Spörer, Robin Stark, Ricarda Steinmayr, Elsbeth Stern, Ulrich Trautwein


ZLT-II

Zürcher Lesetest II Weiterentwicklung des Zürcher Lesetests (ZLT) von Maria Linder und Hans Grissemann

Franz Petermann / Monika Daseking 3., überarbeitete Auflage mit erweiterten Normen Der ZLT-II dient der Überprüfung des schulischen Leistungsstandes im Lesen. Er entdeckt zuverlässig Schüler/-innen mit Schwierigkeiten in diesem Bereich und bietet ebenso Hinweise zur Bestimmung von Fördermaßnahmen. Bereits ab Ende der ersten Klasse können Aussagen über den Leistungsstand eines Kindes im Vergleich zu Kindern der gleichen Klassenstufe gemacht werden. Diese frühe Einschätzung von Leseleistungen ermöglicht das Einleiten von Interventionen, bevor gravierende Auswirkungen auf sämtliche schulischen Leistungen auftreten können. Der Einsatz in höheren Klassenstufen kann einerseits der Förderdiagnostik, andererseits als Verlaufskontrolle bei Lesetrainings dienen.

Test komplett bestehend aus: Manual, 10 Protokollbogen, 10 Bogen

Zuverlässigkeit Für die einzelnen Klassenstufen betragen die internen Konsistenzen für die Untertests α = .83 (8. Klasse) und α = .93 (Ende 2./Anfang 3. Klasse). Die Retest-Reliabilität fallen für die Lesegeschwindigkeiten mit Werten zwischen r = .93 und r = .99 sehr hoch aus. Für die Lesefehler liegen die Koeffizienten zwischen r = .41 und r = .93.

Analyse der Lesefehler, 10 Arbeitsblätter Silbentrennung schriftlich A, 10 Arbeitsblätter Silbentrennung schriftlich B, 6 Wortlesekarten, 6 Textlesekarten,

Normen Es werden Prozentränge bzw. Prozentrangbänder und T-Werte (N = 1367) ab Ende der 1. bis zur 8. Klasse angegeben.

Stimuluskarte Schnelles Benennen 1, Stimuluskarte Schnelles Benennen 2 und Box € 103,00 / CHF 128.00

www.hogrefe.com

Bearbeitungsdauer Die Durchführungsdauer beträgt je nach besuchter Klassenstufe zwischen 15 und 35 Minuten.


Zeitschrift für

Pädagogische Psychologie German Journal of Educational Psychology

Jahrgang 31/Heft 1/2017

Herausgeber Andreas Knapp Detlef H. Rost Assoziierte Herausgeber Tina Hascher Samuel Greiff


Herausgeber

Prof. Dr. Andreas Knapp, Santa Rosa, California, GJEP@gmx.us Prof. Dr. Detlef H. Rost, Faculty of Psychology, South West University, Chongqing (CN) & Fachbereich Psychologie, Philipps-Universität Marburg

Assoziierte Herausgeber

Prof. Dr. Tina Hascher (geschäftsführend), Institut für Erziehungswissenschaft, Universität Bern Prof. Dr. Samuel Greiff, Maison des Sciences Humaines, Université du Luxembourg

Redaktionsassistenz

Dr. Gerda Hagenauer, Institut für Erziehungswissenschaft, Universität Bern, gerda.hagenauer@edu.unibe.ch

Beirat

Roland Brünken, Saarbrücken

Jens Möller, Kiel

Martin Brunner, Berlin

Jan Retelsdorf, Kiel

Joachim C. Brunstein, Gießen

Tina Seufert, Ulm

Susanne R. Buch, Wuppertal

Jörn Sparfeldt, Saarbrücken

Oliver Dickhäuser, Mannheim

Birgit Spinath, Heidelberg

Roland Grabner, Graz

Nadine Spörer, Potsdam

Michael Grosche, Wuppertal

Robin Stark, Saarbrücken

Hans Gruber, Regensburg

Ricarda Steinmayr, Dortmund

Regina Jucks, Münster

Elsbeth Stern, Zürich

Detlev Leutner, Essen

Ulrich Trautwein, Tübingen

Verlag

Hogrefe AG, Länggass-Str. 76, 3000 Bern 9, Tel. +41 (0) 31 300 45 00, verlag@hogrefe.ch, www.hogrefe.ch

Anzeigen

Josef Nietlispach, Hogrefe AG, Länggass-Str. 76, 3000 Bern 9, Tel. +41 (0) 31 300 45 69, inserate@hogrefe.ch

Satz & Druck

AZ Druck und Datentechnik GmbH, Kempten (Allgäu)

Erscheinungsweise

vierteljährlich

Indexierung

Social Sciences Citation Index, Social Scisearch, Current Contents/Social and Behavioral Sciences, PSYNDEX, PsycLIT, Contents Pages in Education, Sociological Abstracts, Linguistics and Language Behavior Abstracts, Child Development Abstracts and Bibliography, Psyc INFO, PsyJOURNALS, IBZ, IBR, Europ. Reference List for the Humanities (ERIH) und Scopus Impact Factor: 0.974 5-Year Impact Factor: 1.364 2015 Journal Citation Reports®, 2016 release, a Thomson Reuters product.

Bezugsbedingungen

Jahresabonnement Institute: CHF 393.– / € 306,– Private: CHF 158.– / € 117,– Einzelheft: CHF 72.50 / € 53,50 Porto und Versandgebühren Schweiz: CHF 14.– Europa: € 13,– Übrige Länder: CHF 26.– Unverbindliche Preisempfehlung Abbestellungen spätestens zwölf Wochen vor Ablauf des Abonnements.

Elektronischer Volltext

www.econtent.hogrefe.com/loi/zpp

ISSN-L 1010-0652 ISSN 1010-0652 (Print) ISSN 1664-2910 (online)

Zeitschrift für Pädagogische Psychologie (2017), 31 (1)

© 2017 Hogrefe


Inhalt Gasteditorial

5

Schulische Inklusion School Inclusion Bernd Ahrbeck

Originalartikel

Förderung sprachlicher Kompetenzen – Das Potenzial der Familiensprache für den Wortschatzerwerb aus Texten

13

Supporting Language Competencies – The Potential of the Family Language for Vocabulary Acquisition from Texts Nele McElvany, Annika Ohle, Wahiba El-Khechen, Ilonca Hardy und Melihan Cinar Wie gut können bildungsstandardbasierte Tests den schulischen Erfolg von Grundschulkindern vorhersagen?

27

How Well Can Standard-Based Tests Predict the Success of Primary-School Students? Gesine Fuchs und Martin Brunner Die individuell präferierte Bezugsnormorientierung und das Selbstkonzept von Grundschulkindern im Fach Mathematik

41

Individually Preferences for Reference Standard Orientation and Self-concept of Elementary School Children in Mathematics Annette Lohbeck Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse

57

Effort Avoiders: Listless or Helpless? A Latent Profile Analysis Katrin Lintorf, Susanne R. Buch, Jörn R. Sparfeldt und Detlef H. Rost Übersichtsartikel

Multiple Ziele und Lernmotivation: Das Forschungsprogramm „Theorie motivationaler Handlungskonflikte“

69

Multiple Goals and Motivation at School: The Theory of Motivational Action Conflicts Manfred Hofer, Stefan Fries und Axel Grund Kurzbeitrag

Qualität von Nachhilfeunterricht und ihre Korrelate

87

Instructional Quality of Private Tutoring and its Correlates Karin Guill, Oliver Lüdtke und Olaf Köller

© 2017 Hogrefe

Zeitschrift für Pädagogische Psychologie (2017), 31 (1)


Empirische Praxis in der Geistigbehindertenpädagogik

Jan Kuhl / Nils Euker (Hrsg.)

Evidenzbasierte Diagnostik und Förderung von Kindern und Jugendlichen mit intellektueller Beeinträchtigung 2016. 312 S., 15 Abb., 11 Tab., Kt € 29,95 / CHF 39.90 ISBN 978-3-456-85499-1 Auch als eBook erhältlich

Innerhalb der Erziehungs- und Bildungswissenschaft, der pädagogischen Praxis und auch der Bildungspolitik setzt sich immer stärker die Ansicht durch, dass die Unterrichtung, Förderung und Therapie von Kindern und Jugendlichen auf Grundlage fundierter empirischer Erkenntnisse erfolgen sollte. Innerhalb der deutschen Geistigbehindertenpädagogik hat sich dieser Ansatz der evidenzbasierten Praxis noch nicht so sehr verbreitet, wie in anderen Teildisziplinen der (Sonder-)Pädagogik.

www.hogrefe.com

Dennoch gibt es, international und inzwischen auch vermehrt in Deutschland, eine substanzielle Anzahl fundierter Studien zur Diagnostik und Förderung von Kindern und Jugendlichen mit intellektueller Beeinträchtigung in verschiedenen Inhaltsbereichen. Ziel des Buches ist es, die aktuelle Forschungslage zusammenzutragen und für weitere Forschung, insbesondere aber für eine evidenzbasierte Praxis nutzbar zu machen.


Gasteditorial

Schulische Inklusion Bernd Ahrbeck Humboldt-Universität zu Berlin, Institut für Rehabilitationswissenschaften, Berlin

Zusammenfassung: Die schulische Inklusion ist ein kontrovers behandeltes und affektiv vielfach hoch besetztes Thema. Häufig wird sie im Rückgriff auf die Menschenrechte mit Erwartungen überfrachtet und mit weitreichenden Zielen wie einer „Schule für alle“ versehen, die sich bei realistischer Betrachtung aus der UN-Behindertenrechtskonvention nicht herleiten lassen. So wünschenswert eine stärkere gemeinsame Beschulung von Kindern mit und ohne Behinderung auch ist: Auch die gemeinsame Beschulung muss sich in ihrer Leistungsfähigkeit legitimieren, empirische Befunde zur Kenntnis nehmen und die Grenzen des Möglichen anerkennen. Schüsselwörter: Inklusion, Behinderung, gemeinsame Beschulung School Inclusion Abstract: School inclusion is a controversial and highly affected topic. In recourse to human rights it is often overloaded with expectations and provided with far-reaching targets, for example a “school for all”, which can not be derived from a realistic view on the UN Convention on the Rights of Persons with Disabilities. As desirable a stronger joint schooling of children with and without disabilities is: The joint schooling has to be legitimized in terms of performance, has to take note of empirical findings and to recognize the constraints of the possible. Keywords: inclusion, disability, joint schooling

Deutschland auf der Anklagebank Es scheint so zu sein: Die Angriffe oder Anklagen, wenn man so will, kommen aus allen Richtungen, von innen und von außen. Der UN-Fachausschuss über die Rechte von Menschen mit Behinderungen (German Statement concerning the Draft General Comment on Article 24 CRPD, 2015) hat heftige Kritik an der Umsetzung der UN-Behindertenrechtskonvention (BRK) in Deutschland geäußert. „Mangelhaft“, so lautet die Note, die daraufhin in Teilen der deutschen Medien vergeben wurde: „Deutschland verfehlt aus der Sicht von Experten die Ziele […] bei der Eingliederung von Behinderten in wesentlichen Punkten“ (Beerheide, 2015, S. 1). Die regierungsunabhängige Monitoringstelle, die den Umsetzungsprozess überprüfen soll, stimmt dem zu. Von „einem inklusiven Bildungssystem, das Förderschülern überall vergleichbare Chancen bietet, ist Deutschland […] noch weit entfernt“ (Klemm, 2015, S. 7). „Aktuell [sei] Deutschland neben Belgien europäisches Schlusslicht“, wie Walter Hirche, der Präsident der deutschen UNESCOKommission (Späth, 2014, S. 1) mitteilt. Vor allem die Doppelstruktur, das Nebeneinander von Allgemeinen und Förderschulen wird heftig angegriffen, auch von der GEW, verbunden mit der Frage, ob eine inklusive Schule überhaupt mit einem gegliederten Schulsystem vereinbar sei (vgl. Brodkorb & Koch, 2013). © 2017 Hogrefe

Auch unter Vertreterinnen und Vertretern einer inklusiven Pädagogik finden sich vehemente Stimmen, die mit dem Stand der gemeinsamen Beschulung hart abrechnen. Es sei ein „Trauerspiel“, wie Deutschland die UN-Behindertenrechtskonvention „entkerne“ und gar nicht daran denke, sie verpflichtungsgemäß umzusetzen (Wocken, 2011b). Insbesondere das Bundesland Bayern gerät dabei ins Visier: „Bayern integriert ‚Inklusion‘ in ‚Separation‘!“ (Wocken, 2015, S. 117). Die inklusive Idee werde systematisch untergraben durch die Existenz mannigfacher institutioneller Angebote und dadurch, dass Schulformen mit unterschiedlicher Zielbestimmung fortgeführt werden. „Inklusion ist lediglich der Untermieter im Haus der Separation; der Hausherr und Vermieter Separation bestimmt in Wahrheit die Möglichkeiten und Grenzen einer inklusiven Pädagogik“ (ebd., S. 117). Im Mittelpunkt der Kritik stehen die hohen Sonderschulbesuchsquoten, die auch im Zuge des Inklusionsprozesses nicht wesentlich zurückgehen (Kultusministerkonferenz, 2014), sowie der Umstand, dass die Existenzberechtigung spezieller Schulen (oder auch Klassen) politisch und pädagogisch nicht grundsätzlich infrage gestellt wird (zum Beispiel: German Statement concerning the Draft General Comment on Article 24 CRPD, 2015). Dort, wo mit Sondereinrichtungen ins Gericht gegangen wird, finden sich nicht selten extreme Stellungnahmen, auch an prominenten Orten. So titelte der „Spiegel“ Zeitschrift für Pädagogische Psychologie (2017), 31(1), 5–11 DOI 10.1024/1010-0652/a000193


6

bereits vor einigen Jahren, Sonderschulen seien die „unverdünnte Hölle“ (Demmer, 2009), etwas Verwerfliches und Schreckliches, das den Schülerinnen und Schülern keinesfalls zugemutet werden dürfe. Und selbst die Feststellung des sonderpädagogischen Förderbedarfs, der keine Aussage über den Förderort enthält, gerät in einen schlimmen Verdacht. Als eine Kategorie, die „eine menschenrechtswidrige Entwürdigung“ darstelle (Wocken, 2012, S. 37) und in eine Reihe mit einem „sexistischen“ und „rassistischen“ Vokabular gestellt wird (Hinz, 2009, S. 173). Das sind harsche Worte, formuliert von führenden Vertretern einer inklusiven Pädagogik, die sich als wissenschaftlich versteht. Die Schärfe, mit der die Klagen vorgebracht werden, erklärt sich unter anderem daraus, dass mit der Inklusion erhebliche Erwartungen verknüpft werden, die auf einen grundsätzlichen Wandel verweisen. Darin dürfte ein wesentlicher Teil ihres Charmes liegen: In der Vorstellung, nunmehr könne eine gänzlich veränderte Form des Umgangs mit behinderten Schülerinnen und Schülern entstehen, im Rahmen der „Akzeptanz von Vielfalt“, die alles Bisherige in den Schatten stellt. Jetzt werde eine neue Beziehungsqualität unter allen Schülerinnen und Schülern möglich, die es zuvor nicht gegeben habe. Infolgedessen könne ein neues Zeitalter der Pädagogik beginnen, das vor allem der oder dem Einzelnen verpflichtet ist und sich nicht mehr primär an gesellschaftlichen Erwartungen und Normalitätszwängen ausrichtet. Die Schule soll dadurch eine neue Funktion erhalten: Selbst inklusiv geprägt, bereitet sie auf eine „inklusive“ Welt vor, die ihrerseits auf einer veränderten gesellschaftlichen „Architektur“ (Bielefeldt, 2010) beruht. Dazu ein Beispiel, das für viele andere steht: „Die BRK muss als ein Meilenstein erkannt werden, der zugleich Grenzstein ist zum Übergang in eine neue Welt, die gänzlich verschieden ist von dem, was aus der Vergangenheit kommt“ (Dreher, 2012, S. 30). Wiederum sind es tonangebende Stimmen des Inklusionsdiskurses, die sich diesen Zielen verpflichtet fühlen; es handelt sich bei Weitem nicht nur um einige wenige Außenseiterinnen und Außenseiter. Tenorth (2011, S. 1) stellt deshalb fest, dass sich gegenwärtig „[u]nter dem Begriff der Inklusion […] die größten moralisch-politischen Ansprüche und die höchsten pädagogischen Versprechen“ versammeln, und Dederich (2013, S. 33) fällt es „schwer, sich des Eindrucks zu erwehren, dass sich manche wissenschaftlichen Kommentatoren in einen Zustand der Verzückung schreiben“. Bei so viel Aufregung ist es empfehlenswert, sich (noch einmal) mit grundlegenden Fakten auseinanderzusetzen. Sitzt Deutschland wirklich zu Recht auf der Anklagebank? Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 5–11

Gasteditorial

Die Behindertenrechtskonvention – falsch verstanden? Die von Deutschland ratifizierte und 2009 in Kraft getretene UN-Behindertenrechtskonvention soll, wie ihr Name bezeugt, die Rechte von Menschen mit Behinderung umfassend stärken. Ihr Ziel ist es, dass sich ihre Lebens-, Lern- und Entwicklungssituation nachhaltig verbessert. Dazu gehört, dass Teilhabe und Partizipation an der Gesellschaft gesichert werden und möglichst wenig Ausschluss erfolgt. Der Autonomie von Menschen mit Behinderung räumt die Behindertenrechtskonvention einen hohen Stellenwert ein: Sie sollen selbst entscheiden können, wie sie leben möchten, was entsprechende Wahlmöglichkeiten voraussetzt. Und was keinesfalls übersehen werden darf: Die Konvention besteht ausdrücklich darauf, dass eine (behinderungsspezifische) Förderung auf dem höchst möglichen Niveau erfolgen soll. Angesichts des bedrückenden Lebens, das vielen behinderten Menschen weltweit aufgezwungen wird, lässt sich die Bedeutung der Konvention erst in vollem Umfang ermessen. Der Ausschluss von Bildungsprozessen und ein unerfüllt bleibendes Bildungsrecht sind für Millionen von Kindern eine schmerzliche Realität. Allein dadurch werden sie später am Rande stehen und kaum ein selbstbestimmtes Leben führen können. Ein solches elementares Bildungsrecht ist hingegen in den meisten europäischen Ländern gesichert, in Deutschland in vollem Umfang und ohne jede Einschränkung. Alle Kinder mit Behinderung besuchen eine Schule: „Wir grenzen heute niemanden mehr wegen ‚Bildungsunfähigkeit‘ aus der Schule aus“ (Tenorth, 2013, S. 7), diese Zeiten sind längst vorbei. Hinzu kommt, dass eine spezielle Förderung durch Sonderpädagoginnen und -pädagogen erfolgt, die selbst nach europäischen Maßstäben besonders hochwertig ausgebildet sind. Auch das sollte bei der Beurteilung der aktuellen Lage berücksichtigt werden. Bestehende Mängel und Unzulänglichkeiten, die es vielfach gibt, können dadurch in ein richtiges Licht gerückt und Veränderungsschritte, die unumgänglich sind, umsichtig eingeleitet werden. Überhaupt nicht strittig ist, dass es zukünftig eine vermehrte schulische Inklusion geben wird. Wer eine gemeinsame Beschulung wünscht, sollte sie in einem überschaubaren Zeitraum bekommen, das ist das einvernehmliche Rechtsverständnis der Bundesländer. Das Gemeinsame wird (eher) als der Regelfall angesehen, spezielle Einrichtungen müssen sich in ihrer Existenz besonders legitimieren. Darüber hinaus besteht aber in vielen weiteren grundlegenden Fragen kein Konsens. Die Ansichten über den einzuschlagenden Weg unterscheiden sich erheblich in Hinblick auf das anzustrebende Reformtempo und – was noch wichtiger ist – auch bezüglich des letztendli© 2017 Hogrefe


Gasteditorial

chen Zieles. Soll es die ungetrennte Gemeinsamkeit aller Schülerinnen und Schüler sein, eine „Schule für alle“, die auf jede Art von institutioneller Differenzierung verzichtet? Oder ein System, das für mehr Gemeinsamkeit sorgt, aber weiterhin unterschiedliche Entwicklungswege anerkennt, Wahlmöglichkeiten sichert und gerade darin den Sinn der UN-Behindertenrechtskonvention erfüllt sieht? Die UN-Behindertenrechtskonvention selbst eröffnet unterschiedliche Interpretationsmöglichkeiten, der Begriff der Inklusion kommt dort allerdings nur selten vor. Im angloamerikanischen Sprachraum findet er sich bereits in den 1980er Jahren, später wurde er mit der Konvention in Verbindung gebracht. Eine allgemein anerkannte Definition sucht man bis heute vergeblich. Die Auffassungen darüber, was unter Inklusion zu verstehen ist, variieren beträchtlich (Terfloth, 2013). Angesichts der Komplexität des zugrunde liegenden Sachverhalts ist das wenig erstaunlich. Die schulische Inklusion ist ein anspruchsvolles, in sich spannungsreiches und in Teilen auch widersprüchliches Phänomen. So kann bereits das Ziel einer optimalen Förderung mit der angestrebten gemeinsamen Beschulung in Konflikt geraten, wenn spezielle Einrichtungen einen größeren Erfolg versprechen. Bei einem Teil der Schülerinnen und Schüler mit schweren Verhaltensstörungen ist dies nachweislich der Fall. Auch bedeutet eine gemeinsame Beschulung nicht zwangsläufig, dass es zu einer erlebten Gemeinsamkeit kommt und eine innere Anbindung an Schule und Mitschülerinnen und Mitschüler gelingt. Häufig mag dies erfreulicherweise gelingen, aber eben nicht immer, wie alltägliche Erfahrungen und empirische Befunde zeigen (z. B. Singer, 2015; Stahlschmidt 2015). Es kann deshalb zu einer „exkludierenden Inklusion“ kommen, die Stichweh (2013, S. 6) der „inkludierende[n] Exklusion der Sonderschulen“ gegenüberstellt. Ein weiteres spannungsreiches und widersprüchliches Feld verbindet sich mit der Leistungsbewertung. In inklusiven Klassen soll jedes Kind für seine Leistungen möglichst die gleiche Anerkennung erhalten, niemand soll zurückgesetzt werden. Zugleich kann die Schule aber nicht darauf verzichten, dass sie Schülerinnen und Schüler miteinander vergleicht und unterschiedlich bewertet. Es sei denn, sie entledigt sich einer ihrer wichtigsten gesellschaftlichen Funktionen und wird dadurch lebensfremd (Ahrbeck, 2016). Bei nüchterner Betrachtung spricht vieles dafür, dass sich nicht alle Problemlagen im Rahmen einer einzigen Organisationsform lösen lassen. Zu dieser Einsicht ist auch Mary Warnock gelangt, zunächst eine der großen Befürworterinnen eines inklusiven Einheitsschulsystems (Warnock & Norwich, 2015). In den USA setzen sich die gleichen Kontroversen, die hierzulande geführt werden, auch noch nach 40 Jahren Erfahrung mit der gemeinsamen Beschulung („Mainstreaming“) fort. Sie nehmen an Heftigkeit eher noch zu (Felder & Schneiders, 2016). © 2017 Hogrefe

7

Auch wenn dies häufig und mit großer Emphase behauptet wird: Eine „Schule für alle“ lässt sich aus der UNBehindertenrechtskonvention nicht zwingend herleiten. Das würde ihren Kerngedanken gründlich missverstehen: „Der Auftrag zur Etablierung eines inklusiven Bildungssystems wird nach UN-Konvention und der Begrifflichkeit der UNESCO […] keinesfalls durch die Auflösung der Förderschulen und die Aufnahme aller Schülerinnen und Schüler mit Behinderung in die Allgemeine Schule erfüllt, sondern durch die Erfüllung der Bedürfnisse aller Lernenden“ (Hillenbrand, 2013, S. 366). Und diese Bedürfnisse sind bekanntlich sehr unterschiedlich. Dem trägt die Kultusministerkonferenz Rechnung, indem sie nüchtern konstatiert, dass die Konvention keine „Aussagen zur Gliederung des Schulwesens enthält“ (Kultusministerkonferenz, 2010, S. 4). Der Europarat (2006) hat in seinen Empfehlungen zur Umsetzung der Konvention festgestellt, dass Bildungstraditionen und national gewachsene Strukturen länderspezifisch berücksichtigt werden sollen. Eine Einheitslösung für alle Länder wird ausdrücklich nicht befürwortet. Bedauerlicherweise fanden diese Empfehlungen nur wenig Beachtung. Und die deutsche Stellungnahme (German Statement concerning the Draft General Comment on Article 24 CRPD, 2015) zur Kritik des UN-Fachausschusses (CRPD) fällt bemerkenswert eindeutig aus. Sie lässt keinen Zweifel daran aufkommen, dass es auch zukünftig institutionelle Differenzierungen geben wird, die Sonderschulen einschließen. Ob Deutschland auf die Anklagebank gehört, das hängt entscheidend davon ab, von welchem Inklusionsverständnis ausgegangen wird. Wenn die Leitidee eine vollständige gemeinsame Beschulung ist, gibt es sicherlich Grund zur Klage. Insbesondere dann, wenn zugleich das gegliederte Schulsystem abgeschafft werden soll. Wird Inklusion aber moderat aufgefasst und an institutionellen Differenzierungen festgehalten, stellen sich die Verhältnisse ganz anders dar. Dann geht es immer noch um die Frage, ob eingeleitete oder geplante Umsteuerungsprozesse zügig genug verlaufen. Aber andere, über Inklusionsquoten hinausgehende Gesichtspunkte geraten stärker in den Vordergrund. Die Bewertungsmaßstäbe werden komplexer, empirische Befunden gewinnen auf breiterer Ebene an Gewicht.

Die empirischen Befunde: Uneindeutig Die Erforschung der inklusiven Beschulung befindet sich in vielerlei Hinsicht noch am Anfang. Zu den Effekten unterschiedlicher Beschulungsformen liegen für viele FörZeitschrift für Pädagogische Psychologie (2017), 31 (1), 5–11


8

derschwerpunkte nur rudimentäre Erkenntnisse vor und gehaltvolle internationale Vergleichsstudien sind rar. Vor allem fehlt es an Untersuchungen, die sich mit Fragen zur differenziellen Indikation auseinandersetzen. In einer Gesamtschau stellt sich der Erkenntnisstand bei Weitem nicht so eindeutig dar, wie häufig behauptet wird. Die empirische Forschung hat zwar eine ganze Reihe von Ergebnissen hervorgebracht, die Vorteile bei gemeinsamer Beschulung belegen. Sie kann demzufolge für viele Schülerinnen und Schüler ertragreich sein, das steht außer Frage. Doch es finden sich auch Befunde, die dem widersprechen. Ein differenziertes Bild entsteht vor allem dann, wenn kognitive, emotionale und soziale Kriterien herangezogen und miteinander verglichen werden. Im Folgenden werden auch Ergebnisse genannt, die auf problematische Seiten gemeinsamer Beschulung verweisen. Nicht aus Voreingenommenheit gegenüber der Inklusionsidee, wie mitunter leichtfertig unterstellt wird, sondern damit ein ausgewogener Überblick entstehen kann. Daran mangelt es durchaus häufig, indem widersprechende Befunde schlichtweg nicht zur Kenntnis genommen werden – im Namen einer euphorischen Inklusionsbefürwortung. Vergleichsweise am besten untersucht ist die schulische Entwicklung von Kindern, die Lernbeeinträchtigungen aufweisen. Vieles spricht dafür, dass sie in ihrer kognitiven Entwicklung stärker von einer gemeinsamen Beschulung profitieren (z. B. Haeberlin, Bless, Moser & Klaghofer, 1991; Kocaj, Kuhl, Kroth, Pant & Stanat, 2014; Werning, 2014). Die Gründe können in einem stärkeren Anregungsmilieu liegen und darin, dass höhere Leistungsanforderungen gestellt werden. Andererseits ist ihre emotionale und soziale Situation oftmals eher ungünstig, wie ältere und neuere Untersuchungen zeigen (Haeberlin et al., 1991; Huber & Wilbert, 2012). Spezielle pädagogische Settings können hier vorteilhaft sein. Zumindest scheint sich eine zentrale inklusionspädagogische These nicht zu bestätigen: Es „lassen sich insgesamt keine Anhaltspunkte für eine positive Wirkung der heterogenen Lerngruppe auf die soziale Integration in der integrationspädagogischen Praxis nachweisen“ (Huber, 2009, S. 243 f.). Die größten Probleme bei der gemeinsamen Beschulung bereiten Schülerinnen und Schüler mit dem Förderschwerpunkt emotional-soziale Entwicklung. Dieses vielfach bestätigte Faktum ergibt sich bereits daraus, dass störendes Verhalten ein wichtiges Definitionsmerkmal dieser Gruppe ist. Ihre vollständige Inklusion gelingt in keinem Land, ganz unabhängig davon, wie Schulsysteme organisiert sind, ob eher gesamtschulartig oder institutionell differenziert. „Nach internationalen Schätzungen zeigen etwa 0.5–1 % der Schülerinnen und Schüler eines Jahrgangs derart gravierende Verhaltensprobleme, dass eine temporäre Förderung in separaten Lernumgebungen indiziert ist“ (Willmann, 2014, S. 319). Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 5–11

Gasteditorial

Ellinger und Stein (2012) kommen in einer Überblicksstudie nationaler und internationaler Befunde zu dem Ergebnis, dass mit unterschiedlichen Beschulungsformen jeweils spezifische Vor- und Nachteile verbunden sind. Sie warnen deshalb vor einer generellen Abschaffung spezieller Förderorte: „Die Aufrechterhaltung eines Angebotsspektrums scheint zugunsten der betroffenen Kinder und Jugendlichen dringend empfehlenswert“ (ebd., S. 85). Irritiert sind sie allerdings darüber, dass der aktuelle wissenschaftliche Erkenntnisstand in den Gutachten und Empfehlungen, die einzelne Bundesländer in Auftrag gegeben haben, keinen adäquaten Niederschlag findet. Er wird dort, wie sie überzeugend darlegen, selektiv wiedergegeben und zudem sehr einseitig interpretiert. Ein erhellender Überblick über angloamerikanische Untersuchungen zu unterschiedlichen Behinderungsformen findet sich bei Felder und Schneiders (2016). Auch hier zeigt sich kein einheitliches Bild; die Ergebnisse fallen häufig konträr aus. Bedauerlicherweise wird der angloamerikanische Diskurs hierzulande nur wenig wahrgenommen. Offene Fragen bestehen auch hinsichtlich der Gestaltung und der Wirksamkeit des gemeinsamen Unterrichts. Huber und Grosche (2012, S. 312) verweisen darauf, dass „bislang ein geeignetes Rahmenmodell zur Umsetzung von Inklusion fehlt“. Sie sehen in dem response-to-intervention-Modell (RTI) einen dafür geeigneten, zukunftsträchtigen Ansatz, ein neues Paradigma der Sonderpädagogik: „RTI ist ein organisatorisches, proaktives Konzept zur frühen Identifikation, Prävention und Intervention bei Lern- und Verhaltensproblemen“ (ebd., S. 312). Der Entwicklungstand der Kinder soll durch Screeningverfahren engmaschig erfasst werden und ein hochwertiger evidenzbasierter Unterricht dafür sorgen, dass Schülerinnen und Schüler auf unterschiedlichen Beeinträchtigungsniveaus eine jeweils optimale Förderung erhalten. In den USA sprechen zahlreiche Studien seit Ende der 1990er Jahren dafür, dass sich schulische Lern- und Entwicklungsprobleme mithilfe dieses Modells reduzieren lassen. Unübersehbar ist aber auch, dass dem Grenzen gesetzt sind, insbesondere bei schwerer beeinträchtigten Schülerinnen und Schülern, die einen sonderpädagogischen Förderbedarf aufweisen (Huber & Grosche, 2012; Limbach-Reich, 2015). Diesbezüglich sind Bedenken gegenüber dem RTI-Modell berechtigt, das sehr komplexen pädagogischen Problemlagen aufgrund seiner inneren Struktur kaum gerecht wird. Dem soll hier jedoch nicht weiter nachgegangen werden, entsprechende Überlegungen wurden an anderer Stelle ausgeführt (Ahrbeck, 2016). In Deutschland wird das RTI-Modell insbesondere im Rügener Inklusionsmodell (RIM) eingesetzt; es ist dort im Grundschulbereich empirisch untersucht worden (Voß et al., 2016). Neben neutralen Befunden stellen sich © 2017 Hogrefe


Gasteditorial

eine ganze Reihe positiver Effekte ein. Schülerinnen und Schüler mit ungünstigen Entwicklungsvoraussetzungen profitieren von diesem Modell, vor allem im Hinblick auf ihre kognitive Entwicklung: Sie lernen mehr. Die emotionale Befindlichkeit von Kindern mit Sprachbeeinträchtigungen ist allerdings in Sprachheilklassen deutlich günstiger. Bei Vertreterinnen und Vertretern eines totalen Inklusionsverständnisses („full inclusion“) ist das RTI-Modell auf heftige Kritik gestoßen. Es sei mit dem Anliegen der Inklusion prinzipiell unvereinbar, wie Hinz (2013, S. 8), einer der führenden Inklusionspädagogen, ausführt: „Der deutlichste Widerspruch zu inklusiven Vorstellungen dürfte darin bestehen, dass bei Prävention der Anschluss an die allgemeine Entwicklung angestrebt wird und Inklusion genau die Freiheit für das Gegenteil postuliert, nämlich die Legitimität individueller Lernwege und Entwicklungen.“ Das RTI-Modell fixiere Kinder auf ihre Besonderheit, etikettiere sie und liefere sie einem Förderbestreben aus, das einer freien Entwicklung im Weg steht. Eine Förderung, die den „Anschluss an die allgemeine Entwicklung“ sucht, verfolgt demnach ein illegitimes Ziel, da sie sich äußeren Entwicklungsvorgaben verpflichtet (vgl. Ferri, 2012; Prengel, 2013; Schumann, 2013). Wenn auf eine zielgerichtete Diagnostik und eine rechtzeitige Prävention verzichtet wird, verbleiben die Schülerinnen und Schüler in ihrer misslichen Ausgangssituation. Sie erfahren nicht die Förderung, die aufgrund ihres Entwicklungstandes pädagogisch geboten ist. Und das in Bereichen, die für ihre Weiterentwicklung von elementarer Bedeutung sind: im Lesen, im Schreiben und im Rechnen. Mit anderen Worten: Die unbedingte Akzeptanz benachteiligter Kinder in einer Pädagogik der Vielfalt steht in der Gefahr, ungewollt zu deren wohlwollender Vernachlässigung beizutragen, so Weiß (2013, S. 213). Bei der viel beschworenen Hinwendung zur Individualisierung von Maßstäben wird häufig übersehen, dass viele Kinder mit speziellem Förderbedarf sehr wohl anschlussfähig an die allgemeine Entwicklung sind und gängige Schulabschlüsse erreichen, zum Beispiel bei Sprachbehinderungen, Sinnesschädigungen oder motorischen Beeinträchtigungen, es sei denn, sie sind in ihren kognitiven Möglichkeiten stark eingeschränkt. Aber auch diese Schülerinnen und Schüler sollten auf einem möglichst hohen Lernniveau gefördert werden, um ihnen den besten Weg ins Leben zu weisen. Bei Kindern mit Lernbeeinträchtigungen, der größten Gruppe mit Förderbedarf, geht es darum, dass die Quote an unteren Schulabschlüssen erhöht wird. Zukünftig bedarf es einer weiteren qualitativ hochwertigen Forschung, an der es bisher in verschiedener Hinsicht mangelt. Sie sollte sich unter anderem mit den flächendeckenden Effekten gemeinsamer Beschulung beschäftigen © 2017 Hogrefe

9

und Gelingensbedingungen vor Ort analysieren, damit bestehende Schwierigkeiten reduziert oder überwunden werden können. Zugleich können dadurch auch die Grenzen des Möglichen und Sinnvollen zutage treten. Zu einem verantwortlichen Umgang mit der inklusiven Umsteuerung gehört es auch, dass vermeintliche Gewissheiten einer wissenschaftlichen Prüfung unterzogen werden. Beispielsweise anhand der Frage, bis zu einem welchen Grad der Heterogenität und Individualisierung des Unterrichts erfolgreiche Lernprozesse für alle Schülerinnen und Schüler möglich sind. Neue Erkenntnisse aus Finnland lassen Zweifel daran aufkommen, ob sich eine stark schülerinnen- und schülerorientierte, individualisierte Unterrichtsgestaltung mit einem allgemein hohen Leistungsniveau vereinbaren lässt (Heller Sahlgren, 2015; Kauffman & Badar, 2014; Wellenreuther, 2015).

Inklusion als Menschenrecht Die Menschenrechte bilden einen wichtigen Referenzpunkt des Inklusionsdiskures. Häufig werden sie bemüht, um der Forderung nach einer „Schule für alle“ Nachdruck zu verleihen, ausgestattet mit der Gewissheit moralischer Unangreifbarkeit. Wocken (2011a) setzt einem Autor, der spezielle Einrichtungen erhalten will, die Formel entgegen: Nicht die Sonderschulen, sondern die Menschenrechte müssten gerettet werden. Schumann (2009, S. 51) konstatiert, dass die „deutschen Schulverhältnisse auf dem Prüfstand des Völkerrechts“ vollständig scheitern, menschrechtlich seien sie grundsätzlich inakzeptabel. Und für Reimann (2014, S. 2) kennt Inklusion keine Grenzen: „Das ist so, als würde man sagen, Menschenrechte haben Grenzen.“ Wird die gemeinsame Beschulung als „Menschenrecht“ aufgefasst und die spezielle Beschulung als „Menschenrechtsverletzung“, dann ist das vordringliche Ziel unumgänglich abgesteckt. Der einzige Weg, der gegangen werden kann, besteht in der Auflösung der entsprechenden Einrichtungen, und ist geleitet von der Überzeugung, dass erst dadurch ein humanes schulisches Miteinander möglich wird: in jedem Fall, für jedes Kind, in jeder pädagogischen Konstellation. Die ubiquitäre Sinnhaftigkeit schulischer Gemeinsamkeit darf nicht mehr zur Disposition gestellt werden; dass es Kindern in einer speziellen Klasse oder Schule besser gehen könnte, wird von vornherein ausgeschlossen. Diese Möglichkeit steht außerhalb des Kalküls. Mit der für alternativlos gehaltenen „Schule für alle“ geht eine zwingende Verpflichtung zur Gemeinsamkeit einher, der sich niemand entziehen darf. Wahlmöglichkeiten für Schülerinnen und Schüler und Eltern entfallen. Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 5–11


10

Die menschenrechtliche Begründung eines totalen Inklusionsentwurfs gerät jedoch in eine bemerkenswerte Beziehung zur Lebenswirklichkeit. Empirische Befunde, die grundlegende Zweifel begründen, sind prinzipiell bedeutungslos geworden. Ob sie aus Systemvergleichen stammen oder sich auf die gemeinsame Beschulung beziehen, spielt dabei keine Rolle. Korrekturen sind nur noch innerhalb des Systems denkbar, mit der Folge, dass sich das Blickfeld erheblich einschränkt. Der lapidare Hinweis, kritische Ergebnisse seien nur ungünstigen Bedingungen geschuldet, sie müssten als reine Übergangsphänomene betrachtet werden, ist aufgrund des nationalen und internationalen Forschungsstandes wenig überzeugend. Eine realistische Bestandsaufnahme lehrt, dass absehbar nicht alle Schülerinnen und Schüler mit Behinderung von dem inklusiven Projekt profitieren. Für viele Kinder wird eine inklusive Beschulung gewinnbringend sein, aber sicher nicht für alle. Inklusive Prozesse können verbessert werden, in vielfacher Hinsicht, wie sich an vielen Orten zeigt. Aber es muss auch anerkannt werden, dass das „Steigerungspotenzial der ‚Fähigkeit von pädagogischen Einrichtungen‘ […] nicht unbegrenzt“ ist (Weiß, 2013, S. 212). Für den einzelnen Schüler / die einzelne Schülerin zählt in erster Linie, was ihm / ihr die Schule mit auf den Lebensweg geben kann. Das ist, vom Kind aus gedacht, die entscheidende Frage. In diesem Sinne muss sich jede Beschulungsform legitimieren – auch die gemeinsame Beschulung.

Literatur Ahrbeck, B. (2016). Inklusion. Eine Kritik. Stuttgart: Kohlhammer. Beerheide, R. (2015). Deutschland verfehlt Ziele. Ärzte Zeitung Online vom 13.3.2015. Zugriff am 12.04.2016. Verfügbar unter http://www.aerztezeitung.de/politik_gesellschaft/gp_specials/ versorgungsgesetz2011/article/881305/integration-deutschland-verfehlt-ziele.html Bielefeldt, H. (2010). Menschenrecht auf inklusive Bildung. Der Anspruch der UN-Behindertenrechtskonvention. VHN, 79(1), 66–69. Brodkorb, M. & Koch, K. (2013). Inklusion. Ende des gegliederten Schulsystems? Schwerin: Ministerium für Bildung, Wissenschaft, Kultur Mecklenburg Vorpommern. Dederich, M. (2013). Inklusion und das Verschwinden der Menschen. Über Grenzen der Gerechtigkeit. Behinderte Menschen, 26(1), 32–43. Demmer, U. (2009). „Die unverdünnte Hölle“. Der Spiegel, 63(2), 26– 29. Dreher, W. (2012). Winds of change – Inklusion wollen. In C. Beyer, G. Fohrer, W. Goschler, M. Heger, C. Kießling & C. Ratz (Hrsg.), Sonderpädagogik und Inklusion (S. 27–41). Oberhausen: Athena. Ellinger, S. & Stein, R. (2012). Effekte inklusiver Beschulung. Forschungsstand im Förderschwerpunkt emotionale und soziale Entwicklung. Empirische Sonderpädagogik, 3(22), 85–109. Europarat, Ministerkomitee. (2006). Empfehlung Rec(2006)5 des Ministerkomitees an die Mitgliedsstaaten zum Aktionsplan des

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 5–11

Gasteditorial

Europarats zur Förderung der Rechte und vollen Teilhabe behinderter Menschen an der Gesellschaft: Verbesserung der Lebensqualität behinderter Menschen in Europa 2006–2015. Zugriff am 12.04.2016. Verfügbar unter http://www.netzwerkartikel-3-de/dokum/er-aktionsplan-de-end2-pdf.pdf Felder, M. & Schneiders, K. (2016). Inklusion kontrovers. Herausforderungen für die Soziale Arbeit. Schwalbach: WochenschauVerlag. Ferri, B. A. (2012). Undermining inclusion? A critical reading of response to intervention (RTI). International Journal of Inclusive Education, 16(8), 863–880. German Statement concerning the Draft General Comment on Article 24 CRPD. (2015). Zugriff am 14.02.2016. Verfügbar unter http://www.ohchr.org/Documents/…/CRPD/…/Germany.p…D Haeberlin, H., Bless, G., Moser, U. & Klaghofer, R. (1991). Die Integration von Lernbehinderten. Versuche, Theorien, Erforschungen, Enttäuschungen, Hoffnungen. Bern: Haupt. Heller Sahlgren, G. (2015). Real Finnish Lessons: the true story of an educational superpower. Centre for policy studies. Zugriff am 14.10.2015. Verfügbar unter http:www.cps.org.uk/…/ 150410115444-RealFinnishLess Hillenbrand, C. (2013). Inklusive Bildung in der Schule. Probleme und Perspektiven für die Bildungsberichterstattung. Zeitschrift für Heilpädagogik, 64(9), 359–369. Hinz, A. (2009). Inklusive Pädagogik in der Schule – veränderter Orientierungsrahmen für die schulische Sonderpädagogik!? Oder doch deren Ende? Zeitschrift für Heilpädagogik, 60(5), 171–179. Hinz, A. (2013). Inklusion – von der Unkenntnis zur Unerkenntlichkeit!? – Kritische Anmerkungen zu einem Jahrzehnt Diskurs über schulische Inklusion in Deutschland. Zeitschrift für Inklusion-online, 8(1), 1–17. Huber, C. (2009). Gemeinsam arbeiten? Empirische Befunde und praxisrelevante Ableitungen zur sozialen Integration mit Sonderpädagogischem Förderbedarf im Gemeinsamen Unterricht. Zeitschrift für Heilpädagogik, 60(7), 242–248. Huber, C. & Grosche, M. (2012). Das response-to-interventionModell als Grundlage für einen inklusiven Paradigmenwechsel in der Sonderpädagogik. Zeitschrift für Heilpädagogik 63(8), 312–322. Huber, C. & Wilbert, J. (2012). Soziale Ausgrenzung von Schülern mit sonderpädagogischem Förderbedarf und niedrigen Schulleistungen im gemeinsamen Unterricht. Empirische Sonderpädagogik, 4(2), 147–165. Kauffman, J. M. & Badar, J. (2014). Instruction, not inclusion, should be the central issue in special education: an alternative view from the USA. Journal of Internationale Special Needs Eduation, 17(1), 13–20. Klemm, K. (2015). Inklusion in Deutschland. Daten und Fakten. Gütersloh: Bertelsmann-Stiftung. Kocaj, A., Kuhl, P., Kroth, A. J., Pant, H. A. & Stanat, P. (2014). Wo lernen Kinder mit sonderpädagogischem Förderbedarf besser? Ein Vergleich schulischer Kompetenzen zwischen Regel- und Förderschulen der Primarstufe. Kölner Zeitschrift für Soziologie und Sozialpsychologie, 66(2), 165–191. Kultusministerkonferenz. (2010). Pädagogische und rechtliche Aspekte der Umsetzung des Übereinkommens der Vereinten Nationen vom 13. Dez. 2006 über die Rechte von Menschen mit Behinderungen (Behindertenrechtskonvention – VN-BRK) in der schulischen Bildung. Beschluss vom 18.11.2010. Zugriff am 12.04.2016. Verfügbar unter http://www.kmk.org/fileadmin/ veroeffentlichung_beschluesse/2010/2010_11_18-Behindertenrechtskonvention.pdf Kultusministerkonferenz. (2014). Sonderpädagogische Förderung in Schulen 2003 bis 2012. Dokumentation Nr. 202 – Februar 2014. Zugriff am 13.04.2016. Verfügbar unter http://www.kmk.

© 2017 Hogrefe


Gasteditorial

org/fileadmin/Dateien/Pdf/Statistik/Dokumentationen/Dokumentation_SoPaeFoe_2012.pdf Limbach-Reich, A. (2015). „Response to Intervention“ (RTI) im Spannungsfeld Inklusiver Diagnostik. In H. Schäfer & C. Rittmeyer (Hrsg.), Handbuch Inklusive Diagnostik (S. 478–495). Weinheim: Beltz. Prengel, A. (2013). Inklusive Bildung in der Primarstufe. Eine wissenschaftliche Expertise des Grundschulverbandes. Frankfurt a. M.: Grundschulverband. Reimann, L. (2014). „Inklusion ist eine Belastung und Inklusion kennt keine Grenzen.“ Zugriff am 18.04.2016. Verfügbar unter http://inklusionsfakten.de/inklusion-ist-eine-belastung-gerade-bei-kindern-mit-verhaltensauffaelligkeiten-und-inklusion-hat-grenzen/ Schumann, B. (2009). Inklusion: eine Verpflichtung zum Systemwechsel – deutsche Schulverhältnisse auf dem Prüfstand des Völkerrechts. Zeitschrift für Inklusion-online, 3(1). Zugriff am 13.04.2016. Verfügbar unter http://www.inklusion-online.net/ index.php/inklusion-online/article/view/171/171 Schumann, B. (2013). Inklusive Bildung braucht inklusive Diagnostik. Zugriff am 04.01.2014. Verfügbar unter http://bildungsklick.de/a/88459/inklusive-bildung-braucht-inklusivediagnostik/ Singer, Ph. (2015). Theoretischer Anspruch und praktische Wirklichkeit des inklusiven Ansatzes im pädagogischen Diskurs. Zu Konsequenzen der normativen Einseitigkeit und des Umgangs mit Fremdheit. In R. Lelgemann, P. Singer & C. Walter-Klose (Hrsg.), Inklusion im Förderschwerpunkt körperliche und motorische Entwicklung (S. 41–84). Stuttgart: Kohlhammer. Späth, D. (2014). Inklusion: Deutschland muss aufholen. Deutsche Welle. Themen/Kultur vom 21.03.2014. Zugriff am 12.04.2016. Verfügbar unter http://www.dw.com/de/inklusion-deutschlandmuss-aufholen/a-17509837 Stahlschmidt, T. (2015). Max wurde zum Außenseiter. In K. Irle (Hrsg.), Wie Inklusion in der Schule gelingen kann und warum manche Versuche scheitern (S. 67–74). Weinheim: Beltz. Stichweh, R. (2013). Inklusion und Exklusion in der Weltgesellschaft – am Beispiel der Schule und des Erziehungssystems. Zeitschrift für Inklusion-online, 8(1), 1–9. Tenorth, H.-E. (2011). Inklusion im Spannungsfeld von Universalisierung und Individualisierung – Bemerkungen zu einem pädagogischen Dilemma. Zugriff am 12.04.2016. Verfügbar unter http://www.schulentwicklung.bayern.de/…/Tenorth-InklusionWuerzburg-2011.pdf Tenorth, H.-E. (2013). Inklusion – Prämissen und Problemzonen eines kontroversen Themas. In J. Baumert, V. Masuhr, J. Möller, T. Rieke-Baulecke, H.-E. Tenorth & R. Werning (Hrsg.), Inklusion.

© 2017 Hogrefe

11

Forschungsergebnisse und Perspektiven. Schulmanagement Handbuch 146 (S. 6–14). München: Oldenbourg,. Terfloth, K. (2013). Exklusion. Zugriff am 13.10.2015. Verfügbar unter http://www.Inklusion-lexikon.de/Exklusion_Terfloth.php Voß, S., Marten, K., Diehl, K., Mahlau, K., Sikora, S., Blumenthal, Y. et al. (2016). Evaluationsergebnisse des Projekts „Rügener Inklusionsmodell (RIM) – Präventive und Integrative Schule auf Rügen (PISaR)“ nach vier Schuljahren zum Messzeitpunkt Juli 2014. Zeitschrift für Heilpädagogik, 67(3), 133–149. Warnock, M. & Norwich, B. (2015). Special Educational Needs. Bloomsbury: A new look. Weiß, H. (2013). Inklusion in frühpädagogischen Einrichtungen – Spannungsfelder und Widersprüche. Frühe Bildung, 2(4), 212–215. Wellenreuther, M. (2015). Lehren und Lernen – aber wie? Empirisch-experimentelle Forschungen zum Lehren und Lernen im Unterricht. Baltmannsweiler: Schneider. Willmann, M. (2014). Lernschwierigkeiten und Verhaltensstörungen in Europa. In F. Wember, R. Stein & U. Heimlich (Hrsg.), Handlexikon Lernschwierigkeiten und Verhaltensstörungen (S. 316–319). Stuttgart: Kohlhammer. Werning, R. (2014). Stichwort: Schulische Inklusion. Zeitschrift für Erziehungswissenschaft, 17(4), 601–623. Wocken, H. (2011a). Rettet die Sonderschulen? – Rettet die Menschrechte! Ein Appell zu einem differenzierten Diskurs über Dekategorisierung. Zeitschrift für Inklusion-online, 6(4), 1–8. Wocken, H. (2011b). Über die Entkernung der Behindertenrechtskonvention. Ein deutsches Trauerspiel in 14 Akten, mit einem Vorspiel und einem Abgesang. Zeitschrift für Inklusion-online, 6(4), 1–28. Wocken, H. (2012). Das Haus der inklusiven Schule. Baustellen – Baupläne – Bausteine. Hamburg: Feldhaus. Wocken, H. (2015). Inklusion als Implantat. Bayern integriert „Inklusion“ in „Separation“. In R. Braches-Chyrek, C. Fischer, C. Mangione, A. Penczek & S. Rahm (Hrsg.), Herausforderung Inklusion. Schule – Unterricht – Profession. Bamberg: University of Bamberg Press, 97–121.

Prof. Dr. Bernd Ahrbeck Humboldt-Universität zu Berlin Institut für Rehabilitationswissenschaften Georgenstr. 36 10099 Berlin Deutschland bernd.ahrbeck@rz.hu-berlin.de

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 5–11


Franz Petermann · Ulrike Petermann

Training mit Jugendlichen

Franz Petermann Ulrike Petermann

Training mit Jugendlichen

Franz Petermann · Ute Koglin Heike Natzke · Nandoli von Marées

Verhaltenstraining in der Grundschule

Aufbau von Arbeits- und Sozialverhalten

Aufbau von Arbeits- und Sozialverhalten

Ein Programm zur Förderung emotionaler und sozialer Kompetenzen

9., überarbeitete und erweiterte Auflage

Franz Petermann / Ute Koglin Heike Natzke Nandoli von Marées

Verhaltenstraining in der Grundschule Ein Programm zur Förderung emotionaler und sozialer Kompetenzen

2., überarbeitete Auflage

mit CD-ROM

mit DVD

9., überarb. und erw. Auflage 2010, 293 Seiten, inkl. CD-ROM, € 39,95 / CHF 53.90 ISBN 978-3-8017-2320-0 Auch als eBook erhältlich

2., überarb. Auflage 2013, 248 Seiten, inkl. DVD, € 39,95 / CHF 53.90 ISBN 978-3-8017-2487-0 Auch als eBook erhältlich

Das Training fördert den Aufbau von Sozial- und Arbeitsverhaltensweisen in Ausbildung und Beruf. Zahlreiche Arbeitsmaterialien erleichtern die Umsetzung des Trainings in der Praxis.

Mit Hilfe des Verhaltenstrainings können die emotionalen und sozialen Kompetenzen von Kindern in der 3. und 4. Klasse der Grundschule gefördert werden.

Franz Petermann Heike Natzke Nicole Gerken Hans-Jörg Walter

Verhaltenstraining für Schulanfänger

Franz Petermann Heike Natzke / Nicole Gerken Hans-Jörg Walter

Franz Petermann Ulrike Petermann Dennis Nitkowski

Verhaltenstraining für Schulanfänger

Emotionstraining in der Schule

Ein Programm zur Förderung emotionaler und sozialer Kompetenzen

Ein Programm zur Förderung der emotionalen Kompetenz

Ein Programm zur Förderung emotionaler und sozialer Kompetenzen 4., aktualisierte Auflage

4., akt. Auflage 2016, 316 Seiten, inkl. CD-ROM, € 34,95 / CHF 45.50 ISBN 978-3-8017-2709-3 Auch als eBook erhältlich

2016, 244 Seiten, inkl. DVD, € 39,95 / CHF 48.50 ISBN 978-3-8017-2687-4 Auch als eBook erhältlich

Das bereits an zahlreichen Schulen erfolgreich eingesetzte Verhaltenstraining für Schulanfänger liegt nun in aktualisierter Auflage vor. Es dient dem Aufbau sozialer und emotionaler Kompetenzen bei Kindern.

Mit Hilfe des Trainings können die emotionalen Kompetenzen von Schülerinnen und Schülern der fünften bis siebten Klassenstufe gefördert werden.

www.hogrefe.com


Originalartikel

Förderung sprachlicher Kompetenzen – Das Potenzial der Familiensprache für den Wortschatzerwerb aus Texten Nele McElvany1, Annika Ohle2, Wahiba El-Khechen1, Ilonca Hardy1 und Melihan Cinar2 1 2

Institut für Schulentwicklungsforschung (IFS), Technische Universität Dortmund Johann Wolfgang Goethe Universität, Frankfurt am Main

Zusammenfassung: Sprachliche Kompetenzen wie der Wortschatz sind zentrale Voraussetzungen für schulischen Erfolg und gesellschaftliche Integration. Vor dem Hintergrund der Theory of Learning from Context (Sternberg & Powell, 1983) und dem Modell des Textverstehens (Kintsch, 1998) wird untersucht, in welchem Umfang Kinder nichtdeutscher Familiensprache (N = 143) neue Wörter aus Lesetexten lernen und ob die Einbeziehung der (türkischen) Familiensprache zur Wortschatzförderung im Deutschen zusätzlichen Nutzen hat. Die Analysen im Rahmen eines experimentellen Prä-Post-Testdesigns mit vier Bedingungen, in denen der Einbezug der Familiensprache manipuliert wurde, und mehrwöchiger Interventionszeit mit 15 Leseeinheiten ergeben ein Befundmuster für die Wortschatzveränderung nach dem Lesen der Texte, bei dem sich kein zusätzliches Potenzial des Einbezugs der Familiensprache zeigt. Die Befunde werden hinsichtlich ihrer Bedeutung für Theorie und zukünftige Forschungsdesiderata sowie die schulische Praxis diskutiert. Schlüsselwörter: Wortschatz, Kinder mit Migrationshintergrund, Lesekompetenz, Theory of Learning from Context, Intervention Supporting Language Competencies – The Potential of the Family Language for Vocabulary Acquisition from Texts Abstract: Language competencies such as vocabulary are core prerequisites for educational success and integration in society. In reference to the Theory of Learning from Context (Sternberg & Powell, 1983) and the Model of text comprehension (Kintsch, 1998) the study investigates (a) to what extent children with non-German family language (N = 143) acquire new words from reading texts and (b) if including the (Turkish) family language has an additional utility for German vocabulary learning. Analyses of vocabulary change after text reading within an experimental pre-post test design with four conditions, in which the inclusion of the family language was systematically manipulated, and multi week intervention covering 15 reading units lead to a pattern of results, in which an additional potential of the family language could not be identified. The results are discussed regarding their relevance for theories, future research, and educational practice. Keywords: Vocabulary, children with Immigrant Background, reading comprehension, theory of learning from context, intervention

Die demografische Entwicklung verdeutlicht seit Langem, dass im Zuge weltweiter Migrationsbewegungen auch im deutschen Bildungssystem zunehmend mehr Kinder und Jugendliche mit einem Migrationshintergrund und in vielen Fällen einer anderen Familiensprache als Deutsch beschult werden (Statistisches Bundesamt, 2014). Ergebnisse aktueller Schulleistungsuntersuchungen (z. B. Bos, Tarelli, Bremerich-Vos & Schwippert, 2012) weisen übereinstimmend darauf hin, dass diese Kinder und Jugendlichen nach wie vor sowohl im sprachlichen als auch im mathematisch-naturwissenschaftlichen Bereich geringere Leistungen erreichen als ihre Peers ohne Migrationshintergrund. Gleichzeitig erwerben sie seltener höhere Bildungsabschlüsse (Autorengruppe Bildungsberichterstattung, 2014; Maaz, Baumert, Gresch & McElvany, 2010). © 2017 Hogrefe

Als Erklärung werden hierfür insbesondere ihre mangelnden sprachlichen Kompetenzen angeführt, die zu den wichtigsten Prädiktoren für Erfolg im deutschen Schulsystem zählen (z. B. Dollmann & Kristen, 2010). In vielen Schulleistungsstudien wird die sprachliche Kompetenz durch die Lesekompetenz der Schülerinnen und Schüler operationalisiert; zunehmend liegen jedoch auch Studien vor, die eine differenziertere Berücksichtigung von Teilkompetenzen, beispielsweise mündliche Sprachkompetenz, und deren Relevanz für die schulische Leistungsentwicklung berücksichtigen (z. B. Maluch, Kempert, Neumann & Stanat, 2015). Die Befunde zur Bedeutung der sprachlichen Kompetenzen für Schulerfolg legen nahe, der Förderung der sprachlichen Fähigkeiten besondere Aufmerksamkeit in Forschung und Praxis zu widmen. EiZeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25 DOI 10.1024/1010-0652/a000189


14

nen geeigneten Ansatzpunkt bildet dabei der Wortschatz als eine grundlegende Facette von Sprachfähigkeit und Voraussetzung für rezeptive sowie produktive sprachliche Handlungen. In Bezug auf den Zusammenhang zwischen Wortschatz und Lesen wurde bisher theoretisch vor allem auf die Bedeutung des Trainings von Wortschatz für das (Text-)Verständnis hingewiesen. Weniger berücksichtigt wurde hingegen die Förderung des Wortschatzes durch eine gute Text- und Verstehenskompetenz (u. a. Fukkink, 2005; Nagy, Herman & Anderson, 1985; Swanborn & de Glopper, 1999): Der Wortschatzzuwachs erfolgt durch das Lernen aus dem Kontext der gelesenen Texte, indem bisher unbekannte Wörter und neue Wortbedeutungen bekannter Wörter aus dem Kontext erschlossen werden und damit der Umfang des mentalen Lexikons in Breite und Tiefe zunimmt (vgl. McElvany & Artelt, 2009). Nicht untersucht wurde bisher, ob dieses Erlernen neuen Wortschatzes aus dem Kontext des Gelesenen für bilinguale Kinder besser gelingt, wenn zusätzlich zu den deutschen Lesetexten im Vorfeld zunächst eine Textfassung in der Herkunftssprache erlesen wird, um den Aufbau eines Kontextverständnisses zu fördern. Das Potenzial der Einbeziehung der Herkunftssprache für die Effektivität des Wortschatzlernens aus Lesetexten für Kinder mit anderer Familiensprache als Deutsch soll in der vorliegenden Studie untersucht werden.

Theoretischer Hintergrund Schülerinnen und Schüler mit Migrationshintergrund Die Heterogenität der Schülerschaft manifestiert sich anhand unterschiedlicher Kriterien und Merkmale, wobei differierende Vorschläge für die Dimensionalität der Heterogenität vorliegen (vgl. Scharenberg, 2012). Neben individuellen und institutionellen Merkmalen sind soziale Hintergrundmerkmale relevante Aspekte, die zu systematischen Unterschieden zwischen Lernenden vor und während der Schulzeit beitragen (Becker & Lauterbach, 2012; Erikson & Goldthorpe, 2010; Putnam, 2015). Eines der zentralen Merkmale ist dabei die Herkunft aus einer Familie mit Migrationshintergrund. Damit eng verbunden ist die Unterscheidung, ob die Familiensprache Deutsch oder eine andere Sprache ist. Die größte Subgruppe mit Migrationshintergrund im deutschen Bildungssystem sind Kinder und Jugendliche mit türkischem Migrationshintergrund (vgl. Statistisches Bundesamt, 2014). Unabhängig davon, ob das Merkmal Migrationshintergrund über Staatsangehörigkeit, Geburtsland des Kindes bzw. der Eltern oder Familiensprache operationalisiert wird, zeigen Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25

N. McElvany et al., Wortschatzförderung mit Familiensprache

sich systematische Unterschiede sowohl in Hinblick auf den schulischen Kompetenzerwerb als auch die Bildungspartizipation zuungunsten der Gruppe der Kinder mit im Vergleich zu denen ohne Migrationshintergrund (z. B. Atger, 2009). Die geringeren Leistungen im Vergleich zu Gleichaltrigen mit deutscher Familiensprache zeigen sich insbesondere für Lernende, die zu Hause (auch) Türkisch sprechen (u. a. Segeritz, Walter & Stanat, 2010), und bleiben signifikant, wenn der sozioökonomische Status der Familie mit in Betracht gezogen wird (Klieme et al., 2010). So zeigen auch die Ergebnisse eines Ländervergleichs aus dem Jahr 2011, dass die Disparitäten in den Lesekompetenzen selbst nach statistischer Kontrolle des Bildungsniveaus der Eltern, des sozioökonomischen Status der Familien und der in der Familie gesprochenen Sprache für türkischstämmige Schülerinnen und Schüler weiterhin groß und statistisch bedeutsam sind (Haag, Böhme & Stanat, 2012). In Bezug auf die Bildungspartizipation erhalten Heranwachsende mit Migrationshintergrund wesentlich häufiger eine Schulformempfehlung für niedriger und seltener für hoch qualifizierende Schulformen als Heranwachsende ohne Migrationshintergrund. Außerdem besuchen sie deutlich häufiger eine Hauptschule und seltener ein Gymnasium als ihre Peers ohne Migrationshintergrund (Autorengruppe Bildungsberichterstattung, 2014). Da sowohl die schulbezogene Motivation der Kinder und Jugendlichen mit Migrationshintergrund als auch die Bildungsaspiration der Eltern für ihre Kinder trotz einer vergleichsweise geringeren Teilhabe an höheren Bildungsgängen nicht geringer und in einigen Bereichen sogar höher ist als in der Gruppe von Kindern ohne Migrationshintergrund, können diese Faktoren den deutlich geringeren Bildungserfolg dieser Schülergruppe nicht erklären (Ditton, Krüsken & Schauenberg, 2005; Kigel, McElvany & Becker, 2015; vgl. auch immigrant optimism-Hypothese von Kao & Tienda, 1998). Dies deutet darauf hin, dass das ungünstige Bildungsmuster zu substanziellen Teilen auf Unterschiede in den Kompetenzen im Sinne primärer sozialer Ungleichheiten (vgl. Boudon, 1974) zurückzuführen ist. Das Niveau ihrer deutschen Sprachkenntnisse stellt für Kinder mit anderer Familiensprache nicht nur für den schulischen Kompetenzerwerb, sondern auch für den bildungsbiografisch entscheidenden Übergang von der Grundschule in die Sekundarstufe I eine schwerwiegende Hürde dar (Maaz et al., 2010; vgl. auch Dollmann & Kristen, 2010). Folglich werden die ungünstigeren Bildungsverläufe in Bezug auf Bildungsbeteiligung und Bildungserfolg neben den erschwerten Zugängen zu Bildung aufgrund eines geringeren sozialen Status und einer möglichen Unkenntnis über das bundesrepublikanische Bildungssystem wesentlich auf die migrationsspezifisch bedingten geringeren sprachlichen Kompetenzen zurückgeführt (vgl. Kristen & Dollmann, 2009). Deren gezielte © 2017 Hogrefe


N. McElvany et al., Wortschatzförderung mit Familiensprache

Förderung ist demnach unabdingbar. Eine zentrale Komponente der Sprache, die es zu fördern gilt, ist dabei der Wortschatz.

Sprachliche Kompetenzen: Wortschatz Sprachkompetenzen wie der Wortschatz sind als ein zentrales kulturelles Werkzeug eine wesentliche Voraussetzung für schulischen und beruflichen Erfolg sowie lebenslanges Lernen. Dieser umfasst die Gesamtheit aller verfügbaren Wörter im mentalen Lexikon und wird in einen produktiven (aktiven) und einen rezeptiven (passiven) Wortschatz unterteilt (Ulrich, 2007). Während der produktive Wortschatz die Bildung sinnvoller Sätze und Äußerungen ermöglicht, trägt der rezeptive Wortschatz zum Verständnis gesprochener und geschriebener Sprache bei (Graves, 2006). Darüber hinaus wird zwischen einem quantitativen Aspekt der Wortschatzbreite (Anzahl lexikalischer Einheiten im mentalen Lexikon) und einem qualitativen Aspekt der Wortschatztiefe (Ausmaß der genannten Wissensaspekte über Wörter) unterschieden (Tannenbaum, Torgesen & Wagner, 2006). Bei der Verwendung von Wortschatz in sprachlichen Handlungskontexten wird weiterhin zwischen Alltagssprache und allgemeiner sowie fachspezifisch-akademischer Sprache unterschieden; insbesondere letztere Sprachkontexte werden als besondere Herausforderung für Kinder nichtdeutscher Herkunftssprache angenommen (Cummins, 1979; jedoch: Eckhardt, 2008). Im schulischen Fachunterricht sind Begriffsbildungsprozesse im Sinne des Erschließens und Erlernens von Wortbedeutungen zentraler Aspekt des instruktionalen Geschehens (vgl. Meloefski, 2007). Da die Häufigkeit der Begriffe aus dem Fachunterricht in der Lebensumwelt der Kinder oftmals nur gering ist, sind sie vielen Kindern unbekannt und es besteht nur eine geringe Wortschatztiefe, d. h., sie können nicht flexibel in verschiedenen Kontexten eingesetzt werden. Bildungssprachlicher Wortschatz wird häufig durch Charakteristika wie Komposita, Fachbegriffe sowie in Texten durch hohe lexikalische Dichte und Kontextferne gekennzeichnet (vgl. Schmölzer-Eibinger, 2013). Insgesamt kann die Verfügbarkeit eines angemessenen (bildungssprachlichen) Wortschatzes in Breite und Tiefe als notwendige Voraussetzung für den Verständnisaufbau bei mündlichen und schriftlichen Unterrichtsinhalten, die Teilnahme am Unterrichtsgeschehen, das Erlernen der entsprechenden Fachinhalte und die mündliche sowie schriftliche Präsentation eigener Fähigkeiten, Gedanken, Gefühle und Meinungen angesehen werden (vgl. Lesaux, Lipka & Siegel, 2006; Scarborough, 2001; Sénéchal, Ouellette & Rodney, 2006). Beim Lesen ermöglicht es der Wortschatz einerseits, lokale Kohärenz herzustellen, andererseits ist er aber auch © 2017 Hogrefe

15

für den Aufbau eines Gesamtverständnisses notwendig (vgl. National Institute of Child Health and Human Development [NICHD], 2000). Wie für die Dekodierfähigkeit so wird auch für den Wortschatz angenommen, dass der schnelle und sichere Zugriff auf das mentale Lexikon dazu führt, dass vermehrt kognitive Ressourcen wie z. B. die Arbeitsgedächtniskapazität für höhere kognitive Prozesse beim Lesen zur Verfügung stehen und ein besseres Gesamtverständnis erzielt wird. So lässt sich für die Grundschule zeigen, dass der vor Schulbeginn gemessene Wortschatzumfang ein zuverlässiger Prädiktor für das Leseverstehen während der späteren Grundschulzeit ist (Scarborough, 2001). Die sprachliche Sozialisation erfolgt zunächst primär im familiären Kontext, wo auditive und darauf aufbauend Wortschatz- und Grammatikfähigkeiten ausgebildet werden (vgl. Klann-Delius, 1999; Szagun, 2006). Mit zunehmendem Alter der Kinder gewinnen aber auch die institutionellen Kontexte an Bedeutung. Im Verlauf der Grundschulzeit erweitern Kinder ihren Wortschatz stetig. Insbesondere mit dem Erwerb schriftsprachlicher Kompetenzen ist ein großer Wachstumsschub zu verzeichnen, welcher sich über die gesamte Schulzeit fortsetzt (Ulrich, 2010). Für bilinguale Kinder ist gut dokumentiert, dass sie auch bei Dominanz der Zweitsprache oder Ausgewogenheit auf hohem Niveau im Vergleich zu monolingualen Kindern über einen geringeren Wortschatz in der Zweitsprache verfügen (z. B. Bialystok, 2009; Mahon & Crutchley, 2006; Paradis, 2007; für Deutschland: u. a. Limbird, 2007). Am Ende der Pflichtschulzeit zeigt unter anderem die DESI-Studie (Deutsch Englisch Schülerleistungen International), dass der Rückstand im Bereich Wortschatz bei Schülerinnen und Schülern mit nichtdeutscher Erstsprache im Vergleich zu Kindern mit Deutsch als Erstsprache größer ist als bei anderen Sprachdimensionen (vgl. Willenberg, 2008). Gleichzeitig geht man im Bereich der Bilingualitätsforschung davon aus, dass sich die beiden Wortschatzfelder in Erst- und Zweitsprache einerseits auf eine gemeinsame begriffliche Basis beziehen, andererseits spezifische Wörter je unterschiedliche Bedeutungen und Konnotationen besitzen, welche in den für Erst- und Zweitsprache typischen Kontexten aktiviert werden (Bialystok, 2015). Es stellt sich vor diesem Hintergrund die Frage, wie der Wortschatzerwerb in der Instruktionssprache Deutsch von Kindern mit Migrationshintergrund durch pädagogische Maßnahmen systematisch gefördert werden kann.

Theoretische Grundlagen der impliziten Wortschatzförderung Ansätze der Wortschatzförderung werden danach unterschieden, ob es sich um eine explizite oder implizite InstZeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25


16

ruktion handelt (schon Werner & Kaplan, 1950; vgl. auch Marulis & Neuman, 2010; NICHD, 2000). Das Lernen neuer Wörter erfolgt bei der expliziten Instruktion direkt und auch ohne kontextuelle Einbettung des zu lernenden Wortschatzes (z. B. beim Vokabellernen). Bei der impliziten Instruktion geschieht das Lernen neuer Wörter hingegen beiläufig, beispielsweise durch das Lesen eines Textes – während das primäre Ziel darin besteht, ein Gesamtverständnis des Textinhalts aufzubauen bzw. zu erhalten (Hulstijn, Hollander & Greidanus, 1996). Sowohl in der Forschung zum Erst- als auch zum Zweitsprachenerwerb dominiert die Annahme, dass die meisten Wörter implizit aus dem Kontext gelernt werden (vgl. auch Landauer, McNamara, Dennis & Kintsch, 2007). Sternberg und Powell (1983) greifen in ihrer Theory of Learning from Context den Grundgedanken der impliziten Instruktion auf und postulieren, dass der Erwerb von neuem Wortschatz durch das Ableiten unbekannter Wörter aus dem Kontext eines gelesenen Textes erfolgen kann. Nach Sternberg (1987) laufen beim Erwerb neuer Wörter aus dem Kontext drei Prozesse ab: (a) die Unterscheidung von relevanten und irrelevanten Informationen im Text, (b) die gezielte Kombination relevanter Hinweise und (c) die Kombination ausgewählter, textimmanenter Informationen mit eigenen Vorkenntnissen. Der Theorie liegen zwei wesentliche Annahmen zugrunde: Die erste Annahme folgt aus der Frage, warum Wörter in manchen Kontexten leichter zu erlernen sind als in anderen. Nach Sternberg und Powell (1983) ist die Schwierigkeit beim Lernen eines neuen Wortes größtenteils vom Textkontext abhängig, der entweder das Lernen vereinfacht oder es hemmt. Sie beschreiben hierfür detailliert spezifische Bedingungen. Kontextuelle Hinweise, die das Wortverständnis fördern sollen, werden in acht Kategorien organisiert, wie z. B. zeitliche, räumliche oder wertende Hinweise. Weiterhin gibt es eine Vielzahl mediierender Variablen, welche die Wahrscheinlichkeit, mit der die Bedeutung eines Wortes erschlossen werden kann, beeinflussen. Diese betreffen das Wort selbst (z. B. Häufigkeit der Erwähnung), aber auch den Kontext (z. B. Nähe der Hinweise zum Wort) und die lernende Person (z. B. themenbezogenes Vorwissen; vgl. Nation, 2004). Die zweite Annahme bezieht sich auf diese Unterschiede in der lernenden Person dahingehend, dass einige Lernende besser im Erwerb neuer Wörter sind als andere. Der Grund für individuelle Unterschiede wird in der Fähigkeit der Lesenden gesehen, nützliche und hemmende kontextuelle Hinweise erkennen und damit umgehen zu können. Neben textimmanenten Bedingungsfaktoren ist demnach auch das Textverständnis der Lernenden eine wichtige Voraussetzung dafür, die Bedeutung unbekannter Wörter aus dem Kontext abzuleiten. Das Lernen aus dem Kontext stellt dabei eine Möglichkeit der IntegratiZeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25

N. McElvany et al., Wortschatzförderung mit Familiensprache

on zweier Aspekte der verbalen Fähigkeiten – Wortschatz und Textverständnis – dar. Textverständnis basiert nach Kintsch (1998) auf der Herstellung lokaler und globaler Kohärenz auf Basis des Textes. Die zentrale Annahme des Konstruktions-Integrations-Modells bezieht sich auf die simultane Speicherung von Textmaterial auf drei hierarchisch aufeinander aufbauenden Ebenen mentaler Repräsentation: Oberflächenrepräsentation, propositionale Repräsentation und Situationsmodell. In der Oberflächenrepräsentation werden der genaue Wortlaut und die exakte Struktur eines Textes abgebildet. Die propositionale Repräsentation gibt hingegen die im Text enthaltene Bedeutung wieder. Im Situationsmodell findet die elaborierteste Art der Verarbeitung statt, indem die Textinformation mit relevantem Vorwissen verknüpft wird. In dem Modell von Kintsch (1998) wird angenommen, dass Lesende verschiedene Formen der Textrepräsentation mental bilden, wobei der Wortschatz ein zentraler Bedingungsfaktor für den Aufbau eines propositionalen Modells auf Textebene und den Aufbau eines übergreifenden Situationsmodells des im Text Dargestellten ist. Für den Ansatz zum Lernen neuer Wörter aus einem Textkontext wurde in verschiedenen Studien Evidenz gefunden (z. B. Cunningham & O'Donnell, 2012; Fukkink, 2005; McElvany & Artelt, 2007; für weitere Beispiele NICHD, 2000; vgl. Metaanalyse von Swanborn & de Glopper, 1999). Auch in einer aktuellen Studie mit Grundschulkindern in Deutschland konnte gezeigt werden, dass das implizite Lernen neuer Wörter aus dem Textkontext für Kinder mit deutsch- und mit türkischsprachigem Familienhintergrund effektiv ist: Der Wortschatzzuwachs beim zweimaligen Lesen eines narrativen Textes ohne zusätzliche Instruktion oder Hilfsmittel lag bei 0.6 Standardabweichungen des Wortschatzes im Prätest (El-Khechen, Gebauer & McElvany, 2012).

Impliziter Wortschatzerwerb bei Kindern nichtdeutscher Herkunftssprache und das Potenzial der Herkunftssprache Es liegen bereits Hinweise darauf vor, dass der Ansatz des Wortschatzlernens aus dem Kontext grundsätzlich auch für Kinder mit einer Zweitsprache wirksam ist (z. B. ElKhechen et al., 2012; Carlo et al., 2004; Moore & Surber, 1992). Allerdings ist der Prozess der Bedeutungsentnahme aus einem Textkontext für Kinder mit einem weniger umfangreichen Wortschatz in der Sprache des Textes besonders schwierig. Gemäß der Theorie von Sternberg und Powell (1983) und dem Modell von Kintsch (1998) ist von einer kumulativen Benachteiligung von Kindern mit nichtdeutscher Familiensprache beim Lernen neuer © 2017 Hogrefe


N. McElvany et al., Wortschatzförderung mit Familiensprache

Wörter aus dem Textkontext auszugehen: Sie haben zunächst häufig einen geringeren Ausgangswortschatz im Deutschen, der zu geringeren Textverständnisleistungen führt. Im Folgenden haben sie dann beim Erwerb von zusätzlichem Wortschatz schlechtere Bedingungen, da sie durch das schlechtere Gesamtverständnis auch weniger neue Wortbedeutungen aus dem Kontext erschließen können. Wird jedoch die Einbeziehung der Familiensprache zum Aufbau eines grundlegenden Kontextverständnisses im Sinne des Situationsmodells nach Kintsch (1998) ermöglicht, könnte sich dieses auf den Wortschatzaufbau im Deutschen auswirken: So ist konkret zu vermuten, dass Kinder bei zusätzlichen Textverarbeitungsprozessen in ihrer Familiensprache ein besseres Gesamtverständnis eines Textes aufbauen können, da Kohärenzbildungsprozesse zunächst in der Familiensprache ablaufen. In einem ersten Schritt erlangen sie demnach ein Verständnis anhand der erstsprachlichen Textversion, sodass sie in einem zweiten Schritt auf Deutsch unbekannte Wörter im Deutschen unter Rückgriff auf das erzeugte Gesamtverständnis besser erschließen können. Bei dem hier zentral angenommenen Mechanismus wird von einer integrierten Textrepräsentation und der Erstellung nur eines Situationsmodells für beide Sprachen ausgegangen. Ist das Textverständnis in der Familiensprache wie z. B. Türkisch ausreichend vorhanden, sollte das Situationsmodell bereits auf der Basis des türkischen Textes in der ersten Darbietung des Textes erfolgreich erstellt werden. In einem zweiten Lesedurchgang können dann unbekannte Wörter auf Deutsch auf der Grundlage des vorhandenen Situationsmodells im Kontext erschlossen werden.

Forschungsanliegen Aus den vorangehenden Ausführungen leitet sich als Forschungsanliegen die übergeordnete Frage ab, ob sich durch eine Intervention unter Einbeziehung der Familiensprache der Erwerb von deutschem (Bildungs-)Wortschatz aus dem schriftlichen Sprachkontext von Lesetexten bei Kindern mit nichtdeutscher Familiensprache im Grundschulalter fördern lässt. Hierfür wurden vier Untersuchungsbedingungen implementiert (s. Abb. 1): In Bedingung A lasen die Kinder die Texte ausschließlich auf Deutsch. In Bedingung B lasen die Kinder die Texte zunächst auf Türkisch und dann auf Deutsch und in Bedingung C zunächst auf Deutsch mit der Übersetzung der Zielwörter ins Türkische und anschließend noch einmal auf Deutsch. In Bedingung D erhielten die Kinder Lesetexte ohne Zielwörter (ersetzt durch die Synonyme) und © 2017 Hogrefe

17

somit keine bildungssprachliche Wortschatzförderung. Konkret sollen die folgenden Forschungsfragen untersucht werden: 1. Wirksamkeit des Mechanismus Learning from Context und des Einbezugs der Familiensprache im Vergleich zu den anderen Interventionsbedingungen der Wortschatzförderung und der Kontrollgruppe: Ist bei Kindern mit nichtdeutscher Familiensprache der Zuwachs im Wortschatz aus dem sprachlichen Kontext deutscher Texte effektiver, wenn (i) vorher der gleiche Text in der Familiensprache gelesen wurde (Bedingung B) als wenn (ii) der Text ausschließlich auf Deutsch (Bedingung A) oder (iii) auf Deutsch mit ergänzender Übersetzung der einzelnen Zielwörter in die Familiensprache (Bedingung C) sowie (iv) auf Deutsch ohne integrierte Zielwörter (Bedingung D) präsentiert wird? 2. Effekte für Wortschatz im Kontext: Lassen sich die Befunde auch für die Wortschatztiefe, also den Zuwachs im Wortschatz, den die Kinder in Satzkontexten richtig einordnen können, zeigen? 3. Moderationseffekt: Ist die Textlesekompetenz in der Familiensprache ein Moderator für den Wortschatzzuwachs in der Gruppe der Kinder mit nichtdeutscher Familiensprache bei der Intervention unter Einbezug ihrer Familiensprache (Bedingung B)? Vor dem Hintergrund der dargestellten theoretischen Annahmen zum Lernen aus dem Kontext nach Sternberg und Powell (1983) und dem Textverständnisaufbau nach Kintsch (1998) wird konkret die theoriebasierte Annahme geprüft, dass der Zuwachs in der Interventionsbedingung B unter Einbezug der Familiensprache größer ist als bei der Bedingung D ohne Intervention (Hypothese 1.1) und dass der Wortschatzzuwachs in dieser Bedingung größer ist, als wenn der Text in Bedingung A nur auf Deutsch (Hypothese 1.2) oder in Bedingung C nur mit Übersetzung der einzelnen Zielwörter gelesen wird (Hypothese 1.3). Weiterführend wird die Hypothese überprüft, dass das Ergebnismuster nicht nur für den Zuwachs in der Kenntnis von Wortschatz ohne Kontext, sondern auch für den Zuwachs im Wortschatz gilt, wenn die Wörter in Satzkontexte integriert sind (Hypothese 2). Da der Aufbau eines Kontextverständnisses nach der Theorie des Lernens aus dem Kontext zentrale Voraussetzung für das Ableiten und Lernen der Bedeutung bisher unbekannter Wörter ist, wird angenommen, dass die Kompetenz im nichtdeutschen Textverstehen ein Moderator für den Wortschatzzuwachs unter Einbeziehung der Familiensprache über nichtdeutsche Texte in Bedingung B ist (Hypothese 3). Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25


18

N. McElvany et al., Wortschatzförderung mit Familiensprache

Methode Stichprobe Die Untersuchung fand im Rahmen des Projekts „Potential der Muttersprache zur Verringerung von Bildungsungleichheit – Wortschatzerwerb von Kindern nichtdeutscher Familiensprache vor zentralen Übergängen des Bildungssystems“ (InterMut) der TU Dortmund und der Universität Frankfurt innerhalb von 2 Monaten im Jahr 2012 an 12 Grundschulen mit 27 teilnehmenden 4. Klassen mit deutscher Unterrichtssprache statt1. In den Klassen nahmen 452 Kinder am Prätest und 467 Kinder am Posttest teil. Insgesamt liegen Daten von 612 Kindern zu einem der beiden Messzeitpunkte und von 401 Kindern zu beiden Zeitpunkten vor. Es gaben von diesen 190 Kinder an, zu Hause (auch) türkisch zu sprechen. In die folgenden Auswertungen wurden aufgrund der Forschungsfrage zum Potenzial der Familiensprache diejenigen Kinder einbezogen, (1) die einen türkischen Familienhintergrund hatten, (2) die an mindestens der Hälfte der 15 Interventionssitzungen teilnahmen, (3) für die sowohl für den Prä- als auch für den Posttest Daten vorlagen und (4) die im Implementationscheck ein grundlegendes Verständnis der Interventionstexte zeigten (vgl. Abschnitt „Überprüfung Implementation“). Damit verblieb eine Stichprobe von 143 Kindern mit türkischem Migrationshintergrund in den Interventionsbedingungen (Bedingung A: N = 52, Bedingung B: N = 34, Bedingung C: N = 28, Bedingung D: N = 29)2. Von diesen waren 49 % weiblich. Das durchschnittliche Alter betrug 9.80 Jahre (SD = 0.58). Vier Prozent der Kinder wurden nicht in Deutschland geboren. Der höchste sozioökonomische Status der Familie lag gemessen am International Socio-Economic Index of Occupational Status (ISEI) (Ganzeboom, de Graaf & Treiman, 1992) im Mittel bei 32.80 (SD = 17.89) und war damit gemäß der Zielpopulation der Studie erwartungsgemäß niedrig. Die Kinder in den vier Interventionsbedingungen unterschieden sich nicht signifikant hinsichtlich ihres Alters (F[3, 139] = 0.385, p > .05) und Geschlechts (χ2 = 2.63, p > .05). Darüber hinaus gab es keine Unterschiede zwischen den Gruppen in ihren mittleren figuralen kognitiven Grundfähigkeiten (F[3, 139] = 2.01, p > .05; Subtest des Kognitiven Fähigkeitstests (KFT) für 4. bis 12. Klassen, Revision, Heller & Perleth, 2000 [Autor: Nicht in Lit.; bitte prüfen]), ihren basalen deutschen und türki1

2

Abbildung 1. Untersuchungsbedingungen in den Interventionssitzungen.

schen Lesefähigkeiten (F[3, 139] = 1.12, p > .05 bzw. F[3, 134] = 1.56, p > .05; Auszug aus Würzburger Leise Leseprobe, Schneider, Blanke, Faust & Küspert, 2011, in deutscher bzw. türkischer Fassung) sowie ihrer deutschen Textlesekompetenz (F[3, 149] = 2.18, p > .05; adaptiert nach ELFE, Lenhard & Schneider, 2006). Erwartungsgemäß lag die durchschnittliche Lesekompetenz der Kinder im Deutschen signifikant über der Lesekompetenz im Türkischen (t[142] = 18.84, p < .05; adaptiert nach ELFE, Lenhard & Schneider, 2006).

Design Der zu lernende bildungssprachliche Wortschatz (Zielwörter) wurde im Rahmen von 15 Interventionssitzungen in unterschiedlichen Lesetexten dargeboten, die täglich in einem Zeitumfang von 45 Minuten im Klassenkontext durch geschulte Testleiterinnen und Testleiter durchgeführt wurden. In jeder der Sitzungen wurden neue Lesetexte verwendet, die neun Zielwörter enthielten, wobei sich in den insgesamt 15 Sitzungen 45 der Wörter in einem weiteren Text als Zielwort wiederholten, sodass insgesamt 90 Zielwörter eingeführt wurden (vgl. Abschnitt „Wortschatz ohne Kontext“). Innerhalb der Interventionssitzungen lasen die Kinder die Texte zweimal, wobei sie unterschiedlichen Untersuchungsbedingungen zugeordnet waren (vgl. Abb. 1). Alle Kinder mit türkischem Migrationshintergrund wurden randomisiert auf die vier Untersuchungsbedingungen verteilt. Es wurde sichergestellt, dass in allen teilnehmenden Schulklassen die vier Interventionsbedingungen realisiert wurden. Unmittelbar vor und nach der Interventionsphase erfolgten die Prä- und Posttestung, um die Wirksamkeit der Intervention zu überprüfen.

Das Projekt „Potential der Familiensprache zur Verringerung von Bildungsungleichheit – Wortschatzerwerb von Kindern nichtdeutscher Familiensprache vor zentralen Übergängen des Bildungssystems“ (InterMut) wurde vom Bundesministerium für Bildung und Forschung im Forschungsschwerpunkt „Chancengleichheit und Teilhabe. Sozialer Wandel und Strategien der Förderung“ gefördert. Die Autorengruppe dankt Frau Dipl.-Päd. Judith Razakowski, Isabella Rogner und Britta Ratajczak für ihre Mitarbeit an der Studie. Die aufgrund der Kriterien nicht berücksichtigten Kinder mit türkischem Familienhintergrund unterschieden sich von der Untersuchungsstichprobe nicht statistisch signifikant in Bezug auf Alter, Geschlecht, sozioökonomischen Hintergrund, kognitive Grundfähigkeiten (figural) und deutscher Textlesekompetenz, wiesen jedoch eine geringere türkische Textlesekompetenz auf.

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25

© 2017 Hogrefe


N. McElvany et al., Wortschatzförderung mit Familiensprache

Instrumente Der Zielwortschatz wurde vor und nach der Intervention durch zwei Instrumente erfasst, welche die Kenntnis der Wortbedeutungen einmal ohne und einmal mit Satzkontext überprüfte. Wortschatz ohne Kontext Der Multiple-Choice-Test zur Erfassung der Wortschatzbreite ist eine Eigenentwicklung und basiert auf dem gleichen Prinzip wie der verbale Teil des KFT. Zu jedem Zielwort (z. B. „Konflikt“) muss das entsprechende Synonym aus einer Liste mit jeweils vier Distraktoren (z. B. „Streit / Reparatur / Lösung / Schwierigkeit / Verbindung“) identifiziert werden (NItems = 90, α = .83/.86). Der Test beinhaltet 30 Nomen, 30 Verben und 30 Adjektive, die überwiegend dem bildungssprachlichen Wortschatz zugeordnet werden können. Es wurde im Vorfeld durch mehrere Pilotierungsschritte geprüft (insgesamt N = 163 Kinder), ob die ausgewählten Zielwörter den Kindern der Altersgruppe mit türkischem Migrationshintergrund tatsächlich überwiegend noch unbekannt waren und ihre Relevanz auch von Lehrkräften (N = 2) und einem Experten der Fachdidaktik Deutsch bestätigt wurde. Jede richtige Antwort wurde mit einem Punkt bewertet, so dass die maximal mögliche Gesamtpunktzahl bei 90 Punkten lag. Es wurden fünf Kinder von den Analysen zum Wortschatz ohne Kontext ausgeschlossen (N = 138), da sie zu einem Zeitpunkt den Test nicht richtig bearbeitet haben (Kriterium: unplausibler Zugewinn von + 2 SD). Diese verteilten sich über drei der vier Interventionsbedingungen (3 × Gruppe A, 1 x Gruppe B, 1 × Gruppe D). Wortschatz mit Satzkontext Die Wortschatztiefe wurde ebenfalls mit einem eigens entwickelten Multiple-Choice-Test erfasst, in dem die Wörter in einem anderen Kontext als dem Lernkontext der Intervention verwendet wurden (NItems = 45, α = .83/.85). Ein Item besteht aus einem Satz mit jeweils einem Zielwort, dessen Sinnhaftigkeit mit „richtig“ oder „falsch“ bewertet werden musste (z. B. „Manuels Mutter wünscht sich zu Weihnachten eine Reklamation in Rot.“). Wenn die Kinder die Antwort nicht wissen, können sie auch ein „Fragezeichen“ anstelle von richtig / falsch ankreuzen. Jede richtig beantwortete Aufgabe wurde mit einem Punkt bewertet. Die maximal mögliche Gesamtpunktzahl lag demnach bei 45 Punkten. Für die Auswertungen zu diesem Test wurden 23 Kinder aus den Interventionsgruppen (10 × A, 6 × B, 3 × C, 4 × D). ausgeschlossen (N = 120), welche die Tests zu einem der Zeitpunkte nicht richtig bearbeitet haben (Kriterium: unplausibler Zugewinn bzw. Verlust von +/− 2 SD). © 2017 Hogrefe

19

Türkische Textlesekompetenz Die türkische Textlesekompetenz wurde anhand von Aufgaben aus dem Leseverständnistest für Erst- bis Sechstklässler (ELFE 1–6; Lenhard & Schneider, 2006) erfasst, die in das Türkische übersetzt wurden. Bei diesem Test wird ein Text mit einigen dazugehörigen Fragen dargeboten. Aus vier möglichen Alternativen soll die richtige Antwort ausgewählt werden. Der Test wurde in zwei Tests ähnlicher Schwierigkeit halbiert, da parallele Tests für die Kompetenzen in Deutsch und Türkisch benötigt wurden. Um trotz der Halbierung des Originaltests eine zufriedenstellende Reliabilität zu erhalten, wurden fünf weitere Aufgaben für jede Testversion entwickelt. Insgesamt bearbeiteten die Kinder dann 15 Items. Jede richtige Antwort wurde mit einem Punkt und jede falsche Antwort mit 0 Punkten bewertet. Entsprechend konnten maximal 15 Punkte erreicht werden. Die Reliabilität des Tests zur Erfassung der türkischen Lesekompetenz betrug für alle Gruppen α = .70; für Gruppe B (vgl. Analyse zu Fragestellung 3) α = .72. Interventionsmaterialien Die Kinder erhielten in den Interventionssitzungen jeweils zum zweimaligen Lesen einen kurzen Text, dessen Altersangemessenheit und Interessantheit in einer vorgelagerten Pilotierung überprüft worden waren. Diese Lesetexte hatten einen Umfang von etwa 300 Wörtern mit jeweils neun zu lernenden Wörtern überwiegend aus dem Bereich des bildungssprachlichen Wortschatzes (Zielwörter; vgl. Abschnitte „Sprachliche Kompetenzen: Wortschatz ‚und‘ Theoretische Grundlagen der expliziten Wortschatzförderung“), die mit unterschiedlichen Kontexthinweisen (vgl. Sternberg, 1987) versehen waren. Es kamen unterschiedliche Textgenres (z. B. Sachtext, Erzählung oder Märchen, neutraler Text), thematische Kontexte (z. B. Sport, Natur oder Geistergeschichte) und Hauptfiguren (z. B. Junge, Mädchen) zum Einsatz. Jeder Text wurde durch zwei kleine Abbildungen illustriert. Überprüfung der Implementation Die Interventionen wurden von geschulten Testleiterinnen und Testleitern nach einem festgelegten Skript durchgeführt. Die mittlere Teilnahme lag bei 13.96 Sitzungen (SD = 1.43) und unterschied sich nicht systematisch zwischen den Gruppen(F[3, 139] = 2.09, p < .05). Zur Überprüfung, ob die teilnehmenden Kinder die gelesenen Texte ausreichend verstanden hatten, wurden direkt nach dem ersten Lesedurchgang jeweils zwei Textverständnisfragen gestellt. Von den maximal möglichen 30 Fragen wurden im Mittel mehr als zwei Drittel (M = 22.99; SD = 4.11) richtig gelöst. Nach dem zweiten Lesen wurden die im Text enthaltenen Zielwörter überprüft Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25


20

N. McElvany et al., Wortschatzförderung mit Familiensprache

Tabelle 1. Mittelwerte (M), Standardabweichungen (SD) und Interkorrelationen der Tests für die Gesamtgruppe M

SD

1

2

3

1 Zielwörter ohne Kontext prä

17.20

8.53

2 Zielwörter ohne Kontext post

21.50

10.26

.80**

3 Zielwörter mit Kontext prä

10.65

6.26

.21**

.23*

4 Zielwörter mit Kontext post

12.20

7.15

.21**

.23*

.63**

4.11

2.84

.16+

.24*

.40**

5 Türkische Textlesekompetenz

4

1 1 1 1 .17+

Anmerkungen. ** p < .01; * p < .05; + p < .10. Nohne Kontext = 138; Nmit Kontext = 120.

und das Interesse der Kinder an dem Text (M = 3.25, SD = 0.51 auf der Skala von 1 = stimmt gar nicht bis 4 = stimmt genau) und ihre Anstrengungsbereitschaft während der Interventionssitzung (M = 3.48, SD = 0.53 auf der Skala von 1 = stimmt gar nicht bis 4 = stimmt genau) erfragt. Es gab für keines der untersuchten Merkmale statistisch signifikante Unterschiede zwischen den Interventionsgruppen.

Klärung von Forschungsfrage 2 die Varianzanalysen analog für den Zielwortschatz mit Kontext als abhängiger Variable wiederholt. Abschließend wurde eine mögliche Moderation (Forschungsfrage 3) durch die Ergänzung des türkischen Textverständnisses als Kovariate in der Analyse für Bedingung B geprüft.

Ergebnisse Auswertungsstrategie Es wurden sukzessiv mehrere Analyseschritte vollzogen: Zunächst erfolgten vorgeschaltete t-Tests für abhängige Stichproben, um die Veränderung der einzelnen Gruppen in beiden Bereichen (Wortschatz ohne bzw. mit Kontext) zu beschreiben. Danach wurde entsprechend der Forschungsfrage 1 eine Varianzanalyse durchgeführt, bei der der Posttest des Zielwortschatzes ohne Kontext als abhängige Variable und der Prätest als Kovariate eingingen. Als unabhängige Variable wurde die Intervention mit den Bedingungen (A, B, C, D) untersucht. Die adjustierten Posttestwerte wurden paarweise bzw. mit geplanten Kontrasten verglichen. In einem weiteren Schritt wurden zur

Deskriptive Ergebnisse der Veränderungen in den Gruppen Für die Gesamtgruppe (N = 143) sind die Mittelwerte, Standardabweichungen und Interkorrelationen aller Tests in Tabelle 1 wiedergegeben. Die manifeste Korrelation zwischen dem Zielwortschatztest ohne Kontext und dem Wortschatztest mit Satzkontext lag bei r = .21, sodass davon ausgegangen werden kann, dass tatsächlich eine andere Kompetenz im Bereich Wortschatz erfasst wurde. Die Veränderung zwischen dem Prä- und Posttest lag bei einem Zugewinn von im Durchschnitt 4.30 (ohne Kontext) bzw. 2.26 (mit Satzkontext) Wörtern, wobei die unter-

Tabelle 2. Nach Interventionsbedingungen getrennt Fallzahlen (N; ohne / mit Kontext), Mittelwerte (M) und Standardabweichungen (SD) im Präund Posttest sowie gepaarte t-Test-Kennwerte (t, df, p) und Cohens d (d) für beide Zielwortschatztests ((bu)) Zielwortschatz ohne Kontext (N = 138) Bedingung

N

Prä M (SD)

Zielwortschatz mit Kontext (N = 128)

Post M (SD)

t (df)

p

d

Prä M (SD)

Post M (SD)

t (df)

p

d

A

49/42

16.43 (9.58)

22.02 (10.66)

–7.07 (48)

< .001

0.55

10.57 (6.86)

13.62 (7.81)

–3.38 (41)

< .01

0.41

B

33/28

18.09 (9.02)

22.48 (11.90)

–3.34 (32)

< .01

0.42

11.14 (6.23)

10.36 (5.55)

0.61 (27)

> .05

–0.13

C

28/25

18.00 (7.62)

21.75 (9.22)

–3.34 (27)

< .01

0.44

10.04 (5.96)

10.56 (7.37)

–0.52 (24)

> .05

0.08

D

28/25

16.68 (6.98)

19.18 (8.46)

–2.34 (27)

< .05

0.32

10.84 (5.82)

13.52 (6.94)

–2.93 (24)

< .01

0.42

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25

© 2017 Hogrefe


N. McElvany et al., Wortschatzförderung mit Familiensprache

schiedliche mögliche Gesamtpunktzahl bei beiden Tests zu beachten ist (vgl. Abschnitt „Wortschatz ohne Kontext“). Die Kompetenzen im türkischen Textverständnis sind insgesamt als niedrig anzusehen. Die deskriptiven Werte der einzelnen Gruppen in den vier Untersuchungsbedingungen im Prä- und Posttest sind in Tabelle 2 dargestellt. Es zeigte sich zunächst für den Zielwortschatz ohne Kontext, dass alle vier Gruppen im Posttest statistisch signifikant besser abschnitten als im Prätest. Gruppe A verzeichnete einen mittleren Zuwachs von 5.59 Zielwörtern, Gruppe B von 4.39 Wörtern, Gruppe C von 3.75 Wörtern und Gruppe D von 2.50 Wörtern. Nur Lernende in Bedingung A erreichten somit einen Wortschatzzugewinn der einer mittleren Effektstärke entspricht. Damit gewannen die Kinder in den drei Interventionsbedingungen mit Zielwortschatz im Mittel 4.76 Wörter hinzu, Kinder in der Kontrollbedingung ohne Zielwörter in den Texten in den Prä- und Posttests 2.50 Wörter. Bei den Werten für den Zielwortschatz im Satzkontext gab es nur bei den Gruppen A und D einen statistisch signifikanten mittleren Zuwachs (3.05 bzw. 2.68 Wörter).

Wirksamkeit der Methode Learning from Context und Potenzial des Einbezugs der Familiensprache im Vergleich zu den anderen Interventionsbedingungen und der Kontrollgruppe Neben der Interventionsbedingung unter Einbezug der Familiensprache (Bedingung B) und der Kontrollbedingung (Bedingung D) wurden wie im Abschnitt Design dargelegt zwei weitere Interventionsbedingungen (Bedingung A und Bedingung C) implementiert. Der Vergleich der vier Bedingungen mittels einer einfaktoriellen univariaten Kovarianzanalyse mit dem Faktor Bedingung, dem Wortschatz im Prätest als Kovariate und dem Wortschatz im Posttest als abhängige Variable ergab keinen statistisch signifikanten Haupteffekt des Faktors Bedingung (F[3, 133] = 1.55, p > .05, ηp2 = .03). Die Kovariate Prätest war statistisch signifikant (F[3, 133] = 237.69, p < .001, ηp2 = .64). Der Vergleich der Bedingung unter Einbezug der Familiensprache in Textform (B) mit der Kontrollgruppe (D) über einen geplanten Kontrast war statistisch nicht signifikant. Der numerisch vorhandene größere mittlere Zugewinn von 4.39 (Gruppe B) im Vergleich zu 2.50 (Gruppe D) war demnach inferenzstatistisch nicht abzusichern und Hypothese 1.1 musste verworfen werden. Hingegen zeigte sich bei dem Vergleich von Bedingung A mit der Kontrollbedingung D ein statistisch signifikanter Vorteil der Gruppe A und anhand der geschätzten Randmittel eine Differenz von 3.08 Wörtern des Zielwortschatzes im Posttest (p < .05; dkorr = 0.32). Die empirischen Ergebnisse wiesen © 2017 Hogrefe

21

demnach darauf hin, dass für den Zielwortschatz im Posttest nur die Bedingung mit zweimaligem deutschem Textlesen effektiver im Vergleich zu der Kontrollgruppe ohne Zielwörter in den Lesetexten war. Die Kontraste der Bedingung unter Einbezug der Familiensprache mit den anderen beiden Interventionsbedingungen (A, C) waren zufallskritisch ebenfalls nicht als unterschiedlich abzusichern. Die Annahmen (Hypothesen 1.2 und 1.3), dass der Wortschatzzuwachs in der Bedingung unter Einbezug der Familiensprache größer sei, als wenn der Text nur auf Deutsch oder nur mit Übersetzung der einzelnen Zielwörter gelesen wird, mussten demnach verworfen werden.

Effekte für Wortschatz im Kontext Um zu prüfen, ob das Befundmuster vergleichbar für Wortschatz war, der im Satzkontext im Sinne der Wortschatztiefe überprüft wurde, wurden die vorangegangenen Auswertungsschritte für den Zielwortschatz im Satzkontext wiederholt. Die einfaktorielle univariate Kovarianzanalyse zur Analyse zum Vergleich der Bedingung unter Einbezug der Familiensprache mit allen anderen Bedingungen ergab einen statistisch signifikanten Haupteffekt des Faktors Bedingung (F[1, 119] = 3.37, p < .05, ηp2 = .08). Die Berechnungen der geplanten Kontraste der Bedingungen zeigten, dass Bedingung A entgegen der angenommenen Hypothese wirksamer war als beide Bedingungen, in denen die Familiensprache integriert war: Im Vergleich der geschätzten Randmittel zu Bedingung B belief sich der Vorteil auf 3.67 Zielwörter im Posttest (p < .01, dkorr = 0.55) und im Vergleich zu Bedingung C auf 2.68 Zielwörter (p = .05, dkorr = 0.32). Auch wurde ein statistisch signifikanter Nachteil der Kinder in der Bedingung B im Vergleich zu der Kontrollgruppe deutlich (3.38 Zielwörter; p < .05, dkorr = –0.56). Das Ergebnismuster bestätigt somit die Befunde, die sich bereits bei den Analysen zum Wortschatz ohne Kontext dahingehend abzeichneten, dass die empirischen Daten die theoriebasierten Hypothesen nicht unterstützten.

Moderationseffekt türkische Textlesekompetenz Abschließend sollte geprüft werden, ob die Wirksamkeit der Interventionsbedingung unter Einbezug der Familiensprache in Form des ersten Lesetextes (B) von den türkischen Textlesekompetenzen der Kinder abhing. Hierzu wurde das türkische Textverständnis als zweite Kovariate neben dem Prätest aufgenommen. Weder für den Posttestwert des Zielwortschatzes ohne Kontext (F[1, 32] = 0.77, p > Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25


22

N. McElvany et al., Wortschatzförderung mit Familiensprache

.05, ηp2 = .03) noch für den Zielwortschatz im Satzkontext (F[1, 27] = 0.75, p > .05, ηp2 = .03) erwies sich dies als statistisch signifikant. Hypothese 3 lautete, dass die Kompetenz in der nichtdeutschen Textlesekompetenz ein Moderator für den Wortschatzzuwachs bei Einbeziehung der Familiensprache über nichtdeutschsprachige Texte sei. Dies konnte in diesem Setting nicht bestätigt werden, in dem zumindest ein Mindestverständnis der türkischen Texte nach dem Kriterium von mindestens 15 der 30 richtig gelösten Textverständnisfragen angenommen werden kann3.

Diskussion Zusammenfassung und Interpretation der Ergebnisse Für die Interventionsbedingung unter Einbeziehung der Familiensprache konnte im Kontext der Methode des Learning from Context für unbekannte Wörter beim Lesen schriftlicher Texte für türkischsprachige Kinder der 4. Klasse im deutschen Grundschulkontext kein Effekt im Vergleich zu Kindern ohne Intervention bzw. für das Maß mit Zielwortschatz im Satzkontext sogar ein geringer Vorteil der Kontrollgruppe festgestellt werden. Dieses Ergebnis scheint die theoretischen Überlegungen zu bestätigen, wonach der Einbezug einer zweiten Sprache sowie der Abruf von Gelerntem in der anderen Sprache eher zu kognitiven Kosten als Nutzen führt (Bialystok, 2009; Butler & Hakuta, 2004; vgl. auch Saalbach, Eckstein, Andri, Hobi & Grabner, 2013, im Kontext Mathematik). Entlang dieses Befundmusters konnte bei dem Vergleich aller Bedingungen nur für die Bedingung mit einem zweimaligem deutschen Textlesen ein Effekt im Vergleich zu der Kontrollgruppe ohne Zielwörter im Wortschatzerwerb festgestellt werden, während es auch für die Bedingung mit einer Übersetzung der Zielwörter in das Türkische im Text keinen Effekt im Vergleich zu der Kontrollgruppe gab. Die fehlenden positiven Effekte durch den Einbezug der Familiensprache als Text bzw. als Übersetzung der Zielwörter innerhalb des deutschen Lesetextes schließen sich an andere Befunde aus dem Bereich des Wissenserwerbs in einer anderen Sprache an. Die Annahme, dass dies durch zusätzlichen cognitive load (Sweller, van Merriënboer, & Paas, 1998) bedingt ist, der die kognitiven Ressourcen für 3

den eigentlichen Fokus (Wissenserwerb) beschränkt, könnte auch für die hier untersuchten Wortschatzbedingungen unter Berücksichtigung der Familiensprache (Wortschatzerwerb aus dem Kontext) zutreffen. Wie oben ausgeführt ist es zudem denkbar, dass das Präsentieren von Wortschatz in der Familiensprache nicht zu einer Anreicherung des Kontexts für den Wortschatzaufbau führte, sondern zu kognitiven Kosten im Sinne einer zusätzlich erforderlichen Rückübersetzung von begrifflichen Inhalten in den Kontext der Zweitsprache. Diese Annahme würde dafür sprechen, dass Kontexteffekte bei zweisprachigen Kindern durch das gleichzeitige Aktivieren der Erstsprache komplexer und möglicherweise weniger linear bzw. additiv sind, als dies für einsprachige Kinder angenommen wird. Auch von einem gemeinsamen Situationsmodell in Erst- und Zweitsprache könnte in diesem Fall nicht ausgegangen werden. Die parallele Prüfung der Effekte anhand eines Zielwortmaßes mit den Zielwörtern im Satzkontext ergab ein vergleichbares Befundmuster, in dem jedoch die Bedingung des zweimaligen Lesens auf Deutsch effektiver war als alle anderen Bedingungen und die Bedingung der Einbeziehung der Familiensprache sogar einen geringen negativen Effekt im Vergleich zu der Kontrollgruppe hatte. Die Kompetenz im nichtdeutschen Textverstehen war kein Moderator für den Wortschatzzuwachs bei Einbeziehung der Familiensprache. Zusammenfassend weisen die Befunde somit nicht auf ein Potenzial der Einbeziehung der Familiensprache in diesem Setting der schriftlichen Lesetexte hin. Auffällig ist schließlich noch der Zugewinn im Wortschatz bei der Kontrollgruppe. Dieser könnte zum einen auf einen Testwiederholungseffekt zurückzuführen sein, der dann in allen Gruppen anteilig zu vermuten ist. Zum anderen könnte es sich bei den Kontrollkindern um einen Wiedererkennungseffekt der Synonyme im Posttest anstelle der Markierung von in ihrer Bedeutung gelernten Zielwörtern handeln. Insofern sind alle Tests von Interventionsbedingungen gegen die Kontrollgruppe als konservativ anzusehen.

Einschränkungen Aufgrund der Gruppengrößen waren einige Befunde nicht zufallskritisch abzusichern. Zu den eher geringen Fallzahlen in den Untersuchungsbedingungen kamen weitere Ausfälle, die sowohl durch die Treatment-Teilnahme als

Wird die türkische Textlesekompetenz als zusätzliche Kontrollvariable in allen anderen Analysen des Manuskripts ebenfalls aufgenommen, ist das Ergebnismuster weitgehend stabil und ändert die zentralen Ergebnisse des Beitrags nicht. Nur bei insgesamt zwei Teilanalysen gab es überhaupt Unterschiede: Bei Fragestellung 1 / Abschnitt „Wirksamkeit der Methode Learning from Context und Potenzial des Einbezugs der Familiensprache im Vergleich zu den anderen Interventionsbedingungen und der Kontrollgruppe“ ist einer der einzelnen Gruppenvergleiche nicht mehr signifikant (p < .13) – Hierbei handelt es sich allerdings um den Vergleich von Bedingung A vs. D, in denen beiden überhaupt kein Türkisch vorkommt. Bei Fragestellung 2 / Abschnitt „Effekte für Wortschatz im Kontext“ ist einer der einzelnen Gruppenvergleiche nicht mehr auf dem 5 %-, sondern nur noch auf dem 10 %-Niveau signifikant (Bedingung B vs. D).

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25

© 2017 Hogrefe


N. McElvany et al., Wortschatzförderung mit Familiensprache

auch notwendige Ausschlüsse einzelner Kinder bei der Auswertung bedingt waren (vgl. Abschnitt Methode). Das Befundmuster war jedoch insgesamt konsistent. Die Ergebnisse basieren auf Kindern, die zu Hause türkisch sprechen und eine deutsche Grundschule besuchen. Insgesamt ist die türkische Textlesekompetenz bei vielen der Kinder als gering einzuschätzen und die Varianz der Türkischkenntnisse ist eingeschränkt, was die Analysen zu dem Moderationseffekt beeinflusst haben könnte. Für diese Gruppe der türkischsprachigen Kinder, die mehrheitlich in den Schulklassen vertreten war, gilt das Befundmuster, dass sich eine Wirksamkeit der Wortschatzförderung im Vergleich zur Kontrollbedingung nur für das zweimalige Lesen des Textes auf Deutsch und in Bezug auf den Wortschatz im Kontext sogar ein Nachteil der Bedingung mit Einbezug der Familiensprache zeigt (vgl. Abschnitt „Wirksamkeit der Methode Learning from Context und Potenzial des Einbezugs der Familiensprache im Vergleich zu den anderen Interventionsbedingungen und der Kontrollgruppe“). Möglicherweise wäre die Befundlage weniger kritisch in Bezug auf den Einbezug der Familiensprache, wenn das Kriterium nicht ein Mindestverständnis gewesen wäre, sondern Kinder mit einer hohen Textkompetenz im Türkischen untersucht worden wären. An dieser Stelle ist jedoch auch darauf hinzuweisen, dass anteilig nur wenige im Deutschen förderungswürdige Kinder gleichzeitig über hohe Kompetenz in diesem Bereich verfügen, da die muttersprachliche Kommunikation innerhalb der Familie meist mündlich erfolgt und weniger systematisch im Schriftspracherwerb in der Familiensprache erfolgt (vgl. Limbird, 2007). Auch handelte es sich nach Hagenauer (2010) um eine Kurzzeitintervention, deren Effekte möglicherweise bei einer längeren Interventionsdauer stärker wären. Schließlich ist kritisch festzuhalten, dass der Zielwortschatz Wörter aus dem Bildungswortschatz beinhaltete, die möglichst vielen der Kinder im Vorfeld unbekannt sein sollten. Es ist demnach möglich, dass andere Wörter, die nur bestimmten Subgruppen unbekannt sind, leichter gelernt werden würden.

Implikationen für Forschung und Praxis Anhand der vorliegenden Studie konnten überwiegend keine Hinweise gewonnen werden, dass der Einbezug schriftlicher Materialien in Form von Texten das implizite Wortschatzlernen für Kinder türkischer Familiensprache im schulischen Unterricht zusätzlich unterstützen würde. Dies gilt auch für das Ergänzen der türkischen Übersetzungen für unbekannte Wörter. Weiterführend hat dies für die Praxis Implikationen dahingehend, dass eine vergleichsweise leicht zu realisierende Form des Einbezugs der Familiensprache über schriftliche Materialien, die © 2017 Hogrefe

23

keine eigenen Sprachkompetenzen der unterrichtenden Lehrkraft voraussetzen und theoretisch für mehrere Herkunftssprachen parallel im Unterricht eingesetzt werden könnte, in der implementierten Form kaum nachweisbare Wirkung auf das Wortschatzlernen haben würde. Für die Praxis leitet sich damit aber auch die Frage nach Konzepten für die Förderung der Herkunftssprache im schriftsprachlichen Bereich ab, wenn pädagogisch und gesamtgesellschaftlich Multilingualität gefördert werden soll. Darüber hinaus ist es ein praxisrelevanter Befund, dass die Methode des Wortschatzlernens aus dem Kontext bei Kindern mit türkischer Herkunftssprache nur eingeschränkt wirksam zu sein scheint. Vor dem Hintergrund der weiten Verbreitung des Lesens von Texten und der damit verbundenen Wortschatzerweiterung im schulischen Alltag, sind insbesondere differenzielle Wortschatzgewinne von Kindern unterschiedlicher Herkunft in weiterführenden Studien empirisch zu prüfen und im Falle der Replikation pädagogisch zu bedenken (vgl. auch zu geschlechtsspezifischen Wortschatzunterschieden McElvany, El-Khechen, Schwabe & Kessels, 2016). Insgesamt muss zudem auf die mittlere Effektstärke im Wortschatzzuwachs (Breite) und die kleine Effektstärke (Tiefe) in allen Untersuchungsgruppen hingewiesen werden: Diese machen deutlich, dass die Methode des Kontextlernens als implizite Methode der Wortschatzförderung wahrscheinlich für deutlichere Zuwächse mit expliziten und interaktiven Varianten der Wortschatzeinbettung und -nutzung angereichert werden muss (vgl. auch Marulis & Neuman, 2010), sodass auch der Einbezug der Familiensprache unter kommunikativen Bedingungen eine andere Effektivität zeigen könnte. Für die Forschung gilt es im Anschluss an die Befunde insbesondere zwei Themenfelder weiterführend zu untersuchen: Zum einen ist zu prüfen, ob der Einbezug der Familiensprache andere Effekte als die hier untersuchten Wortschatzerwerbseffekte hat, beispielsweise in Bezug auf Fragen wie das muttersprachliche Selbstkonzept, die Leselust oder die Selbstwertschätzung der Kinder. Zum anderen ist nach dem schriftsprachlichen Einbezug der Familiensprache nun zu untersuchen, ob andere Formen möglicherweise wirksamer sind. Hier kommt insbesondere eine mögliche Förderung über das Hörverstehen türkischer Texte infrage, da dies dem Alltagsgebrauch der türkischen Sprache als mündliche Sprache im familiären und sozialen Umfeld der Familie näherkommen könnte.

Literatur Atger, A. F. (2009). Education and political participation of migrants and ethnic minorities in the EU. An overview of the literature. Brüssel: Center for European Policy Studies (CEPS). Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25


24

Autorengruppe Bildungsberichterstattung. (2014). Bildung in Deutschland 2014. Ein indikatorengestützter Bericht mit einer Analyse zur Bildung von Menschen mit Behinderung. Wiesbaden: Bertelsmann. Becker, R. & Lauterbach, W. (Hrsg.) (2012). Bildung als Privileg. Erklärungen und Befunde zu den Ursachen der Bildungsungleichheit. Wiesbaden: VS Verlag für Sozialwissenschaften. Bialystok, E. (2009). Bilingualism – the good, the bad, and the indifferent. Bilingualism: Language and Cognition, 12, 3–11. Bialystok, E. (2015). Bilingualism and the development of executive function: the role of attention. Child Development Perspectives, 9, 117–121. Bos, W., Tarelli, I., Bremerich-Vos, A. & Schwippert, K. (2012). IGLU 2011. Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich. Münster: Waxmann. Boudon, R. (1974). The logic of sociological explantions. Harmondsworth: Penguin Education. Butler, Y. G. & Hakuta, K. (2004). Bilingualism and second language acquisition. In T. Bhatia & W. Ritchie (Eds.), Handbook of Bilingualism (pp. 114–145). Oxford: Blackwell Publishers. Carlo, M., August, D., McLaughlin, B., Snow, C., Dressler, C., Lippman, D. et al. (2004). Closing the gap: Addressing the vocabulary needs of English language learners in bilingual and mainstream classrooms. Reading Research Quarterly, 39, 188–215. Cummins, J. (1979). Linguistic interdependence and the educational development of bilingual children. Review of Educational Research, 49, 222–251. Cunningham, G. E. & O'Donnell, C. R. (2012). Reading and vocabulary growth. In E. J. Kame'ennui & J. F. Baumann (Eds.), Vocabulary Instruction: Research to Practice (2nd ed., pp. 256–279). New York: Guilford Press. Ditton, H., Krüsken, J. & Schauenberg, M. (2005). Bildungsungleichheit – der Beitrag von Familie und Schule. Zeitschrift für Erziehungswissenschaft, 8, 285–304. Dollmann, J. & Kristen, C. (2010). Herkunftssprache als Ressource für den Schulerfolg? Das Beispiel türkischer Grundschulkinder. In C. Allemann-Ghionda, P. Stanat, K. Göbel & C. Röhner (Hrsg.), Migration, Identität, Sprache und Bildungserfolg (S. 123–146). Weinheim: Beltz. Eckhardt, A. G. (2008). Sprache als Barriere für den schulischen Erfolg. Potentielle Schwierigkeiten beim Erwerb schulbezogener Sprache für Kinder mit Migrationshintergrund. Münster: Waxmann. El-Khechen, W., Gebauer, M. M. & McElvany, N. (2012). Wortschatzförderung bei Grundschulkindern. Ein Vergleich von Kindern mit und ohne Migrationshintergrund. Zeitschrift für Grundschulforschung, 5(2), 48–63. Erikson, R. & Goldthorpe, J. H. (2010). Has social mobility in Britain decreased? Reconciling divergent findings on income and class mobility. The British Journal of Scoiology, 61, 211–230. Fukkink, R. G. (2005). Deriving word meaning from written context: a process analysis. Learning and Instruction, 15, 23–43. Ganzeboom, H. B. G., de Graaf, P. M. & Treiman, D. J. (1992). A standard international socio-economic index of occupational status. Social Science Research, 21, 1–56. Graves, M. F. (2006). The vocabulary book: Learning and instruction. Newark, DE: International Reading Association. Haag, N., Böhme, K. & Stanat, P. (2012). Zuwanderungsbezogene Disparitäten. In P. Stanat, H. A. Pant, K. Böhme & D. Richter (Hrsg.), Kompetenzen von Schülerinnen und Schülern am Ende der vierten Jahrgangsstufe in den Fächern Deutsch und Mathematik. Ergebnisse des IQB – Ländervergleiches 2011 (S. 209–235). Münster: Waxmann. Hagenauer, G. (2010). Kurzzeitinterventionen versus Langzeitinterventionen. In T. Hascher & B. Schmitz (Hrsg.), Handbuch Interventionsforschung (S. 243–251). Weinheim, München: Juventa.

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25

N. McElvany et al., Wortschatzförderung mit Familiensprache

Heller, K. A. & Perleth, C. (2000). Kognitiver Fähigkeitstest für 4. bis 12. Klassen (KFT 4 – 12+R) (Revision). Göttingen: Beltz-Test. Hulstijn, J. H., Hollander, M. & Greidanus, T. (1996). Incidental vocabulary learning by advanced foreign language students: The influence of marginal glosses, dictionary use, and reoccurrence of unknown words. The Modern Language Journal, 80, 327–339. Kao, G. & Tienda, M. (1998). Educational aspirations of minority youth. American Journal of Education, 106, 349–384. Kigel, R. M., McElvany, N. & Becker, M. (2015). Effects of immigrant background on text comprehension, vocabulary, and reading motivation: a longitudinal study. Learning and Instruction, 35, 73–84. Kintsch, W. (1998). Comprehension. A paradigm for cognition. New York: Cambridge University Press. Klann-Delius, G. (1999). Spracherwerb. Stuttgart: Metzler. Klieme, E., Artelt, C., Hartig, J., Jude, N., Köller, O., Prenzel, M. et al. (Hrsg.) (2010). Bildungsqualität und Evaluation: PISA 2009 Bilanz nach einem Jahrzehnt. Münster: Waxmann. Kristen, C. & Dollmann, J. (2009). Sekundäre Effekte der ethnischen Herkunft. Kinder aus türkischen Familien am ersten Bildungsübergang. In J. Baumert, K. Maaz & U. Trautwein (Hrsg.), Bildungsentscheidungen (S. 205–229). Wiesbaden: VS Verlag für Sozialwissenschaften. Landauer, T. K., McNamara, D. S., Dennis, S. & Kintsch, W. (Eds.) (2007). Handbook of Latent Semantic Analysis. Mahwah, NJ: Lawrence Erlbaum. Lenhard, W. & Schneider, W. (2006). ELFE 1–6. Ein Leseverständnistest für Erst- bis Sechstklässler. Göttingen: Hogrefe. Lesaux, N. K., Lipka, O. & Siegel, L. S. (2006). Investigating cognitive and linguistic abilities that influence the reading comprehension skills of children from diverse linguistic backgrounds. Reading and Writing, 19, 99–131. Limbird, C. K. (2007). Phonological processing, verbal abilities, and second language literacy development among bilingual Turkish children in Germany. Dissertation. Freie Universität Berlin. Maaz, K., Baumert, J., Gresch, C. & McElvany, N. (2010). Der Übergang von der Grundschule in die weiterführende Schule. Leistungsgerechtigkeit und regionale, soziale und ethnisch-kulturelle Disparitäten. Bonn: BMBF. Mahon, M. & Crutchley, A. (2006). Performance of typically-developing school-age children with English as an additional language on the British Picture Vocabulary Scale II. Child Language Teaching and Therapy, 22, 333–351. Maluch, J. T., Kempert, S., Neumann, M. & Stanat, P. (2015). The effect of speaking a minority language at home on foreign language learning. Learning and Instruction, 36, 76–85. Marulis, L. M. & Neuman, S. B. (2010). The effects of vocabulary intervention on young children's word learning: A meta-analysis. Review of Educational Research, 80(3), 300–335. McElvany, N. & Artelt, C. (2007). Das Berliner Eltern-Kind Leseprogramm. Konzeption und Effekte. Psychologie in Unterricht und Erziehung, 4, 312–330. McElvany, N. & Artelt, C. (2009). Systematic reading training in the family: Development, implementation, and evaluation of the Berlin Parent-Child Reading Program. Learning and Instruction, 19, 79–95. McElvany, N., El-Khechen, W., Schwabe, F. & Kessels, U. (2016). Qualitative Wortschatzunterschiede zwischen Mädchen und Jungen im Grundschulalter. Zeitschrift für Pädagogische Psychologie, 30(1), 45–56. Meloefski, R. (2007). Schulpraxis – Vom Alltagsbegriff zum Fachbegriff. Mathematischer und Naturwissenschaftlicher Unterricht, 60(4), 223–228. Moore, J. C. & Surber, J. R. (1992). Effects of context and keyword methods on second language vocabulary acquisition. Contemporary Educational Psychology, 17, 286–292.

© 2017 Hogrefe


N. McElvany et al., Wortschatzförderung mit Familiensprache

Nagy, W., Herman, P. & Anderson, R. (1985). Learning words from context. Reading Research Quarterly, 17, 233–255. Nation, I. S. P. (2004). Learning vocabulary in another language. Cambridge: Cambridge University Press. National Institute of Child Health and Human Development. (2000). Teaching children to read: An evidence-based assessment of the scientific research literature on reading and its implications for reading instruction. Bethesda, MD: National Reading Panel. Paradis, J. (2007). Second language acquisition in childhood. In E. Hoff & M. Shatz (Eds.), Handbook of Language Development (pp. 387–405). Oxford: Blackwell. Putnam, R. (2015). Our kids: The American dream in crisis. Zugriff am 24.06.2015. Verfügbar unter http://robertdputnam.com/ Saalbach, H., Eckstein, D., Andri, N., Hobi, R. & Grabner, R. H. (2013). When language of instruction and language of application differ: Cognitive costs of bilingual mathematics learning. Learning and Instruction, 26, 36–44. Scarborough, H. S. (2001). Connecting early language and literacy to later reading (dis)abilities: Evidence, theory, and practice. In S. Neuman & D. Dickinson (Eds.), Handbook for Research in Early Literacy (pp. 97–110). New York: Guilford Press. Scharenberg, K. (2012). Leistungsheterogenität und Kompetenzentwicklung. Zur Relevanz klassenbezogener Kompositionsmerkmale im Rahmen des KESS-Studie. Münster: Waxmann. Schmölzer-Eibinger, S. (2013). Sprache als Medium des Lernens im Fach. In M. Becker-Mrotzek, K. Schramm, E. Thürmann & H. J. Vollmer (Hrsg.), Sprache im Fach. Sprachlichkeit und fachliches Lernen (S. 25–40). Münster: Waxmann. Schneider, W., Blanke, I., Faust, V. & Küspert, P. (2011). WLLP-R. Würzburger Leise Leseprobe – Revision. Göttingen: Hogrefe. Segeritz, M., Walter, O. & Stanat, P. (2010). Muster des schulischen Erfolgs von jugendlichen Migranten in Deutschland. Evident für segmentierte Assimilation? Kölner Zeitschrift für Soziologie und Sozialpsychologie, 62, 113–138. Sénéchal, M., Ouellette, G. & Rodney, D. (2006). The misunderstood giant: On the predictive role of early vocabulary to future reading. In D. K. Dickinson & S. B. Neumann (Eds.), Handbook of Early Literacy (pp. 173–182). New York: Guilford Press. Statistisches Bundesamt. (2014). Bevölkerung und Erwerbstätigkeit Bevölkerung mit Migrationshintergrund – Ergebnisse des Mikrozensus 2013. Wiesbaden: Statistisches Bundesamt.

© 2017 Hogrefe

25

Sternberg, R. J. (1987). Most vocabulary is learned from context. In M. G. McKeown & M. E. Curtis (Eds.). The Nature of Vocabulary Acquisition (pp. 89 – 105). Hillsdale, NJ: Lawrence Erlbaum Associates. Sternberg, R. J. & Powell, J. S. (1983). Comprehending verbal comprehension. American Psychologist, 38, 878–893. Swanborn, M. S. L. & de Glopper, K. (1999). Incidental word learning while reading: A meta-analysis. Review of Educational Research, 69, 261–285. Sweller, J., van Merriënboer, J. & Paas, F. (1998). Why some material is difficult to learn. Cognition and Instruction, 12, 185–233. Szagun, G. (2006). Sprachentwicklung beim Kind. Ein Lehrbuch. Weinheim: Beltz. Tannenbaum, K. R., Torgesen, J. K. & Wagner, R. K. (2006). Relationships between word knowledge and reading comprehension in third-grade children. Scientific Studies of Reading, 10, 381–398. Ulrich, W. (2007). Wörter Wörter Wörter. Wortschatzarbeit im muttersprachlichen Deutschunterricht. Baltmannsweiler: Schneider. Ulrich, W. (2010). Zur lexikalischen Semantik des Deutschen. Pandaemonium germanicum, 15, 163–189. Werner, H. & Kaplan, E. (1950). Development of word meaning through verbal context: An experimental study. Journal of Psychology, 29, 251–257. Willenberg, H. (2008). Wortschatz Deutsch. In DESI-Konsortium (Hrsg.), Unterricht und Kompetenzerwerb in Deutsch und Englisch. Ergebnisse der DESI-Studie (S. 81–88). Weinheim: Beltz.

Manuskript eingereicht: 29.10.2015 Manuskript angenommen: 16.6.2016 Interessenskonflikt: keine

Nele McElvany Institut für Schulentwicklungsforschung (IFS) Technische Universität Dortmund Vogelpothsweg 78 44227 Dortmund Deutschland nele.mcelvany@tu-dortmund.de

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 13–25


Mehr Lernerfolg für Ihr Kind – wissenschaftlich erwiesen und nachhaltig

Regula Everts / Barbara Ritter

Das Memo-Training Memo, der vergessliche Elefant Mit Gedächtnistraining spielerisch zum Lernerfolg 2., überarb. u. erg. Aufl. 2017. 304 S., Gb € 34,95 / CHF 45.50 ISBN 978-3-456-85697-1 Auch als eBook erhältlich

Regula Everts Barbara Ritter

Das MemoTraining Memo, der vergessliche Elefant Mit Gedächtnistraining spielerisch zum Lernerfolg 2., überarbeitete und ergänzte Auflage

Memo ist ein Zirkuselefant und lebt in der Schweiz. Weil es ihm dort zu kalt ist, will er zurück in seine Heimat Botswana reisen. Doch Memo ist leider sehr vergesslich. Wie gut, dass er im Zirkus eine Menge Freunde hat, die ihm dabei helfen, die abenteuerliche Reise nach Botswana mit schlauen Gedächtnistricks zu meistern. Das neurowissenschaftlich begründete Gedächtnistraining mit dem Elefanten Memo wurde an der Universitätsklinik für Kinderheilkunde in Bern entwickelt, angewendet

www.hogrefe.com

und auf seine Wirkung hin untersucht. Das Training vermittelt Gedächtnisstrategien und stärkt das Arbeitsgedächtnis. Es verhilft Kindern ab sieben Jahren erwiesenermaßen und nachhaltig zu mehr Lernerfolg. Die einfache Handhabung, die kindgerecht gestalteten Übungen und die kunterbunten Geschichten machen das Memo-Training zu einem gelungenen Lernerlebnis sowohl für die Kinder als auch für die Trainerinnen und Trainer. Das Memo-Training wird seit der Erstausgabe im Jahr 2013 von Eltern und Fachpersonen mit Begeisterung und Erfolg angewendet.


Originalartikel

Wie gut können bildungsstandardbasierte Tests den schulischen Erfolg von Grundschulkindern vorhersagen? Gesine Fuchs1 und Martin Brunner1,2 1 2

Institut für Schulqualität der Länder Berlin und Brandenburg e. V. Freie Universität Berlin

Zusammenfassung: Bildungsstandardbasierte Tests werden bundesweit in der Primar- und Sekundarstufe zur Überprüfung von fachlichen Kompetenzen der Schülerinnen und Schüler in Deutschland eingesetzt, um ausgehend vom aktuellen Leistungsstand auch über deren zukünftigen schulischen Erfolg zu informieren. Wie gut diese Prognose gelingt, untersucht die vorliegende Längsschnittstudie anhand bildungsstandardbasierter Tests zur Erfassung der mathematischen Kompetenz und der Lesekompetenz in Deutsch für Brandenburger Grundschulkinder in der 3. bzw. 4. Klasse. Die Ergebnisse aus Regressionsanalysen zeigen, dass bildungsstandardbasierte Kompetenztests Prognosen auf 2 bzw. 3 Jahre später erhobene Kompetenztestergebnisse (β ≥ .56) sowie Schulnoten (β ≤ –.47) in vergleichbarem Ausmaß wie kommerziell erhältliche, standardisierte Schulleistungstests ermöglichen. Zudem ließ sich für beide Fächer eine substanzielle Vorhersagekraft der Kompetenztests für die Gymnasialempfehlung am Ende der 6. Klasse nachweisen. Auch bei Kontrolle in den Vorhersagemodellen für weitere leistungsrelevante Merkmale (Schulnoten, Intelligenz und familiärer Hintergrund) blieb ein prognostischer Mehrwert der Kompetenztests für alle untersuchten Kriterien des schulischen Erfolgs bestehen. Schlüsselwörter: Bildungsstandards, Grundschule, (prognostische) Validität, Mathematik, Lesekompetenz (Deutsch) How Well Can Standard-Based Tests Predict the Success of Primary-School Students? Abstract: Standard-based tests are used in Germany to assess the domain-specific competencies of primary and secondary students, where their current proficiency levels are presumed to inform about their future school success. This longitudinal study examines the extent to which standard-based test scores measuring proficiency in mathematics and German reading comprehension (in the 3rd or 4th grades) predict school success for children at primary schools in the federal state of Brandenburg. Regression analyses show that standard-based test scores predicted both test results (β ≥ .56) and grades (β ≤ –.47) 2 to 3 years later. The predictive power was comparable to that of commercial achievement tests. Further, standard-based tests in both domains predicted teachers' tracking recommendations for attending the highest academic track at the end of 6th grade. The predictive power for all criteria of school success remained even when controlling for additional student characteristics (e. g., grades, intelligence, socioeconomic background). Keywords: standard of education, primary school, (prognostic) validity, mathematics achievement, German reading comprehension

Einführung Bildungsstandards beschreiben „die fachbezogenen Kompetenzen einschließlich zugrunde liegender Wissensbestände, die Schülerinnen und Schüler bis zu einem bestimmten Zeitpunkt ihres Bildungsganges erreicht haben sollen“ (Kultusministerkonferenz [KMK], 2006, S. 6). Zur Überprüfung der Bildungsstandards werden bundesweit Kompetenztests im Rahmen des IQB-Ländervergleichs und der Vergleichsarbeiten (VERA) eingesetzt (KMK, 2015). So gibt es beispielsweise VERA 3 seit dem Schuljahr 2008/2009, und seit 2012 sind bundesweit alle Lehrkräfte der 3. Jahrgangsstufe an öffentlichen Schulen verpflichtet, jährlich in mindestens einem Fach VERA 3 durchzuführen © 2017 Hogrefe

(KMK, 2012). Mit dem Einsatz bildungsstandardbasierter Tests wird das übergeordnete Ziel einer datengestützten Qualitätsentwicklung und -sicherung im Bildungswesen verfolgt (KMK, 2006). Essenziell hierfür ist eine hohe psychometrische Qualität der Tests bzw. der gewonnenen Daten, da weitreichende Entscheidungen auf Grundlage dieser Informationen getroffen werden. Mit dem Nachweis einer hohen Datenqualität wird zum einen der Forderung einschlägiger Teststandards (American Educational Research Association, American Psychological Association & National Council on Measurement in Education, 1999) nachgekommen. Da VERA-Tests in einigen pädagogischen Kreisen heftig kritisiert werden (u. a. Kuhn, 2014), ist damit zum anderen auch die Hoffnung verbunden, dass Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39 DOI 10.1024/1010-0652/a000195


28

G. Fuchs & M. Brunner, Prognosekraft bildungsstandardbasierter Tests

Lehrkräfte sich intensiver mit den Ergebnisrückmeldungen aus VERA auseinandersetzen. Die Ergebnisrückmeldungen bei VERA informieren Lehrkräfte über den aktuellen Leistungsstand ihrer Schülerinnen und Schüler und geben Hinweise für deren weitere schulische Entwicklung. Denn die Bildungsstandards „formulieren fachliche und fachübergreifende Basisqualifikationen, die für die weitere schulische und berufliche Ausbildung von Bedeutung sind und die anschlussfähiges Lernen ermöglichen“ (KMK, 2004, S. 7). Dieser Anspruch impliziert, dass auf Grundlage der Ergebnisse bei bildungsstandardbasierten Tests zentrale Kriterien des Schulerfolgs vorhersagbar sein sollten. Trotz ihrer großen Bedeutung für die Bildungspolitik und Schulpraxis existieren bislang jedoch kaum Studien zur Vorhersagegüte bildungsstandardbasierter Tests für den Grundschulbereich. Ziel der vorliegenden Arbeit ist deshalb die Analyse der Prognosekraft bildungsstandardbasierter Tests in Mathematik und Deutsch (Lesekompetenz) für zentrale Schulerfolgskriterien (Testleistungen, Schulnoten, Gymnasialempfehlung) für Kinder an Brandenburger Grundschulen von der 3. bzw. 4. bis zur 6. Klasse.

Forschungsstand zur Prognosekraft von schulischen Leistungstests In diesem Abschnitt fokussieren wir auf Zusammenhänge bildungsstandardbasierter Tests der Mathematikkompetenz und der Lesekompetenz (in Deutsch) mit drei wichtigen Kriterien des Schulerfolgs: (a) Testleistungen und (b) Schulnoten desselben Faches und (c) Gymnasialempfehlung. Von besonderer Bedeutung ist dabei auch, inwiefern bildungsstandardbasierte Tests einen prognostischen Mehrwert (inkrementelle Validität) gegenüber anderen leistungsrelevanten Prädiktoren (z. B. Schulnoten, Intelligenz, sozioökonomischer Status) besitzen. Ergebnisse dieser Analysen sind hoch relevant für die Akzeptanz bildungsstandardbasierter Tests in der Praxis. Für Lehrkräfte, denen in der Regel lediglich Schulnoten vorliegen, kann der Nachweis eines diagnostischen Mehrwerts von bildungsstandardbasierten Tests zu einem wichtigen Argument werden, um den Aufwand für die Durchführung dieser Tests zu rechtfertigen. Da für einige Fragen zur Prognosekraft bildungsstandardbasierter Tests noch keine relevanten Ergebnisse vorliegen, fassen wir zur Einordnung der vorliegenden Befunde auch die Befundlage für kommerzielle, standardisierte Schulleistungstests zusammen, die frei für Lehrkräfte erhältlich sind. Eine detaillierte Auflistung dieser Ergebnisse befindet sich im ESM 1. Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39

Prognose von Testleistungen Längsschnittliche Befunde für die Vorhersagekraft von bildungsstandardbasierten Testleistungen auf zukünftige Testleistungen berichtet Nachtigall (2014) für Mathematik und für Deutsch. Die durchschnittlichen Korrelationen liegen zwischen r = .63 und r = .67 für ein Vorhersageintervall von der 3. zur 6. Jahrgangsstufe bzw. von der 3. zur 8. Jahrgangsstufe. Diese Ergebnisse liegen in einem ähnlichen Bereich wie auch andere standardisierte Leistungstests. Hier liegen die Korrelationen zwischen .55 ≤ r ≤ .80 in Mathematik und .31 ≤ r ≤ .75 für Deutsch (Lesen). Gründe für die Variabilität der Korrelationen sind u. a. in der unterschiedlichen Prognosedauer und den eingesetzten Verfahren zu suchen. Lediglich für DEMAT 3+ liegen bisher Befunde zum prognostischen Mehrwert bei zusätzlicher Berücksichtigung der Intelligenz mit radj = .47 und der Mathematiknote mit radj = .49 vor (Roick, Gölitz & Hasselhorn, 2004).

Prognose von Schulnoten Die Vorhersage von Schulnoten durch bildungsstandardbasierte Testleistungen innerhalb der Grundschulzeit wurde bislang nur in der Studie von Hildebrandt und Watermann (2015) im Fach Deutsch untersucht. Zur Ermittlung des Testwerts in Deutsch in der 4. Klasse der Primarstufe wurde über mehrere sprachliche Leistungsdomänen (Lesen, Hören, Sprachgebrauch, Rechtschreibung) hin gemittelt. Der Zusammenhang mit zukünftigen Deutschnoten in der 6. Klasse der Sekundarstufe (1 für sehr gut und 6 für ungenügend) betrug über alle Bildungsgänge hinweg im Mittel r = –.38. Auch bei Kontrolle zahlreicher Kovariaten (Deutsch- und Mathematiknote, Geschlecht, Intelligenz, Mathematiktestleistung, sozioökonomischer Familienhintergrund, Migrationshintergrund) konnte der bildungsstandardbasierte Test in Deutsch in der Primarstufe die Deutschnote in der Sekundarstufe vorhersagen: Die bildungsgangspezifischen standardisierten Regressionsgewichte lagen zwischen βadj = –.19 und βadj = –.17. Darüber hinaus gibt es nur Querschnittsanalysen zum Zusammenhang zwischen bildungsstandardbasierten Testleistungen und Schulnoten innerhalb der Primarstufe. Hier liegen die Korrelationen zwischen –.72 ≤ r ≤ –.48 in Mathematik und –.63 ≤ r ≤ –.53 in Deutsch. Die Prognosekraft von kommerziell erhältlichen, standardisierten Testverfahren für zukünftige Schulnoten, die bis zu 2 Jahre später erzielt wurden, beträgt in Mathematik (mit dem DEMAT; Krajewski, Liehm & Schneider, 2004; Roick et al., 2004) zwischen r = –.64 und r = –.69. Die Studie von Roick und Kollegen (2004) wies zudem einen prognostischen Mehrwert der Mathematikleistung bei Kont© 2017 Hogrefe


G. Fuchs & M. Brunner, Prognosekraft bildungsstandardbasierter Tests

rolle der Mathematiknote von radj = –.46 nach. Für Deutsch (mit dem HASE; Roos, Schöler & Treutlein, 2007) liegt die Prognosekraft zwischen r = –.38 bis r = –.45 für spätere Deutsch-, Lese- und Rechtschreibnoten.

Prognose der Gymnasialempfehlung Befunde zur Vorhersage der zukünftigen Übertritts- bzw. Gymnasialempfehlung liegen unseres Wissens für bildungsstandardbasierte Tests nicht vor, da es hierzu bislang nur Querschnittsstudien gibt. Für bildungsstandardbasierte Tests berichten Köller, Eßel-Ullmann und Paasch (2012) innerhalb der 5. Klasse einen positiven Zusammenhang mit dem realisierten Gymnasialbesuch mit Korrelationswerten von r = .53 und r = .55. Testwerte im DEMAT können die Übergangsempfehlung substanziell vorhersagen und besitzen prognostischen Mehrwert über die Deutsch- und Mathematiknote hinaus. Für Leistungstests in Deutsch liegen keine entsprechenden Befunde vor.

Forschungsfragen Bildungsstandardbasierte Tests sind seit über 10 Jahren fester Bestandteil der deutschen Bildungspolitik und -forschung sowie der Schulpraxis: Sie gehören damit zu den am meisten eingesetzten standardisierten Tests an Schulen. Die Bildungsstandards implizieren, dass die Ergebnisse bildungsstandardbasierter Tests auch die zukünftige schulische Entwicklung von Schülerinnen und Schülern vorhersagen können. Jedoch gibt es bislang kaum Studien, die diese Fragestellung empirisch untersucht haben. In der vorliegenden Arbeit analysieren wir daher auf Grundlage repräsentativer Daten von Brandenburger Grundschulkindern die Vorhersagekraft von bildungsstandardbasierten Tests im Hinblick auf drei Forschungsfragen: Wie gut können bildungsstandardbasierte Tests (1) im Fach Mathematik und (2) im Fach Deutsch spätere Testleistungen und Schulnoten desselben Faches vorhersagen? (3) Wie hoch ist die gemeinsame Vorhersagekraft von Testleistungen in Mathematik und Deutsch für die Gymnasialempfehlung? Bei der Beantwortung dieser Forschungsfragen untersuchen wir nicht nur bivariate Zusammenhänge im Längsschnitt, sondern auch den prognostischen Mehrwert von bildungsstandardbasierten Kompetenztests bei Kontrolle von Schulnoten, Intelligenz und sozioökonomischem Hintergrund der Kinder. Welche Ergebnisse sind zu erwarten? Inhaltlich relevante Kompetenzen bzw. das Vorwissen zu einem früheren Zeitpunkt gehören zu den besten Prädiktoren für den zu© 2017 Hogrefe

29

künftigen schulischen Kompetenz- und Wissenserwerb (Helmke & Weinert, 1997). Wie stark die längsschnittlichen Zusammenhänge tatsächlich sind, variiert (wie unser Literaturüberblick bzw. ESM 1 zeigen) jedoch zwischen den eingesetzten Prädiktoren, den untersuchten Kriterien und der Prognosedauer. Auch wenn bislang für den Grundschulbereich in Deutschland nur wenige Befunde zur Verfügung stehen, stellen diese die beste Basis für eine Schätzung der zu erwartenden Ergebnisse in der vorliegenden Studie dar. Dabei können Befunde aus Querschnittsstudien (z. B. zu Schulnoten) als Obergrenze der zu erwartenden Vorhersagekraft im Rahmen dieser Längsschnittstudie angenommen werden. Schmal ist auch die Befundlage zum prognostischen Mehrwert bildungsstandardbasierter Tests über weitere leistungsprädiktive Merkmale. Und es ist darüber hinaus schwierig, Erwartungen zu formulieren, da der Kranz an Kovariaten zwischen den Studien variiert. Generell sind für die vorliegende Studie Koeffizienten im unteren Wertebereich zu erwarten, da wir im Vergleich zu bisherigen Studien mehr leistungsprädiktive Merkmale und einen längeren Prognosezeitraum berücksichtigen.

Methode Stichprobe und Prozedur Zur Analyse der Forschungsfragen nutzten wir die Daten aus der Längsschnittstudie KEGS (Kompetenzentwicklung in der Grundschule), die an öffentlichen Grundschulen in Brandenburg im Auftrag des Ministeriums für Bildung, Jugend und Sport durchgeführt wurde (Fuchs & Brunner, 2014). Im Zentrum der KEGS-Studie stand die Kompetenzentwicklung von Grundschulkindern in Mathematik und Deutsch (Lesekompetenz). Die Erhebungen begannen im Schuljahr 2006/07 (2. Klasse) und endeten im Schuljahr 2010/11 (6. Klasse); sie wurden jährlich jeweils gegen Ende eines Schuljahres in den Monaten Mai bis Juli durchgeführt. Die mathematische Kompetenz wurde von der 2. bis 6. Klasse, die Lesekompetenz von der 4. bis zur 6. Klasse erfasst. Abbildung 1 stellt die Anlage der KEGS-Studie dar. Zu Beginn der KEGS-Studie war es den Schulleitungen freigestellt, ob sie teilnahmen oder nicht. Sofern eine Schulleitung zustimmte, waren alle Kinder einer zufällig gezogenen Klasse in der 2. Jahrgangsstufe zur Teilnahme verpflichtet. Von anfänglich 100 zufällig gezogenen Schulen nahmen in der 2. Klasse letztlich Kinder von 77 Schulen (77 %) teil; in der 3. Klasse waren es 75 Schulen. Um die Integrität der Stichprobe zu sichern, wurden ab dem Schuljahr 2008/09 (4. Jahrgangsstufe) die Schulleitungen zur Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39


30

G. Fuchs & M. Brunner, Prognosekraft bildungsstandardbasierter Tests

Abbildung 1. Anlage der KEGS-Studie über die Erhebungszeitpunkte von der 2. bis zur 6. Klasse. Die Daten in der 2. Klasse wurden nicht in die Analysemodelle dieses Artikels einbezogen (grau hinterlegt). IQB = Institut zur Qualitätsentwicklung im Bildungswesen.

Teilnahme verpflichtet, wobei zugesichert wurde, dass die Daten auf Individual- und Schulebene allenfalls in anonymisierter Form an das Bildungsministerium weitergereicht werden. Dennoch reduzierte sich die Anzahl der teilnehmenden Schulen bis zum Zeitpunkt der 6. Klasse, je nach untersuchtem Fach, auf 68 Schulen für Mathematik und auf 59 Schulen für Deutsch. Analysen zum Stichprobenausfall (s. ESM 2) zeigten, dass Kinder an Schulen, die weiterhin an KEGS teilnahmen, bei 9 von 10 Leistungsindikatoren (Kompetenztests, Noten, Intelligenz) besser abschnitten; Unterschiede in soziodemografischen Merkmalen waren nicht systematisch. Das Studiendesign von KEGS wurde nach Beginn stetig erweitert, um eine Vielzahl von Forschungsfragen zu beantworten, unter anderen auch die Frage nach Durchführungseffekten auf die Datenqualität von bildungsstandardbasierten Tests. Daher führten in einigen Schuljahren entweder Lehrkräfte oder geschulte Testleiterinnen und -leiter die Tests durch. Die Art der Testdurchführung wurZeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39

de per Zufall festgelegt; in beiden Fällen bewerteten geschulte Kodiererinnen und Kodierer die Testantworten. Um die Vorhersagegüte von bildungsstandardbasierten Tests bestmöglich abschätzen zu können, fokussieren wir in den vorliegenden Analysen auf Daten, die auf einer Testadministration und -durchführung durch geschulte Testleiterinnen und -leiter basieren. (ESM 9 – 12 dokumentieren die Ergebnisse, die bei einer Durchführung der Mathematiktests durch Lehrkräfte in der 3. Klasse resultierten; s. a. Abschnitt „Zusatzanalysen“). Da in Mathematik die Tests in der 2. Klasse ausschließlich von Lehrkräften durchgeführt wurden, wurden Daten für Mathematik ab der 3. Klasse für die Analysen zur Vorhersagekraft berücksichtigt. Die so resultierende Längsschnittstichprobe umfasste 568 Kinder (49 % Mädchen; Alter in der 3. Klasse: M = 9.5 Jahre, SD = 0.6 Jahre) jeweils einer Klasse aus 22 Schulen (durchschnittlich 26 Kinder/Klasse), die an mindestens einer Erhebung von der 3. bis zur 6. Jahrgangsstufe teilnahmen (s. a. Abschnitt „Umgang mit fehlenden Werten“). © 2017 Hogrefe


G. Fuchs & M. Brunner, Prognosekraft bildungsstandardbasierter Tests

Messinstrumente Kompetenzen in Mathematik und Deutsch (Lesen) Bei der Erfassung der Kompetenz in Mathematik wurden über alle Erhebungszeitpunkte vier von insgesamt fünf inhaltsbezogenen Kompetenzen berücksichtigt: Zahlen und Operationen, Muster und Strukturen, Größen und Messen sowie Raum und Form. Weiterhin wurden Tests zur Erfassung der Lesekompetenz im Fach Deutsch eingesetzt (Bremerich-Vos & Böhme, 2009). Die vorgesehene Bearbeitungsdauer der Kompetenztests in Mathematik und Deutsch betrug jeweils maximal 45 Minuten. Die Kinder bearbeiteten die Kompetenztests an separaten Tagen, mit maximal einer Woche Abstand. Die Schulen konnten wählen, welchen Test sie zuerst bearbeiteten. Die Items der Kompetenztests beider Fächer stammten zur Mehrzahl aus einem Aufgabenpool, der vom Institut zur Qualitätsentwicklung im Bildungswesen (IQB) zur Überprüfung der Bildungsstandards in der Primarstufe entwickelt wurde: In Mathematik wurde konkret in der 3. Klasse Heft 1, in der 4. Klasse Heft 2 eingesetzt (Granzer et al., 2008a, 2008b). Die Bildungsstandards fokussieren auf die 4. Jahrgangsstufe, und entsprechende Items sind auf das Leistungsniveau in dieser Jahrgangsstufe abgestimmt. Um die Kompetenzentwicklung in Deutsch in den Jahrgangsstufen 5 und 6 zu untersuchen, wurden zudem Items aus der ELEMENT-Studie eingesetzt (Lehmann & Lenkeit, 2008). Die Reliabilität (interne Konsistenz, KR-20) der Kompetenztests variierte zwischen den Erhebungszeitpunkten. In Mathematik lag die Reliabilität bei rtt = .83, .80, .87 und .91 in der 3., 4., 5. und 6. Klassenstufe. Für den Kompetenztest in Deutsch lag die Reliabilität bei rtt = .72, .74 und .81 in der 4., 5. und 6. Klassenstufe. Diese Werte sind für die vorliegenden Forschungsfragen als zumindest zufriedenstellend zu bewerten (Kline, 2005) und mit den Angaben von Köller, Eßel-Ullmann und Paasch (2012) vergleichbar. Schulnoten und Gymnasialempfehlung Im Rahmen der Erhebungen in der 4., 5. und 6. Klasse gaben die Lehrkräfte die Halbjahresnoten der Kinder in den Fächern Deutsch und Mathematik auf der Schulnotenskala von 1 (sehr gut) bis 6 (ungenügend) an. In der 6. Jahrgangsstufe nannten die Lehrkräfte für alle Kinder ihrer Klasse die Empfehlung für einen Bildungsgang in der Sekundarstufe I. In Brandenburg gab es zum Zeitpunkt der KEGS-Studie folgende Optionen: erweiterte Berufsbildungsreife (erweiterter Hauptschulabschluss), Fachoberschulreife (Mittlerer Schulabschluss) und Abitur (allgemeine Hochschulreife). Für die nachfolgenden Analysen kodierten wir die Gymnasialempfehlung (= Abitur) mit 1, alle anderen Optionen wurden mit 0 kodiert. © 2017 Hogrefe

31

Intelligenz In der 4. Klasse wurde der Untertest Figurenanalogien (N2, Testform A) des Kognitiven Fähigkeitstests (KFT 4–12+R; Heller & Perleth, 2000) durchgeführt. Figurenanalogien gelten als guter Indikator für fluide Intelligenz (Horn & Noll, 1997) und haben sich in zahlreichen Schulleistungsstudien bewährt. Die interne Konsistenz bei Kindern in der 4. Klasse liegt bei .94 (Heller & Perleth, 2000). Familiärer Hintergrund Informationen zum familiären Hintergrund stammten von den Kindern zum Zeitpunkt der 6. Klasse sowie von den Eltern, die einen Elternfragebogen ausfüllten, als ihre Kinder die 3. Klasse besuchten. Die Kinder machten Angaben zum Beruf der Eltern. Diese Angaben wurden in den International Socio-Economic Index of Occupational Status (ISEI; Ganzeboom, De Graaf & Treiman, 1992) transformiert. Dabei wurde der höchste ISEI-Wert einer Familie, HISEI, für die vorliegenden Analysen herangezogen. Die Eltern gaben ihren schulischen und beruflichen Abschluss an; für die Analysen verwendeten wir den höchsten Abschluss in einer Familie. Weiterhin beantworteten die Eltern Fragen zum Buchbesitz, zur Häufigkeit gemeinsamer kultureller Aktivitäten, zum Vorhandensein von Wohlstandsgütern und zum monatlich zur Verfügung stehenden Nettoeinkommen des Haushaltes (zu Detailinformationen der Erfassung s. ESM 3).

Datenanalyse Skalierung der Kompetenztests Die Skalierung der Kompetenztests erfolgte für Mathematik und Lesen jeweils getrennt mit dem Programm ConQuest (Wu, Adams & Wilson, 1998) auf Basis eines eindimensionalen Rasch-Modells (Rasch, 1980) für dichotome Daten. Die Itemanalysen erfolgten in zwei Schritten. Erstens wurden in enger Anlehnung an die methodischen Standards der PISA-Studie Items ausgeschlossen, die keine ausreichende Rasch-Homogenität aufwiesen (Organisation for Economic Co-operation and Development, 2009) und deren Trennschärfen nicht substanziell waren. Zweitens haben wir für die Skalierung der Testwerte in Mathematik und Lesen die Itemparameter aus den Normierungsstudien des IQB zugrunde gelegt. Dabei analysierten wir die Messinvarianz über die jeweiligen Erhebungszeitpunkte (Details zur Verlinkung s. ESM 4), indem wir das methodische Vorgehen zur Analyse aus der TOSCA-Studie (Nagy & Neumann, 2010) übernommen und die Klassifikation zum Differential-Item-Functioning (DIF) des Educational Testing Service angewendet haben. In den Analysen wurden dann nur Items berücksichtigt, die nicht der DIF-Kategorie C (β2 ≤ 0.4) angehörten. LetztZeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39


32

G. Fuchs & M. Brunner, Prognosekraft bildungsstandardbasierter Tests

Tabelle 1. Forschungsfrage 1: Vorhersage zukünftiger Testleistungen und Schulnoten in Mathematik Vorhersage mit Mathematik-Kompetenztest in der 3. Klasse auf Kriterien in der Modell

4. Klasse

5. Klasse

Vorhersage mit Mathematik-Kompetenztest in der 4. Klasse auf Kriterien in der

6. Klasse

5. Klasse

6. Klasse

Kriterium: Testleistung in Mathematik (a)

(b)

β

.56

[.49, .64]

.63

[.57, .69]

.58

[.50, .66]

.66

[.59, .72]

.61

[.53, .70]

B*70

38

[33, 44]

47

[42, 52]

45

[38, 52]

50

[43, 58]

48

[41, 56]

R2

.32

.40

Badj*70

20 a

R2

.49 a

.57a

.52a

.57

.53

a

a

a

.11

.08

.06

.40

[14, 27]a

30 a

a

[.32, .49]

a

.33

[.26, .46]

.45

[.35, .54]

.36

[.27, .46]

[23, 37]a

26 a

[18, 33]a

34

[26, 42]

29

[21, 36]

.11

a

.38

.30

sr

[.21, .39]

a

.43

βadj

2

a

.34

a

.07

Kriterium: Mathematiknote (a)

(b)

β

–.54

[–.63, –.45]

–.48

[–.56, –.39]

–.51

[–.60, –.41]

–.57

[–.66, –.48]

–.57

[–.66, –.49]

B*70

–.28

[–.33, –.23]

–.28

[–.33, –.23]

–.35

[–.49, –.21]

–.35

[–.42, –.28]

–.42

[–.49, –.35]

R2

.29

βadj

–.41b

[–.51, –.30]b

–.12a

[–.21, –.03]a

–.15a

[–.25, –.05]a

–.22

[–.32, –.11]

–.22

[–.31, –.13]

Badj*70

–.21b

[–.26, –.16]b

–.07a

[–.12, –.02]a

–.07a

[–.12, –.02]a

–.14

[–.28, .00]

–.14

[–.19, –.09]

2

b

.23

.26

a

R

.41

.56

sr2

.14b

.01a

.32

.33

a

.58

.58

.01a

.03

.03

.56

Anmerkungen. Modell a: bivariates Regressionsmodell. Modell b: multiples Regressionsmodell (Spezifikation s. Text). In Klammern wird das 95 %-Konfidenzintervall ausgewiesen. B*70, Badj*70 Vorhersagekraft für einen Leistungsunterschied von einer Kompetenzstufe. R2 = Determinationskoeffizient. sr2 = Quadrierter Semipartialkorrelationskoeffizient. a In der 3. Klasse wurden die Schulnoten nicht erfasst; in Modell b wurde daher für die Mathematiknote der 4. Klasse kontrolliert. b In der 3. Klasse wurden die Schulnoten nicht erfasst; in Modell b wurde daher nicht für die Mathematiknote kontrolliert.

endlich lagen so pro Erhebungszeitpunkt mindestens 21 Items zur Schätzung der Leistungskennwerte vor (im Detail, s. Fuchs & Brunner, 2014). Als Kompetenztestwerte ermittelten wir Warms Weighted Maximum Likelihood Estimators (WLE; Warm, 1989), die für die nachfolgenden Analysen in die KMK-Bildungsstandardmetrik (Bista-Metrik) transformiert wurden (Mittelwert für Gesamtdeutschland M = 500, SD = 100). Umgang mit fehlenden Werten Der Anteil fehlender Werte lag bei den Kompetenztestwerten in Mathematik und Deutsch zwischen 15 und 29 % und bei den übrigen Variablen zwischen 16 und 57 % (s. ESM 5). Wir nutzten das multiple Imputationsverfahren mice (van Buuren & Groothuis-Oudshoorn, 2011), um 15 vollständige Datensätze zu erzeugen. Bei der Imputation der fehlenden Werte berücksichtigten wir das Skalenniveau der einbezogenen Variablen sowie die hierarchische Datenstruktur. Um die Qualität der imputierten Daten zu Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39

verbessern, nutzten wir zusätzlich zu den Variablen aus den Analysemodellen Alter, Geschlecht und die Mathematikleistung in der 2. Klasse als Hilfsvariablen (Collins, Schafer & Kam, 2001). Statistische Analysemodelle Zur Analyse der Forschungsfragen 1 und 2 zur Vorhersagekraft bildungsstandardbasierter Tests in Mathematik und Deutsch für Testleistungen und Schulnoten verwendeten wir bivariate lineare Regressionsmodelle, in denen jeweils die Testleistung in einer bestimmten Jahrgangsstufe als Prädiktor und die Testleistung bzw. Schulnote in einer späteren Jahrgangsstufe als Kriterium spezifiziert wurden. Diese werden in den Tabellen 1 und 2 jeweils mit Modell a bezeichnet. Neben dem standardisierten Regressionskoeffizienten greifen wir zur Evaluation der gefundenen Zusammenhänge auch auf die Bildungsstandardmetrik zurück. Ein Leistungsunterschied von 70 Punkten entspricht dabei der Breite einer Kompetenzstufe (KMK, 2013a, © 2017 Hogrefe


G. Fuchs & M. Brunner, Prognosekraft bildungsstandardbasierter Tests

Tabelle 2. Forschungsfrage 2: Vorhersage zukünftiger Testleistungen und Schulnoten in Deutsch Vorhersage mit Deutsch-Lesekompetenztest in der 4. Klasse auf Kriterien in der Modell

5. Klasse

6. Klasse

Kriterium: Testleistung in Deutsch-Lesen (a)

(b)

β

.60

[.53, .67]

.61

[.54, .68]

B*70

36

[31, 42]

42

[37, 48]

R2

.36

βadj

.44

[.35, .53]

.43

[.34, .52]

Badj*70

27

[20, 33]

30

[24, 36]

R2

.45

.51

sr2

.13

.13

.37

Kriterium: Deutschnote (a)

(b)

β

–.47

[–.55, –.38]

–.50

[–.58, –.42]

B*70

–.21

[–.25, –.17]

–.28

[–.33, –.23]

R2

.22

βadj

–.19

[–.22, –.06]

–.19

[–.28, –.10]

Badj*70

–.07

[–.11, –.03]

–.07

[–.11, –.03]

R2 2

sr

.25

.58

.57

.01

.02

Anmerkungen. Modell a: bivariates Regressionsmodell. Modell b: multiples Regressionsmodell (Spezifikation s. Text). In Klammern wird das 95 %-Konfidenzintervall ausgewiesen. B*70, Badj*70 Vorhersagekraft für einen Leistungsunterschied von einer Kompetenzstufe. R2 = Determinationskoeffizient. sr2 = Quadrierter Semipartialkorrelationskoeffizient.

2013b). Demnach geben die mit Faktor 70 multiplizierten unstandardisierten Regressionskoeffizienten (B*70) an, wie sehr sich eine spätere Testleistung bzw. eine Schulnote verbessert, falls sich die Leistung auf der Prädiktorvariable um eine Kompetenzstufe erhöht1. Um den prognostischen Mehrwert bildungsstandardbasierter Tests abzuschätzen, analysierten wir multiple lineare Regressionsmodelle (Modell b, Tab. 1 und 2), in denen wir die bivariaten Modelle um zusätzliche Kontrollvariablen erweiterten: Hierzu gehörten die Schulnote (des korre1

33

spondierenden Faches; s. aber auch die Anmerkungen zu Tab. 1), die Intelligenz und alle Indikatoren des familiären Hintergrundes. Zur Bewertung des prognostischen Mehrwerts berichten wir den quadrierten Semipartialkorrelationskoeffizienten (sr2): Er gibt an, wie hoch der Anteil der Varianzaufklärung ist, welcher (unter Berücksichtigung aller Kontrollvariablen) allein auf den bildungsstandardbasierten Test zurückgeführt werden kann. Zur Ermittlung der Vorhersagekraft bildungsstandardbasierter Tests für die Gymnasialempfehlung in der 6. Klasse (Forschungsfrage 3) nutzten wir multivariate logistische Regressionsmodelle. Da die Lehrkräfte die Übertrittsempfehlung auf Grundlage der Leistungen in mehreren Fächern geben sollen (§ 15 Abs. 1 GV; Ministerium für Bildung, Jugend und Sport, 2007), nahmen wir in einem ersten Analyseschritt die Testleistungen in Mathematik und Deutsch der 4. Klasse auf. Wir wählten hier die 4. Klasse, da in dieser Klassenstufe die Kinder zum ersten Mal Kompetenztests in beiden Fächern bearbeiteten. Im zweiten Analyseschritt untersuchten wir den prognostischen Mehrwert der Kompetenztests bei Kontrolle weiterer Kovariaten: Schulnoten desselben Fachs in der 4. Klasse, Intelligenz und Indikatoren des familiären Hintergrundes. Alle Modelle wurden mit Mplus 7.3 (Muthén & Muthén, 1998–2012) berechnet. Zur Schätzung aller Modellparameter verwendeten wir das Robust-Maximum-LikelihoodVerfahren (MLR). Zudem berücksichtigten wir die hierarchische Datenstruktur unter Verwendung des Moduls „complex“ und aggregierten die Ergebnisse über 15 Datensätze.

Ergebnisse Forschungsfrage 1: Vorhersagekraft des Kompetenztests in Mathematik Die Leistungen der Kinder, die sie bei Kompetenztests in Mathematik in der 3. bzw. 4. Klasse zeigten, konnten Testleistungen in Mathematik, die sie bis zu 3 Jahre später erzielten, vorhersagen: Die Vorhersagegüte lag hier zwischen β = .56 und β = .66 (Tab. 1, Testleistung, Modell a). Ein Leistungsunterschied von einer Kompetenzstufe war dabei mit 38 bis 50 Punkten besseren Leistungen in Ma-

Das methodische Vorgehen zur Sicherung der Messinvarianz hatte zur Folge, dass die Anzahl an sogenannten „Linking“-Items zur Verbindung der Tests von aufeinanderfolgenden Erhebungszeitpunkten in Mathematik zwischen 6 bis 21 Items und in Deutsch zwischen 6 bis 22 Items lag (s. ESM 4). Bisher existieren keine einheitlichen Richtlinien, welche Anzahl an Items für eine valide Verlinkung notwendig ist (u. a. Kolen & Brennan, 2004). Eventuell bestehende Schwächen in der Metrikanbindung wirken sich in den Analysen zur Prognosekraft jedoch nur auf die unstandardisierten Regressionskoeffizienten (B*70; s. Tab. 1 bis 3) aus, da diese Koeffizienten sich auf die Bista-Metrik beziehen. Die unstandardisierten Regressionskoeffizienten sollten daher mit gewisser Vorsicht interpretiert werden. Diese Einschränkung gilt jedoch nicht für die standardisierten Regressionskoeffizienten (β), die sich auf Standardabweichungseinheiten beziehen und somit unabhängig von der Metrik der unabhängigen und abhängigen Variablen sind.

© 2017 Hogrefe

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39


34

G. Fuchs & M. Brunner, Prognosekraft bildungsstandardbasierter Tests

thematik in späteren Schuljahren assoziiert (Zeile B*70 in Tab. 1, Modell a). Für alle Vorhersageintervalle zeigte sich ein deutlicher prognostischer Mehrwert der Mathematiktests zur Vorhersage der Testleistung mit adjustierten standardisierten Regressionskoeffizienten von βadj = .30 bis βadj = .45 (Tab. 1, Modell b). Selbst bei Kontrolle der Intelligenz, der Mathematiknote sowie den Merkmalen des familiären Hintergrundes lag die für einen Leistungsunterschied von einer Kompetenzstufe erwartete zukünftige Leistungsdifferenz zwischen 20 und 34 Punkten auf der Bista-Metrik. Die quadrierten Semipartialkorrelationskoeffizienten lagen zwischen sr2 = .06 und sr2 = .11, d. h., durch Kenntnis der Testleistung in Mathematik in der 3. bzw. 4. Jahrgangsstufe konnten (bei Kontrolle der Kovariaten) 6 bis 11 % mehr Varianz in späteren Testleistungen erklärt werden. Ein ähnliches Befundmuster zeigte sich auch für die Vorhersage der Mathematiknoten. Kinder mit besseren Testleistungen in Mathematik erzielten in höheren Klassenstufen bessere Mathematiknoten. Die standardisierten Regressionskoeffizienten lagen zwischen β = –.51 und β = –.57 (Tab. 1, Modell a). Leistungsunterschiede von einer Kompetenzstufe waren dabei unabhängig vom Prognosezeitraum mit besseren Mathematiknoten von etwa einem Drittel Notenpunkt assoziiert. Auch bei Kontrolle der Kovariaten für die Vorhersage der Mathematiknoten wiesen die Kompetenztests in Mathematik einen statistisch bedeutsamen, prognostischen Mehrwert auf (Tab. 1, Modell b). Die Werte lagen zur Vorhersage der Noten in der 5. und 6. Klasse bei βadj = –.12 und βadj = –.22. Ein Leistungsunterschied von einer Kompetenzstufe war dabei mit –.07 und –.14 besseren Mathematiknoten assoziiert. Die quadrierten Semipartialkorrelationskoeffizienten lagen zwischen sr2 = .01 und sr2 = .03. Zur Vorhersage der Noten in der 4. Klasse (ohne Kontrolle der Mathematiknote in der 3. Klasse) lagen die Werte erwartungsgemäß höher.

Forschungsfrage 2: Vorhersagekraft des Lesekompetenztests in Deutsch Die Lesekompetenzleistungen der Kinder in der 4. Klasse konnten – über Zeitintervalle von bis zu 2 Jahren – spätere Testleistungen in Deutsch vorhersagen: Die Vorhersagegüte lag bei β = .60 und β = .61 (Tab. 2, Modell a). Leistungsunterschiede von einer Kompetenzstufe waren dabei mit 36 und 42 Punkten besseren Leistungen in Deutsch in späteren Schuljahren assoziiert (Zeile B*70, Tab. 2, Modell a). Darüber hinaus zeigte sich selbst bei Kontrolle der Kovariaten in Deutsch ein deutlicher prognostischer Mehrwert zur Vorhersage der Testleistung mit Werten von βadj = .43 und βadj = .44 (Tab. 2, Modell b). Hier lag die für einen Leistungsunterschied von einer Kompetenzstufe erZeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39

wartete zukünftige Leistungsdifferenz bei 27 und 30 Punkten auf der Bista-Metrik. Die quadrierten Semipartialkorrelationskoeffizienten lagen jeweils bei sr2 = .13. Für die Vorhersage der Deutschnoten wurden standardisierte Regressionskoeffizienten von β = –.47 und β = –.50 ermittelt (Tab. 2, Modell a). Kinder mit besseren Testleistungen in Deutsch in der 4. Klasse erzielten in höheren Klassenstufen bessere Deutschnoten. Ein Leistungsunterschied von einer Kompetenzstufe war dabei mit –.21 und –.28 besseren Deutschnoten assoziiert. Für die Deutschtests zeigte sich darüber hinaus wiederum bei Kontrolle der Kovariaten ein prognostischer Mehrwert von βadj = –.19 (Tab. 2, Schulnote, Modell b). So lag für einen Leistungsunterschied von einer Kompetenzstufe die erwartete zukünftige Leistungsdifferenz bei –.07 Notenpunkten. Die quadrierten Semipartialkorrelationskoeffizienten lagen bei sr2 = .01 und sr2 = .02.

Forschungsfrage 3: Vorhersage der Gymnasialempfehlung Bildungsstandardbasierte Kompetenztests in Mathematik und der Lesekompetenz in Deutsch in der 4. Klasse konnten die Gymnasialempfehlung in der 6. Klasse vorhersagen (Tab. 3, Modell a). Die bivariaten (punktbiserialen) Korrelationen zwischen Gymnasialempfehlung in der 6. Klasse und den Kompetenztestwerten in Mathematik und Deutsch in der 4. Klasse lagen bei rpb = .68 und rpb = .62 (s. ESM 5). Die Analysen der logistischen Regressionsmodelle zeigten, dass höhere Kompetenzwerte in Mathematik bzw. der Lesekompetenz jeweils mit einer höheren Chance einhergingen, dass Lehrkräfte 2 Jahre später eine Gymnasialempfehlung aussprachen (bei gleichzeitiger Kontrolle der Kompetenz im jeweils anderen Fach; s. Tab. 3, Modell a). Die Regressionskoeffizienten können genutzt werden, um die Wahrscheinlichkeiten für den Erhalt einer Gymnasialempfehlung zu veranschaulichen. Hierzu berechneten wir die adjustierten Wahrscheinlichkeiten für den Erhalt einer Gymnasialempfehlung an den Kompetenzstufengrenzen bei 390, 460, 530 und 600 Punkten auf der Bista-Metrik (Abb. 2). Für die Kontrollvariablen wurde der jeweilige Stichprobenmittelwert einbezogen. Mit dem Zugewinn einer Kompetenzstufe in Mathematik ging eine höhere (für die Lesekompetenz adjustierte) Wahrscheinlichkeit der Gymnasialempfehlung von p = .14 bis .20 einher. Für Lesen lag die (für die Mathematikkompetenz adjustierte) Erhöhung der Wahrscheinlichkeit für eine Gymnasialempfehlung zwischen p = .11 und .14. Wichtig ist an dieser Stelle festzuhalten, dass sowohl der Kompetenztest in Mathematik als auch der Lesekompetenztest einen prognostischen Mehrwert zur Vorhersage © 2017 Hogrefe


G. Fuchs & M. Brunner, Prognosekraft bildungsstandardbasierter Tests

35

Abbildung 2. Forschungsfrage 3: Vorhergesagte Wahrscheinlichkeiten, eine Gymnasialempfehlung am Ende der 6. Klasse zu erhalten auf Grundlage bildungsstandardbasierter Testleistungen (in Bista-Punkten) in (a) Mathematik und (b) Deutsch (Lesen). Modell a: multiples Regressionsmodell, lediglich für anderen Fachtest (Stichprobenmittelwert) kontrolliert (Spezifikation s. Text). Modell b: multiples Regressionsmodell, neben anderem Fachtest ergänzend für zahlreiche weitere Kovariaten (jeweils Stichprobenmittelwerte) kontrolliert (Spezifikation s. Text).

der Gymnasialempfehlung aufwiesen (Tab. 3, Modell b). Bei zusätzlicher Berücksichtigung der Kovariaten lagen die Zuwächse der adjustierten Wahrscheinlichkeiten für

eine Gymnasialempfehlung bei Werten im Kompetenztest Mathematik und im Lesekompetenztests zwischen p = .08 und .09.

Tabelle 3. Forschungsfrage 3: Vorhersage der Gymnasialempfehlung in der 6. Klasse auf Grundlage bildungsstandardbasierter Testleistungen in Mathematik und Deutsch in der 4. Klasse

Zusatzanalysen

Modell Testdomäne

(a)

Koeffizient

95 %-Konfidenzintervall

Exp(β)adj

3.48

[2.45, 4.96]

Exp(B*70)adj

2.32

[1.76, 3.05]

Exp(β)adj

2.47

[1.80, 3.40]

Exp(B*70)adj

1.75

[1.53, 2.01]

Exp(β)adj

1.78

[1.05, 3.02]

Exp(B*70)adj

1.42

[1.08, 1.87]

Exp(β)adj

1.81

[1.24, 2.65]

Exp(B*70)adj

1.42

[1.08, 1.87]

Mathematik

Deutsch

(b)

Mathematik

Deutsch

Anmerkungen. Modell a: multiples Regressionsmodell mit den Testleistungen in Deutsch und Mathematik als Prädiktoren (Spezifikation s. Text). Modell b: multiples Regressionsmodell, in dem zusätzlich zu den Testleistungen in Deutsch und Mathematik für zahlreiche leistungsrelevante Kovariaten kontrolliert wurde (Spezifikation s. Text). Exp(β) „Semistandardisierter“ Wert, Vorhersagekraft für einen Leistungsunterschied von einer Standardabweichung des Prädiktors, Exp(B*70) Vorhersagekraft für einen Leistungsunterschied von einer Kompetenzstufe. Die Werte in der Spalte „Koeffizient“ können auch als Odds Ratios interpretiert werden.

© 2017 Hogrefe

Im Rahmen von zwei Zusatzanalysen gingen wir der Frage nach, inwiefern die bisherigen Befunde repliziert und generalisiert werden können. Erstens kann durch das Zentrieren der Noten am jeweiligen Klassenmittelwert für etwaige Strenge- und Mildeeffekte, aber auch systematische Unterschiede im mittleren Notenniveau kontrolliert werden. Die Ergebnisse dieser Analysen sind im Onlinesupplement (s. ESM 6–8) dokumentiert. Zweitens konnten wir potenzielle Effekte der Durchführungsmodalitäten untersuchen, da für eine zufällig bestimmte Teilstichprobe der KEGS-Studie Lehrkräfte (und keine trainierten Testleiter/innen) die Kompetenztests durchführten (N = 296 Kinder je einer Klasse mit durchschnittlich 23 Kindern aus 13 Schulen, 47 % Mädchen, Alter in der 3. Klasse: M = 9.5 Jahre, SD = 0.5 Jahre). Die Auswertung der Testantworten erfolgte auch hier durch trainierte Kodiererinnen und Kodierer. Einen Teil der Prognosemodelle (Vorhersagen ab der 3. Klasse für Mathematik) konnten wir mit diesem Teildatensatz der KEGS-Studie untersuchen (s. ESM 9–12). Zusammenfassend ist festzuhalten, dass beide Zusatzanalysen das Ergebnismuster für die Prognosegüte replizierten, auch wenn es teilweise kleinere Unterschiede zwischen den Modellparametern gab: Die stärksten Abweichungen fanden wir für die adjustierten Regressionskoeffizienten zur Vorhersage der Schulnote in der 6. Klasse in Abhängigkeit der Durchführungsmodalität (s. ESM 11). Trotz dieser kleineren Unterschiede untermauern die Zusatzanalysen die Generalisierbarkeit der oben darstellten Ergebnisse. Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39


36

G. Fuchs & M. Brunner, Prognosekraft bildungsstandardbasierter Tests

Diskussion Prognosekraft bildungsstandardbasierter Tests Im vorliegenden Beitrag untersuchten wir im Rahmen von drei Forschungsfragen die Prognosekraft bildungsstandardbasierter Tests in Mathematik und der Lesekompetenz in Deutsch für den schulischen Erfolg von Grundschulkindern. Im Rahmen der ersten beiden Forschungsfragen analysierten wir, wie gut bildungsstandardbasierte Tests (1) der Mathematikkompetenz und (2) der Lesekompetenz (in Deutsch) spätere Testleistungen und Schulnoten desselben Faches vorhersagen können. Es zeigte sich, dass Kompetenztests in Mathematik (für Prognosezeiträume von bis zu 3 Jahren) und Tests der Lesekompetenz in Deutsch (für Prognosezeiträume von bis zu 2 Jahren) spätere Testleistungen und Schulnoten desselben Faches substanziell vorhersagen können. Die standardisierten Regressionskoeffizienten der bivariaten Regressionsmodelle zur Vorhersagegüte stimmen im Wesentlichen überein mit den wenigen relevanten Vorgängerstudien (z. B. Nachtigall, 2014; für Überblick zum Forschungsstand s. ESM 1). Die Vorhersagekraft für spätere Testleistungen und von Schulnoten war zudem vergleichbar mit der von kommerziell erhältlichen, standardisierten Schulleistungstests (z. B. DEMAT, HASE). Ein prognostischer Mehrwert bildungsstandardbasierter Tests zur Erfassung der Kompetenz in Mathematik und der Lesekompetenz blieb auch dann bestehen, wenn für weitere leistungsprädiktive Merkmale, wie Schulnoten, Intelligenz und familiärer Hintergrund, der Kinder in den Vorhersagemodellen kontrolliert wurde. Dies sind eindrucksvolle Befunde, da bislang (mit Ausnahme der Studie von Hildebrandt & Watermann, 2015) vergleichbar strenge Analysen zur Vorhersagekraft (bildungs-)standardisierter Leistungstests für den Primarbereich fehlten. Diese Ergebnisse stehen zudem auch im Einklang mit Befunden zur Sekundarstufe, in denen ein prognostischer Mehrwert von bildungsstandardbasierten Tests im Rahmen der Vergleichsarbeiten in der 8. Jahrgangsstufe zur Vorhersage von Prüfungsnoten in der 10. Klasse aufgezeigt werden konnte (Graf, Harych, Wendt, Emmrich & Brunner, 2016). Generell helfen die vorliegenden Ergebnisse zum prognostischen Mehrwert, Kritik an schulischen Leistungstests zu entkräften, wonach diese lediglich den sozioökonomischen Status (Sackett, Kuncel, Arneson, Cooper & Waters, 2009) oder Intelligenz widerspiegeln (Baumert, Lüdtke, Trautwein & Brunner, 2009) sollen. Die dritte Forschungsfrage befasste sich mit der Prognose der Gymnasialempfehlung. Die vorliegenden Ergebnisse zeigten, dass bildungsstandardbasierte Tests in Mathematik und Lesen eine bedeutsame, gemeinsame Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39

Vorhersagekraft für die Gymnasialempfehlung aufweisen. Die Vorhersagekraft für die Gymnasialempfehlung verminderte sich bei Kontrolle der Kovariaten (Schulnoten, Intelligenz und Indikatoren des familiären Hintergrunds) etwas, blieb aber dennoch statistisch bedeutsam.

Grenzen der Studie Als Datengrundlage der dargestellten Analysen diente die KEGS-Längsschnittstudie, deren Studienanlage während des Verlaufs der Erhebungen stetig erweitert wurde. Bei der Analyse der Daten zur Vorhersagegüte musste für das vorliegende Papier die Analysestrategie auf die Verfügbarkeit der Daten abgestimmt werden und es lagen bedauerlicherweise nicht für alle Fächer und Zeitpunkte alle relevanten Variablen vor: z. B. Schulnoten in der 3. Klasse oder die Deutschleistung in der 3. Klasse. Darüber hinaus ist unklar, inwiefern sich die Ergebnisse von Brandenburger Grundschulkindern im Hinblick auf andere Schülerinnen und Schüler in Deutschland generalisieren lassen. So findet der Wechsel von der Primar- in die Sekundarstufe in anderen Bundesländern bereits nach der 4. Jahrgangsstufe und damit 2 Jahre früher als in Brandenburg statt. Bisherige Analysen von Hildebrandt und Watermann (2015) sowie Nachtigall (2014) für Schülerstichproben mit Übergang in die Sekundarstufe I nach der 4. Jahrgangsstufe konnten jedoch ebenso einen substanziellen Zusammenhang zwischen bildungsstandardbasierten Testleistungen in der Primarstufe mit zukünftigen Testleistungen und Schulnoten in der Sekundarstufe aufzeigen. Des Weiteren lassen sich die vorliegenden Ergebnisse nicht uneingeschränkt auf bildungsstandardbasierte Tests, wie diese im Rahmen von bspw. VERA 3 eingesetzt werden, übertragen. So wurden in unserer Studie in den Mathematiktests vier von fünf inhaltsbezogenen Kompetenzen (Leitideen) erfasst sowie die Durchführung und Kodierung der Tests in beiden Fächern geschulten Testleiterinnen und Testleitern bzw. Kodiererinnen und Kodierern übertragen. Im Rahmen von VERA 3 werden hingegen die Schülerinnen und Schüler in der Regel in zwei mathematischen Leitideen geprüft und die Testdurchführung und -auswertung von Lehrkräften übernommen. Die Studie von Graf, Emmrich, Harych und Brunner (2013) zeigte, dass Leistungsunterschiede bei bildungsstandardbasierten Tests in Mathematik im Rahmen von VERA 8 aus der Durchführung durch Testleiterinnen und Testleiter einerseits und durch Lehrkräfte andererseits resultieren können, jedoch nicht zwangsläufig resultieren müssen. Spoden, Fleischer und Leutner (2014) konnten für VERA8-Tests feststellen, dass eine geringere Objektivität bei Auswertung der Testantworten durch Lehrkräfte mit einer höheren mittleren Schülerkompetenz einhergeht. Ent© 2017 Hogrefe


G. Fuchs & M. Brunner, Prognosekraft bildungsstandardbasierter Tests

sprechend den Erfahrungen im angloamerikanischen Raum, in denen viele Kompetenzmessungen im Schulbereich „high-stakes“-Charakter haben (Amrein-Beardsley, Berliner & Rideau, 2010), ist zu erwarten, dass Lehrkräfte den ihnen zur Verfügung stehenden Spielraum zur Beeinflussung der Ergebnisse durch intendierte oder nichtintendierte Handlungen umso mehr nutzen, je stärker sie VERA als ein Kontrollinstrument (bspw. der Schuladministration) wahrnehmen. Inwiefern solche Verzerrungen zu Unter- als auch zu Überschätzungen der Vorhersagekraft von VERA-Tests führen, ist eine offene empirische Frage. Im Rahmen unserer Zusatzanalysen zeigten sich allenfalls kleine Unterschiede in der Prognosegüte zwischen Tests, die von Lehrerinnen und Lehrern oder Testleiterinnen und Testleitern administriert und durchgeführt wurden (s. Abschnitt „Zusatzanalysen“ und ESM 9–12). Abschließend muss für unsere Ergebnisse zu den Leistungstests in Deutsch (Lesekompetenz) einschränkend darauf hingewiesen werden, dass sich vor allem der Test zum Zeitpunkt der 6. Jahrgangsstufe fast vollständig aus ELEMENT-Aufgaben zusammensetzte. Im Rahmen der ELEMENT-Studie 5 und 6 wurden die Testhefte aus Aufgaben verschiedener Schulleistungstests zusammengestellt, die nicht explizit nach den Bildungsstandards konzipiert wurden (Lehmann & Lenkeit, 2008).

Schlussfolgerung Bildungsstandardbasierte Tests werden vor allem im Rahmen der Vergleichsarbeiten in pädagogischen Kreisen heftig kritisiert (u. a. Kuhn, 2014). Darüber hinaus konnten Nachtigall und Hellrung (2013) über die letzten 10 Jahre einen stagnierenden bis rückläufigen Trend bei der wahrgenommen Nützlichkeit von VERA feststellen. Der wahrgenommene Nutzen und die Akzeptanz von Ergebnisrückmeldungen sind aber zentrale Kriterien für die weitere Nutzung der im Rahmen von VERA gewonnenen Informationen (Bonsen, Büchter & Peek, 2006; Kühle & Peek, 2007; Maier, 2008). Unsere Befunde zur Prognosegüte bildungsstandardbasierter Tests liefern Hinweise für die (praktische) Relevanz und Nützlichkeit solcher Tests. So weisen die Befunde dieser Studie darauf hin, dass Lehrkräfte durch Ergebnisse aus bildungsstandardbasierten Tests wichtige Informationen zum zukünftigen Schulerfolg ihrer Schülerinnen und Schüler erhalten können. Wie die Befunde zum prognostischen Mehrwert zeigten, sind diese Informationen auch nicht durch das Wissen um Schulnoten, Intelligenztestergebnisse oder den familiären Hintergrund zu ersetzen. Das Potenzial von bildungsstandardbasierten Tests zur Kompetenzbeurteilung wird vor allem darin gesehen, dass die Schülerleistungen durch die Verortung auf den Bildungsstandards auf einem kriteria© 2017 Hogrefe

37

len Maßstab zurückgemeldet werden. So können Leistungen von Schülerinnen und Schülern auf einem klassenübergreifenden Referenzrahmen verortet werden, was vielen Lehrkräften nur bedingt gelingt (Brunner, Anders, Hachfeld & Krauss, 2011). Gerade deshalb werden Schulnoten auf ihre Vergleichbarkeit kritisiert (zusammenfassend Lintorf, 2012). Bildungsstandardbasierte Tests haben somit das Potenzial, Lehrkräften im Sinne eines Screenings eine Informationsgrundlage zu verschaffen, die die Erkenntnisse aus ihrer eigenen Diagnostik im schulischen Alltag komplementiert und anreichert. In dieser Logik stellen bildungsstandardbasierte Tests einen Ausgangspunkt für weiterführende individuelle Feindiagnostik dar (Köller, Reiss, Stanat & Pant, 2012; Leutner, Fleischer, Spoden & Wirth, 2008).

Elektronische Supplemente Die elektronischen Supplemente sind mit der Onlineversion dieses Artikels verfügbar unter http://dx.doi.org/ 10.1024/1010-0652/a000195. ESM 1. Tabelle. Forschungsstand zu bildungsstandardbasierten und kommerziell erhältlichen, standardisierten Leistungstests. ESM 2. Tabelle. Überblick zum Stichprobenausfall der Schulen bis zur 6. Klasse für Mathematik (ab der 3. Klasse) und für Deutsch (ab der 4. Klasse). ESM 3. Liste. Darstellung der Items zur Erfassung des familiären Hintergrundes. ESM 4. Abbildung. Veranschaulichung der Messinvarianz „Verlinkung“ der bildungsstandardbasierten Kompetenztests in Mathematik und Deutsch (Lesen) mit Itemparametern aus dem IQB-Aufgabenpool und der ELEMENT-Studie in Klasse 5 und 6. ESM 5. Tabelle. Interkorrelationsmatrix aller Analysevariablen. ESM 6. Tabelle. Forschungsfrage 1: Vorhersage zukünftiger Testleistungen und Schulnoten in Mathematik – Schulnoten klassenzentriert. ESM 7. Tabelle. Forschungsfrage 2: Vorhersage zukünftiger Testleistungen und Schulnoten in Deutsch – Schulnoten klassenzentriert. ESM 8. Tabelle. Forschungsfrage 3: Vorhersage der Gymnasialempfehlung in der 6. Klasse auf Grundlage bildungsstandardbasierter Testleistungen in Mathematik und Deutsch in der 4. Klasse – Schulnoten klassenzentriert. Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39


38

G. Fuchs & M. Brunner, Prognosekraft bildungsstandardbasierter Tests

ESM 9. Tabelle. Forschungsfrage 1: Vorhersage zukünftiger Testleistungen und Schulnoten in Mathematik – Testdurchführung von Lehrkräften (3. Klasse). ESM 10. Abbildung. Vergleichende Darstellung der standardisierten Regressionskoeffizienten (β) mit 95 %-Konfidenzintervall zwischen den Analysedatensätzen mit Testadministration und -durchführung von Testleiter/-innen bzw. Lehrkräften zu Forschungsfrage 1: Vorhersage zukünftiger Testleistungen und Schulnoten in Mathematik für Prognosen ab der 3. Klasse. ESM 11. Abbildung. Vergleichende Darstellung der adjustierten standardisierten Regressionskoeffizienten (β adj) mit 95 %-Konfidenzintervall zwischen den Analysedatensätzen mit Testadministration und -durchführung von Testleiter/-innen bzw. Lehrkräften zu Forschungsfrage 1: Vorhersage zukünftiger Testleistungen und Schulnoten in Mathematik für Prognosen ab der 3. Klasse. ESM 12. Tabelle. Interkorrelationsmatrix aller Analysevariablen für KEGSTeildatensatz (3. Klasse, Testdurchführung von Lehrkräften)

Literatur American Educational Research Association, American Psychological Association & National Council on Measurement in Education. (1999). Standards for educational and psychological testing. Washington, DC: American Educational Research Association. Amrein-Beardsley, A., Berliner, D. C. & Rideau, S. (2010). Cheating in the first, second, and third degree: Educators' responses to highstakes testing. Education Policy Analysis Archives, 18(14), 1–36. Baumert, J., Lüdtke, O., Trautwein, U. & Brunner, M. (2009). Largescale student assessment studies measure the results of processes of knowledge acquisition: Evidence in support of the distinction between intelligence and student achievement. Educational Research Review, 4(3), 165–176. Bonsen, M., Büchter, A. & Peek, R. (2006). Datengestützte Schulund Unterrichtsentwicklung. Bewertung der Lernstandserhebungen in NRW durch Lehrerinnen und Lehrer. In W. Bos, H. G. Holtappels, H.-G. Rolff & R. Schulz-Zander (Hrsg.), Jahrbuch der Schulentwicklung (Bd. 14, S. 125–148). Weinheim: Juventa. Bremerich-Vos, A. & Böhme, K. (2009). Lesekompetenzdiagnostik. Die Entwicklung eines Kompetenzstufenmodells für den Bereich Lesen. In D. Granzer, O. Köller, A. Bremerich-Vos, M. van den Heuvel-Panhuizen, K. Reiss & G. Walther (Hrsg.), Bildungsstandards Deutsch und Mathematik. Leistungsmessung in der Grundschule (S. 214–249). Weinheim: Beltz. Brunner, M., Anders, Y., Hachfeld, A. & Krauss, S. (2011). Diagnostische Fähigkeiten von Mathematiklehrkräften. In M. Kunter, J. Baumert, W. Blum, U. Klusmann, S. Krauss & M. Neubrand (Hrsg.), Professionelle Kompetenz von Lehrkräften. Ergebnisse des Forschungsprogramms COACTIV (S. 215–234). Münster: Waxmann. Collins, L. M., Schafer, J. L. & Kam, C.-M. (2001). A comparison of inclusive and restrictive strategies in modern missing data procedures (Special Section: New Approaches to Missing Data.). Psychological Methods, 6(4), 330–351. Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39

Fuchs, G. & Brunner, M. (Hrsg.). (2014). Kompetenzentwicklung und Schulqualität an Brandenburger Grundschulen. Abschlussbericht der KEGS-Studie. Berlin: Institut für Schulqualität der Länder Berlin und Brandenburg e. V. Ganzeboom, H. B. G., De Graaf, P. M. & Treiman, D. J. (1992). A Standard International Socio-Economic Index of Occupational Status. Social Science Research, 21(1), 1–56. Graf, T., Emmrich, R., Harych, P. & Brunner, M. (2013). Durchführungseffekte bei Vergleichsarbeiten in Jahrgangsstufe 8. Empirische Pädagogik, 27(4), 459–473. Graf, T., Harych, P., Wendt, W., Emmrich, R. & Brunner, M. (in Druck). Wie gut können VERA-8-Testergebnisse den schulischen Erfolg am Ende der Sekundarstufe I vorhersagen? Zeitschrift für Pädagogische Psychologie, 30(4), 201 – 204. Granzer, D., Köller, O., Reiss, K., Robitzsch, A., Walther, G. & Winkelmann, H. (2008a). Bildungsstandards. Kompetenzen überprüfen. Grundschule. Klasse 3/4 – Heft 1. Berlin: Cornelsen Verlag. Granzer, D., Köller, O., Reiss, K., Robitzsch, A., Walther, G. & Winkelmann, H. (2008b). Bildungsstandards. Kompetenzen überprüfen. Grundschule. Klasse 3/4 – Heft 2. Berlin: Cornelsen Verlag. Heller, K. A. & Perleth, C. (2000). KFT 4–12 + R. Kognitiver Fähigkeitstest für 4. bis 12. Klassen, Revision (3. Aufl.). Göttingen: Beltz Test. Helmke, A. & Weinert, F. E. (1997). Bedingungsfaktoren schulischer Leistungen. In F. E. Weinert (Hrsg.), Enzyklopädie der Psychologie (Bd. 3: Psychologie des Unterrichts und der Schule, S. 71–176). Göttingen: Hogrefe. Hildebrandt, J. & Watermann, R. (2015). Prognostische Validität von curricular gemessenen Testleistungen am Ende der Grundschulzeit. Vortrag auf der 3. Tagung der Gesellschaft für Empirische Bildungsforschung (GEBF), Bochum. Horn, J. L. & Noll, J. (1997). Human cognitive capabilities: Gf–Gc theory. In D. P. Flanagan, J. L. Genshaft & P. L. Harrison (Eds.), Contemporary intellectual assessment: Theories, tests, and issues (S. 53–91). New York: Guilford Press. Kline, R. B. (2005). Principles and practice of structural equation modeling (2nd ed.). New York: Guilford Press. Kolen, M. J. & Brennan, R. L. (2004). Test equating, scaling and linking. Methods and practices (2nd ed.). New York: Springer. Köller, O., Eßel-Ullmann, G. & Paasch, D. (2012). Validierung eines Instruments zur Erfassung Standard-basierter mathematischer Kompetenzen in der Grundschule. Psychologie in Erziehung und Unterricht, 59(3), 177–190. Köller, O., Reiss, K., Stanat, P. & Pant, H. A. (2012). Diagnostik Standard-basierter mathematischer Kompetenzen im Primarbereich. Ein Überblick. Psychologie in Erziehung und Unterricht, 59(3), 163–176. Krajewski, K., Liehm, S. & Schneider, W. (2004). DEMAT 2+. Deutscher Mathematiktest für zweite Klassen. Göttingen: Beltz. Kühle, B. & Peek, R. (2007). Lernstandserhebungen in NordrheinWestfalen. Evaluationsbefunde zur Rezeption und zum Umgang mit Ergebnisrückmeldungen in Schulen. Empirische Pädagogik, 21(4), 428–447. Kuhn, H.-J. (2014). Anspruch, Wirklichkeit und Perspektiven der Gesamtstrategie der KMK zum Bildungsmonitoring. Die deutsche Schule, 106(3), 414–426. Kultusministerkonferenz. (Hrsg.). (2004). Bildungsstandards der Kultusministerkonferenz – Erläuterungen zur Konzeption und Entwicklung (Am 16.12.2004 von der Kultusministerkonferenz zustimmend zur Kenntnis genommen). Kultusministerkonferenz. (Hrsg.). (2006). Gesamtstrategie der Kultusministerkonferenz zum Bildungsmonitoring. Bonn. Kultusministerkonferenz. (Hrsg.). (2012). Vereinbarung zur Weiterentwicklung von VERA. (Beschluss der Kultusministerkonferenz vom 08.03.2012). Kultusministerkonferenz. (Hrsg.). (2013a). Kompetenzstufenmodell zu den Bildungsstandards im Fach Mathematik für den Pri© 2017 Hogrefe


G. Fuchs & M. Brunner, Prognosekraft bildungsstandardbasierter Tests

marbereich (Jahrgangsstufe 4) (Auf Grundlage des Ländervergleichs 2011 überarbeitete Version in der Fassung vom 11. Februar 2013). Kultusministerkonferenz. (Hrsg.). (2013b). Kompetenzstufenmodell zu den Bildungsstandards für das Fach Deutsch im Kompetenzbereich „Lesen – mit Texten und Medien umgehen“ – Primarbereich – (Auf Grundlage des Ländervergleichs 2011 überarbeiteter Entwurf in der Version vom 13. Februar 2013). Kultusministerkonferenz. (Hrsg.). (2015). Gesamtstrategie der Kultusministerkonferenz zum Bildungsmonitoring: Beschluss der 350. Kultusministerkonferenz vom 11.06.2015. Bonn. Lehmann, R. & Lenkeit, J. (2008). ELEMENT. Erhebung zum Lese- und Mathematikverständnis. Entwicklungen in den Jahrgangsstufen 4 bis 6 in Berlin. Abschlussbericht über die Untersuchungen 2003, 2004 und 2005 an Berliner Grundschulen und grundständigen Gymnasien. Berlin: Humboldt Universität zu Berlin. Leutner, D., Fleischer, J., Spoden, C. & Wirth, J. (2008). Landesweite Lernstandserhebungen zwischen Bildungsmonitoring und Individualdiagnostik. In M. Prenzel, I. Gogolin & H.-H. Krüger (Hrsg.), Kompetenzdiagnostik (S. 149–167). Wiesbaden: VS Verlag für Sozialwissenschaften. Lintorf, K. (2012). Wie vorhersagbar sind Grundschulnoten? Prädiktionskraft individueller und kontextspezifischer Merkmale. Wiesbaden: VS Verlag für Sozialwissenschaften. Maier, U. (2008). Vergleichsarbeiten im Vergleich – Akzeptanz und wahrgenommener Nutzen standardbasierter Leistungsmessungen in Baden-Württemberg und Thüringen. Zeitschrift für Erziehungswissenschaft, 11(3), 453–474. Ministerium für Bildung, Jugend und Sport. (2007). Verwaltungsvorschriften zur Grundschulverordnung (VV-GV). Muthén, L. K. & Muthén, B. O. (1998–2012). Mplus User's Guide. Los Angeles: Muthén & Muthén. Nachtigall, C. (2014). Landesbericht. Thüringer Kompetenztests 2014. Jena: Friedrich-Schiller-Universität, Institut für Psychologie. Nachtigall, C. & Hellrung, K. (2013). Zur zeitlichen Entwicklung der Rezeption von Vergleichsarbeiten. Empirische Pädagogik, 27(4), 423–441. Nagy, G. & Neumann, M. (2010). Psychometrische Aspekte des Tests zu den voruniversitären Mathematikleistungen in TOSCA-2002 und TOSCA-2006: Unterrichtsvalidität, Rasch-Homogenität und Messäquivalenz. In U. Trautwein, M. Neumann, G. Nagy, O. Lüdtke

© 2017 Hogrefe

39

& K. Maaz (Hrsg.), Schulleistungen von Abiturienten (S. 281–306). Wiesbaden: VS Verlag für Sozialwissenschaften. Organisation for Economic Co-operation and Development. (2009). PISA 2006 Technical Report. Paris: OECD Publishing. Rasch, G. (1980). Probabilistic models for some intelligence and attainment tests (Expanded Ed.). Chicago: University of Chicago Press. Roick, T., Gölitz, D. & Hasselhorn, M. (2004). DEMAT 3+. Deutscher Mathematiktest für dritte Klassen. Göttingen: Beltz. Roos, J., Schöler, H. & Treutlein, A. (2007). Zur prognostischen Validität des Heidelberger Auditiven Screenings in der Einschulungsdiagnostik HASE. Abschlussbericht des Projektes EVER. Heidelberg: Pädagogische Hochschule Heidelberg. Sackett, P. R., Kuncel, N. R., Arneson, J. J., Cooper, S. R. & Waters, S. D. (2009). Does socioeconomic status explain the relationship between admissions tests and post-secondary academic performance? Psychological Bulletin, 135(1), 1–22. Spoden, C., Fleischer, J. & Leutner, D. (2014). Niedrige Testmodellpassung als Resultat mangelnder Auswertungsobjektivität bei der Kodierung landesweiter Vergleichsarbeiten durch Lehrkräfte. Journal für Mathematik-Didaktik, 35(1), 79–99. van Buuren, S. & Groothuis-Oudshoorn, K. (2011). mice: Multivariate Imputation by Chained Equations in R. Journal of Statistical Software, 45(3), 1–67. Warm, T. (1989). Weighted likelihood estimation of ability in item response theory. Psychometrika, 54(3), 427–450. Wu, M. L., Adams, R. J. & Wilson, M. (1998). ACER ConQuest. Melbourne: The Australian Council for Educational Research Limited (ACER).

Manuskript eingereicht: 15.12.2015 Manuskript angenommen: 30.07.2016 Interessenskonflikt: Nein

Gesine Fuchs Institut für Schulqualität der Länder Berlin und Brandenburg e. V. Otto-von-Simson-Str. 15 14195 Berlin Deutschland Gesine.Fuchs@isq-bb.de

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 27–39


BASIS-MATH-G 4+–5 Gruppentest zur Basisdiagnostik Mathematik für das vierte Quartal der 4. Klasse und für die 5. Klasse

Elisabeth Moser Opitz / Okka Freesemann / Urs Grob / Susanne Prediger BASIS-MATH-G 4+–5 ist ein Verfahren zur Abklärung von Rechenschwäche und zur Evaluation des Bedarfs an Fördermaßnahmen für rechenschwache Schülerinnen und Schüler. Er überprüft anhand von 19 Aufgaben zentrale Kompetenzen der Grundschulmathematik, indem in den Bereichen Arithmetik und Sachrechnen der Umgang mit Zahl und Maß, Operationen und Rechenverfahren überprüft wird.

Test komplett Bestehend aus: Manual, je 5 Testheften

Das Zahl- und Operationsverständnis wird mittels Aufgaben zum Stellenwertverständnis (Zahlen aufschreiben, Große Zahlen, Zahlenstrahl, Multiplikation und Division) sowie Aufgaben zum Operationsverständnis und zu den Grundvorstellungen (Malaufgaben am Punktefeld, Mal- und Geteiltaufgaben, Textaufgaben) überprüft. Rechnen wird mittels Aufgaben zum Kopfrechnen (Kopfrechnen, Mal 2/Durch 2), Aufgaben zur Zahlzerlegung (Finde Rechnungen, Ergänzen) und Aufgaben zum Zählen (Zählen vorwärts in Zweierschritten, Zählen rückwärts in Zehnerschritten, Zählen rückwärts in Hunderterschritten) überprüft. Schriftliche Rechenverfahren werden mit zwei Aufgaben (Addition und Subtraktion) überprüft. Beide Testhefte (G4+ und G5) liegen in zwei parallelen Testformen vor.

G4+ Testform A und B, G5 Testform A und B, je 5 Auswertungsbogen G4+ (viertes Quartal 4. Klasse und erstes Quartal 5. Klasse) Testform A und B, G5 (viertes Quartal 5. Klasse) Testform A und B, Auswertungsvorlagen Testform A und B, Auswertungsprogramm und Box. Best.-Nr. 03 195 01 ca. € 191,00 / CHF 224.00

www.hogrefe.com

BASIS-MATH-G 4+–5 kann in Schulklassen oder Kleingruppen sowie als Einzeltest eingesetzt werden. Es liegen parallele Testformen vor. Auswertung und Interpretation werden durch ein Auswertungsprogramm unterstützt.


Originalartikel

Die individuell präferierte Bezugsnormorientierung und das Selbstkonzept von Grundschulkindern im Fach Mathematik Annette Lohbeck Universität Vechta / Oldenburg

Zusammenfassung: Zur Beurteilung von Leistungen können drei Bezugsnormen (BNO) angewendet werden: die individuelle (IBNO), soziale (SBNO) und kriteriale BNO (KBNO). Ziel der vorliegenden Studie war es, (1) bei 410 Viertklässlerinnen und Viertklässlern die drei BNO faktorenanalytisch zu konzeptualisieren, (2) die Vorhersagbarkeit des mathematischen Selbstkonzepts (MSK) und der Mathematiknoten (MN) durch die drei BNO zu erfassen und (3) Mediatoreffekte des MSKs sowie Interaktionseffekte für die SBNO auf Schüler- und Klassenebene (SBNO_K) mit der Klassendurchschnittsleistung (KL) zu überprüfen. Faktorenanalysen zeigten, dass sich ein Drei-Faktoren-Modell am besten an die Daten anpasst. Positive Korrelationen lagen zwischen allen Konstrukten und den MN vor. Mehrebenen-Pfadanalysen zeigten positive Pfade von der IBNO und KBNO auf das MSK und vom MSK auf die MN sowie von der SBNO auf die MN, jedoch negative Pfade von der KL und der SBNO_K auf die MN. Das MSK erwies sich als Mediator zwischen der IBNO und den MN sowie zwischen der KBNO und den MN. Schlüsselwörter: Bezugsnormorientierung, Selbstkonzept, Mathematiknoten, Grundschulkinder Individually Preferences for Reference Standard Orientation and Self-concept of Elementary School Children in Mathematics Abstract: Three reference standards (RS) can be used when evaluating academic achievement: individual reference standard (IRS), social reference standard (SRS), and criterion reference standard (CRS). The aim of the present study of 410 fourth graders was (1) to conceptualize the three RS by factor analyses, (2) assess the prediction of math self-concept (MSC) and math grades (MG) by the three RS, and (3) reveal mediating effects of MSC and interaction effects of SRS on individual- and class level (SRS_C) as well as class-average achievement (CA). Factor analyses showed that a three factor-model fits best to the data. Positive relations were found between all constructs and MG. Multilevel analysis yielded positive effects of IRS and CRS on MSC, MSC on MG as well as SRS on MG, while there were negative effects of SRS_C and CA on MG. Keywords: reference standard orientation, self-concept, math grades, elementary school children

Einleitung Um eine Leistung adäquat beurteilen zu können, benötigt man Maßstäbe, genauer Bezugsnormen (BNO), mit denen sich eine Leistung in Relation zu anderen Leistungen vergleichen lässt. Eine isoliert betrachtete Leistung sagt noch nichts darüber aus, ob diese Leistung auch gut oder schlecht ist. So kann eine Leistung (1) mit den früher erbrachten Leistungen verglichen werden (individuelle BNO = IBNO), (2) mit den Leistungen anderer Personen (soziale BNO = SBNO) oder (3) mit den Kriterien der Aufgabe selbst (kriteriale BNO = KBNO). BNO enthalten demnach ganz unterschiedliche Informationen, die für eine adäquate Beurteilung von Leistungen unverzichtbar sind (Rheinberg, 1980, 2014). © 2017 Hogrefe

Die drei verschiedenen BNO wurden bislang nur als Lehrermerkmal konzeptualisiert, da Leistungen von Schülerinnen und Schülern vorrangig von Lehrkräften bewertet werden (z. B. Köller, 2005; Wilbert & Gerdes, 2009). Doch welche BNO Grundschulkinder selbst zur eigenen Leistungs- oder Fähigkeitseinschätzung heranziehen bzw. inwieweit die individuell präferierte Bezugsnormorientierung mit dem Selbstkonzept von Grundschulkindern zusammenhängt, wurde in der Forschung bislang selten thematisiert. Studien zur individuell präferierten Bezugsnormorientierung von Grundschulkindern können jedoch nicht zuletzt im Kontext der Selbstkonzeptentwicklung von Grundschulkindern aufschlussreich sein, da sich das Selbstkonzept im Grundschulalter zunehmend ausdifferenziert (Harter, 2012; Hellmich & Günther, 2011; PoloZeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55 DOI 10.1024/1010-0652/a000199


42

czek, Karst, Praetorius & Lipowsky, 2011). Die vorliegende Studie möchte deshalb den Zusammenhängen zwischen der individuell präferierten Bezugsnormorientierung und dem Selbstkonzept von Grundschulkindern näher nachgehen, wobei das Fach Mathematik fokussiert werden soll. Die Studie geht insofern über andere Studien hinaus, als sie nicht die BNO-Wahl von Lehrkräften untersucht, sondern die individuell präferierte BNO-Wahl von Grundschulkindern. Ziel der Studie ist es speziell, (1) die individuell präferierte BNO-Wahl von Grundschulkindern faktorenanalytisch zu konzeptualisieren, (2) die Vorhersagbarkeit des mathematischen Selbstkonzepts (MSKs) und der Mathematiknoten (MN) durch die drei BNO zu erfassen und (3) Mediatoreffekte des MSKs zwischen den drei BNO und den MN zu analysieren. Da mehrere Studien darauf hinweisen (vgl. z. B. die Studien von Köller, 2004), dass die Auswirkungen sozialer Vergleichsprozesse auf das Selbstkonzept maßgeblich von der Klassendurchschnittsleistung abhängen, z. B., dass sich das Selbstkonzept von Schülerinnen und Schülern negativ entwickelt, wenn sie sich in leistungsstärkeren Schulklassen mit besseren Mitschülerinnen und Mitschülern vergleichen, sollten zudem (4) mögliche Interaktionseffekte für die SBNO auf der Schüler- und Klassenebene mit der Klassendurchschnittsleistung spezifiziert werden. Die vorliegende Studie kann dadurch Hinweise darauf geben, ob es bei der individuell präferierten BNO-Wahl der Kinder interindividuelle Unterschiede gibt und welche Auswirkungen diese auf die Selbstkonzept- und Leistungsentwicklung haben. Daraus lassen sich schließlich wichtige Implikationen ableiten, die für die Förderung des Selbstkonzepts und der Leistungen von Grundschulkindern von hoher Relevanz sein können.

Theoretischer Hintergrund Bezugsnormen und Bezugsnormorientierung Bezugsnormen (BNO) können als Vergleichsstandards definiert werden, mit denen ein Ergebnis verglichen werden kann (Rheinberg & Fries, 2010). Der alleinige Informationsgehalt eines Ergebnisses reicht noch nicht dafür aus, eine Leistung adäquat zu beurteilen. Ein Kind, das z. B. 13 Punkte in einer Mathematikarbeit erreicht, kann sein Ergebnis nicht als gut oder schlecht bewerten, wenn es keinen Vergleichsmaßstab hat. Nach dem Konzept der Bezugsnormorientierung von Rheinberg (1980) lassen sich allgemein drei BNO voneinander unterscheiden: (1) Bei einer individuellen BNO (IBNO) würde das Kind seine erreichten 13 Punkte mit seinen früher erbrachten Punkten vergleichen, (2) bei einer sozialen BNO (SBNO) mit den Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55

A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

erreichten Punkten anderer Kinder in der Klasse und (3) bei einer kriterialen BNO (KBNO) mit den Kriterien der Arbeit bzw. Aufgaben selbst. BNO können demnach in unterschiedlichen Bezugssystemen variieren und als bezugssystemverankerte Standards verstanden werden. Die habituelle Bevorzugung einer bestimmten BNO wird auch als Bezugsnormorientierung bezeichnet (Rheinberg, 1980; Rheinberg & Fries, 2010). Je nach Anwendung einer bestimmten BNO kann ein Ergebnis deshalb ganz unterschiedlich bewertet werden. Jede BNO weist jedoch auch gewisse „blinde Flecken“ auf (vgl. Rheinberg, 2014): Bei Anwendung einer SBNO nimmt das Kind lediglich klasseninterne Vergleiche vor, sodass es eventuell seinen eigenen Lernzuwachs nicht erkennt. Bei Anwendung einer IBNO ist der eigene Lernzuwachs zwar für das Kind erkennbar, überdauernde Leistungsdifferenzen zwischen anderen Kindern werden jedoch vollständig ausgeblendet, die eventuell als Orientierung für die eigene Leistungsbewertung dienen können. Doch auch eine isoliert angewendete KBNO scheint in Lern- und Leistungskontexten wenig sinnvoll zu sein, da das Kind lediglich Informationen über die in den Kriterien umschriebenen notwendigen Kenntnisse erhält, jedoch nicht über die eigenen Lernfähigkeiten oder individuellen Leistungsfortschritte.

Selbstkonzept Nach dem Selbstkonzept-Modell von Shavelson, Hubner und Stanton (1976) kann das Selbstkonzept als ein multidimensionales, hierarchisches Konstrukt beschrieben werden, das sämtliche Bewertungen, Einstellungen und Vorstellungen der eigenen Fähigkeiten und Eigenschaften umfasst, die die eigene Person betreffen (Möller & Trautwein, 2015, S. 180). An der Spitze dieses Modells befindet sich das globale Selbstkonzept, das alle globalen Bewertungen (z. B. die Überzeugung, ein wertvoller Mensch zu sein) subsumiert und sich in akademische und nicht-akademische Selbstkonzeptbereiche aufgliedert, d. h. schulische Selbstkonzepte, die sich auf die Schulfächer beziehen wie z. B. Mathematik oder Englisch, und nicht-akademische Selbstkonzepte, die soziale, emotionale und physische Aspekte beinhalten. Die Differenzierung von Selbstkonzepten nach verschiedenen Domänen lässt sich bereits im frühen Grundschulalter erkennen (Harter, 2012). Schon im Kindergartenalter und ersten Schuljahr können Kinder zwischen verschiedenen Bereichen differenzieren (Arens et al., 2016; Cimeli, Neuenschwander, Röthlisberger & Roebers, 2013; Ehm, Duzy & Hasselhorn, 2011). Selbstkonzepte entstehen auf Basis individueller Erfahrungen sowie der Rückmeldungen von zentralen Bezugspersonen wie Eltern, Lehrkräfte und Gleichaltrige (Shavelson et al., 1976). Die Hauptdeterminante des © 2017 Hogrefe


A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

Selbstkonzepts stellen Leistungen dar, wobei fachspezifische Selbstkonzepte und Leistungen sich auch wechselseitig (reziprok) beeinflussen können (Hellmich & Günther, 2011; Marsh & Martin, 2011): Zu Beginn der Grundschule wirkt das Selbstkonzept stärker auf die Leistungen ein (Self-Enhancement-Ansatz), während am Ende der Grundschulzeit eher die Leistungen das Selbstkonzept beeinflussen (Skill-Development-Ansatz). Um anhand der Leistungen Rückschlüsse über die eigene Leistungsfähigkeit gewinnen zu können, müssen Leistungen jedoch immer in Relation zu verschiedenen Vergleichsmaßstäben – genauer Bezugsnormen (BNO) – gesetzt werden. Vor diesem Hintergrund lässt sich daher naheliegend annehmen, dass die individuell präferierte BNO-Wahl für die Selbstkonzeptentwicklung von hoher Relevanz ist. Umso überraschender ist es, dass das Konzept der BNO bislang noch kaum im Kontext fachspezifischer Selbstkonzepte untersucht wurde. Dies lässt sich wahrscheinlich darauf zurückführen, dass bei der Operationalisierung von fachspezifischen Selbstkonzepten bereits verschiedene Vergleichsmaßstäbe impliziert sind bzw. bestimmte Vergleichsprozesse provoziert werden. Die meisten Studien der Selbstkonzeptforschung stellen deshalb nahezu ausschließlich die sozialen, dimensionalen und kriterialen Vergleichsprozesse als zentrale Determinanten der Selbstkonzeptgenese dar (z. B. Dickhäuser & Galfe, 2004). Nach der Theorie der sozialen Vergleichsprozesse von Festinger (1954) werden soziale Vergleiche vor allem dann vorgenommen, wenn kein objektives Kriterium vorliegt. Zu differenzieren sind dabei soziale Auf- und Abwärtsvergleiche: Bei sozialen Abwärtsvergleichen würde das Kind z. B. seine erreichten 13 Punkte mit den Punkten anderer leistungsschwächerer Kinder in der Klasse vergleichen, sodass es ein höheres Selbstkonzept entwickelt. Bei sozialen Aufwärtsvergleichen würde das Kind seine Leistung dagegen mit den besseren Leistungen leistungsstärkerer Kinder kontrastieren, sodass es ein niedrigeres Selbstkonzept ausbildet. Die meisten Informationen scheinen sich dabei aus Vergleichen mit ähnlich leistungsstarken Bezugspersonen zu ergeben, wenngleich soziale Aufwärtsvergleiche in der Regel am häufigsten vorkommen (vgl. Köller, 2004). Bei dimensionalen Vergleichen würde das Kind seine Mathematikleistung mit den eigenen Leistungen in einem anderen Fach wie z. B. Deutsch vergleichen. Doch auch bei dimensionalen Vergleichen ist zwischen Auf- und Abwärtsvergleichen zu unterscheiden: Bei dimensionalen Abwärtsvergleichen würde das Kind z. B. seine Mathematikleistung mit den eigenen schlechteren Deutschleistungen vergleichen, sodass es ein höheres Selbstkonzept in Mathematik entwickelt. Dimensionale Aufwärtsvergleiche, bei denen das Kind die besseren Leistungen in einem © 2017 Hogrefe

43

anderen Vergleichsfach wie z. B. Biologie feststellen würde, sollten dagegen mit einem geringeren Selbstkonzept in Mathematik einhergehen. Eine weitere Möglichkeit zur Bewertung von Leistungen stellen temporale Vergleiche dar, bei denen das Kind die aktuelle Leistung mit seinen früher erbrachten Leistungen vergleicht, wobei auch hier Auf- und Abwärtsvergleiche auftreten können: Vergleicht ein Kind z. B. seine aktuelle Mathematikleistung mit seinen früher erbrachten schlechteren Mathematikleistungen (temporaler Abwärtsvergleich), sollte das Kind ein höheres Selbstkonzept entwickeln, als wenn es seine aktuelle Mathematikleistung mit seinen besseren Mathematikleistungen aus der Vergangenheit vergleicht (temporaler Aufwärtsvergleich). Da die individuell präferierte BNO-Wahl somit aus verschiedenen Vergleichsprozessen resultiert, lassen sich enge konzeptionelle Ähnlichkeiten zwischen sozialen, individuellen und kriterialen Vergleichsprozessen und dem Konzept der BNO feststellen. Dennoch ist das Konzept der BNO von dem Konzept der Vergleichsprozesse auch eindeutig abgrenzbar, da Vergleiche immer in einem Bezugsrahmen gesetzt werden und Auf- und Abwärtsvergleiche voneinander unterschieden werden müssen: Abwärtsvergleiche sollten mit einem höheren Selbstkonzept einhergehen, Aufwärtsvergleiche jedoch mit einem niedrigeren Selbstkonzept. Entscheidend für das Selbstkonzept ist daher weniger die Art des Vergleichs, sondern eher der Bezugsrahmen. So ist z. B. die Annahme, dass soziale, temporale oder dimensionale Vergleiche förderlich oder ungünstig für das Selbstkonzept sind, zu allgemein, wenn die Vergleiche in keinem Bezug stehen, wie z. B. Vergleiche zwischen Fächern (dimensional), mit früher erbrachten Leistungen (temporal) oder mit den Leistungen anderer Schüler (sozial). Daraus lässt sich für die vorliegende Studie schließen, dass die individuell präferierte BNO-Wahl mit dem Selbstkonzept von Grundschulkindern eng zusammenhängt.

Forschungsstand Bislang liegen noch relativ wenige Befunde zur individuell präferierten BNO-Wahl von Grundschulkindern vor. Eine Ausnahme stellt eine Studie von Lohbeck, Tietjens und Bund (2014) dar, in der die Zusammenhänge zwischen verschiedenen Domänen des physischen Selbstkonzepts (Kraft, Ausdauer, Schnelligkeit, Beweglichkeit, Koordination, Allgemeine Sportlichkeit, Physische Attraktivität), der individuell präferierten BNO, der Zielorientierung und den Sportnoten von Grundschulkindern der 2. und 4. Jahrgangsstufe untersucht wurden. Die Befunde dieser Studie zeigten, dass hohe Selbstkonzepte positiv mit einer IBNO zuZeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55


44

sammenhängen. Die SBNO korrelierte dagegen negativ mit allen Selbstkonzeptfacetten und mit den Noten. Demzufolge scheint die Anwendung einer SBNO bereits im Grundschulalter negativ mit fachspezifischen Selbstkonzepten und Noten einherzugehen, während die Anwendung einer IBNO mit höheren Selbstbewertungen korrespondiert. Die Mehrzahl von Studien (z. B. Arens et al., 2016; Ehm, Nagler, Lindberg & Hasselhorn, 2014) geht jedoch nicht auf die BNO ein, sondern bezieht sich auf die Vergleichsprozesse, die häufig im Kontext des sog. Internal- / External-Frame-of-Reference-Modells (im Folgenden I / E-Modell; Marsh, 1986) und des Big-Fish-Little-Pond-Effekts (im Folgenden BFLPE; Marsh, 1987) thematisiert werden. Beim I / E-Modell wird das Zusammenwirken von zwei Vergleichsprozessen beschrieben: (1) einen interindividuellen Vergleich („external frame of reference“), wonach Schülerinnen und Schüler die eigenen Leistungen mit den Leistungen anderer Mitschülerinnen und Mitschüler vergleichen und (2) einen intraindividuellen Vergleich („internal frame of reference“), bei dem die Schülerinnen und Schüler die eigenen Leistungen entweder mit den eigenen früher erbrachten Leistungen (temporaler Vergleich) oder mit den Leistungen in anderen Schulfächern kontrastieren (dimensionaler Vergleich). Aufgrund dieser Kontrastierungen lassen sich in dem I / E-Modell (Marsh, 1986) deshalb häufig keine oder nur schwach positive Zusammenhänge zwischen verschiedenen fachspezifischen Selbstkonzepten feststellen, während die jeweiligen Leistungen signifikant positiv korrelieren. Bereits zahlreiche Studien haben die Gültigkeit des I / E-Modells in konsistenter Weise belegt (Arens et al., 2016; Ehm et al., 2014; Marsh et al., 2015). In einer Studie von Ehm und Kollegen (2014) wurde das I / E-Modell z. B. bereits bei 1 631 Grundschulkindern im 3. Schuljahr für die drei Domänen Lesen, Rechtschreiben und Rechnen überprüft. Die Ergebnisse dieser Studie zeigten signifikant negative Kontrasteffekte der Leistungen in Mathematik auf die Selbstkonzepte im Lesen (β = –.35, p < .01) und Schreiben (β = –.18, p < .01) sowie signifikant negative Kontrasteffekte der Leistungen im Lesen auf das Selbstkonzept im Rechnen (β = –.25, p < .01). Zwar lag für die Leistung im Schreiben kein signifikant negativer Kontrasteffekt auf das Selbstkonzept im Rechnen (β = .03) vor, jedoch ein signifikant positiver Kontrasteffekt auf das Selbstkonzept im Lesen (β = .28, p < .01). Angenommen wird (vgl. Dickhäuser (2003), dass kontrastierende Leistungsvergleiche sich eher zwischen stark distinkt wahrgenommenen Fähigkeitsbereichen (Fächern) zeigen als zwischen sehr ähnlichen Fähigkeitsbereichen (vgl. auch Möller & Marsh, 2013) und das gemeinsame Unterrichten von Lesen und Schreiben im Fach Deutsch bzw. die Zugehörigkeit dieser beiden Fähigkeitsbereiche zur verbalen Domäne ursächlich für die Assimilationseffekte zwischen Lesen und Schreiben sind. Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55

A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

Besonders ungünstig für die Selbstkonzeptentwicklung sind die sozialen Vergleichsprozesse, die in der Selbstkonzeptforschung auch als BFLPE bezeichnet werden (Chen, Hwang, Yeh & Lin, 2012; Liou, 2014; Marsh, 2005; Marsh, Trautwein, Lüdtke, Baumert & Köller, 2007; Marsh et al., 2015; Nagengast & Marsh, 2012; Niepel, Brunner & Preckel, 2014; Pinxten, Wouters, Preckel, Niepel, De Fraine & Verschueren, 2015): Ein Kind (big fish) in einer leistungsschwächeren Klasse (little pond) entwickelt ein positiveres Selbstkonzept, da es vermehrt Abwärtsvergleiche (Vergleiche mit schlechteren Kindern) anstellen kann. Befindet sich das Kind jedoch in einer leistungsstärkeren Klasse, wird dieses Kind wahrscheinlich ein niedrigeres Selbstkonzept entwickeln, da die Wahrscheinlichkeit für soziale Aufwärtsvergleiche (Vergleiche mit besseren Kindern) höher ist. Trautwein, Lüdtke, Marsh und Nagy (2009) konnten z. B. bei 4810 Gymnasiasten zeigen, dass das Selbstkonzept in Mathematik von Schülerinnen und Schülern in leistungsstärkeren Klassen niedriger ausgeprägt ist und soziale Vergleichsprozesse sich besonders ungünstig auf das Selbstkonzept von leistungsschwächeren Schülerinnen und Schülern auswirken. Zudem legen mehrere Studien in diesem Kontext nahe, dass Schulnoten den BFLPE verstärken und sich dieser Effekt sowohl auf das Selbstkonzept (Zeinz & Köller, 2006) als auch auf andere Variablen wie z. B. das schulische Interesse (Trautwein & Lüdtke, 2005), die Kurswahl in der gymnasialen Oberstufe (Köller, 2004) oder die Unterrichtsbeteiligung (Trautwein, Köller & Kämmerer, 2002) negativ auswirkt. In der PERLE-Studie („Persönlichkeits- und Lernentwicklung“) von Kastens, Gabriel und Lipowsky (2013) konnte der BFLPE sogar schon bei Kindern im 1. Schuljahr nachgewiesen werden. Auch Dickhäuser und Galfe (2004), die Kinder im 3. und 4. Schuljahr untersuchten, stellten ähnliche Ergebnisse fest: Vergleiche mit schlechteren Kindern (soziale Abwärtsvergleiche) gehen mit einem höheren Selbstkonzept einher, während Vergleiche mit besseren Kindern (soziale Aufwärtsvergleiche) mit einem geringeren Selbstkonzept zusammenhängen. Soziale Aufwärtsvergleiche wurden dabei bevorzugt angewendet, vor allem wenn die eigene Leistung schlechter als erwartet war. Dimensionale und temporale Vergleiche wirkten sich dagegen nicht auf das Selbstkonzept der Kinder aus. Dennoch weisen mehrere Studien auch auf positive Effekte der sozialen Vergleichsprozesse auf das Selbstkonzept hin, wonach die negativen Auswirkungen des BFLPEs sich durch die soziale Identifikation mit der sozialen Bezugsgruppe, die ein hohes Ansehen genießt wie z. B. Gymnasiastinnen und Gymnasiasten, teilweise wieder kompensieren. Solche Assimilationseffekte werden auch Basking-in-reflectedglory-Effekte (Cialdini & Richardson, 1980) genannt, wobei sie – wenn sie überhaupt auftreten – in der Regel deutlich schwächer ausfallen als BFLPEe (Trautwein et al., © 2017 Hogrefe


A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

2009). Zusammenfassend lässt sich vor diesem Hintergrund daraus für die vorliegende Studie ableiten, dass die Anwendung einer SBNO, die soziale Vergleichsprozesse impliziert, negativ mit einem hohen Selbstkonzept zusammenhängt, während die IBNO und KBNO, die auf Vergleiche mit den eigenen Leistungen bzw. den Kriterien einer Aufgabe selbst rekurrieren, positiv mit einem hohen Selbstkonzept assoziiert sind.

Forschungsanliegen Ausgehend von dem theoretischen BNO-Konzept von Rheinberg (1980) und den bisherigen Erkenntnissen der Selbstkonzeptforschung ist es ein Anliegen der vorliegenden Studie, (1) die drei theoretisch postulierten BNO auf der Basis von Selbsteinschätzungen von Grundschulkindern faktorenanalytisch zu konzeptualisieren, (2) die Vorhersagbarkeit des MSKs und der MN durch die drei BNO zu erfassen und (3) mögliche Mediatoreffekte des MSKs zwischen den drei BNO und den MN sowie (4) Interaktionseffekte für die SBNO auf der Individual- und Klassenebene mit der Klassendurchschnittsleistung (KL) zu modellieren. Fokussiert werden sollte dabei das Fach Mathematik. Die zentralen Fragestellungen dieser Studie lauten: 1. Lassen sich die drei BNO (IBNO, SBNO und KBNO) faktorenanalytisch klar voneinander trennen? 2. Zeigen sich Zusammenhänge zwischen den drei BNO, dem MSK und den MN der Kinder? 3. Sind die MN durch die drei BNO und das MSK der Kinder erklärbar? 4. Stellt das MSK einen Mediator zwischen den BNO und den MN dar? 5. Sind das MSK und die MN der Kinder von der SBNO auf der Individual- und Klassenebene und der KL abhängig? In Einklang mit den theoretischen Annahmen von Rheinberg (1980) wird erwartet, dass sich sowohl in exploratorischen als auch konfirmatorischen Faktorenanalysen eine Drei-Faktoren-Struktur für die drei BNO (IBNO, SBNO und KBNO) zeigt (Hypothese 1). Zudem sollten positive Zusammenhänge zwischen dem MSK, der IBNO und den MN sowie negative Zusammenhänge zwischen dem MSK, der SBNO und den MN bestehen (Hypothese 2). Ausgehend von der zuvor aufgeführten Literatur zur Selbstkonzeptentwicklung im Grundschulalter, wonach individuelle, soziale und kriteriale Vergleichsprozesse das Selbstkonzept beeinflussen, wird weiterhin erwartet, dass sich die IBNO und KBNO positiv auf das MSK und die MN auswirken, die SBNO jedoch negativ das MSK und die MN tangiert (Hypothese 3). Wie in anderen Studien (z. B. Arens © 2017 Hogrefe

45

et al., 2016; Pinxten, Marsh, De Fraine, Van Den Noortgate & Van Damme, 2014) sollten sich dabei ebenso positive Effekte des MSKs auf die MN abbilden (Hypothese 4). Wenngleich am Ende des 4. Schuljahres eher von einem Skill-Development-Ansatz ausgegangen werden kann, ist Hypothese 4 für die vorliegende Studie insofern gerechtfertigt, als sich in der Selbstkonzeptforschung mittlerweile auch ein sog. Reciprocal Effect-Model etabliert hat (z. B. Ju, Zhang & Katsiyannis, 2013; Marsh & Craven, 2006; Seaton, Parker, Marsh, Craven & Yeung, 2014). Aufgrund der zu erwartenden engen Beziehungen zwischen den drei BNO und dem MSK sowie zwischen dem MSK und den MN wird schließlich vermutet, dass das MSK als Mediator zwischen den drei BNO und den MN fungiert (Hypothese 5). Zu möglichen Interaktionseffekten soll hingegen keine spezifische Annahme formuliert werden.

Methode Stichprobe Datengrundlage dieser Studie bildete eine Stichprobe von N = 410 deutschen Grundschulkindern der 4. Jahrgangsstufe, die in 23 Klassen an neun Grundschulen in Niedersachsen befragt wurden. Davon waren 217 Jungen (52.9 %) und 193 Mädchen (47.1 %). Das Alter der Kinder variierte zwischen 9 und 13 Jahren (MAlter = 9.53, SD = 0.71; MedianAlter = 9.00). Es handelt sich dabei um eine querschnittlich angelegte Fragebogenstudie, in der Grundschulkinder ihre individuell präferierten BNO und mathematischen Fähigkeiten auf verschiedenen Likert-Skalen beurteilen sollten. Die Eltern der Kinder wurden zwei Wochen vor der Befragung ausführlich über die Studie informiert und um eine schriftliche Einverständniserklärung gebeten. Die Teilnahme an der Befragung war freiwillig und anonym. Alle Datenerhebungen fanden unter standardisierter Anleitung von geschulten Testleiterinnen und Testleitern statt, die alle Items in dem Fragebogen laut vorlasen, um standardisierte Bedingungen und eine möglichst zeitökonomische Durchführung in allen Klassen zu gewährleisten. Zur besseren Verständlichkeit wurde ein Beispielitem mit dem korrekten Antwortmodus an der Tafel erläutert, sodass auch Kinder mit geringerem Sprachniveau alle Items vollständig bearbeiten konnten. Sprachoder Verständnisschwierigkeiten wurden nicht berichtet.

Messinstrumente Die Kinder füllten einen Fragebogen aus, der folgende Skalen beinhaltete: Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55


46

Mathematisches Selbstkonzept (MSK) Zur Erfassung des MSKs wurden sechs positiv formulierte Items aus dem deutschsprachigen Self-Description Questionnaire I (SDQ I; Arens, Trautwein & Hasselhorn, 2011) angewendet (Beispielitem: „In Mathe bin ich gut“, α = .90). Alle Items konnten auf einer fünfstufigen LikertSkala von 1 = falsch, 2 = meistens falsch, 3 = manchmal wahr, manchmal falsch, 4 = meistens wahr bis 5 = wahr von den Kindern bewertet werden. Konfirmatorische Faktorenanalysen wiesen auf eine klare Ein-Faktorenstruktur für diese Skala hin (χ2 = 5.24, df = 6, CFI = 1.00, TLI = 1.00, RMSEA = .00, SRMR = .00). Auch andere Studien haben bereits übereinstimmend die Validität und Reliabilität des SDQ I belegt (z. B Arens & Morin, 2016; Arens, Yeung, Craven & Hasselhorn, 2013). Bezugsnormorientierung (BNO) Zur Erfassung der individuell präferierten BNO der Kinder wurde aufgrund der mangelnden Verfahren ein neues Instrument entwickelt. Als Basis für die Itemkonstruktion wurde der Fragebogen zur BNO bei der Selbstbewertung (FBno-S) von Dickhäuser und Stiensmeier-Pelster (2000; vgl. Dickhäuser & Rheinberg, 2003) herangezogen, der bislang nur in einer Studierendenversion vorliegt und ausschließlich die soziale und individuelle BNO fokussiert. Die Instruktion zu Beginn des Fragebogens für die vorliegende Studie begann mit der Frage: „Wann findest du dich gut in Mathe?“, gefolgt von dem Itemstamm „Ich finde mich gut in Mathe, wenn …“. Die IBNO wurde mit drei Items („…, wenn ich mich bei den Aufgaben jedes Mal verbessere“, α = .82), die SBNO mit vier Items („… wenn ich mehr kann als andere“, α = .88) und die KBNO mit fünf Items („…, wenn ich alle Aufgaben schaffe“, α = .80) erfasst. Kurze, einfache Aussagesätze mit einem direkten Personenbezug sind bei Befragungen mit Grundschulkindern angemessen, da im Grundschulalter noch von einem hohen Egozentrismus ausgegangen werden kann. Der Begriff „Leistung“ wurde bewusst vermieden, da jüngere Kinder bei diesem Wort eventuell Verständnisschwierigkeiten aufweisen könnten. Alle Items konnten auf einer vierstufigen Likert-Skala von 1 = stimmt nicht, 2 = stimmt wenig, 3 = stimmt fast bis 4 = stimmt genau von den Kindern beurteilt werden. Die Zusammenstellung der Items für die drei Skalen erfolgte nach einem induktiven Vorgehen (vgl. Bühner, 2011, S. 94), d. h., in einigen vorangestellten Untersuchungen wurden die neu entwickelten Items an mehreren Grundschulen erprobt und den testtheoretischen und faktorenanalytischen Befunden entsprechend (höchste Faktorenladungen und höchste Trennschärfen) selektiert. Negativ konnotierte Items wurden nicht konstruiert, da diese in Stichproben mit jüngeren Kindern häufig einen eigenen Faktor in Faktorenanalysen bilden (vgl. Breuker & Rost, 2011). Im Anhang A sind alle Items für die drei BNOSkalen zu ersehen. Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55

A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

Weitere Variablen Neben dem Alter und dem Geschlecht gaben die Kinder zudem ihre Mathematiknoten für das nächste Schulhalbjahreszeugnis an, da alle Datenerhebungen kurz vor der nächsten Zeugnisvergabe stattfanden.

Datenauswertung Zur Überprüfung der faktoriellen Validität des BNO-Konzepts wurden sowohl exploratorische (EFA) als auch mehrere konfirmatorische Faktorenanalysen (CFA) mit IBM SPSS 23® und Mplus 7.1 (Muthén & Muthén, 1998–2014) durchgeführt. Um die Faktoren für die drei BNO als latente Variablen interpretieren zu können, die die Korrelationen zwischen den manifesten Items für die BNO erklären, wurde für die EFA eine varimax-rotierte Hauptachsenanalyse (engl. principal axes factor analysis, PFA) gewählt. In den anschließend berechneten CFA wurden folgende Modelle untersucht: (1) ein Ein-Faktor-Modell (Modell 1), bei dem alle manifesten Items auf einem globalen latenten Faktor laden, (2) ein Zwei-Faktoren-Modell (Modell 2), bei dem die IBNO und SBNO einen latenten Faktor und die KBNO einen weiteren latenten Faktor mit den jeweiligen manifesten Items als Indikatoren bilden und 3) ein Drei-Faktoren-Modell (Modell 3), bei dem drei latente Faktoren für die IBNO, SBNO und KBNO mit den jeweiligen manifesten Items als Indikatoren differenziert werden. Um eine mögliche Konfundierung mit der MSK-Skala ausschließen zu können, wurde zudem (4) ein viertes Modell (Modell 4) mit vier latenten Faktoren und den jeweiligen manifesten Items als Indikatoren für die drei BNO und das MSK berechnet. Korrelationen zwischen den Messfehlern der Items innerhalb eines Faktors wurden zugelassen, um die Schätzung der Modelle zu verbessern und eine Überschätzung latenter Zusammenhänge zu vermeiden. Ein solches Vorgehen ist gerechtfertigt, wenn (1) die geschätzten Parameter als bedeutsam angesehen werden können und ähnliche Itemformulierungen gemeinsame Varianz teilen, (2) sowohl die MI- (= modification indices) Werte als auch der EPC- (expected parameter change) Wert substanziell zur Verbesserung des Modellfits beitragen und (3) es durch die Modifizierung bzw. zusätzliche Freisetzung von Parametern zu keinem überfitteten Modell kommt (vgl. Byrne, 2012, S. 88). Hinweise auf die Modellgüte gaben die klassischen Fit-Indizes (im Einzelnen der CMIN / DF, der Tucker-Lewis-Index (TLI), der Comparative Fit Index (CFI), der Root Mean Square Error of Approximation (RMSEA) und der Standard Root Mean Square Residual (SRMR). Zur Beurteilung der Modellgüte wurden die Grenzwerte nach Weiber und Mühlhaus (2014) herangezogen, wonach ein guter Modellfit bei folgenden Grenzwerten vorliegt: CFI ≥ 0.9, TLI ≥ 0.9, 0.05 ≤ RMSEA ≤ 0.08 und SRMR ≤ .08. Unterschiede im Modellfit © 2017 Hogrefe


A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

wurden mit χ2-Differenztests nach Satorra-Bentler (Satorra & Bentler, 2001) untersucht. Die linearen Zusammenhänge zwischen den drei BNO, dem MSK und den MN wurden über bivariate Pearson-Korrelationen analysiert. Zur besseren Interpretierbarkeit wurden die MN für die Korrelationsund Regressionsanalysen umkodiert, sodass höhere Werte besseren MN entsprechen. Um die prädiktiven Zusammenhänge zwischen den Konstrukten zu erfassen, wurden zwei Mehrebenen-Pfadmodelle in Mplus berechnet. In beiden Modellen gingen neben dem Geschlecht (Junge = 0, Mädchen = 1) als Kontrollvariable direkte Pfade von den drei BNO auf das MSK und auf die MN sowie direkte Pfade vom MSK auf die MN ein. In Modell 1 wurden zusätzlich indirekte Effekte mit dem MSK als Mediator zwischen den drei BNO (IBNO, SBNO, KBNO) und den MN getestet. Da die bisherigen Befunde zum BFLPE relativ robust darauf hinweisen, dass soziale Aufwärtsvergleiche sich häufig negativ auf fachspezifische Selbstkonzepte auswirken, wurden in Modell 2 außerdem Interaktionseffekte für die individuelle und kollektiv erlebte SBNO mit jeweils der Klassendurchschnittsleistung (KL) modelliert. Alle Variablen wurden an der Gesamtstichprobe z-standardisiert und gingen als manifeste Merkmale in die Analysen ein. Da davon auszugehen war, dass Grundschulkinder bei Anwendung einer SBNO ihre MN mit den MN anderer Kinder in der Klasse vergleichen, wurde die SBNO in beiden Modellen sowohl als Prädiktor auf der Individual- als auch als Prädiktor auf der Klassenebene betrachtet. Auf der Individualebene kann somit untersucht werden, wie hoch das MSK und wie gut die MN eines Kindes in Abhängigkeit von der individuell präferierten SBNO ausgeprägt sind, während auf der Klassenebene der Effekt der kollektiv erlebten SBNO und damit der Kontexteffekt spezifiziert werden kann. Die kollektiv erlebte SBNO wurde mittels der auf der Individualebene zstandardisierten Werte für die SBNO-Skala berechnet. Zusätzlich gingen die auf der Klassenebene aggregierten MN als weitere Kontextvariable in die Analysen ein. Die KL wurde dabei ebenso durch Aggregation der auf der Individualebene z-standardisierten MN gebildet. Aufgrund der hierarchischen Datenstruktur wurde die in Mplus implementierte Analyseoption: type = twolevel (random) und die Maximum-Likelihood- (ML-) Methode angewendet. Fehlende Werte wurden mit dem Full-Information-Maximum-Likelihood-Algorithmus bei den Schätzungen berücksichtigt. Es fehlten max. 2.6 % auf der Itemebene. Um feststellen zu können, wie stark die Antworten der Kinder durch den Klassenkontext beeinflusst worden sind, wurden zudem für alle Variablen der Individualebene (MSK, IBNO, SBNO, KBNO, MN) die Intraklassenkorrelationen (ICC) berechnet. Da das Geschlecht als eine relevante Variable bei der bevorzugten BNO-Wahl und Selbstkonzeptentwicklung angesehen werden kann, wurden zusätzlich Mittelwertunterschiede mit t-Tests für unabhängige Stichproben überprüft. © 2017 Hogrefe

47

Ergebnisse Faktorielle Validität des dreidimensionalen BNO-Konzepts Sowohl die Befunde der PFA als auch die Ergebnisse der CFA zeigten, dass eine Drei-Faktoren-Struktur für die drei Faktoren IBNO, SBNO und KBNO hinreichend angemessen ist. In der varimax-rotierten PFA stellten sich nach dem Kaiser-Eigenwert-Kriterium von > 1 genau drei Faktoren über einen Wert von 1 heraus (Eigenwertverlauf: 4.85, 2.10, 1.09). Die Varianzaufklärung für dieses Modell betrug etwa 67.03 %. Hinweise auf die Angemessenheit eines Drei-Faktoren-Modells gaben ebenso die anderen Kennwerte der PFA: Die Measure of Sample Adequacy-Koeffizienten schwankten zwischen .82 und .92, der KaiserMeyer-Olkin-Koeffizient erreichte einen Wert von etwa .87 und der Bartlett-Test (χ2 = 2197.35, df = 66, p < .001) sowie die Kommunalitäten für die einzelnen Items (.42 ≤ h2 ≤ .76) fielen zufriedenstellend aus. Empirische Evidenz für das erwartete Drei-Faktoren-Modell ließ sich auch in den Modellüberprüfungen der CFA feststellen: Sowohl das Ein-Faktor-Modell (Modell 1) mit einem latenten Faktor und den jeweiligen manifesten Items als Indikatoren als auch das Zwei-Faktoren-Modell (Modell 2) mit einem latenten Faktor für die IBNO und SBNO sowie einem latenten Faktor für die KBNO zeigten im Vergleich zu dem Drei-Faktoren-Modell (Modell 3) keine hinreichenden Fit-Indizes. Die zusätzlich berechneten χ2-Differenztests nach Satorra-Bentler (Satorra & Bentler, 2001) bestätigten, dass sich das Drei-Faktoren-Modell mit drei latenten Faktoren eindeutig am besten an die Daten anpasst. Tabelle 1 gibt die Fit-Indizes und Ergebnisse der χ2Differenztests für alle drei Modelle zur Bezugsnormorientierung wieder.

Deskriptive Analysen Die deskriptiven Statistiken (Mittelwerte und Standardabweichungen) sowie die Intraklassenkorrelationen und bivariaten manifesten Pearson-Korrelationen für die zentralen Variablen in dieser Studie sind Tabelle 2 zu entnehmen. Für das MSK, die IBNO und die KBNO ließen sich in der Gesamtstichprobe bei einem vier- bzw. fünfstufigen Antwortformat generell sehr hohe Skalenmittelwerte erkennen. Die höchsten Mittelwerte zeigten sich für das MSK, gefolgt von der IBNO und KBNO. Die MN fielen dagegen eher durchschnittlich aus. Signifikante Geschlechtsunterschiede lagen lediglich für die IBNO vor (t (363.58) = –3.33, p < .01), wonach Mädchen eine stärker ausgeprägte IBNO berichten als Jungen. Die ICC für die einzelnen Variablen der Individualebene variierten zwischen .05 (MSK / IBNO) Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55


48

A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

Tabelle 1. Ergebnisse der konfirmatorischen Faktorenanalysen für drei Modelle zur Bezugsnormorientierung χ2

Modelle (M)

M1: Ein-FaktorModell

χ2/df

df

CFI

TLI

RMSEA [90 % CI]

β

SRMR

Modellvergleich

cd

TRd

χ2-Differenztest Δχ2

Δdf

p

946.41

54

0.98

.41

.28

.20 [.19–.21]

.13

.52–.64

M1 vs. M2

–20.75

–13.49

480.60

1

< .001

M2: Zwei-Faktoren- 465.81 Modell

53

1.39

.73

.66

.14 [.13–.15]

.14

.28–.85

M2 vs. M3

1.02

532.13

393.01

4

< .001

M3: Drei-FaktorenModell

49

1.42

.98

.98

.03 [.02–.05]

.04

.63–.88

M1 vs. M3

–3.33 –247.33

873.61

5

< .001

72.80

Anmerkungen. χ2 = Chi-Quadrat-Wert, df = Freiheitsgrad, χ²/df = der am Freiheitsgrad relativierte Chi-Quadrat-Wert. cd = Scaling-CorrectionFaktor des Satorra-Bentler Chi-Quadrat-Differenztests. TRd = Satorra-Bentler skalierter Chi-Quadrat-Differenzwert. CFI = Comparative Fit Index, TLI = Tucker-Lewis-Index, RMSEA = Root Mean Square Error of Approximation, SRMR = Standard Root Mean Square Residual, 90 % CI = 90 % Konfidenzintervall, β = standardisierte Regressionskoeffizienten.

und .11 (MN) und deuteten damit auf einen bedeutsamen Einfluss der Klassenebene auf die einzelnen Merkmale der Individualebene hin. Alle manifesten Korrelationen befanden sich mit Werten zwischen .20 und .54 im hoch signifikant positiven Bereich (p < .001). Die Skaleninterkorrelationen für die drei BNO legten zudem nahe, dass die Kinder dieser Studie nahezu alle drei BNO gleichzeitig zur Einschätzung ihrer mathematischen Fähigkeiten anwenden. Am höchsten korrelierte die IBNO mit der KBNO. Doch auch die Korrelation zwischen der SBNO und KBNO fiel relativ hoch aus. Demzufolge scheinen sowohl die IBNO als auch der SBNO häufig zusammen mit einer KBNO angewendet zu werden. Die positive Korrelation zwischen der IBNO und der SBNO war dagegen deutlich schwächer ausgeprägt (r = .26), wenngleich eine simultane Anwendung dieser BNO ebenso nicht gänzlich ausgeschlossen werden kann. Das MSK korrelierte am höchsten mit den MN und am schwächsten mit der IBNO. Die kollektiv erlebte SBNO

(SBNO_K) war zudem mit allen drei BNO signifikant positiv assoziiert und die Klassendurchnittsleistung (KL) signifikant negativ mit dem MSK, den MN und der kollektiv erlebten SBNO (SBNO_K; vgl. Tab. 2).

Mehrebenenanalysen Signifikante Befunde ließen sich ebenso in den Mehrebenen-Pfadmodellen zur Vorhersage des MSKs und der MN feststellen. Tabelle 3 fasst die Ergebnisse der in dieser Studie berechneten Mehrebenen-Pfadmodelle zusammen. Sowohl in Modell 1 als auch in Modell 2 lagen folgende signifikante Effekte vor: Neben einem bedeutsamen Geschlechtseffekt, der auf ein höheres MSK bei Jungen im Vergleich zu Mädchen hindeutete, stellten sich signifikant positive Effekte der IBNO und der KBNO jeweils auf das MSK heraus. Die SBNO auf Individualebene erwies sich dagegen nur für die MN als ein signifikant posi-

Tabelle 2. Deskriptive Statistiken, Mittelwertvergleiche (**p < .01), Intraklassenkorrelationen und Korrelationen für die zentralen Variablen Variablen

Gesamt N = 410

Mädchen n = 193

Jungen n = 217

ICC

1) IBNO

3.65 (0.58)

3.75**(0.42)

3.56 (0.68)

.05

2) SBNO

2.69 (0.91)

2.62 (0.89)

2.75 (0.93)

.09

3) KBNO

3.50 (0.55)

3.54 (0.51)

3.47 (0.59)

.06

4) MSK

3.73 (0.91)

3.66 (0.88)

3.79 (0.93)

.02

5) MN

2.52 (0.97)

2.54 (0.96)

2.51 (0.98)

.17

6) SBNO_K

2.69 (0.33)

2.71 (0.31)

2.67 (0.34)

7) KL

2.52 (0.35)

2.51 (0.35)

2.54 (0.36)

2

.26*** –

3

4

5

6

7

.54***

.33***

.19***

.10*

–.03

.43***

.22***

.20***

.36***

–.05

.37***

.25***

.21***

–.08

.51***

.08

–.11*

.05

–.37***

–.15**

Anmerkungen. IBNO = individuelle Bezugsnormorientierung, SBNO = soziale Bezugsnormorientierung, KBNO = kriteriale Bezugsnormorientierung, MSK = mathematisches Selbstkonzept, MN = Mathematiknoten. SBNO_K = die auf Klassenebene aggregierte SBNO, KL = Klassendurchschnittsleistung Mathematik. ICC = Intraklassenkorrelation. *p < .05, **p < .01, ***p < .001.

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55

© 2017 Hogrefe


A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

49

tiver Prädiktor. Das höchste Regressionsgewicht zeigte das MSK auf die MN. Auf der Klassenebene ließen sich dennoch ebenso hoch bedeutsam negative Effekte der KL und der kollektiv erlebten SBNO (SBNO_K) jeweils auf die MN konstatieren: Kinder in leistungsstärkeren Klassen oder in Klassen, in denen die Kinder eine stärker ausgeprägte SBNO bei anderen Mitschülerinnen und Mitschülern in der Klasse wahrnehmen, erreichen demzufolge schlechtere MN. Die KL zeigte dagegen in beiden Modellen keinen signifikant negativen Effekt auf das MSK, was somit nicht auf einen bedeutsamen BFLPE hinweist. In Modell 1 (M1), in dem keine Interaktionseffekte berücksichtigt wurden, zeigten sich zudem zwei signifikant positive Mediatoreffekte des MSKs zwischen der IBNO und den MN sowie zwischen der KBNO und den MN: Der indirekte Effekt des MSKs zwischen der IBNO und den MN betrug etwa .09 (p < .001) und der totale direkte Effekt etwa .08. Der signifikant indirekte Effekt des MSKs zwischen der KBNO und den MN lag bei etwa .11 (p < .05) und der totale direkte Effekt bei etwa .15. Die Varianzaufklärung fiel für das MSK mit 0.17 und für die MN mit 0.29 % jedoch gering aus. In Modell 2 (M2), das zusätzlich die beiden Interaktionsterme „SBNO_I × KL“ und „SBNO_K × KL“ als Prädiktoren beinhaltete, ließen sich dagegen keine signifikanten

Interaktionen feststellen. Die Effekte der anderen Prädiktoren auf das MSK und die MN sind somit unabhängig von der Höhe der individuell präferierten und kollektiv erlebten SBNO der Kinder. Abbildung 1 stellt die signifikanten Effekte des Mehrebenen-Pfadmodells 2 dar.

Diskussion Die vorliegende Studie stellt eine Erweiterung des bisherigen Forschungsstandes zur Selbstkonzeptentwicklung im Grundschulalter dar, da sie erstmalig ein ursprüngliches Lehrermerkmal als Schülermerkmal konzeptualisiert und im Zusammenhang mit dem mathematischen Selbstkonzept (MSK) und Mathematiknoten (MN) von Grundschulkindern analysiert: die individuell präferierte Bezugsnormorientierung. Nach dem theoretischen Konzept von Rheinberg (1980) wurden dabei drei BNO als Determinante für das MSK und die MN von Grundschulkindern genauer in den Blick genommen: die individuelle BNO (IBNO), die soziale BNO (SBNO) und kriteriale BNO (KBNO). Ziel der vorliegenden Studie war es speziell, (1) die faktorielle Validität des theoretischen Konzepts der Bezugsnormorientierung von Rheinberg (1980) zu über-

Tabelle 3. Ergebnisse der Mehrebenenanalysen zur Vorhersage des mathematischen Selbstkonzepts und der Mathematiknoten – standardisierte Regressionsgewichte und erklärte Varianzanteile Modelle

Modell 1

Modell 2

Abhängige Variablen

MSK

MN

MSK

MN

Prädiktoren

β (SE)

β (SE

β (SE

β (SE

–.23* (0.09)

.05 (0.08)

–.22* (0.09)

.04 (0.08)

Individualebene Geschlecht (Junge = 0) IBNO

.19*** (0.04)

SBNO_I

.06 (0.06)

.10* (0.04)

.06 (0.05)

.10* (0.04)

KBNO

.24*** (0.04)

.04 (0.06)

.24*** (0.04)

.04 (0.06)

MSK

–.01 (.05)

.46*** (0.05)

.19*** (0.04)

–.01 (0.05)

.47*** (0.05)

Klassenebene KL

–.08 (0.04)

–.36*** (0.02)

–.07 (0.04)

–.37*** (0.02)

SBNO_K

–.02 (0.05)

–.09*** (0.02)

–.01 (0.07)

–.10*** (0.02)

Interaktion: SBNO_I × KL

.04 (0.06)

–.02 (0.08)

Interaktion: SBNO_K × KL

.04 (0.04)

–.04 (0.04)

R2

.17

.29

Anmerkungen. IBNO = individuelle Bezugsnormorientierung, SBNO_I = soziale Bezugsnormorientierung (Individualebene), KBNO = kriteriale Bezugsnormorientierung, MSK = mathematisches Selbstkonzept, KL = Klassendurchschnittsleistung Mathematik, SBNO_K = die auf Klassenebene aggregierte SBNO, β = standardisierter Beta-Koeffizient, SE = Standardfehler, R2 = Determinationskoeffizient der Varianzaufklärung, *p < .05, **p < .01, ***p < .001.

© 2017 Hogrefe

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55


50

A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

Geschlecht –.22** IBNO

.19**/.09***

KBNO

KL R2 = .29

R2 = .17

MN

MSK .24***/.11***

.47***

SBNO .10*

–.37*** –.10*** SBNO_K

Abbildung 1. Mehrebenen-Pfadmodell mit den signifikant prädiktiven Zusammenhängen zwischen den einzelnen Variablen dieser Studie. IBNO = individuelle Bezugsnormorientierung, SBNO = soziale Bezugsnormorientierung, KBNO = kriteriale Bezugsnormorientierung, MSK = mathematisches Selbstkonzept, MN = Mathematiknoten, KL = Klassendurchschnittsleistung, SBNO_K = die auf Klassenebene aggregierte, kollektiv erlebte SBNO, Geschlecht (Junge = 0, Mädchen = 1). Dargestellt werden die standardisierten Regressionskoeffizienten. Die Items als manifesten Indikatoren werden zur besseren Übersicht nicht dargestellt. Die zweiten Werte nach dem Schrägstrich bei der IBNO und KBNO stellen die indirekten Effekte mit dem MSK als Mediator dar. ***p < .001, **p < .01, *p < .05.

prüfen, (2) die Vorhersagbarkeit des MSKs und der MN durch die drei BNO anhand von Mehrebenen-Pfadmodellen zu erfassen und (3) mögliche Mediatoreffekte des MSKs zwischen den drei BNO und den MN sowie (4) Interaktionseffekte für die SBNO auf der Individual- und Klassenebene mit der Klassendurchschnittsleistung (KL) zu spezifizieren. Die zentralen Ergebnisse dieser Studie lassen sich wie folgt zusammenfassen: Da bis heute noch keine Verfahren zur Erfassung der individuell präferierten BNO für Grundschulkinder vorliegen, wurde in einem ersten Schritt die faktorielle Validität von drei für diese Studie neu entwickelten Skalen zur Erfassung der IBNO, SBNO und KBNO bei Grundschulkindern untersucht. In Einklang mit den theoretischen Annahmen von Rheinberg (1980) und Hypothese 1 ließen sich für das erwartete Drei-Faktoren-Modell im Vergleich zu einem globalen Ein-Faktor-Modell und einem ZweiFaktoren-Modell eindeutig die besten testtheoretischen und faktorenanalytischen Befunde erzielen: Alle drei BNO-Skalen erreichten zufriedenstellende interne Konsistenzen und konnten sowohl in einer exploratorischen Hauptachsenanalyse als auch in mehreren konfirmatorischen Faktorenanalysen solide reproduziert werden. Empirische Evidenz ließ sich dagegen nur teilweise für Hypothese 2 feststellen, die von positiven Zusammenhängen zwischen dem MSK, der IBNO und den MN sowie negativen Zusammenhängen zwischen dem MSK, der SBNO und den MN ausging. In den bivariaten manifesten Pearson-Korrelationsanalysen zeigten sich für alle drei BNO hoch signifikant positive Zusammenhänge mit dem MSK und den MN. Die erwartungswidrigen positiven Korrelationen mit der SBNO erklären sich eventuell damit, dass alle Items der drei BNO-Skalen positiv formuliert sind und nur soziale Abwärtsvergleiche implizieren, die sich jedoch nicht wie soziale Aufwärtsvergleiche immer negativ auf das MSK auswirken dürften. Die Operationalisierung der Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55

SBNO scheint deshalb in der vorliegenden Studie mit dem Fokus auf soziale Abwärtsvergleiche nur für leistungsstärkere Schüler / -innen geeignet zu sein. Möglicherweise erklärt sich dadurch auch der vergleichsweise relativ geringe Mittelwert für diese Skala. Interessant sind dennoch die hoch signifikanten Interkorrelationen der drei BNO-Skalen, da diese darauf hindeuten, dass Grundschulkinder nahezu alle drei BNO gleichzeitig zur Einschätzung ihrer mathematischen Fähigkeiten anwenden, vor allem die IBNO und SBNO zusammen mit der KBNO, jedoch weniger die IBNO zusammen mit der SBNO. Die engeren Zusammenhänge zwischen der IBNO und KBNO sowie zwischen der SBNO und KBNO lassen sich vermutlich darauf zurückführen, dass die KBNO sich nicht auf Personen bezieht und sich deshalb als eher neutralerer Bezugsrahmen mit individuellen und sozialen Vergleichsmaßstäben gut kombinieren lässt. Die IBNO bezieht sich dagegen auf die eigene Person und grenzt sich insofern eindeutiger von der SBNO ab, als die SBNO eher auf die Leistungen der sozialen Bezugsgruppe rekurriert. Der signifikant positive Zusammenhang zwischen dem MSK und den MN lässt sich auch in die Befunde anderer Studien einreihen, wonach enge Zusammenhänge zwischen fachspezifischen Selbstkonzepten und Leistungen bestehen (z. B. Arens et al., 2016; Niepel et al., 2014). Relativ hoch fielen allerdings die Intraklassenkorrelationen für die einzelnen Skalen aus, die alle über dem kritischen Grenzwert von 5 % lagen (vgl. Lüdtke, Trautwein, Kunter & Baumert, 2006) und damit auf einen bedeutsamen Einfluss der Klassenebene auf die einzelnen Variablen hinweisen. Demzufolge scheint nicht nur das MSK, sondern auch die individuell präferierte BNO-Wahl vom Klassenkontext beeinflussbar zu sein. Der starke Einfluss der Klassenebene auf die BNO der Kinder könnte möglicherweise ein Hinweis darauf sein, dass die individuell präferierte BNO der Kinder auch die bevorzugte BNO-Wahl der jeweiligen Lehrkraft widerspiegelt. © 2017 Hogrefe


A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

Weitere interessante Befunde stellten sich ebenso in den Mehrebenen-Pfadanalysen heraus, in denen die Vorhersagbarkeit des MSKs und der MN durch die drei BNO in Abhängigkeit von der SBNO auf der Individual- und Klassenebene unter Kontrolle des Geschlechts überprüft wurde. Betrachtet wurden zwei Modelle, in denen direkte Pfade von den drei BNO auf das MSK und auf die MN sowie direkte Pfade vom MSK auf die MN modelliert wurden. In Modell 1 wurden zudem indirekte Effekte mit dem MSK als Mediator zwischen den drei BNO und den MN getestet und in Modell 2 zusätzlich Interaktionseffekte für die individuell präferierte und kollektiv erlebte SBNO mit der Klassendurchschnittsleistung (KL). Hypothese 3, die von positiven Effekten der IBNO und KBNO auf das MSK und die MN sowie negativen Effekten der SBNO auf das MSK und die MN ausging, kann jedoch nur einschränkend mit den durchgeführten Analysen bestätigt werden: Wie erwartet zeigten sich in beiden Modellen signifikant positive Effekte der IBNO und KBNO auf das MSK, jedoch nicht auf das MN und für die SBNO lagen schwach signifikant positive Effekte auf die MN vor. Grundschulkinder mit einer stärker ausgeprägten IBNO und KBNO weisen demzufolge ein höheres MSK auf. Dies stellt insofern einen neuen Erkenntnisfortschritt für die Selbstkonzeptforschung dar, als vorherige Studien bislang noch keine Effekte der KBNO auf fachspezifische Selbstkonzepte empirisch belegen konnten (vgl. Dickhäuser & Rheinberg, 2003). Zu fragen wäre in diesem Kontext, worauf sich die signifikanten Effekte der IBNO und KBNO sowie die nichtsignifikanten Effekte der SBNO auf das MSK zurückführen lassen. Eine mögliche Erklärung wäre ein anderes Lernverhalten, eine andere Lernmotivation oder auch eine andere Zielorientierung der Kinder: So lässt sich z. B. naheliegend annehmen, dass Kinder, die danach streben, ihre Leistungen stets verbessern zu wollen oder einfach nur die Kriterien der Aufgaben erfüllen wollen, sich mehr für das Lernen motivieren können und sich deshalb mehr anstrengen als solche Kinder, die ihre eigenen Leistungen immer mit den Leistungen anderer – eventuell sogar leistungsstärkerer – Kinder vergleichen. Soziale Aufwärtsvergleiche sollten sich dagegen negativ auf die Lernmotivation und das Selbstkonzept auswirken, was sich letztlich in einem ungünstigeren Lernverhalten widerspiegeln dürfte. Wie in anderen Studien (z. B. Arens et al., 2016; Pinxten et al., 2014) und in Einklang mit Hypothese 4 erwies sich das MSK zudem in beiden Modellen als hoch signifikant positive Determinante für die MN. Besonders aufschlussreich sind die signifikant positiven Effekte der kollektiv erlebten SBNO (SBNO_K) und der Klassendurchschnittsleistung (KL) auf die MN, wonach Grundschulkinder bessere MN erreichen, wenn die meisten Kinder in der Klasse eher eine SBNO zur Beurteilung ihrer mathematischen Fähigkeiten anwenden und bessere Mathematiknoten haben. © 2017 Hogrefe

51

Diese Effekte lassen schließlich den Schluss zu, dass die mit der SBNO einhergehenden sozialen Vergleichsprozesse für das Erbringen von besseren MN durchaus auch funktional sind. So kann davon ausgegangen werden, dass sich anhand von sozialen Vergleichsmaßstäben die eigenen Zielsetzungen auch gut mit der sozialen Umwelt und den Erwartungen anderer Personen anpassen lassen (vgl. Lüdtke & Köller, 2002). Dies unterstreicht ebenso der leicht signifikant positive Effekt der SBNO auf die MN, wonach Kinder mit einer stärker ausgeprägten SBNO bessere MN erreichen. Darüber hinaus lässt sich wie für fachspezifische Selbstkonzepte und Leistungen nicht ausschließen, dass zwischen BNO und Noten reziproke Zusammenhänge bestehen, die in der vorliegenden Studie jedoch nicht untersucht wurden. Dennoch kann ebenso davon ausgegangen werden, dass Kinder mit besseren MN gerade deswegen soziale Vergleiche mit schlechteren Mitschülerinnen und Mitschülern bzw. soziale Abwärtsvergleiche anstellen, um z. B. ihr Selbstkonzept in diesem Fach zu stärken. Zukünftige Studien in diesem Kontext sollten deshalb immer beide Wirkrichtungen untersuchen. Erklärungsbedürftig sind in der vorliegenden Studie zudem die nicht gefundenen, jedoch zu erwartenden negativen Effekte der KL auf das MSK, da zahlreiche Studien relativ robust auf derartige BFLPE hinweisen (Marsh et al., 2015; Nagengast & Marsh, 2012; Niepel et al., 2014; Pinxten et al., 2015). In der vorliegenden Studie fanden sich lediglich sehr schwache und nicht signifikante negative Effekte der KL auf das MSK. Eine mögliche Erklärung für dieses erwartungswidrige Ergebnis wäre, dass die Kinder in dieser Studie sich überwiegend in mittelstarken bzw. eher leistungsschwächeren Klassen befanden, da ihre MN insgesamt nur zufriedenstellend ausfielen. Soziale Vergleiche scheinen für das MSK von Kindern in leistungsschwächeren Klassen deshalb weniger eine Rolle zu spielen als individuelle oder kriteriale Vergleiche. Dies verdeutlichen in der vorliegenden Studie auch die signifikanten positiven Effekte der IBNO und KBNO auf das MSK, der im Vergleich zu den anderen BNO relativ geringere Mittelwert sowie die geringeren Korrelationen der SBNO mit dem MSK, während die SBNO sich nicht signifikant negativ auf das MSK in der hier berechneten Regressionsanalyse auswirkte. Weitere Studien sollten die Befunde der vorliegenden Studie deshalb in sehr unterschiedlich leistungsstarken Klassen überprüfen. Bemerkenswert sind in der vorliegenden Studie nicht zuletzt die signifikanten Mediatoreffekte des MSKs zwischen der IBNO und den MN sowie zwischen der KBNO und den MN. Für die SBNO ließ sich dagegen keine signifikante Mediatorwirkung des MSKs zwischen den BNO und den MN feststellen. Hypothese 5 kann deshalb nur teilweise als gültig angesehen werden. Die signifikanten Mediatoreffekte legen damit einen weiteren in der SelbstkonZeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55


52

zeptforschung bislang noch unbekannten Befund nahe: Grundschulkinder mit einer stärker ausprägten IBNO und KBNO weisen – vermittelt über das MSK – bessere MN auf. Diese Ergebnisse entsprechen auch den Annahmen des Erwartung-mal-Wert-Modells von Eccles (1983), wonach fachspezifische Selbstkonzepte als bedeutsamer Mediator zwischen distaleren Lernmerkmalen wie z. B. früheren Lernerfahrungen, Kausalattributionen oder Rückmeldungen wichtiger Bezugspersonen und fachspezifischen Leistungen beschrieben werden.

Limitationen Die vorliegende Studie weist mehrere Limitationen auf: Eine erste Limitation betrifft die selektive Stichprobe, da ausschließlich Grundschulkinder der 4. Jahrgangsstufe aus dem nördlichen Raum Deutschlands befragt wurden. Die Befunde von Dickhäuser und Galfe (2004) zeigen z. B., dass jüngere Kinder aufgrund ihrer geringeren kognitiven Reife weniger soziale Vergleichsinformationen nutzen und eher temporale oder dimensionale Vergleichsmaßstäbe zur Beurteilung ihrer Leistungen heranziehen. So lässt sich nicht ausschließen, dass Grundschulkinder verschiedener Altersstufen sich in der Anwendung von BNO auch unterscheiden. Eine weitere Limitation bezieht sich auf die für diese Studie neu generierten BNO-Skalen, da diese bislang noch nicht in anderen Studien überprüft wurden. Kritisch anzusehen ist vor allem die Operationalisierung der drei BNO, da alle Items für die drei BNO-Skalen nicht nur die Richtung des Vergleichs bzw. den jeweiligen Referenzrahmen, sondern auch eine Leistungsbewertung beinhalten (z. B. „Ich finde mich gut in Mathe, wenn ich mehr kann als andere“). Dennoch kann eine mögliche Konfundierung mit dem MSK in der vorliegenden Studie auch ausgeschlossen werden, da sich in einer zusätzlich berechneten CFA die drei BNO-Skalen und die MSK-Skala eindeutig voneinander trennen ließen (χ2 = 195.909, df = 124, χ2/df = 1.2493, CFI = .976, TLI = .971, RMSEA = .038). Weitere Studien wären jedoch wünschenswert, die die Messqualität dieses Instruments schärfen. Als problematisch anzusehen wäre zudem das Querschnittsdesign der vorliegenden Studie, da sich auf einer querschnittlichen Datenebene lediglich Hinweise auf prädiktive Zusammenhänge gewinnen lassen. Längsschnittstudien müssen deshalb die berichteten Befunde dieser Studie untermauern. Auch eine Übertragung der Befunde auf andere Schulfächer kann mit den Daten nicht gewährleistet werden, da in dieser Studie ausschließlich das Fach Mathematik fokussiert wurde. Zukünftige Studien sollten deshalb ein breiteres Spektrum Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55

A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

von Schulfächern untersuchen, um die (prädiktiven) Zusammenhänge in dieser Studie auch für andere Schulfächer zu belegen. Besonders interessant zu untersuchen wäre z. B. das Fach Sport, da in sportbezogenen Lern- und Leistungskontexten soziale Vergleichsprozesse nahezu forciert werden. Hinweise darauf geben z. B. die Befunde von Gerlach (2006), Gerlach, Trautwein und Lüdtke (2007) oder Lohbeck und Kollegen (2014). So lässt sich naheliegend annehmen, dass Kinder im öffentlichen Sportsetting eher eine SBNO zur Leistungsbewertung anwenden, da sie z. B. auf dem Sportplatz sofort sehen, wer bei einem Ausdauerlauf als Erstes durch das Ziel läuft. Darüber hinaus stellt sich grundsätzlich die Frage, ob die individuell präferierte BNO der Kinder im Grundschulalter auch stabile Merkmale darstellen bzw. ob Kinder im Laufe der Grundschulzeit durch die zunehmenden Lernerfahrungen ihre individuell präferierte BNO-Wahl noch verändern. Auch dafür wären Längsschnittstudien notwendig und sicherlich gewinnbringend. Trotz dieser Limitationen legt die vorliegende Studie ein wichtiges Ergebnis nahe, das in der Selbstkonzeptforschung bislang noch nicht bekannt ist: Grundschulkinder im 4. Schuljahr entwickeln ein höheres MSK, wenn sie entweder eine IBNO oder eine KBNO zur Einschätzung ihrer mathematischen Fähigkeiten anwenden. Daraus lässt sich als wichtige Implikation für die Schulpraxis schließen: Lehrkräfte sollten die IBNO und KBNO von Grundschulkindern mehr fördern, um Kindern zu einem höheren MSK zu verhelfen. Die SBNO scheint dagegen nur für die Vorhersage der MN eine bedeutsame Rolle zu spielen, jedoch nicht für das MSK, was in Hinblick auf die Selbstkonzeptentwicklung als ein pädagogisch wünschenswerter Befund angesehen werden kann, da soziale Vergleiche sich häufig negativ auf das Selbstkonzept auswirken (z. B. Marsh et al., 2015; Nagengast & Marsh, 2012; Pinxten et al., 2015).

Danksagung Ich danke allen Schülern/-innen, Lehrkräften und beteiligten Studierenden der Universität Oldenburg für die großartige Unterstützung bei den Datenerhebungen, vor allem Michael Bartling für die Organisation der Studie und Mara Krone sowie den Gutachtern/-innen für die wertvollen Anregungen zur Verbesserung des Manuskripts.

Literatur Arens, A. K., Marsh, H. W., Craven, R. G., Yeung, A. S., Randhawa, E. & Hasselhorn, M. (2016). Math self-concept in preschool child© 2017 Hogrefe


A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

ren: Structure, achievement relations, and generalizability across gender. Early Childhood Research Quarterly, 36, 391–403. Arens, A. K. & Morin, A. J. S. (2016). Examination of the structure and grade-related differentiation of multidimensional selfconcept instruments for children using ESEM. Journal of Experimental Education, 84, 330–355. Arens, A. K., Trautwein, U. & Hasselhorn, M. (2011). Erfassung des Selbstkonzepts im mittleren Kindesalter: Validierung einer deutschen Version des SDQ I. Zeitschrift für Pädagogische Psychologie, 25, 131–144. Arens, A. K., Yeung, A. S., Craven, R. G. & Hasselhorn, M. (2013). A short German version of the Self-Description Questionnaire I: theoretical and empirical comparability. International Journal of Research & Method in Education, 36, 415–438. Breuker, J. J. & Rost, D. H. (2011). Diagnose und Förderung von Selbstkonzepten in der Grundschule. In F. Hellmich (Hrsg.), Selbstkonzepte im Grundschulalter. Modelle, empirische Ergebnisse, pädagogische Konsequenzen (S. 231–246). Stuttgart: Kohlhammer. Bühner, M. (2011). Einführung in die Test- und Fragebogenkonstruktion (3., aktual. und erw. Aufl.). München: Pearson Studium. Byrne, B. M. (2012). Structural equation modeling with Mplus: Basic concepts, applications, and programming. New York: Routledge. Chen, S. K., Hwang, F. M., Yeh, Y. C. & Lin, S. S. J. (2012). Cognitive ability, academic achievement and academic self-concept: Extending the internal / external frame of reference model. British Journal of Educational Psychology, 82, 308–326. Cialdini, R. B. & Richardson, K. D. (1980). Two indirect tactics of image management: Basking and blasting. Journal of Personality and Social Psychology, 39, 406–415. Cimeli, P., Neuenschwander, R., Röthlisberger, M. & Roebers, C. M. (2013). Das Selbstkonzept von Kindern in der Schuleingangsphase. Ausprägung und Struktur sowie Zusammenhänge mit frühen kognitiven Leistungsindikatoren. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 45, 1–13. Dickhäuser, O. (2003). Überprüfung des erweiterten Modells des internal / external frame of reference. Zeitschrift für Pädagogische Psychologie, 35, 200–207. Dickhäuser, O. & Galfe, E. (2004). Besser als …, schlechter als …. Leistungsbezogene Vergleichsprozesse in der Grundschule. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 36, 1–9. Dickhäuser, O. & Rheinberg, F. (2003). Bezugsnormorientierung: Erfassung, Probleme, Perspektiven. In J. Stiensmeier-Pelster & F. Rheinberg (Hrsg.), Diagnostik von Motivation und Selbstkonzept (S. 41–55). Göttingen: Hogrefe. Dickhäuser, O. & Stiensmeier-Pelster, J. (2000). Motivationale Orientierung und Selbstkonzept eigener Begabung – zwei unabhängige Konstrukte? Poster vorgestellt auf dem 20. Motivationspsychologischen Kolloquium, Dortmund. Eccles, J. S. (1983). Expectancies, values and, academic choice. In J. Spence (Ed.), Achievement and achievement motivation (pp. 87–134). San Francisco: W. H. Freeman. Ehm, J.-H., Duzy, D. & Hasselhorn, M. (2011). Das akademische Selbstkonzept bei Schulanfängern. Spielen Geschlecht und Migrationshintergrund eine Rolle? Frühe Bildung, 0, 37–45. Ehm, J.-H., Nagler, T., Lindberg, S. & Hasselhorn, M. (2014). Dimensionale Vergleichseffekte zwischen Lesen, Rechtschreiben und Rechnen. Eine Erweiterung des I / E-Modells für die Grundschule. Zeitschrift für Pädagogische Psychologie, 28, 51–56. Festinger, L. (1954). A theory of social comparison processes. Human Relations, 7, 117–140. Gerlach, E. (2006). Selbstkonzepte und Bezugsgruppeneffekte. Entwicklung selbstbezogener Kognitionen in Abhängigkeit von der sozialen Einheit. Zeitschrift für Sportpsychologie, 13, 104–114. © 2017 Hogrefe

53

Gerlach, E., Trautwein, U. & Lüdke, O. (2007). Referenzgruppeneffekte im Sportunterricht. Zeitschrift für Sportpsychologie, 38, 73–83. Harter, S. (2012). The construction of the self: A developmental perspective (Vol. 2). New York: Guilford Press. Hellmich, F. & Günther, F. (2011). Entwicklung von Selbstkonzepten bei Kindern im Grundschulalter. In F. Hellmich (Hrsg.), Selbstkonzepte im Grundschulalter (S. 19–46). Stuttgart: Kohlhammer. Ju, S., Zhang, D. & Katsiyannis, A. (2013). The causal relationship between academic self-concept and academic achievement for students with disabilities: An analysis of SEELS data. Journal of Disability Policy Studies, 24, 4–14. Kastens, C., Gabriel, K. & Lipowsky, F. (2013). Selbstkonzeptentwicklung im Anfangsunterricht. Persönlichkeits- und Lernentwicklung an staatlichen und privaten Grundschulen. Ergebnisse der PERLE-Studie zu den ersten beiden Schuljahren. Münster: Waxmann. Köller, O. (2004). Konsequenzen von Leistungsgruppierungen. Münster: Waxmann. Köller, O. (2005). Bezugsnormorientierung von Lehrkräften: Konzeptuelle Grundlagen, empirische Befunde und Ratschläge für praktisches Handeln. In R. Vollmeyer & J. Brunstein (Hrsg.), Motivationspsychologie und ihre Anwendung (S. 189–202). Stuttgart: Kohlhammer. Liou, P. Y. (2014). Investigation of the big-fish-little-pond effect on students’ self-concept of learning mathematics and science in Taiwan: Results from TIMSS 2011. Asia-Pacific Education Researcher, 23, 769–778. Lohbeck, A. Tietjens, M. & Bund, A. (2014). Das physische Selbstkonzept, die individuell präferierte Bezugsnormorientierung und die Zielorientierung bei Grundschulkindern der zweiten und vierten Jahrgangsstufe. Zeitschrift für Sportpsychologie, 21, 1–12. Lüdtke, O. & Köller, O. (2002). Individuelle Bezugsnormorientierung und soziale Vergleiche im Mathematikunterricht. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 34, 156–166. Lüdtke, O., Trautwein, U., Kunter, M. & Baumert, J. (2006). Analyse von Lernumwelten. Zeitschrift für Pädagogische Psychologie, 20, 85–96. Marsh, H. W. (1986). Verbal and math self-concepts: An internal external frame of reference model. American Educational Research Journal, 23, 129–149. Marsh, H. W. (1987). The big-fish-little-pond-effect on academic self-concept. Journal of Educational Psychology, 79, 280–295. Marsh, H. W. (2005). Big-fish-little-pond-effect on academic selfconcept. Zeitschrift für Pädagogische Psychologie, 19, 119–127. Marsh, H. W., Abduljabbar, A. S., Morin, A. J. S., Parker, P., Abdelfattah, F., Nagengast, B. et al. (2015). The big-fish-little-pond effect: Generalizability of social comparison processes over two age cohorts from Western, Asian, and Middle Eastern Islamic countries. Journal of Educational Psychology, 107, 258–271. Marsh, H. W. & Craven, R. G. (2006). Reciprocal effects of self-concept and performance from a multidimensional perspective: Beyond seductive pleasure and unidimensional perspectives. Perspectives on Psychological Science, 1, 133–163. Marsh, H. W. & Martin, A. J. (2011). Academic self-concept and academic achievement: Relations and causal ordering. British Journal of Educational Psychology, 81, 59–77. Marsh, H. W., Trautwein, U., Lüdtke, O., Baumert, J. & Köller, O. (2007). The big-fish-little-pond effect: Persistent negative effects of selective high schools on self-concept after graduation. American Educational Research Journal, 44, 631–669. Möller, J. & Marsh, H. W. (2013). Dimensional Comparison Theory. Psychological Review, 120, 544–560 Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55


54

Möller, J. & Trautwein, U. (2015). Selbstkonzept. In E. Wild & J. Möller (Hrsg.), Pädagogische Psychologie (S. 177–199). Heidelberg: Springer. Muthén, L. K. & Muthén, B.O. (1998–2014). Mplus User's Guide. Seventh Edition. Los Angeles, CA: Muthén & Muthén. Nagengast, B. & Marsh, H. W. (2012). Big fish in little ponds aspire more: Mediation and cross-cultural generalizability of schoolaverage ability effects on self-concept and career aspirations in science. Journal of Educational Psychology, 104, 1033–1053. Niepel, C., Brunner, M. & Preckel, F. (2014). Achievement goals, academic self-concept, and school grades in mathematics: Longitudinal reciprocal relations in above average ability secondary school students. Contemporary Educational Psychology, 39, 301–313. Pinxten, M., Marsh, H. W., De Fraine, B., Van Den Noortgate, W. & Van Damme, J. (2014). Enjoying mathematics or feeling competent in mathematics? Reciprocal effects on mathematics achievement and perceived math effort expenditure. British Journal of Educational Psychology, 84, 152–174. Pinxten, M., Wouters, S., Preckel, F., Niepel, C., De Fraine, B. & Verschueren, K. (2015). The formation of academic self-concept in elementary education: A unifying model for external and internal comparisons. Contemporary Educational Psychology, 41, 124–132. Poloczek, S., Karst, K., Praetorius, A.-K. & Lipowsky, F. (2011). Generalisten oder Spezialisten? Bereichsspezifizität und leistungsbezogene Zusammenhänge des schulischen Selbstkonzepts von Schulanfängern. Zeitschrift für Pädagogische Psychologie, 25, 173–183. Rheinberg, F. (1980). Leistungsbewertung und Lernmotivation. Göttingen: Hogrefe. Rheinberg, F. (2014). Bezugsnormen und schulische Leistungsbeurteilung. In F. E. Weinert (Hrsg.), Leistungsmessungen in Schulen (3. Aufl., S. 59–71). Weinheim: Beltz. Rheinberg, F. & Fries, S. (2010). Bezugsnormorientierung. In D. H. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (4., überarb. Aufl., S. 61–68). Weinheim: Beltz. Satorra, A. & Bentler, P. M. (2001). A scaled difference chi-square test statistic for moment structure analysis. Psychometrika, 66, 507–514. Seaton, M., Parker, P., Marsh, H. W., Craven, R. G. & Yeung, A. S. (2014). The reciprocal relations between self-concept, motivation and achievement: juxtaposing academic self-concept and achievement goal orientations for mathematics success. Educational Psychology, 34, 49–72.

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55

A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

Shavelson, R. J., Hubner, J. J. & Stanton, G. C. (1976). Validation of construct interpretations. Review of Educational Research, 46, 407–441. Trautwein, U., Köller, O. & Kämmerer, E. (2002). Effekte innerer und äußerer Leistungsdifferenzierung auf selbstbezogene Fähigkeitskognitionen, die wahrgenommene Unterrichtspartizipation und die wahrgenommene soziale Akzeptanz. Psychologie in Erziehung und Unterricht, 49, 237–286. Trautwein, U. & Lüdtke, O. (2005). The Big-fish-little-pond-effect: Future research questions and educational implications. Zeitschrift für Pädagogische Psychologie, 19, 137–140. Trautwein, U., Lüdtke, O., Marsh, H. W. & Nagy, G. (2009). Withinschool social comparison: How students' perceived standing of their class predicts academic self-concept. Journal of Educational Psychology, 101, 853–866. Weiber, R. & Mühlhaus, D. (2014). Strukturgleichungsmodellierung: Eine anwendungsorientierte Einführung mit Hilfe von AMOS, SmartPLS und SPSS (2. Aufl.). Heidelberg: Springer. Wilbert, J. & Gerdes, H. (2009). Die Bezugsnormwahl bei der Bewertung schulischer Leistungen durch angehende Lehrkräfte des Förderschwerpunktes Lernen. Heilpädagogische Forschung, 35, 122–132. Zeinz, H. & Köller, O. (2006). Noten, soziale Vergleiche und Selbstkonzepte in der Grundschule. In A. Schründer-Lenzen (Hrsg.), Risikofaktoren kindlicher Entwicklung, Migration, Leistungsangst und Schulübergang (S. 177–190). Wiesbaden: VS Verlag für Sozialwissenschaften.

Manuskript eingereicht: 06.03.2016 Nach Revision angenommen: 01.09.2016 Interessenkonflikt: Nein

Dr. Annette Lohbeck Verwaltung der Professur für Empirische Bildungsforschung Universität Vechta Burgstr. 18 Raum: H205 49377 Vechta Deutschland annette.lohbeck@uni-vechta.de annette.lohbeck@uni-oldenburg.de

© 2017 Hogrefe


A. Lohbeck, Bezugsnormorientierung und Selbstkonzept

55

Anhang Anhang A. Skalen zur Schüler-Bezugsnormorientierung Ich finde mich gut in Mathe, … 1. …, wenn ich mehr kann als andere. (SBNO) 2. …, wenn ich alle Aufgaben schaffe. (KBNO) 3. …, wenn ich in einer Arbeit besser bin als andere. (SBNO) 4. …, wenn ich beim Üben immer besser werde. (IBNO) 5. …, wenn ich alle Aufgaben schnell kann. (KBNO) 6. …, wenn ich eine Aufgabe schneller kann als andere. (SBNO) 7. …, wenn ich alle Aufgaben gut mache. (KBNO) 8. …, wenn ich bei jedem Üben bessere Ergebnisse habe als vorher. (IBNO) 9. …, wenn ich alle Aufgaben richtig mache.(KBNO) 10. …, wenn ich bei jedem Üben mehr kann als vorher. (IBNO) 11. …, wenn ich die besten Noten in der Klasse habe. (SBNO) 12. …, wenn ich alle Aufgaben gut verstehe. (KBNO) Anmerkungen. SBNO = soziale Bezugsnormorientierung, KBNO = kriteriale Bezugsnormorientierung, IBNO = individuelle Bezugsnormorientierung. Alle Items wurden auf einer vierstufigen Likert-Skala von 1 = stimmt nicht, 2 = stimmt wenig, 3 = stimmt fast bis 4 = stimmt genau von den Kindern eingeschätzt.

Anzeige

Helmut Lukesch (Hrsg.)

Auffälligkeiten im Erleben und Verhalten von Kindern und Jugendlichen Helmut Lukesch (Hrsg.)

Auffälligkeiten im Erleben und Verhalten von Kindern und Jugendlichen Handlungsmöglichkeiten für Lehrkräfte

Handlungsmöglichkeiten für Lehrkräfte

Kinder und Jugendliche können verschiedenste Auffälligkeiten im Erleben und Verhalten zeigen. Der Band vermittelt Lehrkräften notwendiges Hintergrundwissen und gibt Anleitung, wie Schülerinnen und Schüler mit psychischen Auffälligkeiten, Lernstörungen und andere Schwierigkeiten effektiv unterstützt werden können.

2016, 440 Seiten, € 39,95 / CHF 48.50 ISBN 978-3-8017-2746-8 Auch als eBook erhältlich

www.hogrefe.com

© 2017 Hogrefe

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 41–55


AFS

KAT-III

Angstfragebogen für Schüler

Kinder-Angst-Test-III

7., überarbeitete und neu normierte Auflage W. Wieczerkowski / H. Nickel / A. Janowski / B. Fittkau / W. Rauer / F. Petermann Einsatzbereich: 9 bis 18 Jahre (4. bis 12. Schulklasse). Einzelund Gruppensetting. Verwendung zur Erfassung des Ausmaßes der Angstatmosphäre in Schulklassen und als Material für Selbsterfahrungsgruppen, zur individuellen Diagnostik, Therapiekontrolle sowie als Forschungsinstrument zur Erfassung der Angstkomponenten in psychologischen, soziologischen und pädagogischen Untersuchungen. Das Verfahren: Der AFS ist ein mehrfaktorieller Fragebogen, der die ängstlichen und unlustvollen Erfahrungen von Schülerinnen und Schülern unter drei Aspekten erfasst: Prüfungsangst (PA), allgemeine (manifeste) Angst (MA) und Schulunlust (SU). Ferner enthält der AFS eine Skala zur Erfassung der Tendenz von Schülerinnen und Schülern, sich angepasst und sozial erwünscht darzustellen (SE). Der AFS ist seit vielen Jahren in der schulpsychologischen und klinischen Praxis fest etabliert. Das Verfahren wurde im Jahre 2015 neu normiert. Dabei wurde der Einsatzbereich verändert. Er reicht nun von der 4. bis zur 12. Schulklasse (statt von der 3. bis zur 10. Schulklasse). Der Altersbereich wurde erweitert und reicht nun von 9 bis 18 Jahren (statt von 9 bis 16/17 Jahren). Im Unterschied zur sechsten Auflage entfallen die Einschätzskalen zur Fremdbeurteilung durch Lehrkräfte. Bearbeitungsdauer: Je nach Altersstufe 10 bis 25 Minuten.

02 002 01 Test komplett

128,00 €

Testbatterie zur Erfassung der Ängstlichkeit und von Zustandsängsten bei Kindern und Jugendlichen A. Tewes / A. Naumann Einsatzbereich: Kinder und Jugendliche von 6 bis 18 Jahren. Einzelund Gruppentest. Verwendung in der Schulpsychologie, Erziehungsberatung, Klinik und Pädagogik bei Leistungs- und Verhaltensauffälligkeiten sowie in der Forschung.

Das Verfahren: Der im deutschsprachigen Raum gut eingeführte Kinder-Angst-Test zur Erfassung des dispositionellen Ängstlichkeitsgrades (Trait-Skala) liegt nun als revidierte, neu standardisierte Fassung vor. Einige Items wurden gegenüber der Vorgängerversion sprachlich angepasst. Das Verfahren wird weiterhin durch zwei aktuell evaluierte, zusätzlich einsetzbare Angstzustandsskalen (State-Skalen) ergänzt: Form P (Prospektiv) ermöglicht die Selbsteinschätzung akuter Erwartungsangst vor furchtbesetzten Ereignissen, z.B. vor Klassenarbeiten oder Arztbesuchen. Form R (Retrospektiv) erlaubt dem Schulkind im Anschluss an derartige Situationen, seine tatsächlich erlebten Angstreaktionen zu charakterisieren. Mit beiden Skalen kann also der akute emotionale Erlebniszustand an einem oder mehreren Zeitpunkten einer Angstepisode erfasst und ggf. miteinander verglichen werden. Neu ist der optional einsetzbare Explorationsbogen für Eltern- oder Bezugspersonen, mit dem insbesondere im klinischen Alltag die mittels der Fragebögen erfassten eigenanamnestischen Angaben des Kindes bzw. des Jugendlichen um wertvolle Informationen ergänzt werden können. In diesem werden sowohl allgemeine störungsunabhängige als auch störungsspezifische anamnestische Informationen im Hinblick auf die Diagnosestellung nach ICD-10 erfasst. Der Bogen wurde vor allem zur Anwendung durch klinisch erfahrenes Personal entwickelt, kann jedoch auch anderen Nutzern der Testbatterie wertvolle Informationen liefern. Bearbeitungsdauer: Etwa 5 bis 15 Min. für Form A, 5–10 Min. für die Formen P und R. Ca. 30–60 Min. für die Exploration der Bezugspersonen.

01 082 01 www.KRJUHIH FRP

Test komplett

www.KRJUHIH FRP

120,00 €


Originalartikel

Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse Katrin Lintorf1, Susanne R. Buch1, Jörn R. Sparfeldt2 und Detlef H. Rost3 1 2 3

Bergische Universität Wuppertal Universität des Saarlandes Philipps-Universität Marburg und Southwest University Chongqing

Zusammenfassung: Das Konstrukt „Anstrengungsvermeidung“ (Rollett & Bartram, 1998) geht mit ungünstigen Ausprägungen in motivationalen, affektiven sowie kognitiven Merkmalen einher. Zudem sollen sich zwei Anstrengungsvermeidungstypen abgrenzen lassen. Bislang existieren jedoch nur wenige Belege für die Unterscheidbarkeit verschiedener Typen. Anhand einer Gymnasialstichprobe (N = 1079; 8./9. Klassenstufe) wurde untersucht, ob sich unter Berücksichtigung kognitiver, motivationaler und affektiver Merkmale (zwei) Anstrengungsvermeidungsgruppen differenzieren und validieren lassen. Latente Profilanalysen sprachen für drei oder vier Klassen. Die Drei-Klassen-Lösung zeigte im Wesentlichen niveauverschiedene Profile. Die Vier-Klassen-Lösung ergab zwei Klassen mit durchschnittlichen bzw. unterdurchschnittlichen Anstrengungsvermeidungswerten („Unauffällige“ bzw. „Mustergültige“). Zudem resultierten zwei Anstrengungsvermeidungsklassen mit jeweils ungünstigen Profilen in den Analyse- und Validierungsvariablen. Sie unterscheiden sich weniger in der Ausprägung kognitiver, sondern eher in der Ausprägung motivationaler wie affektiver Merkmale („Desinteressierte“ vs. „Ängstliche“). Die Befunde werden vor dem Hintergrund differenzieller Interventionsansatzpunkte diskutiert. Schlüsselwörter: Anstrengungsvermeidung, Leistungsängstlichkeit, Selbstkonzept, Zielorientierungen, latente Profilanalyse Effort Avoiders: Listless or Helpless? A Latent Profile Analysis Abstract: The construct of “effort avoidance” (Rollett & Bartram, 1998) is associated with unfavorable motivational, affective, and cognitive attributes. Additionally, a distinction can be made between two types, though empirical support for these different types of effort avoiders is rare. This paper tests the discriminability of (two) types of effort avoiders in a sample of high-school students (N = 1,079; grades 8–9), taking motivational, affective, and cognitive attributes into consideration. Latent profile analyses revealed solutions with three or four classes. The threeclass model displayed latent classes with (mainly) differing levels of the profiles. The four-class model revealed two classes with average vs. below-average effort-avoidance scores (“unremarkable” vs. “exemplary” students). Additionally, the model distinguished between two classes of effort avoiders, each showing an unfavorable profile in the attributes used for classification and validation. These classes differed less in cognitive attributes and more in motivational and affective variables (“indifferent” vs. “anxious” students). The results are discussed with regard to differential intervention strategies. Keywords: effort avoidance, test anxiety, self-concept, goal orientations, latent profile analysis

Einleitung Neben kognitiven, affektiven und volitionalen Eigenschaften gelten motivationale Merkmale als wichtige Determinanten schulischen Lernens (z. B. Hattie, 2015). Entsprechend ist die Identifikation und Förderung von Schülern1 mit motivationalen Defiziten eine zentrale pädagogischpsychologische Aufgabe. Ein in der Beratungspraxis verbreitetes Verfahren zur Diagnose solcher Defizite ist der Anstrengungsvermeidungstest (AVT) von Rollett und Bartram (1977, 1998). Unter Anstrengungsvermeidung verstehen die Autoren „die Tendenz, sich den mit dem 1

Leistungseinsatz in bestimmten Tätigkeitsfeldern verbundenen, emotionell negativ erlebten Anstrengungen durch den aktiven Einsatz geeigneter Vermeidungsstrategien zu entziehen“ (Rollett & Bartram, 1998, S. 7). Anstrengungsvermeidung wird dann als Entlastung erlebt (Rollett, 2005). Anstrengungsvermeidende Schüler weisen nach Rollett und Bartram (1998) charakteristische Ausprägungen motivationaler, emotionaler sowie kognitiver Merkmale auf (z. B. mangelndes Interesse, emotionale Vernachlässigung, schlechtere Schulleistungen), wobei die Autoren auf Grundlage unterschiedlicher Arbeitsstile (desorganisiert vs. apathisch) zwei Typen von Anstren-

Aus Gründen der Lesbarkeit verwenden wir in diesem Beitrag das generische Maskulin.

© 2017 Hogrefe

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 57–68 DOI 10.1024/1010-0652/a000198


58

K. Lintorf et al., Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse

gungsvermeidern differenzieren. Allerdings liegen bislang nur wenige belastbare empirische Belege für diese Typologie vor. Ziel dieses Beitrags ist es, zu prüfen, ob sich diese und/oder andere Anstrengungsvermeidungstypen zeigen, um gegebenenfalls daraus differenzielle Konsequenzen für Diagnostik und Intervention abzuleiten.

Theoretischer Hintergrund und empirischer Forschungsstand Nachfolgend beschreiben wir zunächst das Konstrukt „Anstrengungsvermeidung“ und gehen auf die Anstrengungsvermeidungsdiagnostik sowie entsprechende Bezüge zu zentralen motivationalen, affektiven und kognitiven Merkmalen ein. Anschließend stellen wir die Befundlage zu Anstrengungsvermeidungstypen dar.

Anstrengungsvermeidung: Konstrukt und Genese In den 1970er Jahren fielen Rollett und Bartram (1977) in ihrer lerntherapeutischen Arbeit leistungsverweigernde Schüler auf, deren Störung anscheinend nicht durch klassische Leistungsmotivationskonzepte erklärbar war. In der traditionellen Motivationspsychologie wurde angenommen, dass Personen grundsätzlich leistungsmotiviert sind (wenn auch in unterschiedlichem Grad); hingegen sahen sich Rollett und Bartram (1998) mit einer nahezu „negative[n] Leistungsmotivation“ (S. 6) konfrontiert: der Anstrengungsvermeidung. Eine bereichsspezifische Anstrengungsvermeidungsmotivation entwickelt sich, wenn eine Person in einem bestimmten Handlungsbereich eine zielbezogene Tätigkeit wiederholt als aversiv erlebt, die Vermeidung der Tätigkeit aber nicht möglich und das Handlungsziel mit einem Anreizdefizit verbunden ist (Rollett & Rollett, 2010, 2013; s. auch die Kontroverse zwischen Jopt, 1982, 1984 und Rollett, 1983). Dysfunktional wird Anstrengungsvermeidung, sobald sie die Bewältigung des Alltags einschränkt oder gar zur Gefährdung eigener Lebensziele führt (Rollett, 1994b; Rollett & Bartram, 1998). Zur Erfassung der Anstrengungsvermeidung liegen Verfahren für unterschiedliche Zielgruppen vor (Schüler: z. B. Bild-AVT, Ambros, 1985; AVT, Rollett & Bartram, 1998; Berufsgruppen: z. B. AVT Arbeitnehmer, Bittner, 2000). Der für Schüler der 5. bis 9. Klasse konzipierte AVT erhebt neben besonderen Bemühungen bei der Erfüllung schulischer Routineaufgaben (Skala „Pflichteifer“ [PFL]) die Neigung, Anstrengungen im schulischen und häuslichen Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 57–68

Bereich zu vermeiden (Skala „Anstrengungsvermeidung“ [AV]). Die AV-Items basieren auf Ausreden lernschwacher, arbeitsunwilliger Schüler (Rollett & Bartram, 1977). Von den 27 AV-Items bilden 20 eine Rasch-homogene Skala. In Verfahren für andere Zielgruppen ließen sich allerdings – bei teilweise ähnlichen Itemformulierungen, aber anderem Antwortformat – neben einem PFL-Faktor teils mehrere AV-Faktoren interpretieren. So identifizierte Gashi (2011) anhand der Eigenwerte und des Scree-Tests drei Faktoren (Anstrengungsvermeidung als trait, Anstrengungsvermeidungsstrategien, Anstrengungsvermeidung im sozialen Kontext). Bezogen auf motivationale Spezifika hat Anstrengungsvermeidung eine hohe Ähnlichkeit zu motivationalen Konstrukten mit explizit meidungsbezogener Komponente. Entsprechend bestehen nur schwache Zusammenhänge zu annäherungsbezogenen Merkmalen wie Hoffnung auf Erfolg (Rollett & Rollett, 2010) oder AnnäherungsLeistungszielorientierung (r = .17; Spinath, StiensmeierPelster, Schöne & Dickhäuser, 2012), jedoch moderate Zusammenhänge zu meidungsbezogenen Merkmalen wie Furcht vor Misserfolg (zusammenfassend: Rollett & Rollett, 2010) oder Arbeitsvermeidung und VermeidungsLeistungszielorientierung (r = .41 bzw. r = .31; Spinath et al., 2012). Neben einer gewissen Ähnlichkeit legen diese moderaten Zusammenhänge aber auch eine Abgrenzbarkeit der erwähnten motivationalen Konstrukte zur Anstrengungsvermeidung nahe. So kann Misserfolgsmotivation durchaus mit zielbezogenem Verhalten kovariieren (ggf. in Form von Mogeln; Rollett & Rollett, 2010), und der Arbeitsvermeidung fehlt die Betonung des affektiven Erlebens (Spinath et al., 2012). Anstrengungsvermeidung ist dagegen eng an das Erleben negativer Emotionen geknüpft. Dies spiegeln auch Befunde zu verschiedenen Ängstlichkeitsmaßen wider (für frühe Befunde s. Borchert & Masendorf, 1975). So resümierten Sirsch und Jirasko (1996) einen Zusammenhang von etwa r = .30 zwischen Prüfungsängstlichkeit und Anstrengungsvermeidung, teilweise wurden auch höhere Korrelationen ermittelt (z. B. r = .52/.35 für Jungen/Mädchen bei Jirasko & Sirsch, 1996; r = .39 für Leistungsängstlichkeit bei Helmke & Rheinberg, 1996). Vor allem aber beschreiben Rollett und Bartram (1998) Anstrengungsvermeidungsmotivierte als hilflos im Umgang mit negativen Emotionen, was sich in lageorientiertem Verhalten äußert (z. B. r = –.36/–.46 mit der prospektiven Handlungskontrolle bei Schülern der 3. und 4. Klasse; Helmke & Mückusch, 1994). Bezüge zu positiv getönten Emotionen sind dagegen bislang kaum erforscht. Zur Lernfreude, verstanden als affektive Komponente des fachspezifischen Interesses, ermittelten Helmke und Rheinberg (1996) schwach negative Zusammenhänge (r = –.29/–.31 für Deutsch/Mathematik), während Rollett (2005) anstrengungsmeidende Schüler als © 2017 Hogrefe


K. Lintorf et al., Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse

mitunter besonders positiv gestimmt charakterisiert. Der dominante negative Affekt bei Anstrengungsvermeidungsmotivierten behindert selbst dann zielbezogene Aktivitäten, wenn die Person zu deren Ausführung ausreichend befähigt wäre (Rollett & Bartram, 1998). Bezogen auf kognitive Merkmale bestätigen dies die eher schwachen Zusammenhänge der Anstrengungsvermeidung mit Intelligenzmaßen (Helmke & Rheinberg, 1996: r = –.16; Rollett, 2004: β = –.18; Rollett & Bartram, 1998: –.29 ≤ r ≤ –.07). Ähnliches gilt für die Selbsteinschätzung eigener Fähigkeiten: Zwar unterscheiden sich Personen mit hoher vs. niedriger Anstrengungsvermeidungstendenz in ihrem Fähigkeitsselbstkonzept (Jopt, 1982; Rollett, 2004), entsprechende Zusammenhänge sind aber gering bis mäßig (r = –.17/–.27; Helmke & Rheinberg, 1996). Diese Befunde scheinen gegen eine objektive wie auch eine subjektiv wahrgenommene Überforderung als generelle Ursache der Anstrengungsvermeidung zu sprechen. Allerdings werden in der Forschung zur Genese der Anstrengungsvermeidung Über-, aber auch Unterforderung als relevante Faktoren thematisiert (Rollett, 2004; Rollett & Hanfstingl, 2005). Zudem findet sich üblicherweise ein schwacher bis mittlerer Zusammenhang mit Schulnoten (z. B. .24 ≤ r ≤ .49 bei Rollett, 2005), wobei Leistungsdefizite sowohl Ursache als auch Folge der Anstrengungsvermeidung sein könnten. Zusammenfassend lassen sich bedeutsame bivariate Zusammenhänge zwischen Anstrengungsvermeidung und lernrelevanten Schülermerkmalen festhalten. Schüler mit hoher Anstrengungsvermeidungstendenz scheinen demnach weniger durch eine geringere intellektuelle Leistungsfähigkeit gekennzeichnet zu sein, sondern vielmehr durch motivationale und affektive Defizite sowie schlechtere Schulleistungen.

Anstrengungsvermeidungstypen Obwohl der AVT keine testdiagnostische Differenzierung verschiedener Anstrengungsvermeidungstypen vorsieht, trafen bereits Rollett und Bartram (1977) eine entsprechende Unterscheidung. Mit Cluster- und Diskriminanzanalysen ermittelten sie anhand der Testleistungen und benötigten Arbeitszeiten von Hauptschülern verschiedene Gruppen, von denen zwei eine hohe Anstrengungsvermeidung aufwiesen (bspw. Rollett & Bartram, 1974; Rollett, Bartram & Stodt, 1974). In Verbindung mit ihren Praxiserfahrungen beschreiben Rollett und Bartram (1977, 1998) diese Typen folgendermaßen: Der Anstrengungsvermeider mit desorganisiertem Arbeitsstil (Prävalenz: ca. 13 %) sei typischerweise ein Junge. Charakteristisch seien für ihn schlechte Schulleistungen, teilweise niedrige Testintelligenz, Ausübung unterrichtsferner Aktivitäten, kurze © 2017 Hogrefe

59

Arbeitszeiten, Aggression bei Leistungsanforderungen sowie eine Entwicklungsgeschichte mit emotionaler Vernachlässigung und überhöhten Leistungsanforderungen. Der Anstrengungsvermeider mit apathischem Arbeitsstil (Prävalenz: 20 % bis 30 %) weise ebenfalls schlechte Schulleistungen auf, sei aber eher durchschnittlich intelligent, habe Schwierigkeiten mit dem Beginn von Arbeiten, benötige lange Arbeitszeiten und wirke interessen-/teilnahmslos. Einen aktuelleren Beleg für Anstrengungsvermeidungstypen bieten Clusteranalysen von Helmke und Rheinberg (1996) im Rahmen der Grundschulstudie SCHOLASTIK. Im Gegensatz zu Rollett und Bartram (1974) bzw. Rollett et al. (1974) wählten die Autoren neben der Anstrengungsvermeidung verschiedene kognitive (Intelligenz, Schulleistung), affektive (Schulfreude, fachbezogene Lernfreude, Leistungsängstlichkeit), motivationale (Fähigkeitsselbstkonzept) und volitionale (Lernverhalten, Handlungs-/Lageorientierung) Schülermerkmale aus und berücksichtigten somit vier zentrale Bereiche lernrelevanter Personenmerkmale. Helmke und Rheinberg (1996) ermittelten vier Cluster, von denen zwei ein unauffälliges bis günstiges Profil aufwiesen. Die beiden anderen Cluster zeigten jedoch jeweils eine hohe und im Gruppenvergleich ähnlich ausgeprägte Anstrengungsvermeidung sowie Leistungsängstlichkeit. Eines dieser Cluster (22 % der Schüler, resignativer Typus) zeichnete sich zudem durch schlechte Schulnoten, eine geringe Intelligenz, ein niedriges Deutsch-Selbstkonzept, wenig Schulfreude und eine geringe Unterrichtsbeteiligung aus. Beim anderen Cluster (30 % der Schüler) waren diese Merkmale weniger ungünstig ausgeprägt; dafür zeigten diese Schüler starke Lernstörungen und eine ausgeprägte Lageorientierung. Helmke und Rheinberg (1996) interpretierten diese Profile sowie unterschiedliche Antwortmuster im AVT als Hinweis auf differenzielle Bedingungsfaktoren der Anstrengungsvermeidung: Beim letztgenannten Cluster vermuteten sie motivationale Defizite, beim resignativen Typus dagegen Überforderung. Wagner, Spiel und Tranker (2003) ermittelten bei Gymnasiasten und Hauptschülern der 6. und 7. Klasse anhand von Anstrengungsvermeidung, Pflichteifer und kognitiven Merkmalen drei Cluster. Überdurchschnittlich hohe Werte bei der Anstrengungsvermeidung wiesen nur die „Problemschüler“ auf. Ähnlich wie die „Fleißigen“ fielen sie durch schlechte Noten und eher unterdurchschnittliche Leistungen in einer schulleistungsnahen, verbalen Intelligenzskala auf. In einer figuralen, schulleistungsfernen Intelligenzskala lagen ihre Leistungen allerdings nah am Stichprobenmittelwert, zwischen denen der „Fleißigen“ und der „Musterschüler“. Beschreibungen von Anstrengungsvermeidungstypen beruhen also einerseits auf Praxiserfahrungen der TestauZeitschrift für Pädagogische Psychologie (2017), 31 (1), 57–68


60

K. Lintorf et al., Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse

toren und andererseits auf wenigen, größtenteils älteren Studien. Sofern in diesen nicht ausschließlich kognitive Merkmale berücksichtigt wurden, deuten die Befunde auf zwei unterscheidbare Typen von Schülern mit hoher Anstrengungsvermeidung hin. Die Beschreibung beider Typen ist durch kognitive, motivationale und affektive Defizite gekennzeichnet. Während bei dem einen Typus („resignativ“, „desorganisiert“) kognitive und tendenziell auch affektive Problematiken überwiegen, weist der andere („apathisch“) eher motivationale Defizite auf.

Forschungsfrage Die begrenzte Befundlage zu Anstrengungsvermeidungstypen verweist auf eine hohe Bedeutung kognitiver, aber insbesondere auch nichtkognitiver Merkmale. Die wenigen, zumeist älteren Studien weisen aber methodische Grenzen auf und machen Forschungslücken deutlich: 1. Es erfolgte keine typenbezogene Kriteriumsvalidierung. 2. Ungeklärt ist, inwieweit sich die spärlichen Befunde auf ältere Schüler bzw. Schüler anderer Schulformen generalisieren lassen. 3. Schließlich fußen die Ergebnisse auf Clusteranalysen, in deren Vorfeld verschiedene subjektive Entscheidungen – mit entsprechenden Konsequenzen für die Befundinterpretation – zu treffen sind (J. Rost, 2004). Daher dient die vorliegende Studie der Beantwortung folgender Forschungsfragen: Lassen sich in einer größeren, aktuelleren Stichprobe älterer Schüler (Sekundarstufe) unter Berücksichtigung kognitiver, motivationaler und affektiver Merkmale zwei abgrenzbare Gruppen („Typen“) von Anstrengungsvermeidern gemäß den bisherigen Befunden erstens bestätigen und zweitens validieren? Wir erwarteten, neben möglichen anderen Typen, zwei Typen mit hoher Anstrengungsvermeidung, die im Vergleich zur Gesamtgruppe der untersuchten Schüler eine charakteristische Geschlechterverteilung und eine defizitäre Ausprägung der genannten Merkmale aufweisen sollten. Dabei sollte der eine Typ mit hoher Anstrengungsvermeidung insbesondere durch kognitive und affektive, der andere insbesondere durch motivationale Defizite gekennzeichnet sein. Dies sollte sich für Typisierungs- wie auch für Validierungsmerkmale nachweisen lassen.

2

Methode Stichprobe An der Studie nahmen 1105 Schüler aus k = 44 Klassen der 8. und 9. Jahrgangsstufe von drei niedersächsischen und vier baden-württembergischen Gymnasien teil. Von den ursprünglich 1173 kontaktierten Schülern konnten 68 Schüler aus verschiedenen Gründen (z. B. Krankheit, fehlende Elterngenehmigung) nicht befragt werden. Weitere 26 Schüler wurden aufgrund nicht instruktionsgemäßer Beantwortung (z. B. Musterankreuzungen) ausgeschlossen. Die verbleibende Analysestichprobe von N = 1 079 Schülern (mittleres Alter 14.26 Jahre, SD = 0.75) verteilte sich nahezu gleich auf die beiden Bundesländer (NI: 50.7 %, BW: 49.3 %) und die Geschlechtergruppen (53.0 % Mädchen, 47.0 % Jungen). Pro Klasse lagen Daten von 15 bis 30 Schülern vor.

Durchführung und Variablen Die Erhebungen nahmen pro Klasse eine Schulstunde in Anspruch und wurden von zwei geschulten Psychologiestudentinnen2 geleitet. Bei allen Ratingskalen wurde – teilweise abweichend vom Original – ein einheitliches, fünfstufiges Antwortformat (1 = „trifft gar nicht zu“, 5 = „trifft genau zu“) gewählt, um die mit Formatwechseln verbundene Gefahr erhöhter Fehlervarianz zu vermeiden (vgl. Tab. 1). Zum Einsatz kam die Skala Anstrengungsvermeidung (AV) aus dem Anstrengungsvermeidungstest (AVT; Rollett & Bartram, 1998). Für alle Analysen wurden ausschließlich die 20 Rasch-homogenen Items verwendet. Die Auswahl der Typisierungsvariablen erfolgte in Anlehnung an Helmke und Rheinberg (1996): Zur Erfassung der Schulleistung gaben die Schüler die Zeugnis-Halbjahresnoten in Deutsch und Mathematik an (vgl. Sparfeldt, Buch, Rost & Lehmann, 2008). Dezimalangaben wurden zu ganzzahligen Noten vereinheitlicht. Als Indikator für die kognitive Leistungsfähigkeit dienten die Subtests „Analogien“ und „Zahlenreihen“ aus dem Intelligenz-StrukturTest 70 (I-S-T 70; Amthauer, 1973). Die Skalenwerte wurden jahrgangsstufenweise pro Parallelversion z-standardisiert und zu einem Summenwert über beide Subtests verrechnet. Die Erfassung des schulischen Interesses erfolgte über eine selbst entwickelte Skala, die an den Fragebogen zum Studieninteresse (FSI; Schiefele, Krapp, Wild & Winteler, 1993) und das schulfachspezifische Inte-

Frau Antje David und Frau Mirja Felies, die die Daten im Rahmen ihrer Studienabschlussarbeiten erhoben haben, sei für ihre große Sorgfalt und für ihr hohes Engagement herzlich gedankt.

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 57–68

© 2017 Hogrefe


K. Lintorf et al., Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse

61

Tabelle 1. Psychometrische Kennwerte der verwendeten Skalen/Items N

Items

α

M

SD

ICC

Antwortstufen im Original

Anstrengungsvermeidung (AVT)

1010

20

.81

2.31

0.54

.04

2

Note Deutsch

1060

--

--

3.08

0.81

.05

--

Note Mathematik

1060

--

--

3.07

1.01

.04

--

Intelligenz

1065

40

.81

0.01

1.59

.03

--

Interesse

1063

11

.78

2.86

0.64

.02

5/6

Selbstkonzept (SKSLF)

1061

8

.81

3.03

0.73

.02

6

Aufgeregtheit (TAI-G)

1068

8

.90

2.55

0.97

.03

4

Besorgnis (TAI-G)

1071

10

.90

2.99

0.95

.03

4

Kognitive Angstmanifestation (DAI)

1066

8

.90

2.38

0.88

.04

5

Note Englisch

1060

--

--

3.02

0.91

.04

--

Selbstwert

1056

10

.84

3.84

0.71

.01

4

Hilflosigkeit

1065

5

.80

2.02

0.82

.04

- -1

Lernzielorientierung (SELLMO)

1049

8

.80

3.77

0.68

.03

5

Annäherungs-Leistungszielorientierung (SELLMO)

1052

7

.83

3.16

0.83

.04

5

Vermeidungs-Leistungszielorientierung (SELLMO)

1050

8

.86

2.54

0.87

.04

5

Arbeitsvermeidung (SELLMO)

1055

8

.85

2.61

0.85

.02

5

Typisierungsvariablen

Validierungsvariablen

Anmerkungen. Schulnoten wurden nicht umgepolt. Bei allen Rating-Skalen wurde ein fünfstufiges Antwortformat (1 = „trifft gar nicht zu“, 5 = „trifft genau zu“) vorgegeben. 1 keine Angabe im Original

ressengitter (Sparfeldt, Rost & Schilling, 2004) angelehnt ist (Beispiel-Item: „Schule gehört für mich persönlich zu den wichtigsten Dingen“). Das schulische Selbstkonzept wurde mit der Skala zur Erfassung des Selbstkonzepts schulischer Leistungen und Fähigkeiten (SKSLF; D. H. Rost & Lamsfuß, 1992) in der Version von D. H. Rost und Sparfeldt (2002) erhoben. Die Operationalisierung der Prüfungsängstlichkeit erfolgte über drei Skalen: „Aufgeregtheit“ (AU) und „Besorgnis“ (BE) aus der deutschen Version des Test Anxiety Inventory (TAI-G; Hodapp, 1991) sowie „Kognitive Angstmanifestation“ (KOG) aus dem Differentiellen Leistungsangst-Inventar (DAI; D. H. Rost & Schermer, 2007). Für die Validierung der zu ermittelnden Schülertypen wurden ebenfalls insbesondere kognitive und motivationale Variablen ausgewählt, die gemäß dem oben dargestellten Forschungsstand sowohl engere Bezüge zu den Typisierungsvariablen als auch Zusammenhänge zur Anstrengungsvermeidung annehmen ließen: Als weiterer © 2017 Hogrefe

Schulleistungsindikator wurde daher die Zeugnis-Halbjahresnote in Englisch herangezogen und analog zu den anderen Noten vereinheitlicht. Zur Erfassung der eng mit (Prüfungs-)Ängstlichkeit assoziierten Hilflosigkeit wurden die mathematikspezifischen Items aus Trautwein und Köller (2003) für den schulfachübergreifenden Kontext angepasst (Beispiel: „In der Schule fühle ich mich oft völlig verloren“). Mit den Skalen zur Erfassung der Lern- und Leistungsmotivation (SELLMO; Spinath et al., 2012) erhoben wir die interessennahe Lernzielorientierung (LZO) und Annäherungs-Leistungszielorientierung (ALZO) sowie die anstrengungsvermeidungsnahen Skalen VermeidungsLeistungszielorientierung (VLZO) und Arbeitsvermeidung (AVM). Schließlich erfragten wir noch das allgemeine Selbstwertgefühl (Self-Esteem-Skala; Rosenberg, 1965, deutsche Formulierungen nach Ferring & Filipp, 1996) als globalen – neben dem fähigkeitsspezifischen – Aspekt der Selbstbewertung. Aufgrund der Befunde zu unterschiedlichen Verteilungen von Mädchen und Jungen bezogen auf Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 57–68


62

K. Lintorf et al., Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse

„desorganisierte“ und „apathische“ Anstrengungsvermeider (vgl. Abschnitt „Anstrengungsvermeidungstypen“) wurde das Geschlecht der Schüler erhoben.

Analysestrategie Trotz geringer Intraklassenkorrelationen (für die Typisierungs- und Validierungsvariablen s. Tab. 1, bei den einzelnen AVT-Items: ρ ≤ .052) kann die Vernachlässigung der Stichprobenclusterung bei hinreichender Clustergröße zu einem deutlich liberaleren3 als dem nominellen α-Niveau in der statistischen Signifikanzprüfung beitragen. Daher wurden alle Variablen klassenweise an ihren Gruppenmittelwerten zentriert: Die Dimensionalität der AV-Items wurde dann aufgrund der widersprüchlichen Befundlage (s. Abschnitt „Anstrengungsvermeidung: Konstrukt und Genese“) mittels Hauptachsenanalyse (Promax Rotation mit κ = 4, SPSS 23) überprüft. Zur Bestimmung der Faktorenzahl wurden neben dem Eigenwertkriterium λ > 1 auch die Parallelanalyse und der revidierte MAP-Test herangezogen (beides jeweils mit der SPSS-Syntax von O'Connor, 2000). Dabei basierte die Parallelanalyse auf einer Hauptkomponentenanalyse (PCA; zur Begründung vgl. Bühner, 2011; Buja & Eyuboglu, 1992) mit 9000 simulierten Datensätzen. Die anschließende Typisierung erfolgte mittels latenter Profilanalysen (LPA) in Mplus 7.3 (Muthén & Muthén, 1998–2012). Im Gegensatz zur Clusteranalyse bietet die LPA Modellgeltungstests zur Entscheidung über die Klassenzahl (Magidson & Vermunt, 2002). Die Klassenzahl bestimmten wir über den Vergleich verschiedener Kriterien der Modellpassung bei Modellen mit differierender Klassenzahl (Geiser, 2011; Lubke & Muthén, 2005): (1) Bei den Informationskriterien AIC und BIC steht ein kleinerer Wert für eine bessere Passung. (2) Die Entropie zeigt mit Werten nahe 1 eine hohe und mit Werten nahe 0 eine geringe Zuverlässigkeit der Klassifikation an. (3) Likelihood-RatioTests (LRT) ermöglichen eine inferenzstatistische Prüfung der Passung konkurrierender Modelle (VLMR-LRT und LMRadj-LRT). (4) Die mittlere Klassenzuordnungswahrscheinlichkeit sollte für alle Klassen über pmin > .80 liegen. (5) Neben diesen statistischen Kriterien sind insbesondere auch inhaltliche und theoretische Überlegungen bedeutsam (v. a. Sparsamkeit und Interpretierbarkeit). Eine ML-Schätzung kann lokale Maxima und somit suboptimale Lösungen produzieren. Daher wurde in Mplus die Anzahl der zufälligen Startwertsets (STARTS = 5000 500) und der Iterationen (STITERATIONS = 250) erhöht

3

(vgl. Flaherty & Kiff, 2012; Geiser, 2011). Die Standardfehler wurden mittels TYPE = COMPLEX korrigiert und fehlende Werte per FIML geschätzt. Für die Interpretation und Evaluation der Profile wurden zum einen für jedes Merkmal die Abweichungen der in Mplus ermittelten Klassenmittelwerte vom Gesamtmittelwert betrachtet. Dafür zogen wir die unstandardisierte Lösung heran, da standardisierte LPA-Lösungen in Mplus eine Varianzhomogenisierung (d. h. Varianzen von 1.0 in allen Klassen) aufweisen. Für eine bessere Interpretierbarkeit der unstandardisierten Lösung z-standardisierten wir alle Variablen zusätzlich zur oben erwähnten Gruppenmittelwertzentrierung auch am Gesamtmittelwert. Im Anschluss wurde varianzanalytisch mit SPSS geprüft, inwieweit sich die auf Basis der a-posteriori-Wahrscheinlichkeiten ermittelten Klassen in den Typisierungsund Validierungsmerkmalen unterscheiden. Von Interesse waren dabei post-hoc-Vergleiche von Gruppen mit hoher Anstrengungsvermeidung, für die wir den konservativen Tamhanes T2-Test (Field, 2013) und ein statistisches Signifikanzniveau von α = .05 wählten. Bei der Bewertung der Profilunterschiede orientierten wir uns in erster Linie an den Effektstärken (Cohens d).

Ergebnisse Deskriptiva und Faktorenanalyse Die Faktorenanalyse der 20 AV-Items wies vier Eigenwerte größer eins (4.36, 1.34, 1.12, 1.11) mit einer kumulativen Varianzaufklärung von 39.72 % aus. Der revidierte MAPTest favorisierte einen Faktor. Die Parallelanalyse deutete auf zwei Faktoren hin, der Eigenwert des zweiten Faktors lag aber nur sehr knapp über dem 95. Perzentil der Zufallswerte (1.24). Die Kriterien sprachen somit für eine einfaktorielle Lösung. Ähnliches galt für das Ladungsmuster. Bei einer zweifaktoriellen Lösung wies die Mustermatrix für den zweiten Faktor nur drei Items mit a > .30 aus, während dies beim ersten Faktor für neun Items galt. Gleichzeitig belegte die Strukturmatrix für 11 Items eine Korrelation von r > .30 mit jeweils beiden Faktoren. Die Korrelation der beiden Faktoren betrug r = .56. Insgesamt unterstützen die Daten also eine einfaktorielle Lösung und bestätigten somit die Rasch-konformen Ergebnisse der Testautoren (Rollett & Bartram, 1998). Für die späteren Analysen wurden die Daten daher zu einem Skalensummenscore verrechnet.

s. Forumsbeiträge in Mplus Discussions von L. K. Muthén vom 16.11.1999. Verfügbar unter http://www.statmodel.com/discussion/messages/12/18.html [04.04.2016]

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 57–68

© 2017 Hogrefe


K. Lintorf et al., Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse

63

Tabelle 2. Interkorrelationen der Typisierungs- und Validierungsvariablen Skalen/Items (ggf. Instrument)

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

(9)

(10)

(11)

(12)

(13)

(14)

(15)

(1) Anstrengungsvermeidung (AVT)

-

(2) Note Deutsch

.31

-

(3) Note Mathematik

.22

.36

-

(4) Note Englisch

.30

.54

.39

(5) Intelligenz

–.05

–.16

–.32

–.16

-

(6) Interesse

–.40

–.23

–.12

–.21

–.03

(7) Selbstkonzept (SKSLF)

–.31

–.40

–.45

–.45

.18

.35

-

(8) Selbstwert

–.23

–.05

–.13

–.16

.04

.10

.36

(9) Aufgeregtheit (TAI-G)

.27

.01

.14

.10

–.15

.04

–.22

–.37

-

(10) Besorgnis (TAI-G)

.36

.12

.29

.18

–.19

.03

–.23

–.29

.56

-

(11) Kognitive Angstmanifestation (DAI)

.55

.21

.33

.30

–.13

–.19

–.39

–.37

.61

.55

-

(12) Hilflosigkeit

.52

.19

.35

.27

–.18

–.21

–.46

–.41

.49

.46

.62

–.26

–.21

–.08

–.15

.00

.50

.28

.16

.02

.06

–.13

–.17

(14) Annäherungs-Leistungszielorientierung (SELLMO)

.00

–.03

–.03

–.03

–.07

.35

.28

.02

.13

.24

.00

.01

.40

-

(15) Vermeidungs-Leistungszielorientierung (SELLMO)

.26

.12

.12

.15

–.07

.02

–.15

–.25

.29

.35

.26

.27

.04

.53

-

(16) Arbeitsvermeidung (SELLMO)

.55

.25

.18

.24

–.07

–.48

–.24

–.12

.14

.22

.36

.36

–.27

.14

.43

(13) Lernzielorientierung (SELLMO)

-

-

-

-

Anmerkungen. Alle Variablen sind an den Klassenmittelwerten zentriert. Statistisch insignifikante Werte (p  .05) kursiv. N = 909.

Tabelle 1 und 2 fassen die psychometrischen Kennwerte und Korrelationen der Typisierungs- und Analysevariablen zusammen. Alle Skalen wiesen eine hinreichende interne Konsistenz (αmin = .78) auf. Die Korrelationen fielen in der Regel gering bis mittelhoch aus. Für Annäherungs-Leistungszielorientierung ergaben sich zumeist schwache Zusammenhänge zu den anderen Variablen. Höhere Korrelationen (r ≈ .50) fanden sich hauptsächlich zwischen den Leistungsängstlichkeitsfacetten sowie zwischen diesen und Anstrengungsvermeidung, aber auch zwischen Arbeitsvermeidung und Anstrengungsvermeidung.

Typisierung Für die Typisierung wurden latente Profilanalysen mit bis zu sechs Klassen gerechnet (Kennwerte s. Tab. 3). Die Informationskriterien AIC und BIC nahmen mit steigender Klassenzahl kontinuierlich ab. Dies deutete auf eine Lösung mit einer möglichst hohen Klassenzahl hin, was jedoch dem Gebot der Sparsamkeit widersprach. Demgegenüber bevorzugten der VLMR-LRT und der LMRadj-LRT © 2017 Hogrefe

eher eine geringere Klassenzahl: Eine Vier-Klassen-Lösung passte im Vergleich zu einer Drei-Klassen-Lösung nicht statistisch signifikant besser zu den Daten, wohl aber eine Drei- im Vergleich zu einer Zwei-Klassen-Lösung. Gemäß der mittleren Klassenzuordnungswahrscheinlichkeit war allerdings eine Vier-Klassen-Lösung noch tolerabel. Erst ab fünf Klassen galt für wenigstens eine Klasse p < .80. Lediglich die Entropie blieb annähernd unverändert. Gemessen an den verschiedenen Maßen zur Beurteilung der Modellgüte schien eine Drei- oder Vier-Klassen-Lösung daher am besten mit den Daten vereinbar zu sein. Betrachtet man neben statistischen Kennwerten die Interpretierbarkeit, differenzierte die Zwei-Klassen-Lösung lediglich zwischen einem durchweg günstigen vs. ungünstigen Profil und war daher aus diagnostischer Sicht wenig ergiebig. Auch in der Drei-Klassen-Lösung fanden sich wieder zwei Klassen (n = 286 vs. n = 243) mit durchweg günstigem vs. ungünstigem Profil, darunter eine Klasse mit statistisch signifikant überdurchschnittlicher Anstrengungsvermeidungstendenz (M = 0.73, p < .001). Eine dritte Gruppe (n = 550) zeigte in allen Merkmalen eher durchschnittliche Ausprägungen, die allerdings in einigen Merkmalen statistisch signifikant vom Stichprobenmittelwert Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 57–68


64

K. Lintorf et al., Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse

Tabelle 3. Maße zur Beurteilung der Modellgüte der latenten Profilanalysen 1 Klasse

2 Klassen

3 Klassen

4 Klassen

5 Klassen

6 Klassen

AIC

27063.94

25656.40

25233.30

24962.57

24848.45

24739.97

BIC

27153.65

25840.80

25512.39

25336.35

25316.93

25303.14

p-Wert VLMR LRT

-

< .01

< .01

.17

.47

.62

p-Wert LMRadj LRT

-

< .01

< .01

.18

.48

.62

Entropie

-

.76

.76

.74

.74

.74

pmin

-

.91

.88

.82

.78

.77

abwichen (z. B. AV: M = 0.14, p = .010; Deutschnote: M = 0.19, p = .013; Interesse: M = –0.20, p = .003). Die Vier-Klassen-Lösung (s. Abb. 1) war der Drei-Klassen-Lösung ähnlich. Im Unterschied zu dieser ergaben sich je zwei Klassen mit eher günstigem und eher ungünstigem Profil (s. auch Tab. 4). Die zahlenmäßig kleinste Gruppe (Klasse 1) zeigte in allen Bereichen überdurchschnittlich günstige Ausprägungen (z. B. Intelligenz: M = 0.39, AV: M = –0.96), sodass man sie als die „Mustergültigen“ beschreiben könnte. Klasse 4 wies ebenfalls ein eher günstiges Muster auf, erschien aber insgesamt als „unauffällig“: Die Schüler hatten gute, statistisch signifikant überdurchschnittliche Schulleistungen bei durchschnittlich ausgeprägter Intelligenz und wiesen ein statistisch signifikant erhöhtes Interesse und Selbstkonzept bei einer durchschnittlichen Anstren-

gungsvermeidung (M = –0.17) auf. Aus affektiver Sicht berichteten die Schüler dieser Klasse zwar eine überdurchschnittliche Aufgeregtheit (M = 0.30), aber durchschnittliche Besorgnis und kognitive Angstmanifestation (M = 0.09/–0.07). Die anderen beiden Klassen ähnelten sich in den Profilen bei den kognitiven und motivationalen Merkmalen. Beide besaßen statistisch signifikant unterdurchschnittliche Noten und ein unterdurchschnittliches schulisches Interesse sowie Selbstkonzept. Klasse 3 war aber durch eine besonders hohe Anstrengungsvermeidung (M = 0.78) und Ängstlichkeit (z. B. DAI-KOG: M = 1.23) sowie durch eine unterdurchschnittliche Intelligenz (M = –0.35) gekennzeichnet, während Klasse 2 bei einer durchschnittlichen Intelligenz (M = –0.17) eine etwas überdurchschnittliche Anstrengungsvermeidung (M = 0.23) und durchschnittliche (z. B. Besorgnis: M =

Tabelle 4. Mittelwerte, Standardabweichungen und Ergebnisse der varianzanalytischen Vergleiche zwischen den vier Klassen hinsichtlich der Analysevariablen aus den latenten Profilanalysen Skalen/Items (ggf. Instrument)

Klasse 2 Klasse 1 (n = 323) (n = 219) Mustergültige Desinteressierte

Klasse 3 (n = 252) Ängstliche

Klasse 4 (n = 285) Unauffällige

Tamhanes T21

ANOVA

M

SD

M

SD

M

SD

M

SD

F(df1, df2)

ηp2

ΔM

0.39

0.92

–0.17

1.00

–0.35

0.97

0.18

0.94

36.07(3, 1061)*

.09

Note Mathe

–0.71

0.75

0.37

0.90

0.56

0.92

–0.35

0.86

119.74(3, 1056)*

Note Deutsch

–0.58

0.92

0.62

0.74

0.41

0.87

–0.58

0.82

Interesse

0.47

1.01

–0.48

0.88

–0.24

0.98

0.37

SKSLF

0.84

0.94

–0.42

0.69

–0.67

0.86

AVT (AV)

–0.96

0.69

0.23

0.83

0.78

TAI-G (AU)

–0.87

0.56

–0.52

0.61

TAI-G (BE)

–0.89

0.72

–0.29

DAI (KOG)

–1.08

0.40

–0.17

Intelligenz

d1

SE

p

–0.19

0.08

.122

–0.18

.25

0.15

0.08

.312

0.20

193.07(3, 1056)*

.35

–0.26

0.07

.001

–0.26

0.82

76.88(3, 1059)*

.18

0.26

0.08

.006

0.25

0.40

0.80

201.50(3, 1057)*

.36

–0.25

0.07

.001

–0.31

0.88

–0.17

0.80

195.97(3, 1006)*

.37

0.52

0.08

< .001

0.64

1.05

0.84

0.30

0.74

437.35(3, 1064)*

.55

1.61

0.06

< .001

2.13

0.83

1.02

0.67

0.09

0.77

281.05(3, 1067)*

.44

1.34

0.06

< .001

1.74

0.67

1.23

0.76

–0.07

0.63

587.17(3, 1062)*

.62

1.45

0.06

< .001

1.96

Anmerkungen. *p < .05. Statistisch insignifikante Abweichungen vom Gesamtmittelwert (p  .05) kursiv. 1 Angaben für den Vergleich von Klasse 2 und 3. M, SD und d auf Basis der Daten aus Mplus, ANOVA und post-hoc-Test aus SPSS. Abkürzungen der Skalen s. Abschnitt „Durchführung und Variablen“.

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 57–68

© 2017 Hogrefe


K. Lintorf et al., Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse

Abbildung 1. Profile der Vier-Klassen-Lösung (Abkürzung der Skalen s. Abschnitt „Durchführung und Variablen“)

–0.29) bis geringe Leistungsängstlichkeit (Aufgeregtheit: M = –0.52) berichtete. Zusammenfassend betrachtet, wiesen die Drei- und VierKlassen-Lösungen je zwei Klassen mit überdurchschnittlicher Anstrengungsvermeidung aus. Allerdings erschien eine AV-Klasse, die – wie in der Drei-Klassen-Lösung – aus gut 50 % der Schülerschaft bestand, weniger sinnvoll. Im Gegensatz dazu war die Vier-Klassen-Lösung bei akzeptabler statistischer Modellgüte besser interpretierbar.

65

Deutschnote (d = –0.26). Orientiert am jeweils prägnantesten Merkmal, ließe sich Klasse 3 somit als die Gruppe der ängstlichen Anstrengungsvermeider („Ängstliche“) beschreiben und Klasse 2 als die der eher desinteressierten Anstrengungsvermeider („Desinteressierte“). Hinsichtlich der Validierungsvariablen zeigten sich in ANOVAs ebenfalls statistisch signifikante – teils auch große – Klassenunterschiede (Tab. 5). Dabei unterschieden sich die Desinteressierten (Klasse 2) und Ängstlichen (Klasse 3) im post-hoc-Vergleich in fünf von sieben Merkmalen. Besonders groß waren die Differenzen im affektiven Bereich. Im Vergleich zu den Desinteressierten erlebten die Ängstlichen eine statistisch signifikant und deutlich höhere Hilflosigkeit (d = –1.16) und zeichneten sich durch einen geringeren Selbstwert (d = 0.71) aus. Daneben zeigten Letztere aber auch eine statistisch signifikant höhere Annäherungs-Leistungszielorientierung (d = –0.36), Vermeidungs-Leistungszielorientierung (d = –0.62) und Arbeitsvermeidung (d = –0.24). Auch unterschieden sich die beiden Gruppen in der Geschlechterzusammensetzung. Während unter den Ängstlichen statistisch signifikant mehr Mädchen als Jungen vertreten waren (nw = 160, nm = 92; χ2 = 73.36, p < .001), war es bei den Desinteressierten umgekehrt (nw = 110, nm = 213; χ2 = 52.44, p < .001).

Diskussion Profilunterschiede Für die Evaluation der Vier-Klassen-Lösung wurden sowohl die Typisierungs- als auch die Validierungsvariablen varianzanalytisch auf Klassenunterschiede geprüft. Univariate ANOVAs belegten erwartungsgemäß einen statistisch signifikanten Effekt der Klassenzugehörigkeit bei allen Typisierungsvariablen (Tab. 4). Alle Effekte waren als groß einzuordnen. Lediglich für die Intelligenz zeigte sich mit ηp2 = .09 ein mittlerer Effekt. Der Post-hoc-Vergleich der beiden Klassen mit hoher Anstrengungsvermeidungstendenz führte zu differenzierteren Befunden (Tab. 4). Zwischen diesen Klassen 2 und 3 mit jeweils hoher Anstrengungsvermeidungstendenz ließen sich keine statistisch signifikanten Unterschiede in der Intelligenz und der Mathematiknote feststellen, wohl aber in den anderen Merkmalen: Diese Unterschiede fielen fast ausschließlich zuungunsten von Klasse 3 aus. Nur die mittlere Deutschnote und das Interesse waren in Klasse 3 weniger ungünstig ausgeprägt als in Klasse 2. Besonders groß waren die Unterschiede bei den Ängstlichkeitsmaßen (d = 2.13/1.74/1.96), gefolgt von einem mittleren Effekt bei der Anstrengungsvermeidung (d = 0.64) und kleinen Effekten beim allgemeinen schulischen Selbstkonzept (d = –0.31), dem Interesse (d = 0.25) und der © 2017 Hogrefe

Unsere Studie hatte zum Ziel, Typen von Anstrengungsvermeidern zu ermitteln und zu beschreiben. Ähnlich wie von den Autoren des Anstrengungsvermeidungstests angenommen (Rollett & Bartram, 1998) und wie von Helmke und Rheinberg (1996) dargelegt, fanden sich auch in dieser Studie unterschiedliche Typen. In der favorisierten Vier-Klassen-Lösung zeigten sich zwei Klassen mit durchweg günstigem („Mustergültige“) bzw. günstigem bis durchschnittlichem Profil („Unauffällige“). Zudem waren erwartungsgemäß zwei Typen durch eine höhere Anstrengungsvermeidungstendenz sowie durch differenzielle Ausprägungen in den weiteren Typisierungs- und Validierungsmerkmalen gekennzeichnet. Diese beiden Anstrengungsvermeiderklassen zeichneten sich durch unterdurchschnittliche Noten und ein geringeres Interesse sowie schlechteres Selbstkonzept aus. In der Klasse mit der höheren Anstrengungsvermeidungstendenz war dies gepaart mit hoher Ängstlichkeit und einer leicht unterdurchschnittlichen Intelligenz („Ängstliche“). Damit bildet diese Klasse den Antityp zu den „Mustergültigen“ und ähnelt dem desorganisierten (Rollett & Bartram, 1998) bzw. dem resignativen Typus (Helmke & Rheinberg, 1996). Die Ähnlichkeit zu Letzterem ist bei einer Prävalenz von 23 %, dem höheren MädchenanZeitschrift für Pädagogische Psychologie (2017), 31 (1), 57–68


66

K. Lintorf et al., Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse

Tabelle 5. Mittelwerte, Standardabweichungen und Ergebnisse der varianzanalytischen Vergleiche zwischen den vier Klassen hinsichtlich der Validierungsvariablen Skalen/Items (ggf. Instrument)

Klasse 1 Klasse 2 Mustergültige Desinteressierte

Klasse 3 Ängstliche

Klasse 4 Unauffällige

Tamhanes T21

ANOVA

M

SD ηp

M

SD

M

SD

M

SD

F(df1, df2)

η2

ΔM

SE

–0.54

0.85

0.39

0.83

0.50

0.99

–0.47

0.87

100.24(3, 1056)*

.22

0.11

0.08

.674

0.12

0.50

0.79

0.10

0.83

–0.61

1.12

0.04

0.95

57.49(3, 1052)*

.14

–0.71

0.09

< .001

0.71

–0.83

0.52

–0.04

0.86

1.01

0.91

–0.20

0.74

223.67(3, 1061)*

.39

1.05

0.08

< .001 –1.16

LZO (SELLMO)

0.27

1.05

–0.29

0.97

–0.18

0.96

0.28

0.89

25.32(3, 1045)*

.07

0.10

0.08

.782 –0.10

ALZO (SELLMO)

0.01

1.14

–0.24

0.91

0.11

0.97

0.16

0.96

9.69(3, 1048)*

.03

0.35

0.08

< .001 –0.36

VLZO (SELLMO)

–0.43

0.96

–0.10

0.94

0.51

0.98

0.00

0.93

39.47(3, 1046)*

.10

0.61

0.08

< .001 –0.62

AVM (SELLMO)

–0.65

0.89

0.25

0.92

0.48

1.00

–0.20

0.83

72.77(3, 1051)*

.17

0.23

0.08

.029 –0.24

Note Englisch Selbstwert Hilflosigkeit

p

d1

Anmerkungen. * p < .05. Statistisch insignifikante Abweichungen vom Gesamtmittelwert (p  .05) kursiv. 1 Angaben für den Vergleich von Klasse 2 und 3. Alle Angaben aus SPSS. Abkürzungen der Skalen s. Abschnitt „Durchführung und Variablen“.

teil und den hohen Ängstlichkeitswerten allerdings ausgeprägter. Wie schon Helmke und Rheinberg (1996) vermuteten, könnten diese Schüler in den an sie gestellten Leistungsanforderungen eine größere Herausforderung als ihre Mitschüler sehen, was nicht zuletzt auch der – im Gruppenvergleich kleinste – Selbstkonzeptwert nahelegt. Der im Anstrengungsvermeidungskonstrukt verankerte negative Affekt zeigte sich bei dieser Gruppe vor allem in der Leistungsängstlichkeit. Dazu passen die im Gruppenvergleich mit Abstand höchsten Werte beim Validierungsmerkmal der Hilflosigkeit. Anstrengungsvermeidung scheint hier daher weniger das Resultat eines mit dem Handlungsziel verbundenen Anreizdefizits zu sein (Rollett & W. Rollett, 2013), sondern eher eine Art Copingstrategie zur Bewältigung von Angst (Rollett, 1994a). Die Leistungsdefizite und die leicht erhöhte Anstrengungsvermeidungstendenz von Schülern der anderen AVKlasse („Desinteressierte“) gingen dagegen nicht mit intellektuellen Defiziten oder einer erhöhten Prüfungsängstlichkeit einher. Erwartungsgemäß zeichneten sich hier aber, ähnlich wie bei Helmke und Rheinberg (1996), kleine bis mittlere motivationale Defizite ab. Die Typisierung ergab ein unterdurchschnittliches Interesse, das noch geringer war als das der Ängstlichen. Die Validierung zeigte Vergleichbares hinsichtlich der Zielorientierung: Wie den Ängstlichen, so ist auch den Desinteressierten eine Kompetenzerweiterung weniger wichtig. Im Vergleich zu den anderen Klassen, insbesondere den Ängstlichen, legen sie aber weder Wert auf die Demonstration von Kompetenzen noch auf die Überdeckung von Inkompetenz. Sie erscheinen lustlos und somit von einem Anreizdefizit betroffen (Rollett & Rollett, 2013). Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 57–68

Neben den erwähnten Ähnlichkeiten differieren die hier identifizierten Typen aber auch von bisherigen Beschreibungen. Anders als beispielsweise bei Helmke und Rheinberg (1996) gab es in kognitiver Hinsicht keine wesentlichen Unterschiede, wohl aber in der Leistungsängstlichkeit und Anstrengungsvermeidung. Damit erscheinen die hier beschriebenen Typen im Vergleich zueinander dennoch stimmig: Nur die Ängstlichen fallen durch hohe Werte bei allen meidungsbezogenen Konstrukten auf. Möglicherweise erleben die Desinteressierten dagegen schulische Anforderungen als weniger aversiv. Limitationen in der Interpretation unserer Ergebnisse beziehen sich zum einen auf die verwendete Stichprobe. So könnten die (wenigen) Unterschiede zu früheren Typenbeschreibungen, insbesondere die unterschiedliche Ausprägung der Anstrengungsvermeidung in den beiden Defizitgruppen, ein Spezifikum einer älteren und eher homogenen sowie (schulformbedingt) leistungsstarken Stichprobe sein (zu Schulformunterschieden in der Anstrengungsvermeidung s. Sirsch & Jirasko, 1996). Eine heterogenere Stichprobe wie etwa die Grundschulstichprobe von Helmke und Rheinberg (1996) sollte die Differenzierbarkeit verschiedener Klassen (so auch von Anstrengungsvermeidungstypen) begünstigen und zu eindeutigeren Ergebnissen führen (z. B. konsistentere Hinweise auf die Klassenzahl gemäß den Modellgütemaßen). Zudem ist der Unterschied in der Anstrengungsvermeidung nur relativ zur untersuchten Stichprobe aussagekräftig, die jedoch recht umfangreich war. Aufgrund eines abweichenden Antwortformats konnte kein Vergleich zu den Normwerten des AVTs erfolgen. Zum anderen erlaubt unsere querschnittliche Datenbasis keine Prüfung von Vermutun© 2017 Hogrefe


K. Lintorf et al., Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse

gen über typenbedingte differenzielle Ursachen der Anstrengungsvermeidung. Unterschiedliche Typen von Anstrengungsvermeidern könnten auch ein Hinweis auf verschiedene Stadien im Entwicklungsverlauf der Anstrengungsvermeidung sein – zumal sich die Typen in dieser Studie nicht nur durch ein differenzielles Profil, sondern auch in der Höhe der Anstrengungsvermeidung unterscheiden. Fehlende Längsschnittstudien (Ausnahme: Rollett & Hanfstingl, 2005) begrenzen jedoch, wie erwähnt, derartige Vermutungen (vgl. auch Sirsch & Jirasko, 1996). Forschungsbedarf sehen wir also insbesondere in Längsschnitt- sowie Interventionsstudien, um die Fragen nach der Stabilität von Typen und nach möglichen typenbezogenen differenziellen Ursachen sowie Entwicklungsverläufen beantworten zu können. Trotz dieser Limitationen lassen sich Argumente für die Robustheit und Generalisierbarkeit unserer Befunde anführen: Zunächst fand die Erwartung zweier differenzierbarer Anstrengungsvermeidungstypen Bestätigung. Zudem waren diese den bisher beschriebenen Typen sehr ähnlich – obwohl die vorliegende Studie hinsichtlich der Probandenauswahl, Typisierungsmethode und Typisierungsvariablen von den wenigen früheren Arbeiten abwich. Schließlich bestätigten sich die Typen erstmals auch in einer zusätzlichen Validierung. Künftige Studien sollten diese ersten Hinweise auf die Generalisierbarkeit der Befunde aber auf eine breitere Datenbasis stellen. Mit Blick auf die pädagogisch-psychologische Praxis könnte es nützlich sein, die beiden Gruppen mit hoher Anstrengungsvermeidung zu unterscheiden. So könnten die identifizierten Defizite und Charakteristika Hinweise auf mögliche differenzielle Ursachen der von Anstrengungsvermeidern erlebten Aversion liefern. Interventionsempfehlungen beschränken sich bislang lediglich auf das anstrengungsvermeidende Problemverhalten (bspw. Rollett & Bartram, 1998 zum Umgang mit oppositionellem Verhalten von Anstrengungsvermeidern) und gehen weniger auf Ursachen ein. Möglicherweise profitiert aber die Gruppe der leistungsängstlichen Anstrengungsvermeider vor allem von bewährten Strategien des Leistungsängstlichkeitsmanagements (z. B. Entspannungsübungen, alternative bzw. funktionalere Kognitionen und Selbstverbalisierungen), idealerweise gepaart mit einer Einübung effektiver Arbeits- und Lernstrategien sowie eines fachlichen Kompetenzaufbaus (Ergene, 2003; von der Embse, Barterian & Segool, 2013). Entsprechend könnten bei desinteressierten Anstrengungsvermeidern insbesondere motivationsförderliche Maßnahmen wirksam sein (z. B. Mitbestimmung im Unterricht, Koppelung des Unterrichtsstoffs an bestehende Interessen etc., Schiefele, 2014). Eine ergänzende Diagnostik motivationaler und affektiver Charakteristika könnte somit helfen, bisherige Interventionshinweise um eine auf die jeweilige Problema© 2017 Hogrefe

67

tik abgestimmte Beratung sowie Förderung zu erweitern. Zukünftige Interventionsstudien könnten abklären, ob sich diese Vermutungen empirisch erhärten lassen.

Literatur Ambros, R. (1985). Testanalytische Überprüfung und Normierung des „Bild-AVT“ an einer repräsentativen Stichprobe niederösterreichischer Volksschüler. Dissertation, Universität Wien. Amthauer, R. (1973). Intelligenz-Struktur-Test (I-S-T 70) (4. Aufl.). Göttingen: Hogrefe. Bittner, U. (2000). Leistungsmotiviertes Handeln und Anstrengungsvermeidung in der Wirtschaft. Dissertation, Universität Wien. Borchert, J. & Masendorf, F. (1975). Zum Bedingungsverhältnis von Sozialstatus, Erziehungsstil der Mutter und des Lehrers und affektiven Schülervariablen. Psychologie in Erziehung und Unterricht, 22, 137–147. Bühner, M. (2011). Einführung in die Test- und Fragebogenkonstruktion (3. Aufl.). München: Pearson. Buja, A. & Eyuboglu, N. (1992). Remarks on parallel analysis. Multivariate Behavioral Research, 27, 509–540. Ergene, T. (2003). Effective interventions on test anxiety reduction: A meta-analysis. School Psychology International, 24, 313–328. Ferring, D. & Filipp, S.-H. (1996). Messung des Selbstwertgefühls: Befunde zu Reliabilität, Validität und Stabilität der RosenbergSkala. Diagnostica, 42, 284–292. Field, A. (2013). Discovering statistics using IBM SPSS (4th ed.). London: Sage. Flaherty, B. P. & Kiff, C. J. (2012). Latent class and latent profile models. In H. Cooper, P. M. Camic, D. L. Long, A. T. Panter, D. Rindskopf & K. J. Sher (Eds.), APA handbook of research methods in psychology (Vol. 3, pp. 391–404). Washington, DC: APA. Gashi, A. (2011). Untersuchungen über Beziehungen zwischen Anstrengungsvermeidung, Selbststeuerung und Lernemotionen bei Jugendlichen aus psychologischer Sicht. Diplomarbeit, Universität Wien. Zugriff am 23.03.2015. Verfügbar unter http://othes. univie.ac.at/16660/1/2011-09-29_9301444.pdf Geiser, C. (2011). Datenanalyse mit Mplus. Eine anwendungsorientierte Einführung (2. Aufl.). Wiesbaden: VS Verlag für Sozialwissenschaften. Hattie, J. (2015). Lernen sichtbar machen. Überarbeitete deutschsprachige Ausgabe von Visible Learning (3. Aufl.). Baltmannsweiler: Schneider. Helmke, A. & Mückusch, C. (1994). Handlungs- und Lageorientierung bei Grundschülern. Zeitschrift für Pädagogische Psychologie, 8, 63–72. Helmke, A. & Rheinberg, F. (1996). Anstrengungsvermeidung – Morphologie eines Konstruktes. In C. Spiel, U. Kastner-Koller & P. Deimann (Hrsg.), Motivation und Lernen aus der Perspektive lebenslanger Entwicklung (S. 207–224). Münster: Waxmann. Hodapp, V. (1991). Das Prüfungsängstlichkeitsinventar TAI-G: Eine erweiterte und modifizierte Version mit vier Komponenten. Zeitschrift für Pädagogische Psychologie, 5, 121–130. Jirasko, M. & Sirsch, U. (1996). Anstrengungsvermeidung und elterliches Erziehungsverhalten. In C. Spiel, U. Kastner-Koller & P. Deimann (Hrsg.), Motivation und Lernen aus der Perspektive lebenslanger Entwicklung (S. 225–234). Münster: Waxmann. Jopt, U.-J. (1982). Anstrengungsvermeidungstendenz: „Faulpelz“ im neuen Gewand? Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 14, 324–336. Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 57–68


68

K. Lintorf et al., Anstrengungsvermeider: Lustlos oder hilflos? Eine latente Profilanalyse

Jopt, U.-J. (1984). Anstrengungsvermeidungstendenz: Motiv ohne Motivation oder Ein Test ersetzt noch keine Theorie. Replik auf B. Rollett. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 16, 77–80. Lubke, G. H. & Muthén, B. O. (2005). Investigating population heterogeneity with factor mixture models. Psychological Methods, 10, 21–39. Magidson, J. & Vermunt, J. K. (2002). Latent class models for clustering: A comparison with K-means. Canadian Journal of Marketing Research, 20, 37–44. Muthén, L. K. & Muthén, B. O. (1998–2012). Mplus user's guide (7th ed.). Los Angeles, CA: Muthén & Muthén. O'Connor, B. P. (2000). SPSS and SAS programs for determining the number of components using parallel analysis and Velicer's MAP test. Behavior Research Methods, Instruments, & Computers, 32, 396–402. Rollett, B. A. (1983). Anstrengungsvermeidung als Motiv. Eine Antwort auf U.-J. Jopt. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 15, 75–84. Rollett, B. A. (1994a). Anstrengungsvermeidung in Schule und Beruf. In G. Gittler, M. Jirasko, U. Kastner-Koller, C. Korunka & A. Al-Roubaie (Hrsg.), Die Seele ist ein weites Land: Aktuelle Forschung am Wiener Institut für Psychologie (S. 81–92). Wien: WUV. Rollett, B. A. (1994b). Lernen und Lehren. Eine Einführung in die pädagogische Psychologie und ihre entwicklungspsychologischen Grundlagen (4. Aufl.). Wien: WUV. Rollett, B. A. (2004). Schulbezogene Anstrengungsvermeidung als Reaktion auf Überforderung. Annales Psychologici, 52, 87–97. Rollett, B. A. (2005). Die Genese des Anstrengungsvermeidungsmotivs im familiären Kontext. In R. Vollmeyer & J. C. Brunstein (Hrsg.), Motivationspsychologie und ihre Anwendung (S. 92–108). Stuttgart: Kohlhammer. Rollett, B. A. & Bartram, M. (1974). Konstruktion eines Prüfverfahrens der Anstrengungsvermeidung als Prognoseinstrument für den Lernerfolg. In L. H. Eckensberger & U. S. Eckensberger (Hrsg.), Bericht über den 28. Kongress der Deutschen Gesellschaft für Psychologie in Saarbrücken 1972 (Bd. 5, S. 95–105). Göttingen: Hogrefe. Rollett, B. A. & Bartram, M. (1977). Anstrengungsvermeidungstest. Braunschweig: Westermann. Rollett, B. A. & Bartram, M. (1998). Anstrengungsvermeidungstest (3. Aufl.). Göttingen: Hogrefe. Rollett, B. A., Bartram, M. & Stodt, H. (1974). Untersuchungen zur Prognose des Lernerfolgs bei Programmiertem Unterricht. In L. H. Eckensberger & U. S. Eckensberger (Hrsg.), Bericht über den 28. Kongress der Deutschen Gesellschaft für Psychologie in Saarbrücken 1972 (Bd. 5, S. 117–127). Göttingen: Hogrefe. Rollett, B. A. & Hanfstingl, B. (2005). Der Schulübertritt des Untersuchungskindes: Belastung und Bewältigung. In B. A. Rollett, H. Werneck & B. Hanfstingl (Hrsg.), Das Längsschnittprojekt Familienentwicklung im Lebenslauf (FIL): Familienentwicklung beim Schulübertritt (S. 67–91). Wien: Institut für Entwicklungspsychologie und Psychologische Diagnostik. Zugriff am 08.10.2015. Verfügbar unter http://homepage.univie.ac.at/harald.werneck/ FIL/Forschungsbericht_t5.pdf Rollett, B. A. & Rollett, W. (2010). Anstrengungsvermeidung. In D. H. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (4. Aufl., S. 17–22). Weinheim: Beltz. Rollett, B. A. & Rollett, W. (2013). Anstrengungsvermeidungsmotivation. In M. A. Wirtz (Hrsg.), Dorsch. Lexikon der Psychologie (16. Aufl., S. 160). Bern: Huber.

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 57–68

Rosenberg, M. (1965). Society and the adolescent self-image. Princeton, NJ: University Press. Rost, D. H. & Lamsfuß, S. (1992). Entwicklung und Erprobung einer ökonomischen Skala zur Erfassung des Selbstkonzepts schulischer Leistungen und Fähigkeiten (SKSLF). Zeitschrift für Pädagogische Psychologie, 6, 239–250. Rost, D. H. & Schermer, F. J. (2007). Differentielles-LeistungsangstInventar (DAI) (2. Aufl.). Frankfurt a. M.: Harcourt Test Services. Rost, D. H. & Sparfeldt, J. R. (2002). Facetten des schulischen Selbstkonzepts. Ein Verfahren zur Messung des differentiellen Selbstkonzepts schulischer Leistungen und Fähigkeiten (DISKGitter). Diagnostica, 48, 130–140. Rost, J. (2004). Lehrbuch Testtheorie – Testkonstruktion (2. Aufl.). Bern: Huber. Schiefele, U. (2014). Förderung von Interessen. In G. W. Lauth, M. Grünke & J. C. Brunstein (Hrsg.), Interventionen bei Lernstörungen: Förderung, Training und Therapie in der Praxis. (2. Aufl., S. 251–261) Göttingen: Hogrefe. Schiefele, U., Krapp, A., Wild, K.-P. & Winteler, A. (1993). Der „Fragebogen zum Studieninteresse“ (FSI). Diagnostica, 39, 335–351. Sirsch, U. & Jirasko, M. (1996). Anstrengungsvermeidung. In C. Spiel, U. Kastner-Koller & P. Deimann (Hrsg.), Motivation und Lernen aus der Perspektive lebenslanger Entwicklung (S. 185–194). Münster: Waxmann. Sparfeldt, J. R., Buch, S. R., Rost, D. H. & Lehmann, G. (2008). Akkuratesse selbstberichteter Zensuren. Psychologie in Erziehung und Unterricht, 55, 68–75. Sparfeldt, J. R., Rost, D. H. & Schilling, S. R. (2004). Schulfachspezifische Interessen – ökonomisch gemessen. Psychologie in Erziehung und Unterricht, 51, 213–220. Spinath, B., Stiensmeier-Pelster, J., Schöne, C. & Dickhäuser, O. (2012). Skalen zur Erfassung der Lern- und Leistungsmotivation (SELLMO) (2. Aufl.). Göttingen: Hogrefe. Trautwein, U. & Köller, O. (2003). Was lange währt, wird nicht immer gut. Zur Rolle selbstregulativer Strategien bei der Hausaufgabenerledigung. Zeitschrift für Pädagogische Psychologie, 17, 199–209. von der Embse, N., Barterian, J. & Segool, N. (2013). Test anxiety interventions for children and adolescents: A systematic review of treatment studies from 2000–2010. Psychology in the Schools, 50, 57–71. Wagner, P., Spiel, C. & Tranker, M. (2003). Wer nimmt Nachhilfe in Anspruch? Eine Analyse in Hauptschule und Gymnasium. Zeitschrift für Pädagogische Psychologie, 17, 233–243.

Manuskript eingereicht: 22.11.2015 Nach Revision angenommen: 30.07.2016 Interessenkonflikt: Nein

Dr. Katrin Lintorf Institut für Bildungsforschung in der School of Education Bergische Universität Wuppertal Campus Grifflenberg Gaußstr. 20 42119 Wuppertal Deutschland lintorf@uni-wuppertal.de

© 2017 Hogrefe


Mit ACT zu einem besseren Leben gelangen

Matthias Wengenroth

Das Leben annehmen So hilft die Akzeptanz- und Commitment-Therapie (ACT) Mit einem Vorwort von Thomas Heidenreich. 3., unveränd. Aufl. 2016. 308 S., 11 Abb., 4 Tab., Gb € 24,95 / CHF 32.50 ISBN 978-3-456-85683-4 Auch als eBook erhältlich

Mit dem Ansatz der Akzeptanz- und Commitment-Therapie (ACT) gelangen Sie zu einem zufriedeneren und besseren Leben: Dieser Ratgeber zeigt Ihnen anschaulich und unterhaltsam, wie ACT wirkt. Kämpfen Sie mit Gefühlen und Gedanken, die Ihnen das Leben schwer machen? Haben Sie schon vieles ausprobiert, um dagegen anzugehen, und sind dabei kaum weitergekommen? Und haben Sie das Gefühl, dass währenddessen das Leben an Ihnen vorbeizieht? Die diesem Buch zugrunde liegende Akzeptanz- und Commitment-Therapie

www.hogrefe.com

(ACT), die hier in leicht verständlicher und unterhaltsamer Weise vorgestellt wird, bietet neuartige und sehr erhellende Einblicke in die Ursachen menschlichen Leidens. Zudem zeigt ACT auf, wie wir besser mit den schwierigen Aspekten des Menschseins umgehen und gleichzeitig die eigenen Fähigkeiten und Stärken weiterentwickeln können. Dieses Buch hilft Ihnen dabei! Es zeigt Ihnen, wie Sie mithilfe einfacher, aber nachweislich wirksamer Methoden selbst die Voraussetzungen dafür schaffen können, vom Leben das zu bekommen, wonach Sie sich tief in Ihrem Inneren sehnen.


Ohne Wollen kein Können – wie Sie gezielt zur Lernmotivation Ihrer Kinder beitragen.

Gustav Keller

Ich will nicht lernen! Motivationsförderung in Elternhaus und Schule 5., überarbeitete Auflage 2016. 136 S., 3 Abb., Kt € 16,95 / CHF 21.90 ISBN 978-3-456-85582-0 Auch als eBook erhältlich

Vielen Kindern und Jugendlichen mangelt es nicht an Intelligenz, sondern an Lernmotivation. Doch wie entstehen solche Motivationsstörungen, wie äußern sie sich – und vor allem: was können Sie dagegen tun? Dieser fachkundige und vielfach bewährte Ratgeber klärt Eltern, Lehrer und Erzieher über mögliche Ursachen auf, liefert Hintergründe und vermittelt wirksame und praxiserprobte Hilfen zur häuslichen und schulischen Motivationsförderung. Die zentralen Förderbausteine sind: • systematische Verselbständigung • altersgemäßes Fordern, Loben und Ermutigen

www.hogrefe.com

• • • • •

konstruktive Kritik und Grenzziehung Erziehungskonsens Wecken von Neugier Tätigkeitsangebote Lernen lernen, Lernen mit dem Computer und Lernspiele • Selbstmotivierung und Sinnfindung. Die Leserinnen und Leser erhalten nicht nur Erklärungshilfen und Fördertipps, sondern sie werden auch durch interessante Fall- und Motivationsgeschichten zum Nachdenken angeregt. „Dieser kompetente Ratgeber motiviert zu einer konstruktiven Auseinandersetzung mit der Thematik“. 4 bis 8


Übersichtsartikel

Multiple Ziele und Lernmotivation: Das Forschungsprogramm „Theorie motivationaler Handlungskonflikte“ Manfred Hofer1, Stefan Fries2 und Axel Grund2 1 2

Pädagogische Psychologie, Universität Mannheim Fakultät für Psychologie und Sportwissenschaft, Abteilung für Psychologie, Universität Bielefeld

Zusammenfassung: Der Beitrag berichtet über das Forschungsprogramm „Theorie motivationaler Handlungskonflikte“, das Situationen behandelt, in denen Personen zwei gleichwertige Ziele verfolgen. Die Theorie wird an Lernenden untersucht, die Konflikte zwischen schulischen und außerschulischen Zielen erleben. Diese Konflikte spiegeln prototypisch die gesellschaftlich relevante Konkurrenz zwischen wohlbefindens- und leistungsbezogenen Werten und Zielen wider. Mit dem Anstreben von Zielen zeigen Lernende an, dass sie ihre altersspezifischen Entwicklungsaufgaben bearbeiten. Die Theorie spezifiziert die Interferenz von Anreizen der nichtgewählten Handlung mit der Ausübung der gewählten Lern- oder Freizeithandlung. In quer- und längsschnittlichen-, Experience-Sampling- sowie experimentellen Studien wird gezeigt, dass motivationale Interferenz Leistung und affektives Wohlbefinden der Lernenden beeinträchtigen kann. Bei den Bedingungen motivationaler Interferenz stehen gesellschaftlich vermittelte Werte der Leistung und des Wohlbefindens im Mittelpunkt. Wir schlagen Maßnahmen zur Minimierung von Zielkonflikten und zur Herstellung einer ausgewogenen Zeitverteilung auf verschiedene Lebensbereiche vor. Schlüsselwörter: Lernmotivation, motivationale Interferenz, motivationale Konflikte, multiple Ziele, Zeitbalance Multiple Goals and Motivation at School: The Theory of Motivational Action Conflicts Abstract: This article presents the research program “Theory of Motivational Action Conflicts”, which addresses situations in which persons aim at achieving more than one important goal. The theory was studied with students striving simultaneously to reach academic and nonacademic goals. When students experience goal conflicts, incentives attached to options not chosen may interfere with the execution of the chosen action. Cross-sectional, longitudinal, experience-sampling, and experimental studies show that, depending on its strength, motivational interference can impair the achievements as well as the well-being of students. The article provides hints on how students can minimize goal conflicts in order to experience a better balance across developmental contexts. Keywords: Learning motivation, motivational interference, motivational conflicts, multiple goals, time balance

Einleitung Das Forschungsprogramm zu motivationalen Handlungskonflikten, das erstmals 2004 dargestellt wurde (Hofer, 2004), behandelt vor dem Hintergrund relevanter Aspekte gesellschaftlichen Wertewandels das Erleben und Verhalten von Personen in Situationen, in denen ihre Motivation für ein Ziel in Konkurrenz mit der Motivation für ein anderes Ziel tritt. Die Überlegungen und Untersuchungen beschränken sich im Rahmen der pädagogisch-psychologischen Verankerung des Forschungsprogramms meist auf den Fall von Konflikten zwischen schulischen und Freizeitzielen bei Lernenden1. Diese Engführung wurde auch gewählt, da Schule-Freizeit-Konflikte prototypisch die gesellschaftlich relevante Konkurrenz zwischen wohlbefin1

dens- und leistungsbezogenen Werten und Zielen widerspiegeln. Gleichzeitig gehen wir aber davon aus, dass die zugrunde liegenden motivationalen Mechanismen über den untersuchten Geltungsbereich hinausweisen.

Zielsetzung, Annahmen und Skizzierung der Theorie motivationaler Handlungskonflikte In der pädagogisch-psychologischen Forschung wird die Lebenswelt von Lernenden oft so rekonstruiert, als bestünde sie überwiegend aus dem Lernkontext. Insbeson-

Mit „Lernenden“ bezeichnen wir im Folgenden Kinder, Jugendliche und junge Erwachsene.

© 2017 Hogrefe

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85 DOI 10.1024/1010-0652/a000197


70

dere Analysen der Lernmotivation (Wentzel & Miele, 2016) befassen sich fast ausschließlich mit schulbezogenen Zielen. Würden Lernende tatsächlich nur akademische Ziele verfolgen, dann wäre die Frage nach multiplen Zielen eher nebensächlich, denn ihr zielbezogenes Handeln wäre immer auf Lernen ausgerichtet und leicht zu regulieren. Aktiviert eine Person zu einem bestimmten Zeitpunkt ein schulisches Ziel, dann müsste ihr die Steuerung ihrer Handlungen leicht fallen. Je nachdem, wie weit der gegenwärtige vom gewünschten Zustand abweicht, sollte sie mehr oder weniger Zeit und Anstrengung in Lernen investieren. Doch die Lebenswelt von Schülerinnen und Schülern ist deutlich vielfältiger. Lernende haben viele Ziele und lassen auch ihre außerschulischen Ziele in das Lerngeschehen einfließen (Dowson & McInerney 2003; Wentzel, 2003). Geraten zwei Ziele in einen Konflikt, haben Lernende zu entscheiden, welches Ziel sie verfolgen wollen. Die Theorie motivationaler Handlungskonflikte (Hofer & Fries, 2016) befasst sich mit der Situation, in der eine Person zu einem Zeitpunkt mehr als ein wichtiges Ziel anstrebt. a. Sie beschreibt, wie Anreize, die mit der nicht gewählten Option verbunden sind, die Ausführung der gewählten Alternative beeinträchtigen. Dieses Phänomen bezeichnen wir als motivationale Interferenz. b. Sie verweist auf ausgewählte Determinanten, die das Entstehen motivationaler Interferenz begünstigen. Wir fokussieren dabei auf gesellschaftlich vermittelte Werte. c. Und sie zeigt die Folgen motivationaler Interferenz für die Leistungserbringung, das affektive Wohlbefinden und die Persönlichkeitsentwicklung auf. Wie deutlich werden wird, verbindet die Theorie eine Sichtweise, die auf konkrete motivationale Prozesse orientiert ist (motivationale Interferenz), mit einer, die den Einfluss kultureller, motivational bedeutsamer Überzeugungen thematisiert (kultureller Wertewandel und individuelle Werte). Persönliche Ziele sind Vorstellungen von Zuständen, die man im Alltag anstrebt und in Zukunft realisieren möchte (Brunstein & Maier, 1996; Kruglanski et al., 2002). Ein Ziel ist mit jenen Handlungen kognitiv verbunden, durch die man glaubt, das betreffende Ziel erreichen zu können. Sind in einer Situation mehrere Ziele aktiviert, stellt sich die Frage der Beziehung zwischen diesen Zielen. Neben der Unverbundenheit von Zielen werden zwei Klassen von Zielrelationen unterschieden (s. Dowson & McInerney 2003; Unsworth, Yeo & Beck, 2014). Eine Verbindung zwischen zwei Zielen ist dann förderlich, wenn eine Handlung, die zu einem Ziel führt, auch für das Erreichen des anderen Ziels nützlich ist. In einen Sportclub einZeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85

M. Hofer et al., Multiple Ziele und Lernmotivation

treten, kann sowohl dem Ziel „Fußballspielen“ als auch jenem des „Treffens von Gleichaltrigen“ dienen. Eine Zielbeziehung ist hemmend, wenn eine Handlung das Erreichen eines Ziels begünstigt, aber dem Erreichen des anderen wegen zeitlicher Beschränkungen, Knappheit anderer Ressourcen oder Unvereinbarkeit im Wege steht. Ein solcher Fall liegt vor, wenn ein Schüler an der Erledigung seiner Hausaufgaben sitzt und eine Nachricht von einem Freund auf seinem Smartphone erhält, der ihn auffordert, an einem Onlinespiel mitzumachen, oder wenn eine Schülerin während eines Besuchs bei einer Freundin von ihrer Mutter an die Vorbereitung auf eine Klassenarbeit erinnert wird. Sind die zeitlichen Ressourcen beschränkt, sollte ein motivationaler Konflikt erlebt werden. Die potenzielle Konflikthaftigkeit von Lernen und Spielen wird bereits von Kindergartenkindern gesehen (Li, 2016). Im Schulkontext tritt sie dann deutlicher auf. So gaben deutsche Sechs-, Acht- und Zehntklässler an, Schule-Freizeit-Konflikte im Mittel „manchmal“ zu erleben. Nur 11 % sagten, sie erleben sie nie (Fries, Schmid, Dietz & Hofer, 2005). In einer Interviewstudie berichteten Eltern, dass ihre 10- bis 15-jährigen Kinder sich im Mittel mehrmals pro Woche nicht zwischen zwei Alternativen aus den Bereichen Schule und Freizeit entscheiden können (Hofer & Saß, 2006). Am häufigsten scheinen Hausaufgaben und Verabredungen mit Freunden zu konkurrieren. Studierende berichteten in einer Experience-Sampling-Studie eine Woche lang über motivationale Konflikte aus ihrem Alltag (Grund, Grunschel, Bruhn & Fries, 2015). Die Autoren unterschieden zwischen Wollen-Konflikten (man denkt, man will etwas anderes tun) und Sollen-Konflikten (man denkt, man sollte etwas anderes tun). In 27 % aller Alltagssituationen berichteten die Versuchspersonen, dass sie lieber etwas anderes getan hätten. In 24 % der Situationen dominierte das Gefühl, etwas anderes tun zu sollen (vgl. Riediger & Freund, 2008). Auch in anderen westlichen Ländern sind Schule-Freizeit-Konflikte weit verbreitet (Brint & Cantwell, 2010; Randel, Stevenson & Witruk, 2000). Unsere Studien beschränken sich wegen deren besonderer Bedeutsamkeit auf Konflikte zwischen schulischen- und Freizeitzielen. Schulische Ziele sind auf schulische Leistungserbringung in oder außerhalb der Schule ausgerichtet. Freizeitziele in oder außerhalb der Schule haben keinen curricularen Bezug und unterliegen stärker der freien Bestimmung. Zentral in der Theorie motivationaler Handlungskonflikte ist das Konstrukt der motivationalen Interferenz. Egal wie sich eine Person in einem Zielkonflikt entscheidet, Gedanken und Gefühle, die mit der nichtgewählten Handlung verbunden sind, sollten die Ausführung der gewählten Handlung beeinträchtigen. Leistet der Schüler der Aufforderung zum Onlinespiel nicht Folge, mag seine Konzentration für das Lernen sinken, weil er der verpass© 2017 Hogrefe


M. Hofer et al., Multiple Ziele und Lernmotivation

ten Gelegenheit nachtrauert. Lässt die Schülerin die Erinnerung ihrer Mutter unbeachtet, müsste ihr Zusammensein mit der Freundin durch Gedanken an die Notwendigkeit der Vorbereitung getrübt sein. Bei der Analyse von Zielkonflikten nehmen wir zwei Setzungen vor: a. Wir gehen davon aus, dass vielfältige Freizeitaktivitäten von hoher Bedeutung für die Entwicklung Lernender sind, da sie der Bewältigung von Entwicklungsaufgaben dienen. Lernende gehen Zielen in verschiedenen Lebensbereichen nach, um ihre altersbezogenen Entwicklungsaufgaben zu bearbeiten (vgl. Heckhausen, Wrosch & Schulz, 2010). b. Zielkonflikte werden nicht lediglich als momentane Unvereinbarkeiten von Intentionen angesehen, sondern können einen tiefer liegenden Widerspruch zwischen grundlegenden Werten ausdrücken (s. auch Emmons, King & Sheldon, 1993). Unsere Gesellschaft ist durch eine Kombination moderner und postmoderner Werte gekennzeichnet (Inglehart, 1998). Sie erlaubt Menschen, viele Ziele anzustreben, und stellt ihnen eine Vielzahl von Handlungsmöglichkeiten zur Verfügung, zwischen denen auch junge Menschen wählen können. In einer solchen Gesellschaft treten Zielkonflikte gehäuft auf. Bevor das Konzept der motivationalen Interferenz, seine Bedingungen und Konsequenzen anhand einschlägiger Befunde erläutert werden, werden diese beiden Hintergründe dargestellt. Abbildung 1 zeigt die Beziehungen zwischen den zentralen Konzepten der Theorie auf personaler Ebene. Lernende sind in einen schulbezogenen und in einen freizeitbezogenen Kontext eingebettet. Leistungswerte hängen primär mit schulbezogenen Zielen, Wohlbefindenswerte primär mit freizeitbezogenen Zielen zusammen. Von der Konstellation der Ziele hängt wiederum die Häufigkeit und Intensität motivationaler Handlungskonflikte ab, die ihrerseits auf akademische Leistung, Persönlichkeitsentwicklung und Lebensbalance wirken.

71

ben (Havighurst, 1972) ermöglicht die Kategorisierung der verschiedenen Ziele Heranwachsender und hilft zu verstehen, wann Zielkonflikte auftreten können (Cantor & Blanton, 1996). Nach dieser Theorie streben Menschen jene persönlichen Ziele an, die ihre alterstypischen Entwicklungsaufgaben lösen helfen. Zum Beispiel wollen sich Lernende in der mittleren Kindheit in einer geschlechtsangemessenen Weise verhalten. Das wird im Jugendalter weniger bedeutsam, wenn das Streben nach Liebesbeziehungen zu einer zentralen Entwicklungsaufgabe wird (Oerter & Dreher, 2002). Werden Entwicklungsaufgaben nicht innerhalb relevanter Zeitspannen erarbeitet, drohen soziale Zurückweisung, niedrige Lebenszufriedenheit und das Risiko, bei der Bearbeitung weiterer Entwicklungsaufgaben zu scheitern. Da den Aktivitäten in der Freizeit (z. B. Mediennutzung, sportliche Aktivitäten, extracurriculares Lernen) eine Schlüsselrolle für die Individualentwicklung zugeschrieben wird (Noack, 2008), erscheint es zwingend, neben schulischen auch nichtschulische Ziele zu beachten. Um die Wichtigkeit von Zielen zu erfassen, die in Schule-Freizeit-Konflikten aufeinandertreffen, ließen wir in einer qualitativ-quantitativen Erhebung 348 Gymnasialschüler der 10. Klasse persönliche Ziele aufschreiben (Hofer, Kuhnle & Kilian, 2014). Die Schülerinnen und Schüler beurteilten jedes Ziel nach dessen Wichtigkeit und ordneten es einer der folgenden Kategorien von Entwicklungsaufgaben zu: Schule, Integration in die Gruppe der Gleichaltrigen, Beziehung zu Personen des anderen Geschlechts, Genießen der Freizeit, Umgang mit körperlichen Veränderungen, Ablösen von den Eltern, Entwickeln einer eigenen Weltanschauung, Planen langfristiger Lebensziele, Pflichten, Geschlechtsrolle (vgl. Kracke & Heckhausen, 2008). Anschließend beschrieben die Schülerinnen und Schüler einen kürzlich erlebten Schule-Freizeit-Konflikt und ihre Entscheidung darin. Die meisten Zielkategorien wurden mindestens als ziemlich wichtig erachtet. Neben Schule wurden Integration in die Gruppe der Gleichaltrigen, Genießen der Freizeit und das Entwickeln eines individuellen Lebensstils als besonders wichtig bewertet. Schülerinnen und Schüler, die sich in dem

Multiple Ziele aus entwicklungspsychologischer Sicht Entwicklungsaufgaben als Ziele Wir betrachten die Bedingungen und Konsequenzen von Schule-Freizeit-Konflikten in einem Entwicklungskontext, der sowohl schulbezogene als auch freizeitbezogene Ziele umfasst (vgl. Abb. 1). Die Theorie der Entwicklungsaufga© 2017 Hogrefe

Abbildung 1. Die Theorie motivationaler Handlungskonflikte

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85


72

berichteten Konflikt für die Freizeitoption entschieden hatten, präferierten schulische Ziele gleich hoch wie Freizeitziele. Sie entschieden sich für die jeweiligen nichtschulischen Optionen nicht etwa, weil ihnen schulische Ziele weniger wichtig waren, sondern weil die gewählten Optionen mit wichtigen Entwicklungsaufgaben zusammenhingen. Die Idee der Entwicklungsaufgaben ermöglicht also eine theoriebasierte Differenzierung von entwicklungspsychologisch bedeutsamen Zielen, die in Konflikt geraten können. Die Tatsache, dass vielen Freizeitzielen eine ähnlich hohe Bedeutung wie schulischen Zielen zugesprochen wurde, unterstreicht die Notwendigkeit, über die Betrachtung schulischer Ziele hinauszugehen.

Entscheidungen in Zielkonflikten Um die Handlungswirksamkeit von Zielen zu überprüfen, gingen wir davon aus, dass sich Lernende in Schule-Freizeit-Konflikten für jene Handlung entscheiden, die ihnen als für das Erreichen eines wichtigen Ziels nützlich erscheint (s. Unsworth et al., 2014). In der angeführten Erhebung gaben die Schülerinnen und Schüler Auskunft über den Zusammenhang zwischen den in dem Konflikt beschriebenen Optionen und ihren Zielen. Schülerinnen und Schüler, die sich für die schulische Tätigkeit entschieden hatten, hielten schulische Ziele für wichtiger als nichtschulische. Die einzelnen nichtschulischen Optionen in Schule-Freizeit-Konflikten (Freizeit, Freunde und Partnerschaft) konnten jedoch durch die Wichtigkeit der betreffenden Zielinhalte nur eingeschränkt vorhergesagt werden (Hofer et al., 2014). Vermutlich ist für Schülerinnen und Schüler das Lösen verschiedener Entwicklungsaufgaben Teil einer übergeordneten Identitätssuche, in der Kontakte mit Freunden eine zentrale Rolle spielen. Das Treffen von Freunden kann der Eingliederung in die Gruppe dienen, erleichtert auch die Suche nach gegengeschlechtlichen Kontakten (Noack, 1990) und die Abgrenzung von den Eltern. Die Entscheidung für eine Option ließ sich mit hoher Genauigkeit auf der Basis der MittelZiel-Zusammenhänge für die Handlung und für die Alternative klassifizieren. So entschieden sich die Schülerinnen und Schüler umso eher für die schulische Option, je mehr sie diese mit Schulzielen verbanden, je mehr sie die Alternative nicht mit Schulzielen verbanden und je weniger sie die Alternative mit Freizeitzielen verknüpft sahen. Umgekehrt sahen Schülerinnen und Schüler, die sich für die Freizeitoption entschieden hatten, ihre Handlungen stärker mit Freizeitzielen als mit Schulzielen und ihre Alternative stärker mit Schulzielen als mit Freizeitzielen verknüpft (Hofer, Kilian, Kuhnle, Hellmann & Barth, 2011). Diese Befunde stützen die Auffassung, dass Lernende jene Handlungen wählen, mit denen sie glauben, ihre dringliZeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85

M. Hofer et al., Multiple Ziele und Lernmotivation

chen Entwicklungsaufgaben zu bewältigen (Heckhausen et al., 2010).

Motivationsrelevante Aspekte kulturellen Wertewandels Leistungs- und Wohlbefindenswerte Die persönlichen Ziele Lernender werden nicht nur von altersspezifischen Entwicklungsaufgaben, sondern auch vom kulturellen Umfeld mitbestimmt. Ein zentraler Aspekt des kulturellen Umfelds sind die in der jeweiligen Gesellschaft vorherrschenden Werte. Unser Wertebegriff unterscheidet sich von dem in Motivationstheorien (z. B. Erwartungs-Wert-Modellen), in denen der Begriff Wert den Anreiz (oder die Valenz) einer bestimmten Aufgabe oder Klasse von Aufgaben bezeichnet. Individuelle Werte sind hingegen generalisierte Überzeugungen über die Wünschbarkeit von Verhalten und Ereignissen (Fries, Schmid & Hofer, 2007). Freiheit, Selbstbestimmung, Macht und Sicherheit sind typische Beispiele für Werte (Schwartz, 1992). Individuelle Werte sind motivational wirksam, denn eine Person setzt sich vor dem Hintergrund ihrer Werte entsprechende Ziele (Fries et al., 2005). Individuelle Werte wurden in der Pädagogischen Psychologie bislang kaum thematisiert (Boekaerts, de Koning & Vedder, 2006). Wir nutzten Ron Ingleharts Modell des Wertewandels, um gesellschaftliche Werte mit Zielen von Lernenden zu verknüpfen. Inglehart (1998) weist darauf hin, dass in westlichen Gesellschaften sogenannte moderne Werte wie harte Arbeit, Sicherheit und Wohlstand zunehmend in Wettbewerb treten mit postmodernen Werten wie Toleranz, Zusammensein mit Freunden und Selbst-Aktualisierung. Moderne Werte verlieren durch den Anstieg postmoderner Werte jedoch nicht an Relevanz. In postmodernen Gesellschaften messen Lernende beiden Wertedimensionen hohe Bedeutung bei (Ovadia, 2003). Die Unterscheidung Ingleharts ist nützlich, weil Schule und Freizeit in vielerlei Hinsicht die wichtigsten Kontexte sind, in denen Heranwachsende leben. Sie scheinen ihre modernen Werte vorwiegend mit Lerntätigkeiten zu verbinden. Im Unterschied dazu realisieren sie postmoderne Werte stärker in der Zeit, die sie frei bestimmen können. Die erste Studie im Rahmen unseres Forschungsprogramms war ein problemzentriertes Leitfrageninterview, in dem 16-Jährige unter anderem nach Begriffsverständnis und Bewertung von Leistung und Wohlbefinden befragt wurden. Die Befragten sahen den schulischen Kontext von Leistungswerten und die Freizeit von Wohlbefindenswer© 2017 Hogrefe


M. Hofer et al., Multiple Ziele und Lernmotivation

ten dominiert. Auffallend war das einheitlich positive Verständnis von Leistung. Der Begriff Leistung wird dabei sowohl als Anstrengung (Prozess) als auch als Ergebnis von Anstrengung (Produkt) gesehen Der Begriff „Wohlbefinden“ bezeichnet in unserem Kontext eine Wertorientierung und nicht einen aktuellen oder habituellen Gefühlszustand, bei dem positive Emotionen und Kognitionen gegenüber negativen dominieren (Hascher, 2004). Der Wohlbefindenswert ist eher die Bedeutung, die eine Person dem Zustand des affektiven Wohlbefindens beimisst. Je höher diese ist, desto stärker dürfte die Person den Zustand anstreben (Schmid, Hofer, Dietz, Reinders & Fries, 2005). Lernende entwickeln ihre Ziele im täglichen Leben innerhalb dieser Kontexte. Im Alltag kommt es zwar durchaus vor, dass Leistungswerte in der Freizeit realisiert werden (z. B. beim Sport) und Wohlbefindenswerte in schulischen Kontexten. Die empirischen Befunde spiegeln jedoch eine deutliche Häufung der umgekehrten Verhältnisse wider. Das hat wohl auch damit zu tun, dass Lernaktivitäten eher selten rein auf das Erleben momentaner positiver Zustände ausgerichtet, also tätigkeitsorientiert sind (vgl. Rheinberg, 2006), sondern vorwiegend den Zweck verfolgen, eigenen und fremden Erwartungen und Normen zu entsprechen (vgl. Grund, Brassler & Fries, 2014). In Freizeitkontexten tritt das zweckfreie, selbstbestimmte Handeln zur Steigerung des momentanen Lustempfindens häufiger auf. Die in Abbildung 1 skizzierte SchuleFreizeit-Dichotomie spiegelt daher eine typische Konfliktkonstellation wider. Die Werte von Lernenden haben wir meist mit zwei Prototypen-Items erfasst, die aus umfassenden Beschreibungen unterschiedlicher Werte bestehen. Das Item für den Leistungswert-Prototyp beschreibt einen Schüler / eine Schülerin mit klaren Zielen, der / die sich auch durch unangenehme Aufgaben durchbeißt und der / die in seinem / ihrem Leben etwas erreichen will. Das Item für den Wohlbefindenswert beschreibt eine Schülerin / einen Schüler, die / der viel Zeit mit Freunden verbringt, die / der die Abwechslung und spontane Aktivitäten liebt und Freude am Leben haben will. Die befragten Schülerinnen und Schüler beurteilten diese Prototypen im Hinblick auf deren Ähnlichkeit zu sich selbst und wie sympathisch sie ihnen sind. Empirisch sind die beiden Wertedimensionen meist negativ korreliert, sie stellen aber nicht die Endpole eines Kontinuums dar. Typischerweise sind beide bei den befragten Personengruppen im Mittel hoch ausgeprägt. In einer Untersuchung an italienischen Achtklässlern haben wir deren Einordnung in die bekannte Wertesystematik von Schwartz (1992) geprüft. Der Wohlbefindenswert lag nahe den Werten Stimulation, Hedonismus und Selbstbestimmung. Der Leistungswert lag nahe den Werten Sicherheit und Konformität, also am konservativen Pol, aber entfernt vom Schwartz'schen Leistungswert, der offen© 2017 Hogrefe

73

sichtlich stark Konkurrenzsituationen erfasst. Die inneren Konsistenzen der Werte waren in etwa gleich hoch wie jene der Schwartz'schen Werte (Hofer, Kuhnle, Kilian, Marta & Fries, 2011).

Werte und Handlungsoptionen Die Zunahme an postmodernen Werten kann mit dem gestiegenen Wohlstand der Menschen erklärt werden (Schulze, 1992). Er offeriert Lernenden eine breite Palette an Möglichkeiten und fördert die Entwicklung entsprechender Werthaltungen. Dem Zusammenhang zwischen Wohlstand, Breite an Freizeitmöglichkeiten, Werten und Zielkonflikten sind wir an neun Stichproben von 15-Jährigen aus Ländern mit großen Wohlstandsunterschieden (Bosnien-Herzegowina, Deutschland, Indien, Italien, Kroatien, Mexiko, Paraguay, Spanien und USA) nachgegangen (Hofer, Schmid, Fries, Zivkovic & Dietz, 2009; Hofer, Schmid & Zivkovic, 2008). Wenn Wertewandel auf einer Zunahme an Handlungsmöglichkeiten beruht, dann müssten Befragte in Ländern mit niedrigem Bruttoinlandsprodukt pro Kopf weniger Freizeitmöglichkeiten und niedrigere Wohlbefindenswerte aufweisen als jene aus Ländern mit hohem Wohlstand. Zur Messung der Optionsbreite dienten sieben Items aus der PISA-Studie (Kunter et al., 2003), in denen erfragt wurde, wie viele Freizeitutensilien (Autos, Fernseher, PCs, Handys etc.) zu Hause vorhanden sind. Im Ergebnis gaben Lernende in wohlhabenden Ländern (vor allem Deutschland und USA) eine erheblich größere Palette an freizeitnutzbaren Gegenständen an als z. B. in Indien. Erstere waren auch am meisten wohlbefindensorientiert. Auf individueller Ebene war die Optionsbreite in der Gesamtstichprobe positiv mit Wohlbefindens- und negativ mit Leistungswerten korreliert. Es besteht somit ein Zusammenhang zwischen Breite an Freizeitoptionen und Wohlbefindenswerten. Ist Wohlstand mit dem Bereitstellen vieler Handlungsmöglichkeiten verbunden, dann können sich entsprechende Ziele bilden. Die Zeit jedoch, die mit einer zielgerichteten Tätigkeit verbracht wird, steht notwendigerweise für das Anstreben anderer Ziele nicht zur Verfügung (Flammer, Alsaker & Noack, 1999), sodass die Zahl motivationaler Handlungskonflikte zunehmen müsste. Tatsächlich berichteten Lernende aus den USA und Italien mehr Schule-Freizeit-Konflikte als jene aus Indien (Hofer et al., 2009). Über alle Länder hinweg gaben Personen mit hohen Wohlbefindenswerten mehr Zielkonflikte an. Dies legt die Annahme nahe, dass Wohlstand das Freizeitangebot erweitert, Wohlbefindenswerte und nichtschulische Ziele verstärkt und einen Anstieg von Schule-FreizeitKonflikten bewirkt. Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85


74

Motivationale Interferenz Das Konstrukt der motivationalen Interferenz Das Konstrukt motivationale Interferenz thematisiert den Einfluss motivationaler Charakteristika unterlassener Handlungsmöglichkeiten auf das Erleben und Verhalten während der gerade ausgeführten Aktivität. Abbildung 2 stellt die Situation eines konkreten Handlungskonflikts dar (z. B. Lernen für eine Klassenarbeit oder Freunde treffen). Betrachten wir zur Erläuterung den Fall, dass eine Person die Lernhandlung gewählt hat. Im Einklang mit anderen Motivationstheorien gehen wir davon aus, dass bestimmte motivationale Qualitäten der Lernhandlung (z. B. intrinsische Anreize) ihr Erleben und Verhalten während des Lernens positiv beeinflussen, während andere Qualitäten (z. B. Vermeidungsanreize) diese eher negativ beeinflussen. Diese „klassische“ Perspektive wird durch die durchgezogenen Pfeile in Abbildung 2 symbolisiert. Zusätzlich zu dieser Perspektive nehmen wir an, dass Erleben und Verhalten beim Lernen auch von den motivationalen Charakteristika potenzieller Freizeitalternativen abhängen und zwar negativ. Dieser motivationale Interferenzeffekt wird durch die gestrichelten Pfeile in Abbildung 2 symbolisiert. Motivationale Interferenz wird als Prozess verstanden, der sich in einem beeinträchtigten Erleben und Verhalten widerspiegelt. Die verpassten Anreize der Freizeitaktivität wirken sich negativ darauf aus, wie es der lernenden Person geht und wie gut sie lernt. Dabei spielt es keine Rolle, welcher Art die verpassten Anreize sind. Sowohl das schlechte Gewissen, das Heranwachsende zum Treffen von Freunden antreibt (z. B. weil man die Freunde in der Vergangenheit schon häufiger versetzt hat), als auch der entgehende Spaß sind Opportunitätskosten der Lernhandlung (vgl. Eccles, 2005; Flake, Barron, Hullemann, McCoach & Welsh, 2015) und können das Lernen destabilisieren. Die konfligierenden motivationalen Ten-

Abbildung 2. Motivationale Interferenz in einem konkreten Handlungskonflikt. Die unterbrochenen Pfeile symbolisieren motivationale Interferenzen durch die motivationalen Eigenschaften jeweils konfligierender Handlungstendenzen.

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85

M. Hofer et al., Multiple Ziele und Lernmotivation

denzen der Lernhandlung und der Freizeithandlung wirken also zusammen bei der Erklärung des Erlebens und Verhaltens beim Lernen. Je höher die verpassten Anreize der Freizeithandlung, umso stärker zeigt sich die Interferenz in affektiven, kognitiven und behavioralen Indikatoren, z. B. in schlechter Stimmung, oberflächlichem Lernen und geringerer Persistenz. Diese Aussagen gelten auch für den Fall, dass sich die Person in der Konfliktsituation für die Freizeithandlung entscheidet. Neben den Anreizen für diese Handlung bestimmen dann die entgangenen Anreize der abgewählten Lernhandlung, wie die Person die Freizeit erlebt. So kann das Wissen um den Pflichtcharakter der Lernhandlung (Schüler wissen z. B. in der Regel, dass sie eine Sanktion erwartet, wenn sie keine Hausaufgaben machen) den Freizeitgenuss trüben.

Studien zu motivationaler Interferenz außerhalb des Klassenzimmers In Studien zu motivationaler Interferenz (z. B. Fries, Dietz & Schmid, 2008; Grund & Fries, 2012) stellten sich Kinder, Jugendliche und junge Erwachsene eine Konfliktsituation vor, in der eine typische Lernaktivität (auf eine Klassenarbeit lernen, Hausaufgaben machen, einen Seminartext lesen) mit einer typischen Freizeitaktivität (Freunde treffen, fernsehen) konkurriert. Sie gaben dann an, wie es ihnen ergehen würde, sollten sie sich für die Lernaktivität bzw. für die Freizeitaktivität entscheiden. Die Items wurden aus der Interviewstudie abgeleitet, in der die Phänomenologie der motivationalen Interferenz erfasst worden war (Schmid et al., 2005). Es ging insbesondere darum, Erlebens- und Verhaltensaspekte abzubilden, in denen sich motivationale Interferenz manifestiert. So entstanden Items zu a) Ablenkbarkeit (z. B. „Dann lasse ich mich beim Lernen von allem Möglichen ablenken“), b) oberflächlicher Verarbeitung (z. B. „Dann lerne ich eher oberflächlich, damit ich schnell fertig bin“), c) niedriger Persistenz (z. B. „Dann fällt es mir besonders schwer, zu Ende zu lernen“), d) Switching (z. B. „Dann springe ich zwischen dem Lernen und anderen Tätigkeiten hin und her“) und e) beeinträchtigter Stimmung (z. B. „Dann bin ich schnell genervt, weil ich hier sitzen und lernen muss“). Diese Facetten sind in der Regel hoch korreliert und scheinen dieselbe latente Variable abzubilden (Fries et al., 2008). Für die Freizeitentscheidung wurden eigene Skalen entwickelt, die sich auf Stimmung (z. B. „Dann ist meine Laune getrübt, weil zu Hause das Lernen noch auf mich wartet“) und Ablenkbarkeit beziehen (z. B. „Dann kann mich nichts von meinen Freunden ablenken“, umgekehrte Kodierung). Die genutzten Konfliktszenarien sollten also prototypische Erlebens- und Verhaltensreaktionen induzie© 2017 Hogrefe


M. Hofer et al., Multiple Ziele und Lernmotivation

ren. Es sollte abgebildet werden, wie sich Schüler und Studierende in solchen und ähnlichen Konfliktsituationen verhalten und was sie dann typischerweise erleben. Motivationale Charakteristika der in Konflikt stehenden Handlungen wurden unterschiedlich operationalisiert. Fries und Kollegen (2008) unterschieden intrinsische („Ich mag es, mich auf Klassenarbeiten vorzubereiten“) und extrinsische Anreize („Noten sind wichtig für mein späteres Leben“). Je angenehmer und / oder je wichtiger Lernen eingeschätzt wird, umso leichter sollte das Lernen erfolgen und umso niedriger sollten die berichteten Beeinträchtigungen sein. Ein inkrementeller Varianzanteil des Lernerlebens und -verhaltens sollte durch die Anreize der Freizeitaktivität vorhergesagt werden. Dies zeigte sich in der Tat. Entsprechend Abbildung 2 hingen extrinsischen Anreize der Freizeitaktivität mit dem Erleben und Verhalten beim Lernen zusammen. Je höher die Freizeitanreize ausgeprägt waren, umso schlechter erging es den befragten Personen nach der Entscheidung für die Lernaktivität. In einer differenzierteren Erfassung motivationaler Charakteristika bezogen sich Grund und Fries (2012) sowie Grund und Kollegen (2014) auf Konzepte der Selbstbestimmungstheorie und der Zielorientierungstheorie. Sie unterschieden bei Studierenden fünf Anreizqualitäten (s. Abb. 2). Für jede Aktivität wurden intrinsische Anreize (z. B. „Ich lerne / Ich treffe meine Freunde, weil ich dabei Freude empfinde“), Lernziel- (z. B. „… weil ich mich gerne weiterentwickle“), Annäherungs- (z. B. „… weil ich mir davon bestimmte Vorteile verspreche“), Vermeidungs- (z. B. „… weil ich mir bestimmte Unannehmlichkeiten ersparen möchte“) und Fremdanreize erfasst (z. B. „… um bestimmte Erwartungen von anderen Personen zu erfüllen“). Sowohl für hypothetische (d. h. vorgegebene, prototypische Konfliktszenarien) als auch für idiografische (d. h. selbst erlebte) Konflikte zeigte sich der Interferenzeffekt: Nicht nur die Anreize der ausgewählten Aktivität, sondern auch die Anreize der abgewählten Alternative sagten vorher, wie es den Studierenden erging. Dies galt sowohl für die Lern-Entscheidung als auch für die Freizeit-Entscheidung. Durch die differenzierte Anreizerfassung konnte zudem die Annahme bestätigt werden, dass verpasste Anreize unabhängig von ihrer motivationalen Qualität (z. B. Annäherung vs. Vermeidung) die gewählte Alternative beeinflussen. Für diese Anreize fanden wir durchgängig positive Beziehungen zur Erlebensbeeinträchtigung während der Ausführung der gewählten Handlung. Betrachteten wir hingegen die Anreize der gewählten Handlung als Prädiktoren des Erlebens, fanden wir theoriekonform differenzielle Vorhersagemuster. So gingen z. B. intrinsische Anreize mit weniger Beeinträchtigungen einher, während Vermeidungs- und Fremdanreize mit mehr Beeinträchtigungen einhergingen. © 2017 Hogrefe

75

Um die Generalisierbarkeit der Befunde zu motivationaler Interferenz besser abzusichern, untersuchten wir sie auch im (Lern-)Alltag (Grund, Grunschel et al., 2015; Grund, Schmid & Fries, 2015). Auch hier war die Frage, inwiefern die Anwesenheit und Stärke alternativer Handlungstendenzen das aktuelle (Lern-)Erleben beeinträchtigen. Studierende gaben mithilfe der Experience-Sampling-Methode über insgesamt eine Woche mehrmals täglich Auskunft über ihr Erleben und Verhalten in ihrem Alltag. In zufälligen Intervallen wurden sechs Mal pro Tag über Smartphone unter anderem ihre aktuelle Stimmung, der aktuelle Kontext (z. B. Lernen vs. Freizeit) und das Ausmaß und die Art motivationaler Konflikte erfasst. Dazu wurden die Studierenden in Anlehnung an Riediger und Freund (2008) gefragt, inwiefern sie aktuell lieber etwas anderes tun wollten oder aber etwas anderes tun sollten als das, was sie gerade taten. So erhielten wir durchschnittlich 40 „Echtzeiterfahrungen“ pro Versuchsperson. Insgesamt war in 57 % aller Situationen eine konfligierende Handlungstendenz präsent. In Lernsituationen lag der Konfliktanteil sogar bei über 82 %. Nur in 120 von 672 Lernepisoden wurde nicht das Gefühl berichtet, etwas anderes tun zu wollen oder zu sollen. Wenig überraschend fanden wir eine höhere negative Aktivierung (z. B. „besorgt“ sein) und eine niedrigere Valenz (z. B. „glücklich“ sein) bei Lernaktivitäten als bei Freizeithandlungen, was als Hinweis auf höhere motivationale Interferenz gedeutet werden kann. Generell wird Lernen also weniger positiv erlebt als Freizeit. Besonders negativ erlebt wurden Situationen mit einem starken Anreiz, etwas anderes tun zu wollen. Dieses Erleben trat besonders häufig in Lernkontexten auf, während in Freizeitkontexten eher der Konfliktfall dominierte, etwas anderes tun zu sollen. WollenKonflikte scheinen stärker affektiv begründet zu sein, während Sollen-Konflikte eher Ergebnis kognitiv geprägter Bewertungen sind. Interessanterweise wurden Lernsituationen, in denen kein Konflikt bestand, ähnlich positiv erlebt wie Freizeit. All diese Befunde sprechen für die Alltagsrelevanz motivationaler Interferenz. Und sie verdeutlichen die Notwendigkeit, konkurrierende Handlungstendenzen bei der Erklärung von Erleben und Verhalten zu berücksichtigen.

Studien zu motivationaler Interferenz im Klassenzimmer Schule-Freizeit-Konflikte können auch während des Unterrichts auftreten. Lernende können zu einer „off-task“Aktivität dann wechseln, wenn sich die Motivationskonstellation geändert hat, z. B. wenn eine Person ein Briefchen (oder eine Textnachricht) erhält. Der Unterricht behandelt ein interessantes Thema, aber das Briefchen ist lang und Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85


76

die Person ist neugierig auf seinen Inhalt. Achtklässler stellten sich vor, dass sie in einem solchen Szenario dem Unterricht folgen wollten (Kilian, Hofer, Fries & Kuhnle, 2010). Dann gaben sie die affektiven, kognitiven und verhaltensbezogenen Konsequenzen dieser Wahl an. Sie berichteten über eine umso höhere motivationale Interferenz, je wichtiger ihnen Freizeitziele waren. Für den Fall, dass sie das Briefchen lesen würden, war die motivationale Interferenz umso höher, je wichtiger ihnen schulbezogene und je weniger wichtig ihnen freizeitbezogene Ziele waren (Kilian, Hofer & Kuhnle, 2013). Ein Ereignis, das viele Lehrer als Normverstoß und somit als Disziplinproblem definieren, wird hier als Ergebnis eines Zielkonflikts rekonstruiert (Hofer, 2007): Die Motivation, dem Unterricht zu folgen, sinkt im Verlaufe einer Unterrichtsstunde, und die Motivation für ein anderes Ziel kann ansteigen, z. B. aufgrund äußerer Anreize. Wenn die Motivation für das aktuelle Ziel niedriger ist als jene für die verfügbare Alternative, erfolgt ein Handlungswechsel (Atkinson, 1974). Das undisziplinierte Verhalten einer Person ist dann Ausdruck davon, dass sie ein Ziel anstrebt, das ihr anscheinend im Moment wichtiger ist als der Unterricht, vielleicht weil sie einer Zurückweisung durch eine Freundin entgehen möchte.

Bedingungen motivationaler Konflikte Da sich Zielkonflikte von Lernenden auf deren Leistungen und deren Wohlbefindensgefühle auswirken können, ist es wichtig, Faktoren zu kennen, die diese Konflikte begünstigen. Von der Vielzahl möglicher Determinanten der Häufigkeit von Schule-Freizeit-Zielkonflikten, der Entscheidung in solchen Konflikten und der motivationalen Interferenz haben wir die beiden Konstrukte individuelle Werte und Selbstkontrollstärke genauer untersucht (s. Abb. 1).

Individuelle Werte Im Sinne der klassischen Auffassung, dass individuelle Werte handlungsleitend sind, konnten wir deutliche Zusammenhänge mit Konstrukten der Theorie motivationaler Handlungskonflikte finden. Haupt-, Realschul- und Gymnasialschüler der 4., 6. und 8. Klasse mit hohen Leistungswerten entschieden sich häufiger für die Lernalternative in Schule-Freizeit-Konflikten, berichteten geringere motivationale Interferenz beim Lernen nach einem solchen Konflikt und investierten mehr Zeit in Lernen als Schüler und Schülerinnen mit niedrigen Leistungswerten Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85

M. Hofer et al., Multiple Ziele und Lernmotivation

(Hofer, Möhle, Kuhnle, Kilian & Schmid, 2008; Hofer et al., 2007). Ähnlich gaben bei Zielkonflikten im Klassenzimmer (Briefchen-Lesen vs. Unterricht-Verfolgen) Achtklässler mit hohen Leistungswerten an, sich eher gegen das Lesen des Briefchens zu entscheiden (Kilian, Hofer, Fries et al., 2010). Lernende mit hohen Leistungswerten, die in der Situation der Freizeitalternative nachgaben, berichteten über stärkere Beeinträchtigungen in diesem Bereich (Fries et al., 2005). Umgekehrt entschieden sich Personen mit hohen Wohlbefindenswerten häufiger für die Freizeitoption und berichteten über weniger Beeinträchtigungen bei deren Ausübung (Hofer et al., 2007). In einer Studie, in der Konfigurationen von Werten beachtet wurden, berichteten Schülerinnen und Schüler mit sowohl hohen Leistungs- als auch hohen Wohlbefindenswerten über häufige Schule-Freizeit-Konflikte und darüber, dass ihnen eine Entscheidung in diesen Konflikten besonders schwer fällt (Fries et al., 2005). Lernende mit hohen Leistungswerten und solche mit niedrigen Wohlbefindenswerten wiesen auch bessere Schulnoten auf (Fries et al., 2005; Hofer, Kuhnle et al., 2011; Hofer et al., 2007; Hofer et al., 2014; Hofer et al., 2009; Kilian, Hofer, Fries et al., 2010). Die Korrelationen zwischen Wertorientierungen und Schulnoten waren vermittelt über die Anreize der verschiedenen Schulfächer (Fries et al., 2007). So könnten sich individuelle Werte über die Anreize, die Schüler dem jeweiligen zielgerichteten Verhalten zuschreiben, auf schulische Motivation und Leistung auswirken. Interessanterweise fanden sich bei Lernenden aus so verschiedenen Ländern wie Bosnien-Herzegowina, Indien, Italien, Spanien und auch Vietnam vergleichbare Zusammenhangsmuster. Kinder und Jugendliche mit hohen Leistungswerten entschieden sich häufiger für das schulische Ziel und erlebten niedrigere motivationale Interferenz in Lern- und höhere in Freizeitsituationen, während sich jene mit hohen Wohlbefindenswerten häufiger für das Freizeitziel entschieden und niedrigere Interferenz während der Freizeit und höhere beim Lernen berichteten (Hofer, Fries et al., 2010; Hofer et al., 2007; Hofer et al., 2009). Längsschnittliche Befunde geben Hinweise auf die Richtung der Effekte. Schülerinnen und Schüler mit hohen Leistungswerten gaben 8 Monate später höhere motivationale Interferenz beim Lesen des Briefchens an, während Schülerinnen und Schüler mit hohen Wohlbefindenswerten niedrigere motivationale Interferenz berichteten (Kilian, Hofer & Kuhnle, 2010). Dies deutet darauf hin, dass Werte motivationale Interferenz verursachen. In einer Studie prüften wir die Erwartung, dass der Zusammenhang zwischen Werten und motivationaler Interferenz durch persönliche Ziele vermittelt wird. Empirisch zeigten sich bei deutschen Zehntklässlern signifikante Korrelationen zwischen der Leistungswertorientierung der Schüle© 2017 Hogrefe


M. Hofer et al., Multiple Ziele und Lernmotivation

rinnen und Schüler und schulbezogenen, frei genannten persönlichen Zielen sowie zwischen der Wohlbefindenswertorientierung und außerschulischen Zielen (Kilian et al., 2013). Es spricht also einiges dafür, dass die Variation individueller Werte die Variation verschiedener Aspekte des Lernverhaltens bedingt. Personen mit hohen Wohlbefindenswerten finden in der Regel Freizeitziele wichtiger, erleben häufiger Schule-Freizeit-Konflikte, entscheiden sich öfter für die Freizeitoption und erleben dann weniger motivationale Interferenz als Personen mit niedrigen Wohlbefindenswerten. Sie investieren auch weniger Zeit ins Lernen, weil sie dabei mehr motivationale Interferenz erleben.

Selbstkontrolle Selbstkontrolle als Eigenschaft bezeichnet die interindividuell variierende Fähigkeit, die eigenen Gedanken, Gefühle und Handlungen zu kontrollieren. Sie wird als bedeutsam erachtet, wenn attraktive Alternativen, die mit der Erreichung eines ins Auge gefassten Ziels interferieren, gehemmt werden müssen (Baumeister & Vohs, 2004). In Abbildung 1 wird Selbstkontrolle als Beispiel für weitere personale Bedingungsvariablen des Erlebens motivationaler Konflikte verortet. In quer- und längsschnittlichen Studien wiesen Schülerinnen und Schüler mit hoher Selbstkontrollstärke seltener SchuleFreizeit-, Schule-Schule- und Freizeit-Freizeit-Konflikte auf (Kuhnle, Hofer & Kilian, 2010) und erlebten weniger motivationale Interferenz sowohl in Lern-als auch in Freizeitsituationen (Grund & Fries, 2014; Hofer, Kuhnle, Kilian & Fries, 2012). Viele Studien haben eine hohe prognostische Validität der Selbstkontrollstärke im Leistungsbereich gezeigt. Lernende können ihre akademischen Leistungen erhöhen, wenn sie über die Fähigkeit verfügen, ihre langfristigen Ziele vor spontanen Impulsen zu schützen (z. B. Spörer, Brunstein & Glaser, 2006). Selbst unter Konstanthaltung des Vorwissens konnte Selbstkontrolle einen beträchtlichen Anteil an Schulnotenvarianz erklären (z. B. Duckworth, Quinn & Tsukayama, 2012; Hofer et al., 2012; Kuhnle, Hofer & Kilian, 2012). Selbstkontrolle war auch positiv verbunden mit Messungen gesunder Persönlichkeitsentwicklung wie Zeitbalance, der Tendenz, beim Lernen Flow zu erleben, und dem Ausmaß, in dem Lernende Studiergewohnheiten präferieren (Kuhnle et al., 2012). In einer Experience-Sampling-Studie an Studierenden (Grund, Grunschel et al., 2015) korrelierte Selbstkontrolle mit affektivem Wohlbefinden und Lebenszufriedenheit, vermittelt über weniger Studium-Freizeit-Konflikte. Selbstkontrolle kann auf unterschiedliche Weise zur Verringerung von Zielkonflikten beitragen. Personen mit © 2017 Hogrefe

77

hoher Selbstkontrolle sollten besser in der Lage sein, die jeweils ausgeübte Tätigkeit von störenden Gedanken abzuschirmen, die von Anreizen der nichtgewählten Tätigkeit ausgehen. Auch haben Personen mit hoher Selbstkontrolle Lerngewohnheiten, die das Auftreten von Zielkonflikten vermindern (Galla & Duckworth, 2015).

Folgen motivationaler Konflikte Nachdem Befunde zu motivationaler Interferenz in Konfliktsituationen und deren Bedingungen dargestellt wurden, gehen wir den Auswirkungen von Zielkonflikten und der daraus resultierenden motivationalen Interferenz nach. Wir besprechen diese Folgen motivationaler Konflikte in Hinblick auf Lernergebnisse, Persönlichkeitsentwicklung und Lebensbalance (s. rechte Seite von Abb. 1).

Leistung Wie gezeigt, wird das aktuelle Erleben bei Lernaktivitäten beeinträchtigt, wenn diese mit konfligierenden Handlungstendenzen interferieren. Da diese Beeinträchtigungen auch relevante kognitive und verhaltensbezogene Prozesse betreffen, sollten letztlich auch die Lernergebnisse davon betroffen sein. In quer- und längsschnittlichen Studien mit hypothetischen Konflikten hing die Stärke der berichteten Beeinträchtigungen nach der Entscheidung für eine Lernalternative negativ mit Schulnoten (Hofer et al., 2012; Hofer, Kuhnle et al., 2011; Kilian, Hofer, Fries et al., 2010) und der selbstberichteten aufgewendeten Lernzeit zusammen (Hofer et al., 2007). Auch in den Experience-Sampling-Daten ging auf Personenebene die durchschnittliche Konfliktintensität von Studierenden in Lernsituationen mit selbstberichteten Beeinträchtigungen in diesem Lebensbereich einher. Je höher das durchschnittliche Gefühl, lieber etwas anderes tun zu wollen als zu lernen, umso niedriger waren die Studienzufriedenheit, das Engagement für das Studium und die selbsteingeschätzte relative Leistung (Grund, Schmid et al., 2015). In Fragebogenstudien zu hypothetischen Konflikten gingen höhere Erlebensbeeinträchtigungen nach Entscheidungen für die Freizeitalternative mit besseren Noten einher (z. B. Kilian, Hofer, Fries et al., 2010). Vermutlich erleben leistungsorientierte Personen stärkere Beeinträchtigungen während der Freizeit und investieren mehr Zeit für das Lernen. Experimentelle Studien stützen die Vermutung, dass motivationale Konflikte über motivationale Interferenz zu Leistungseinbußen führen. Fries und Dietz (2007) ließen Schülerinnen und Schüler aus Sachtexten lernen, entweder Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85


78

nachdem sie bereits eine attraktive Zweitaufgabe ausgeführt hatten (Musikvideos bewerten) oder aber diese noch im Anschluss an die Lernaufgabe erwarteten. Die zweite Bedingung sollte einen motivationalen Konflikt erzeugen, da bereits während des Lernens eine starke alternative Handlungstendenz für die Videoaufgabe ausgebildet ist, während in der Kontrollbedingung diese Tendenz bereits befriedigt ist. Die Schülerinnen und Schüler der Kontrollbedingung berichteten weniger Beeinträchtigungen beim Lernen und lernten besser als jene, die die Videoaufgabe antizipierten. In einem weiteren Experiment wurde die Möglichkeit zum Handlungswechsel tatsächlich realisiert (Fries & Schmid, 2007). Während der Bearbeitung von Abbildungen zu verschiedenen naturwissenschaftlichen Themen (z. B. Treibhauseffekt) am Computer bestand für die Schülerinnen und Schüler der beiden Experimentalgruppen zu beliebigen Zeitpunkten die Möglichkeit, zu aktuellen Musikvideos zu wechseln. In der Kontrollgruppe war diese Möglichkeit nicht gegeben. Außerdem wurde variiert, ob das Videoschauen erlaubt oder verboten war. In beiden Experimentalbedingungen berichteten die Schülerinnen und Schüler höhere affektive und kognitive Beeinträchtigungen. Zudem fertigten sie schlechtere Abbildungsbeschreibungen als die Kontrollgruppe an. Die Verbotsmanipulation hatte keinen Einfluss. Es scheint so zu sein, dass alleine die Präsenz der Alternative und nicht deren tatsächliche Verfügbarkeit entscheidend für Interferenzeffekte ist. Motivationale Interferenz findet demnach auf der Ebene der kognitiven Repräsentation von Wünschbarkeiten statt. Zusammenfassend sprechen Befunde aus unterschiedlichen methodischen Ansätzen dafür, dass motivationale Interferenz Lernprozesse und Lernergebnisse beeinträchtigt. Selbst wenn sich Personen für das Lernen entscheiden und Freizeitverlockungen widerstehen, kann ihr Lernprozess nachhaltig gestört werden.

Persönlichkeitsentwicklung Häufige Zielkonflikte sind generell ein Risiko für die Entwicklung einer gesunden Persönlichkeit und für Zufriedenheit (Emmons et al., 1993). So berichten Personen mit wenigen Zielkonflikten eine höhere Lebenszufriedenheit als Personen mit vielen Konflikten (Riediger & Freund, 2004). In unseren Studien hing die Tendenz zum Erleben motivationaler Interferenz beim Lernen und in der Freizeit positiv mit Burnout und negativ mit Lebenszufriedenheit zusammen (Grund & Fries, 2014). Gehäufte Erfahrungen motivationaler Interferenz können erklären, dass bei 18-Jährigen Schule-Freizeit-Konflikte mit Maßen seelischer Gesundheit wie Depression und Lebenszufriedenheit verbunden waren (Ratelle, Vallerand, Senécal & Provencher, 2005). Auch in alltagsnahen Messungen gingen Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85

M. Hofer et al., Multiple Ziele und Lernmotivation

akkumulierte Konflikterlebnisse negativ mit Gefühlen des Wohlbefindens einher (Grund, Grunschel et al., 2015). Dabei waren vor allem häufige und intensive Gedanken, etwas anderes tun zu sollen, negativ mit der allgemeinen Lebenszufriedenheit gekoppelt, während das Gefühl, etwas anderes zu wollen, vor allem mit dem globalen affektiven Wohlbefinden verbunden war. Motivationale Interferenz kann auch die Ausprägung bestimmter Werte beeinflussen. In einer Längsschnittstudie wiesen Jugendliche, die hohe Interferenz während einer typischen „off-task“-Aktivität (Lesen eines Briefchens im Unterricht) berichteten, 8 Monate später niedrigere Wohlbefindenswerte und höhere Leistungswerte auf (Kilian, Hofer, Fries et al., 2010). In einer weiteren Studie zeigten Jugendliche mit hoher motivationaler Interferenz während einer typischen Freizeittätigkeit (z. B. Fernsehen) im darauffolgenden 2-jährigen Zeitraum einen Abfall des Wohlbefindenswerts und einen Anstieg des Leistungswerts, während Jugendliche mit hoher Interferenz beim Lernen einen Anstieg des Wohlbefindenswerts aufwiesen (Hofer, Schmid, Fries, Kilian & Kuhnle, 2010). Diese Befunde veranlassten uns zur Theorie der Werteänderung als Ergebnis kumulierter positiver oder negativer Handlungserfahrungen (Hofer, Reinders & Fries, 2010). Erlebt eine Person gehäuft positive Gefühle bzw. einen reibungslosen Verlauf (geringe motivationale Interferenz) zielgerichteter Handlungen, kommt sie allmählich zu einer positiveren Einschätzung der mit diesem Ziel verbundenen Werte. Umgekehrt können negative Gefühle bzw. ein stockender Verlauf (hohe motivationale Interferenz) beim Ausüben von Handlungen zu einer Reduktion der entsprechenden Werte führen. In einer experimentellen Studie prüften wir die in dieser Theorie enthaltene Annahme, dass Personen ihr Verhalten und Erleben bei der Ausführung einer Tätigkeit im Anschluss an einen motivationalen Konflikt beobachten (Kilian, Hofer & Kuhnle, 2012). In einem 2x2-Design wurde ein motivationaler Konflikt hergestellt, indem Versuchspersonen bei der Bearbeitung einer langweiligen Leistungsaufgabe zu einer attraktiven Alternative wechseln konnten. Motivationale Interferenz wurde manipuliert, indem die Aufgabe bei der Hälfte der Versuchspersonen in eine Rahmenhandlung eingebettet war. Das sollte die positiven Anreize der Alternative mindern. Die Variable Selbstfokus wurde manipuliert, indem die Hälfte der Versuchspersonen bei der Bearbeitung der Aufgabe auf ihr Erleben motivationaler Interferenz achtete. Erwartungsgemäß waren Personen in der Gruppe mit hoher motivationaler Interferenz weniger leistungswertorientiert, wenn sie auf ihr Erleben achteten, im Vergleich zu Versuchspersonen mit niedrigem induzierten Selbstfokus. Allgemein gesprochen erhöhen häufige positive Erfahrungen in einem Lebensbereich dessen Wertschätzung und © 2017 Hogrefe


M. Hofer et al., Multiple Ziele und Lernmotivation

verringern bei Zeitknappheit die Wertschätzung konkurrierender Tätigkeiten. Negative Erfahrungen bewirken das Gegenteil. So kann etwa der hohe Wert, den eine Person der Freundschaft zuschreibt, darauf zurückzuführen sein, dass sie wahrnimmt, wie sehr sie das Zusammensein mit Freunden genießt und die Abwesenheit von Freunden bedauert.

Lebensbalance Personen mit häufigen motivationalen Konflikten gelingt es offenbar nicht, sich ausreichend ihren verschiedenen Zielen zu widmen. Forschungen zur Work-Life-Balance zeigen, dass Menschen zufriedener sind, wenn sie ihre sozialen Rollen in der Arbeit und in der Familie in Einklang bringen können (z. B. Greenhaus, Collins & Shaw, 2003). In unseren Studien ließen wir Achtklässler angeben, inwieweit sie ihre Zeit angemessen auf verschiedene Lebensbereiche (Arbeit / Leistung, soziale Kontakte, Gesundheit / Köper, Lebenssinn) verteilen (jeweils zu viel / zu wenig / angemessen). Das Maß für die Zeitbalance war negativ mit der Häufigkeit erlebter Konflikte (Schule-Freizeit, SchuleSchule und Freizeit-Freizeit) und mit Prokrastination sowie positiv mit Schulleistung, Selbstkontrolle und der Tendenz, beim Lernen Flow zu erleben, korreliert (Kuhnle et al., 2010; Kuhnle, Hofer & Kilian, 2011; Kuhnle et al., 2012). Da das Konstrukt der Schule-Freizeit-Balance sowohl Lernerfolg als auch die Bewältigung anderer altersbezogener Entwicklungsaufgaben umfasst, schlagen wir vor, es als übergreifendes Erziehungsziel zu definieren (Hofer, 2014).

Strategien multipler Zielerreichung Motivationale Interferenz kann man nur dann erleben, wenn man sich in einem Zielkonflikt für eine Option entscheidet. Man kann aber auch auf eine Entscheidung verzichten und stattdessen versuchen, beide Ziele gleichzeitig zu erreichen. Unter Nutzung der Konstrukte der Theorie motivationaler Handlungskonflikte beurteilen wir die dabei angewendeten Strategien danach, inwieweit sie Zielkonflikte reduzieren, die angestrebten Ziele erreichen und Zeitbalance herstellen. In einer Pilotstudie basierend auf Tiefeninterviews befragte Schlick (2010) sechs Personen danach, wie sie in Situationen reagieren, in denen wichtige Ziele nur schwer gleichzeitig erreicht werden können. Im Folgenden beschreiben wir vier Strategien. Die Strategie des Multitaskings als Durchführung einer Zweittätigkeit neben dem Lernen nimmt parallel zur Verbreitung elektronischer Medien bei Lernenden rasant zu (Carrier, Rosen, Cheever & Lim, 2015): „Und da läuft natürlich immer alles gleichzeitig. Da läuft die Glotze, da ist © 2017 Hogrefe

79

der Computer an. (…) Dann sitzt sie noch auf dem Sofa und lernt Vokabeln“ (Hofer & Saß, 2006, S. 128). Angesichts von Zeitknappheit erscheint es vielen jungen Menschen erstrebenswert, anstatt sich nur für ein Ziel zu entscheiden, gleichzeitig auch ein weiteres Ziel anzustreben. In der Literatur herrscht jedoch weitgehend Einigkeit darüber, dass alltägliches Multitasking die Qualität des Lernens in und außerhalb des Unterrichts, Noten und Schulleistungen beeinträchtigt (Carrier et al., 2015). Beim Lernen entsteht durch irrelevante Reize und Gedanken kognitive Interferenz (Ophira, Nass & Wagner, 2009). Folglich ist bei Multitasking in Kauf zu nehmen, dass beide Ziele schlechter als angezielt erreicht werden (Kompromissbildung nach Fuhrer, 1984). Die Wahl von multifinalen Handlungen dürfte besonders effektiv sein, weil mit einer einzigen Handlung mehrere Ziele zugleich erreicht werden können. Das spart Zeit und verhindert Interferenz. Beispielsweise scheinen Jugendliche, indem sie Musik hören, verschiedene Entwicklungsaufgaben gleichzeitig zu bearbeiten (Integration in die Gruppe Gleichaltriger, Autonomiestreben; Boehnke, Münch & Hoffmann, 2002). Die Identifikation multifinaler Handlungen ist jedoch schwierig, weil das simultane Anstreben verschiedener Ziele die Optionen auf jene einschränkt, die beiden Zielen dienlich sind (Köpetz, Faber, Fishbach & Kruglanski, 2011). Gelingt es, beim Verfolgen verschiedener Ziele die entsprechenden Aktivitäten in eine ökonomische Reihenfolge zu bringen, kann man zeitsparend Zielkonflikte vermeiden und trotzdem beide Ziele erreichen (Linearisieren; Simon, 1967). Wir wissen kaum etwas darüber, welche Sequenzierungsstrategien Lernende wählen und mit welchen Methoden sie sie umsetzen. Einige Strategien mögen dazu beitragen, Zielkonflikte zu vermeiden, andere mögen Zeit sparen und damit der Zeitbalance dienen, wieder andere könnten eine bessere Zielerreichung gewährleisten. Die eigenen Ziele zu überdenken und sie ggf. entsprechend ihrer momentanen Wichtigkeit neu zu ordnen (Repriorisierung), kann Zielkonflikte vermindern und der Zielerreichung dienen (Cantor & Blanton, 1996). Ziele und Werte ändern sich im Verlauf der Persönlichkeitsentwicklung. Ist eine Aufgabe erfolgreich gelöst, kann das Ziel aufgegeben werden. Wird eine neue Aufgabe aktuell, müssen Ziele adjustiert werden, um zielführende Handlungen zu wählen (Pinquart, Silbereisen & Wiesner, 2004). Lernende müssen über ihre Ziele von Zeit zu Zeit mehr oder weniger explizit nachdenken und ihre Prioritäten ggf. neu festsetzen. Zusammenfassend sind Strategien zum Vermeiden von Zielkonflikten durch gleichzeitiges Erreichen mehrerer Ziele, außer Multitasking, noch kaum erforscht. Manche mögen schwer realisierbar sein, andere führen vermutlich nicht zu besserer Zeitbalance und wieder andere mindern Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85


80

die Zielerreichung. Unklar ist auch, wann der Einsatz einer solchen Strategie hilfreicher ist, als sich in einem Zielkonflikt entweder für die eine oder die andere Option zu entscheiden.

Theoretische Schlussfolgerungen und weiterführende Fragen Die Befunde aus dem Forschungsprogramm machen zunächst deutlich, dass das Verfolgen außerschulischer statt schulischer Ziele nicht Zeichen niedriger Lernmotivation sein muss. Im Einklang mit klassischen Theorien schulischer Motivation befördern die Anreize einer schulischen Aufgabe die Lernmotivation. Zusätzlich bestimmen auch die Anreize konfligierender Aktivitäten die Wahl der Aufgabe und die Qualität der Durchführung. Da die Bereitschaft, ein Ziel anzustreben, durch die Zugänglichkeit konkurrierender Ziele verringert wird, können sich Lernende trotz hoher Lernmotivation dann gegen Lernen entscheiden, wenn die Motivation für eine alternative Tätigkeit in der betreffenden Situation ebenfalls hoch ist. Sollten sie trotzdem lernen, dürften sie dies mit weniger Freude und Konzentration tun. Erweitert man Theorien lernmotivierten Verhaltens um einen Interaktionseffekt, könnten sie den Fall behandeln, dass die Lernmotivation mit der Motivation für eine alternative Handlung konkurriert. Und zwar sollte die Beziehung zwischen Motivationsstärke und Lerninvestition auch von der Wichtigkeit konkurrierender Ziele abhängen. Eine lineare Beziehung zwischen Lernmotivation und Lernverhalten dürfte nur bei niedriger Wichtigkeit alternativer Ziele auftreten. Daneben scheint die Theorie im Hinblick auf folgende sechs Aspekte weiterführend: Erstens erlaubt das Konzept der Entwicklungsaufgaben eine Konkretisierung der Opportunitätskosten einer Lernhandlung. In der Erwartungs-Wert-Theorie wird der Fall, dass Lernende bei der Entscheidung für eine Lernaktivität auf eine attraktive Alternative verzichten, als Kosten bezeichnet (Eccles, 2005). Die theoretische und empirische Behandlung von Opportunitätskosten wird erst neuerdings thematisiert (z. B. Flake et al., 2015). Das Konzept der Entwicklungsaufgaben hilft einzuschätzen, auf was Personen verzichten, wenn sie sich in einem Schule-Freizeit-Konflikt einer Lernhandlung zuwenden. Sie vernachlässigen dann womöglich Handlungen, die der Bearbeitung altersgemäßer Aufgaben dienen. Wir haben das Konzept der Entwicklungsaufgaben insbesondere im Hinblick auf jugendliche Schülerinnen und Schüler entfaltet. Grundschüler haben auch Entwicklungsaufgaben zu bewältigen, ihre Entscheidungsmöglichkeiten sind aber begrenzter. Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85

M. Hofer et al., Multiple Ziele und Lernmotivation

Das Konzept der motivationalen Interferenz ergänzt zweitens Überlegungen zu psychologischen Kosten bei Zielkonflikten. Motivationale Interferenz stellt eine weitere Kostenkategorie dar, indem sie auf die Minderung der Ausführungsqualität der gewählten Handlung verweist. Neben den Opportunitätskosten durch das Verpassen von Anreizen der nicht gewählten Handlung ergeben sich schlechtere Verhaltens- und Erlebensoutcomes. Motivationale Interferenz tritt drittens nicht nur bei Lernhandlungen auf. Auch die Durchführung der Alternativhandlung (hier häufig Freizeitaktivität) kann durch wartende Lernmotivationen beeinträchtigt werden. Solche Spill-over-Effekte (s. Grund & Fries, 2014) bleiben durch den üblichen Fokus auf Lern- und Leistungsvariablen in der pädagogischen Psychologie meist unbeachtet. Viertens gibt die Theorie einen Einblick in den Zusammenhang von Werthaltungen und Lernen. Sie verbindet gesellschaftliche Werte in westlichen Gesellschaften mit der Art und Weise, wie Schülerinnen und Schüler ihre schulischen und außerschulischen Ziele angehen. Die zentralen Zusammenhänge der Theorie sind auch für Lernende in Gesellschaften mit anderen Werten gültig. Mit der Einbindung von gesellschaftlich vermittelten Werthaltungen in die motivationspsychologische Rekonstruktion von Konflikten zwischen schulischen und außerschulischen Zielen schlägt die Theorie die Brücke zwischen einer situations- und prozessbezogenen Perspektive und einer kulturbezogenen Sichtweise. Gerade in diesem Punkt weist die Theorie über alternative Theorien der Lernmotivation (vgl. Wentzel & Miele, 2016) hinaus. Fünftens weist die Theorie auf die vernachlässigte Frage der motivationalen Dynamik hin (Schmidt & DeShon, 2007). Situationale Gelegenheiten können Ziele wecken, auf- oder abwerten (Fishbach & Zhang, 2008). Auch ändert sich die motivationale Tendenz für ein Ziel entsprechend dem Ist-Stand, den eine Person in dem betreffenden Bereich konstatiert, und dem Fortschritt, den sie darin macht. Sechstens schließlich ist die Frage des Einsatzes von Volitionsstrategien beim selbstregulierten Lernen neu zu bewerten. In Theorien selbstregulierten Lernens gilt das Auftauchen von nicht lernrelevanten Zielen als zu vermeidender und zu bekämpfender Störfall. Der Einsatz volitionaler Strategien soll helfen, äußeren und inneren Ablenkungen zu widerstehen (z. B. Schmitz & Wiese, 2006). Unbeschadet der Wichtigkeit, sich sowohl beim Lernen als auch bei anderen Tätigkeiten gegen konkurrierende Motivationen abzuschirmen, um die Qualität der Handlungsausführung zu sichern, sind „Ablenkungen“ nach ihrem entwicklungspsychologischen Stellenwert zu beurteilen. Adaptive Selbstregulation meint, dass man sich je nach relativer Bedeutung der Ziele entweder von Alternativen abschirmt oder aber bereit ist, nichtschulische Ziele anzustreben, z. B. mit Freunden zu feiern, die Freizeit zu © 2017 Hogrefe


M. Hofer et al., Multiple Ziele und Lernmotivation

genießen und individuelle Interessen zu entwickeln, selbst wenn schulische Aufgaben warten (Grund & Fries, 2014). Das bisherige Forschungsprogramm generiert eine Reihe relevanter Anschlussfragen. So sollten die grundlegenden Annahmen und Prinzipien der Theorie motivationaler Handlungskonflikte in anderen Anwendungskontexten geprüft werden. Interessanterweise scheint die Häufigkeit motivationaler Konflikte mit dem Alter abzunehmen (Riediger & Freund, 2008). Gleichwohl ist die Integration multipler Ziele aus unterschiedlichen Lebensbereichen für viele Eltern und Berufstätige eine zentrale Herausforderung (Greenhaus et al., 2003). Auf Prozessebene stellt sich die Frage, inwieweit neben Anreizparametern weitere motivationale Merkmale zur Erklärung motivationaler Interferenzeffekte herangezogen werden können (vgl. Brassler, Grund, Dedic, Wilmer & Fries, 2016). So könnte bei hoher Bedeutsamkeit von Anreizen unterlassener Handlungstendenzen deren subjektive Erfolgserwartung entscheidend sein. Passend hierzu zeigten Masicampo und Baumeister (2011), dass Interferenzeffekte reduziert werden können, wenn unerledigte Aufgaben bereits vorab durch Pläne spezifiziert worden sind. Schließlich sollte zukünftige Forschung das Verhältnis der beschriebenen Annahmen und Befunde zu anderen Modellen der Selbstregulation klären. Die Annahme konfligierender Werte und daraus resultierender motivationaler Interferenzen könnte eine alternative Erklärung für bisherige Befunde im Bereich der Selbstkontrollforschung liefern. Wenn Personen mit hoher Fähigkeit zur Selbstkontrolle gleichzeitig hohe Leistungs- und niedrige Wohlbefindenswerte aufweisen (vgl. Kuhnle et al., 2010), dann sollte bereits aufgrund dieser spezifischen Anreizstruktur weniger Anlass zur Überwindung aversiver Erlebnisse beim Lernen und zur Unterdrückung attraktiver Freizeitalternativen bestehen. Genießt Lernen eine höhere Bedeutung als Freizeit, dann braucht es kaum „Willensstärke“ bei der Verfolgung akademischer Ziele. Das Konzept der motivationalen Interferenz ermöglicht so eine kritische Prüfung der Funktionsweise von Selbstkontrolle.

Pädagogische Schlussfolgerungen Wie kann man Lernende unterstützen, ihre Ziele in verschiedenen Lebensbereichen zu erreichen? Die Frage, wie Erziehung in der Bildung zu gestalten sei, wird paradoxerweise von den allgemeinen Erziehungswissenschaftlern völlig ausgeklammert (Zedler, 2011). Auch die empirische Bildungsforschung geht nur am Rande der Frage nach, wie Unterricht und Schule neben Leistung auch Motivation und Persönlichkeitsentwicklung fördern können. Nach bisherigen Befunden ist eine simultane Leistungs- und Motivationsförderung eher wahrscheinlich, wenn Lehr© 2017 Hogrefe

81

kräfte neben einer effizienten Klassenführung und einer klar strukturierten Unterrichtsgestaltung auch sozial kompetent und schülerzugewandt unterrichten und sich zudem Zeit für Entfaltung gewährende Interaktionen nehmen (z. B. Fauth, Decristan, Rieser, Klieme & Büttner, 2014; Schrader, Helmke & Dotzler, 1997). Anhand unserer Theorie und Befunde können wir spezifizierend fragen: Wie kann man bei Lernenden motivationale Konflikte reduzieren und ihnen eine ausgeglichene Zeitbalance für die Bearbeitung der anfallenden Entwicklungsaufgaben und für das Erreichen sowohl schulischer als auch außerschulischer Ziele ermöglichen? Im Folgenden behandeln wir unter präskriptiver Perspektive die Konstrukte Klärung von Zielen, Ermöglichen positiver Gefühle beim Lernen sowie Selbstkontrolle und diskutieren Fördermöglichkeiten in der Schule.

Zielklärung Das Anstreben multipler Ziele setzt voraus, dass Personen über ihre Ziele Bescheid wissen. Bei klaren Zielen kann motivationale Interferenz vermindert werden (Strickland & Galimba, 2001). Da sich die relative Wichtigkeit von Zielen je nach Bearbeitungsstand der Entwicklungsaufgaben ändert, sollten Lernende von Zeit zu Zeit über die Bedeutsamkeit ihrer Ziele nachdenken. Mit einem webbasierten Selbstmanagementtagebuch, in dem Studierende angehalten wurden, über die Wichtigkeit ihrer akademischen und nichtakademischen Ziele zu reflektieren, konnten wir die Häufigkeit von Zielkonflikten reduzieren (Winter, 2007). Zielklärung und Zeitplanung stärken das Gefühl der Kontrolle über die eigene Zeit (Häfner, Stock & Oberst, 2015) und verbessern akademische Leistungen (Morisano, Hirsh, Peterson, Pihl & Shore, 2010). In ihrem Programm TimeWise trainierten Caldwell, Baldwin, Walls und Smith (2004) bei Siebtklässlern das Erkennen der Gründe für die Nutzung von Freizeit (z. B. extrinsische / identifizierte Motivation), die Wahrnehmung der eigenen Befindlichkeiten und Interessen sowie die Planung von Aktivitäten. Mit diesem Programm verbesserten die Autoren verschiedene freizeitbezogene Variable wie z. B. Planung und Entscheidung, intrinsische Motivation, Fähigkeit zur Umstrukturierung langweiliger Situationen und das allgemeine Wohlbefinden. Hilfreich für die Zielklärung können Instrumente sein, die bei Lernenden den Ist-Stand und den gewünschten Stand beim Erreichen altersabhängiger Aufgaben abfragen (Pinquart et al., 2004). Damit könnten auch Lehrkräfte herausfinden, wie gut Lernende in diesen Aufgaben vorankommen. Sie müssten dann das Zeitbudget entsprechend sortieren. Entwicklungsaufgaben als Suchkategorien können es Lehrkräften auch erleichtern, schulische Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85


82

Lehr-Lern-Situationen so zu gestalten, dass sie aktuelle Entwicklungsaufgaben tangieren (Multifinalität von Handlungen). Auch Gestalter des „Schullebens“ sollten darüber nachdenken, was Kindern und Jugendlichen in ihrem Alltag neben schulischem Erfolg wichtig ist. Gebundene Ganztagsschulen können entlang der Entwicklungsaufgaben ein mehrdimensionales Zielkonzept begründen und daraus die Bereitstellung räumlicher und sächlicher Angebote für extracurriculare Aktivitäten ableiten.

M. Hofer et al., Multiple Ziele und Lernmotivation

und unterscheiden darin unter anderem „Sensitivität“ und „Hineinversetzen in die Schülerperspektive“. Im Lichte unserer Theorie begünstigen Lehrkräfte mit solchen Eigenschaften eine positive Entwicklung von Schülerinnen und Schülern, weil sie damit die individuellen altersabhängigen Ziele der Lernenden ermitteln können. Sie können ihnen dann leichter zu einer multiplen Zielerreichung verhelfen.

Förderung der Selbstkontrolle Ermöglichen positiver Gefühle Unsere Befunde weisen auf die Bedeutung positiver Gefühle bei der Tätigkeitsausübung hin. Bei niedriger motivationaler Interferenz sind positive Gefühle wahrscheinlicher. Da eine geringe Leistungsbereitschaft von Lernenden häufig weniger an niedrigen Leistungszielen und -werten liegt, sondern an einer Kombination hoher Leistungsziele und hoher Freizeitziele, dürfte es wenig erfolgversprechend sein, stärkere Leistungsanreize bereitzustellen. Unsere Befunde stützen eher die Empfehlung, schulisches Lernen so zu organisieren, dass es effektiv und freudvoll ist, weil dann bei Lernenden mit hohen Wohlbefindenswerten auch deren Leistungswerte gestärkt werden, vorausgesetzt, sie achten bei der Ausübung der Tätigkeit auf ihre inneren Reaktionen und reflektieren darüber. Erzieher sollten der Breite von Zielen Lernender Rechnung tragen und sie ermuntern, entsprechende Situationen aufzusuchen. Lehrkräfte, die ihren Schülerinnen und Schülern mehr Freiheitsspielräume (z. B. „Die Schüler wählen Aufgaben nach Interesse frei“) und Kooperationsmöglichkeiten (z. B. „Die Schüler führen Partnerkontrolle durch“) zugestehen, scheinen im Hinblick auf Schülerleistungen und Lernfreude erfolgreicher zu sein. Im Lichte der Selbstbestimmungstheorie werden diese Befunde dahingehend interpretiert, dass Freiheitsspielräume und Zusammenarbeit Grundbedürfnisse nach Autonomie und sozialer Eingebundenheit abdecken (Kammermeyer & Martschinke, 2009). Unsere Theorie legt die Erklärung nahe, dass diese Lehrkräfte es den Lernenden erleichtern, neben schulischen auch andere Entwicklungsaufgaben anzugehen. Lernende nutzen die angebotenen Freiräume, um Situationen herzustellen, die sie benötigen. Das Zusammensein mit Freunden ist dafür offenbar besonders geeignet, weil dabei verschiedene Entwicklungsaufgaben gleichzeitig bearbeitet werden können. Befunde zu affektivem Wohlbefinden von Schülern legen nahe, dass fürsorgliche Lehrkräfte Schulfreude und positive Einstellungen zur Schule fördern (Hascher, 2004). Pianta und Hamre (2009) konzipieren in ihrem System zur Klassifikation von Lehrer-Schüler-Interaktionen die Lehrereigenschaft „Emotionale Unterstützung“ Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85

Unsere Befunde weisen schließlich darauf hin, dass Lernende sich ggf. selbst motivieren müssen, um sich in eine weniger geliebte Tätigkeit hineinzubringen oder an dieser dranzubleiben. Die Strategie der Implementationsintention ist hilfreich, zielgerichtete Aktivitäten in Gang zu setzen und am Laufen zu halten. Durchhaltepläne können sicherstellen, Ziele auch wie vorgesehen umzusetzen. Dafür kann man entsprechend dem Prinzip der mentalen Kontrastierung auch Strategien formulieren, um erfolgreich mit Hindernissen (z. B. Anrufe von Freunden) umzugehen, welche vom eigenen Vorhaben ablenken können (Duckworth, Gendler & Gross, 2014). Da die mit Freizeitaktivitäten verbundenen Ziele für Außenstehende häufig wenig sichtbar sind, besteht bei Betonung der Selbstkontrolle die Gefahr einer einseitigen Fokussierung auf leistungsthematische Ziele. Selbstkontrollstrategien können, wenn chronisch angewendet, zu Entfremdungsphänomenen führen (Kuhl & Beckmann, 1994). Gleichwohl können sie Personen helfen, sich auf ihr Lernen zu konzentrieren und ihre Aktivitäten auch in anderen wichtigen Lebensbereichen voranzutreiben. Motivationale Handlungskonflikte können auch dadurch verringert werden, dass Tätigkeiten strukturiert werden. Strukturierte Tätigkeiten, die sich durch regelmäßige Teilnahme, regelgeleitetes Verhalten, Anleitung durch erwachsene Personen und Schwerpunkt auf den Fähigkeitserwerb auszeichnen (Mahoney & Stattin, 2000), haben sich im Vergleich zu spontanen Aktivitäten, die kein vorgezeichnetes Ende haben, ohne erwachsene Aufsicht ablaufen und nicht auf den Fähigkeitserwerb ausgerichtet sind, als vorteilhaft für die schulische, soziale und emotionale Entwicklung herausgestellt (Feldman & Matjasko, 2005). Folgt man Gewohnheiten, treten Zielkonflikte und motivationale Interferenz seltener auf, weil die Person die Handlungsauslösung an die Situation delegiert hat und die Entscheidung nicht mehr selbst treffen muss (Galla & Duckworth, 2015; Wood, Quinn & Kashy, 2002). Schülerinnen und Schüler, die bei der Erledigung ihrer täglichen Hausaufgaben auf Gewohnheiten zurückgriffen, gaben weniger Prokrastination an und wählten häufiger die Lern- statt der Freizeitaktivität (Dietz, Hofer & Fries, 2007). Bei der Strukturierung von Aktivitäten sind stets unerwartete Ereignisse mit zu be© 2017 Hogrefe


M. Hofer et al., Multiple Ziele und Lernmotivation

denken. Planung und Flexibilität sind auszubalancieren (s. Caldwell et al., 2004). Ganztagsschulen sind besonders geeignet, neben unterrichtlichen auch extracurriculare Aktivitäten in strukturierter Form anzubieten. Auch Eltern sollten dafür sorgen, dass die Freizeittätigkeiten ihrer Kinder möglichst strukturiert ablaufen. Zusammenfassend spezifizieren wir mit unserem Ansatz Befunde aus der Bildungsforschung zur Bedeutung eines „unterstützenden Klassenklimas“, indem wir mit der Forderung nach Zielreflexion neue Anregungen geben und aufzeigen, dass die Strukturierung von Tätigkeiten für schulische- und Freizeitaktivitäten hilfreich ist. Zum anderen deuten wir Empfehlungen aus der Literatur neu, etwa die Bedeutung freudvoller Tätigkeiten und das Gewähren von Wahlfreiheiten. Schließlich kommen wir, was die Rolle von Leistungsanreizen betrifft, zu gegenteiligen Empfehlungen als die Literatur. Unsere Überlegungen können Schulen, Lehrkräften und Eltern auch helfen, eigene Maßnahmen zu finden, um Heranwachsenden ihre entwicklungsbedingten Ziele bewusst zu machen und ihnen Tätigkeiten zu ermöglichen, die sie als freudvoll erleben. Ziel sollte sein, dass Lernende sowohl schulische als auch andere entwicklungsrelevante Ziele erreichen.

Literatur Atkinson, J. W. (1974). Motivational determinants of intellectual performance and cumulative achievement. In J. W. Atkinson & J. O. Raynor (Eds.), Motivation and achievement (pp. 389–410). Washington, DC: Winston. Baumeister, R. F. & Vohs, K. D. (Eds.). (2004). Handbook of self-regulation. Research, theory, and applications. New York: Guilford Press. Boehnke, K., Münch, T. & Hoffmann, D. (2002). Development through media use? A German study on the use of radio in adolescence. International Journal of Behavioral Development, 26, 193–201. Boekaerts, M., de Koning, E. & Vedder, P. (2006). Goal-directed behavior and contextual factors in the classroom: An innovative approach to the study of multiple goals. Educational Psychologist, 41, 33–51. Brassler, N. K., Grund, A., Dedic, M., Wilmer, E. & Fries, S. (2016). Interfered by the unaccomplished: expectations regarding unaccomplished tasks matter for focal experience and behavior. Manuskript eingereicht zur Publikation. Brint, S. & Cantwell, A. M. (2010). Undergraduate time use and academic outcomes: Results from EUCUES 2006. Teachers College Records, 112, 2441–2470. Brunstein, J. C. & Maier, G. W. (1996). Persönliche Ziele. Ein Überblick zum Stand der Forschung. Psychologische Rundschau, 47, 146–160. Caldwell, L. L., Baldwin, C. K., Walls, T. & Smith, E. A. (2004). Preliminary effects of a leisure education program to promote healthy use of free time among middle school adolescents. Journal of Leisure Research, 36, 310–335. Cantor, N. & Blanton, H. (1996). Effortful pursuit of personal goals in daily life. In P. M. Gollwitzer & J. A. Bargh (Eds.), The psychology of action: Linking cognition and motivation to behavior (pp. 338–359). New York: Guilford Press. © 2017 Hogrefe

83

Carrier, L. M., Rosen, L. D., Cheever, N. A. & Lim, A. F. (2015). Causes, effects, and practicalities of everyday multitasking. Developmental Review, 35, 64–78. Dietz, F., Hofer, M. & Fries, S. (2007). Individual values, learning routines, and academic procrastination. British Journal of Educational Psychology, 77, 893–906. Dowson, M. & McInerney, D. M. (2003). What do students say about their motivational goals? Towards a more complex and dynamic perspective on student motivation. Contemporary Educational Psychology, 28, 91–113. Duckworth, A. L., Gendler, T. S. & Gross, J. J (2014). Self-control in school-age children. Educational Psychologist, 49, 199–217. Duckworth, A. L., Quinn, P. D. & Tsukayama, E. (2012). What No Child Left Behind leaves behind: The roles of IQ and self-control in predicting standardized achievement test scores and report card grades. Journal of Educational Psychology, 104, 439–451. Eccles, J. S. (2005). Subjective task value and the Eccles et al. model of achievement-related choices. In A. J. Elliot & C. S. Dweck (Eds.), Handbook of competence and motivation (pp. 105–121). New York: Guilford Press. Emmons, R. A., King, L. A. & Sheldon, K. (1993). Goal conflict and the self-regulation of action. In D. M. Wegner & J. W. Pennebaker (Eds.), Handbook of mental control. Century psychology series (pp. 528–551). Englewood Cliffs, NJ: Prentice Hall. Fauth, B., Decristan, J., Rieser, S., Klieme, E. & Büttner, G. (2014). Student ratings of teaching quality in primary school: Dimensions and prediction of student outcomes. Learning and Instruction, 29, 1–9. Feldman, A. F. & Matjasko, J. L. (2005). The role of school-based extracurricular activities in adolescent development: A comprehensive review and future directions. Review of Educational Research, 75, 159–210. Fishbach, A. & Zhang, Y. (2008). Together or apart: When goals and temptations complement versus compete. Journal of Personality and Social Psychology, 94, 547–559. Flake, J. K., Barron, K. E., Hullemann, C., McCoach, B. D. & Welsh, M. E. (2015). Measuring cost: The forgotten component of expectancy-value theory. Contemporary Educational Psychology, 41, 232–244. Flammer, A., Alsaker, F. D. & Noack, P. (1999). Time use by adolescents in an international perspective. I: The case of leisure activities. In: F. D. Alsaker & A. Flammer (Eds.), The adolescent experience. European and American adolescents in the 1990s (pp. 33–60). Hillsdale: Erlbaum. Fries, S. & Dietz, F. (2007). Learning in the face of temptations: The case of motivational interference. The Journal of Experimental Education, 76, 93–112. Fries, S., Dietz, F. & Schmid, S. (2008). Motivational interference in learning: The impact of leisure alternatives on subsequent selfregulation. Contemporary Educational Psychology, 33, 119–133. Fries, S. & Schmid, S. (2007). Lernen bei attraktiven Handlungsalternativen: Das Phänomen der motivationalen Interferenz. Zeitschrift für Pädagogische Psychologie, 21, 171–181. Fries, S., Schmid, S., Dietz, F. & Hofer, M. (2005). Conflicting values and their impact on learning. European Journal of Psychology of Education, 20, 259–273. Fries, S., Schmid, S. & Hofer, M. (2007). On the relationship between value orientation, incentives, and academic achievement. European Journal of Psychology of Education, 22, 201–216. Fuhrer, U. (1984). Mehrfachhandeln in dynamischen Umfeldern. Göttingen: Hogrefe. Galla, B. M. & Duckworth, A. L. (2015). More than resisting temptation: Beneficial habits mediate the relationship between selfcontrol and positive life outcomes. Journal of Personality and Social Psychology, 109, 508–525. Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85


84

Greenhaus, J. H., Collins, K. M. & Shaw, J. D. (2003). The relation between work-family balance and quality of life. Journal of Vocational Behavior, 63, 510–531. Grund, A., Brassler, N. K. & Fries, S. (2014). Torn between study and leisure: How motivational conflicts relate to students' academic and social adaptation. Journal of Educational Psychology, 106, 242–257. Grund, A. & Fries, S. (2012). Motivational interference in study-leisure conflicts: How opportunity costs affect self-regulated learning. Educational Psychology: An International Journal of Experimental Educational Psychology, 32, 589–612. Grund, A. & Fries, S. (2014). Study and leisure interference as mediators between students' self-control capacities and their domain-specific functioning and general well-being. Learning and Instruction, 31, 23–32. Grund, A., Grunschel, C., Bruhn, D. & Fries, S. (2015). Torn between want and should: An experience-sampling study on motivational conflict, well-being, self-control, and mindfulness. Motivation and Emotion, 39, 506–520. Grund, A., Schmid, S. & Fries, S. (2015). Studying against your will: Motivational interference in action. Contemporary Educational Psychology, 41, 209–217. Häfner, A., Stock, A. & Oberst, V. (2015). Decreasing students' stress through time management training: An intervention study. European Journal of Psychology of Education, 30, 81–94. Hascher, T. (2004). Wohlbefinden in der Schule. Münster u. a.: Waxmann. Havighurst, R. (1972). Developmental tasks and education (3. Aufl.). New York: Random House. Heckhausen, J., Wrosch, C. & Schulz, R. (2010). A motivational theory of life-span development. Psychological Review, 117, 32–60. Hofer, M. (2004). Gasteditorial: Schüler wollen für die Schule lernen, aber auch anderes tun. Theorien der Lernmotivation in der Pädagogischen Psychologie. Zeitschrift für Pädagogische Psychologie, 18, 79–92. Hofer, M. (2007). Goal conflicts and self-regulation: A new look at pupils’ off-task behaviour in the classroom. Educational Research Review, 2, 28–38. Hofer, M. (2014). Persönlichkeitsentwicklung als Erziehungsziel jenseits kognitiver Kompetenzen. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 46, 55–66. Hofer, M. & Fries, S. (2016). A multiple goals perspective on academic motivation. In K. R. Wentzel & D. B. Miele (Eds.), Handbook of Motivation at School (2nd ed., pp. 440–458). New York, NY: Routledge / Taylor & Francis Group. Hofer, M., Fries, S., Helmke, A., Kilian, B., Kuhnle, C., Zivkovic, I. et al. (2010). Value orientations and motivational interference in school-leisure conflict: The case of Vietnam. Learning and Instruction, 20, 239–249. Hofer, M., Kilian, B., Kuhnle, C., Hellmann, K. & Barth, D. (2011). Persönliche Ziele und Schule-Freizeit-Konflikte bei Jugendlichen. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 43, 142–152. Hofer, M., Kuhnle, C. & Kilian, B. (2014). Erfolg in der Schule und andere Entwicklungsaufgaben: Tätigkeiten von Jugendlichen im Wettstreit. Unterrichtswissenschaft, 42, 171–186. Hofer, M., Kuhnle, C., Kilian, B. & Fries, S. (2012). Cognitive ability and personality variables as predictors of school grades and test scores in adolescents. Learning and Instruction, 22, 368–375. Hofer, M., Kuhnle, C., Kilian, B., Marta, E. & Fries, S. (2011). Motivational interference in school-leisure conflict and learning outcomes: The differential effects of two value conceptions. Learning and Instruction, 21, 301–316. Hofer, M., Möhle, T., Kuhnle, C., Kilian, B. & Schmid, S. (2008). Schule-Freizeit-Konflikte, Wertorientierungen und motivationale InZeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85

M. Hofer et al., Multiple Ziele und Lernmotivation

terferenz und Leistungen bei Grundschülern. Unterrichtswissenschaft, 36, 197–215. Hofer, M., Reinders, H. & Fries, S. (2010). Wie sich die Werte ändern. Ein zieltheoretischer Vorschlag zur Erklärung individuellen und gesellschaftlichen Wertewandels. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 42, 26–38. Hofer, M. & Saß, C. (2006). „Also, man würde lieber rausgehen, wenn viele Hausaufgaben zu machen sind.“ Motivationale Handlungskonflikte von Jugendlichen aus Elternsicht. Psychologie in Erziehung und Unterricht, 53, 120–131. Hofer, M., Schmid, S., Fries, S., Dietz, F., Clausen, M. & Reinders, H. (2007). Individual values, motivational conflicts, and learning for school. Learning and Instruction, 17, 17–28. Hofer, M., Schmid, S., Fries, S., Kilian, B. & Kuhnle, K. (2010). Reciprocal relationships between value orientation and motivational interference during studying and leisure. British Journal of Educational Psychology, 80, 623–645. Hofer, M., Schmid, S., Fries, S., Zivkovic, I. & Dietz, F (2009). Value orientations and studying in school-leisure conflict: A study with samples from five countries. Learning and Individual Differences, 19, 101–112. Hofer, M., Schmid, S. & Zivkovic, I. (2008). Schule-Freizeit-Konflikte, Wertorientierungen und motivationale Interferenz in der Freizeit. Eine kulturübergreifende Studie. Zeitschrift für Entwicklungspsychologie und Pädagogische Psychologie, 40, 55–68. Inglehart, R. (1998). Modernisierung und Postmodernisierung. Kultureller, wirtschaftlicher und politischer Wandel in 43 Gesellschaften. Frankfurt a. M.: Campus. Kammermeyer, G. & Martschinke, S. (2009). Qualität im Anfangsunterricht. Ergebnisse aus der KILIA-Studie. Unterrichtswissenschaft, 37, 95–106. Kilian, B., Hofer, M., Fries, S. & Kuhnle, C. (2010). The conflict between on-task and off-task actions in the classroom and its consequences for motivation and achievement. European Journal of Psychology of Education, 25, 67–85. Kilian, B., Hofer, M. & Kuhnle, C. (2010) Value orientations as determinants and outcomes of conflicts between on-task and offtask actions in the classroom. Learning and Individual Differences, 20, 501–506. Kilian, B., Hofer, M. & Kuhnle, B. (2012). The influence of motivational conflicts on personal values. Journal of Educational and Developmental Psychology, 2, 57–68. Kilian, B., Hofer, M. & Kuhnle, C. (2013). Conflicts between on-task and off-task behaviors in the classroom: the influences of parental monitoring, peer value orientations, students' goals, and their value orientations. Social Psychology of Education, 16, 77–94. Köpetz, C., Faber, T., Fishbach, A. & Kruglanski, A. W. (2011). The multifinality constraints effect: How goal multiplicity narrows the means set to a focal end. Journal of Personality and Social Psychology, 100, 810–826. Kracke, B. & Heckhausen, J. (2008). Lebensziele und Bewältigung im Jugendalter. In R. K. Silbereisen & M. Hasselhorn (Hrsg.), Entwicklungspsychologie des Jugendalters (Enzyklopädie der Psychologie, Serie Entwicklungspsychologie, Bd. 5, S. 497–533). Göttingen: Hogrefe. Kruglanski, A. W., Shah, J. Y., Fishbach, A., Friedman, R., Chun, W. Y. & SleethKeppler, D. (2002). A theory of goal systems. Advances in Experimental Social Psychology, 34, 331–378. Kuhl, J. & Beckmann, J. (1994). Alienation: Ignoring one's preferences. In J. Kuhl & J. Beckmann (Eds.), Volition and personality: Action versus state orientation (pp. 375–390). Seattle: Hogrefe & Huber. Kuhnle, C., Hofer, M. & Kilian, B. (2010). The relationship of value orientations, self-control, frequency of goal conflicts in school and leisure, and life-balance in adolescence. Learning and Individual Differences, 20, 251–255. © 2017 Hogrefe


M. Hofer et al., Multiple Ziele und Lernmotivation

Kuhnle, C., Hofer, M. & Kilian, B. (2011). The relationship of selfcontrol, procrastination, motivational interference and regret with school grades and life balance. Diskurs Kindheits- und Jugendforschung, 6, 31–44. Kuhnle, C., Hofer, M. & Kilian, B. (2012). Self-control as predictor of school grades, life balance, and flow in adolescents. British Journal of Educational Psychology, 82, 533–548. Kunter, M., Schümer, G., Artelt, C., Baumert, J., Klieme, E., Neubrand, M. et al. (2003). Pisa 2000 – Dokumentation der Erhebungsinstrumente (Materialien aus der Bildungsforschung Nr. 72). Berlin: MPI für Bildungsforschung. Li, J. (2016). Play or learn: European-American and Chinese kindergartners’ perceptions about the conflict. British Journal of Educational Psychology, 86, 57–74. Mahoney, J. L. & Stattin, H. (2000). Leisure activities and adolescent antisocial behavior: The role of structure and social context. Journal of Adolescence, 23, 113–127. Masicampo, E. J. & Baumeister, R. F. (2011). Consider it done! Plan making can eliminate the cognitive effects of unfulfilled goals. Journal of Personality and Social Psychology, 101, 667–683. Morisano, D., Hirsh, J. B., Peterson, J. B., Pihl, R. O. & Shore, B. M. (2010). Setting, elaborating, and reflecting on personal goals improves academic performance. Journal of Applied Psychology, 95, 255–264. Noack, P. (1990). Jugendentwicklung im Kontext. Zum aktiven Umgang mit sozialen Entwicklungsaufgaben in der Freizeit. München: Beltz. Noack, P. (2008). Freizeitorte und Freizeitaktivitäten. In R. K. Silbereisen & M. Hasselhorn (Hrsg.). Entwicklungspsychologie des Jugendalters (Enzyklopädie der Psychologie, Serie Entwicklungspsychologie, Bd. 5, S. 291–330). Göttingen: Hogrefe. Oerter, R. & Dreher, E. (2002). Jugendalter. In R. Oerter & L. Montada (Hrsg.), Entwicklungspsychologie (5. Aufl., S. 258–318). Weinheim: Psychologie Verlags Union. Ophira, E., Nass, C. & Wagner, A. D. (2009). Cognitive control in media multitaskers. Proceedings of the National Academy of Sciences, 106, 15583–15587. Ovadia, S. (2003). Suggestions of the postmodern self: Value changes in American high school students, 1976–1996. Sociological Perspectives, 46, 239–256. Pianta, R. C. & Hamre, B. K. (2009). Conceptualization, measurement, and improvement of classroom processes: Standardized observation can leverage capacity. Educational Researcher, 38, 109–119. Pinquart, M., Silbereisen, R. K. & Wiesner, M. (2004). Changes in discrepancies between desired and present states of developmental tasks in adolescence: A 4-process model. Journal of Youth and Adolescence, 33, 467–477. Randel, B., Stevenson, H. W. & Witruk, E. (2000). Attitudes, beliefs, and mathematics achievement of German and Japanese high school students. International Journal of Behavioral Development, 24, 190–198. Ratelle, C. F., Vallerand, R. J., Senécal, C. & Provencher, P. (2005). The relationship between school-leisure conflict and educational and mental health indexes: A motivational analysis. Journal of Applied Social Psychology, 35, 1800–1823. Rheinberg, F. (2006). Motivation (5. Aufl.). Stuttgart: Kohlhammer. Riediger, M. & Freund, A. M. (2004). Interference and facilitation among personal goals: Differential associations with subjective well-being and persistent goal pursuit. Personality and Social Psychology Bulletin, 30, 1511–1523. Riediger, M. & Freund, A. M. (2008). Me against myself: Motivational conflicts and emotional development in adulthood. Psychology and Aging, 23, 479–494. © 2017 Hogrefe

85

Schlick, F. (2010). Strategien zur Verfolgung multipler Ziele im Alltag. Eine Interviewstudie. Unveröffentlichte Diplomarbeit. Universität Mannheim. Schmid, S., Hofer, M., Dietz, F., Reinders, H. & Fries, S. (2005). Value orientations and everyday action conflicts: An interview study. European Journal of Psychology of Education, 20, 243–258. Schmidt, A. M. & DeShon R. P. (2007). What to do? The effects of discrepancies, incentives, and time on dynamic goal prioritization. Journal of Applied Psychology, 92, 928–941. Schmitz, B. & Wiese, B. S. (2006). New perspectives for the evaluation of training sessions in self-regulated learning: Time-series analyses of diary data. Contemporary Educational Psychology, 31, 64–96. Schrader, F. W., Helmke, A. & Dotzler, F. E. (1997). Zielkonflikte in der Grundschule: Ergebnisse aus dem SCHOLASTIK-Projekt. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S. 299–316). Weinheim: Psychologie Verlags Union. Schulze, G. (1992). Die Erlebnisgesellschaft. Kultursoziologie der Gegenwart. Frankfurt a. M.: Campus. Schwartz, S. H. (1992). Universals in the content of values: Theoretical advances and empirical tests in 20 countries. In M. Zanna (Ed.), Advances in experimental social psychology (Vol. 25, pp. 1–65). New York: Academic. Simon, H. A. (1967). Motivational and emotional controls of cognition. Psychological Review, 74, 29–39. Spörer, N., Brunstein, J. C. & Glaser, C. (2006). Aufmerksamkeitskontrolle als Indikator der Selbstregulation und ihr Einfluss auf Schulleistungen: Ergebnisse einer Längsschnittanalyse. Psychologie in Erziehung und Unterricht, 53, 1–11. Strickland, O. & Galimba, M. (2001). Managing time: The effects of personal goal setting on resource allocation strategy and task performance. The Journal of Psychology, 135, 357–367. Unsworth, K., Yeo, G. & Beck, J. (2014). Multiple goals: A review and derivation of general principles. Journal of Organizational Behavior, 35, 1064–1078. Wentzel, K. R. (2003). School adjustment. In W. M. Reynolds & G. E. Miller (Eds.), Handbook of psychology. Vol. 7. Educational Psychology (pp. 235–258). New York: Wiley. Wentzel, K. R. & Miele, D. B. (2016). (Eds.). Handbook of Motivation at School (2nd ed.). New York, NY: Routledge / Taylor & Francis Group. Winter, C. (2007). Analyse und Förderung selbstregulierten Lernens durch Self-Monitoring. Unveröffentlichte Dissertation. Universität Mannheim, Fakultät für Sozialwissenschaften. Wood, W., Quinn, J. M. & Kashy, D. A. (2002). Habits in everyday life: Thought, emotion, and action. Journal of Personality and Social Psychology, 82, 1281–1297. Zedler, P. (2011). Vom Verschwinden der „Erziehung“ aus der Erziehungswissenschaft. Zum Nebeneinander von (Erziehungs-)Philosophie und sozialwissenschaftlicher Forschung. In J. Breithausen & F. Caputo (Hrsg.), Pensiero critico (S. 319–347). Cosenza: Pellegrini.

Manuskript eingereicht: 22.11.2016 Nach Revision angenommen: 30.07.2016 Interessenskonflikt: Nein

Prof. Dr. Manfred Hofer Pädagogische Psychologie Universität Mannheim Neckargrün 6 68259 Mannheim Deutschland manfred.hofer@sowi-uni.mannheim.de Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 69–85


IDS-P

IDS

Intelligence and Development Scales – Preschool

Intelligence and Development Scales

Intelligenz- und Entwicklungsskalen für das Vorschulalter A. Grob / G. Reimann / J. Gut / M.-C. Frischknecht

Die IDS-P liefern für Kinder von 3 bis 5 Jahren einen Intelligenzwert sowie ein umfassendes Entwicklungsprofil in fünf Funktionsbereichen: – Kognition – Psychomotorik – Sozial-Emotionale Kompetenz – Denken Logisch-Mathematisch – Sprache Bereichsspezifische Stärken und Schwächen des Kindes können sowohl zum individuellen Entwicklungsprofil als auch zu jenem der Altersgruppe in Beziehung gesetzt werden. Zusätzlich zu den fünf Funktionsbereichen können Hinweise zum Umgang des Kindes mit der Testsituation gewonnen werden. Besonderheiten der IDS-P ŋ ,QWHOOLJHQ] XQG (QWZLFNOXQJV GLDJQRVWLN LQ HLQHP 9HUIDKUHQ ŋ ¾EHUZLHJHQG VSUDFKIUHLH (UIDVVXQJ GHU ,QWHOOLJHQ] ŋ PRGXODUHU 7HVWDXIEDX I¾U LQ GLYLGXHOO DQJHSDVVWHV 7HVWHQ ŋ DEZHFKVOXQJVUHLFKH XQG VSLH OHULVFKH 7HVW GXUFK I¾K UXQJ PLW attraktivem Testmaterial ŋ DQZHQGHUIUHXQGOLFKH XQG FRP SXWHU EDVLHUWH $XVZHUWXQJ

Test komplett bestehend aus: Manual, 25 Protokollbogen, Auswerteprogramm, umfangreichem Stimulusmaterial und Koffer Bestellnummer 03 174 01, € 1226,00 / CHF 1460.00

www.hogrefe.com

Intelligenz- und Entwicklungsskalen für Kinder von 5–10 Jahren A. Grob / C. S. Meyer / P. Hagmann-von Arx

Als erstes Testverfahren bieten die Intelligence and Development Scales (IDS) für Kinder von 5 bis 10 Jahren einen Intelligenzwert (IQ) sowie ein umfassendes Entwicklungsprofil in sechs Funktionsbereichen: – Kognition – Psychomotorik – Sozial-Emotionale Kompetenz – Mathematik – Sprache – Leistungsmotiviation Im Fokus steht die Dynamik bereichsspezifischer Stärken und Schwächen des Kindes. Diese werden sowohl zum individuellen Entwicklungsprofil als auch zu dem der Altersgruppe in Beziehung gesetzt. 2., überarbeitete Auflage des Manuals Die überarbeitete Auflage des Manuals beinhaltet unter anderem ergänzende Informationen zur Durchführung und Auswertung des Tests, Angaben zu Testalteräquivalenten sowie aktuelle Forschungsergebnisse bzw. Validierungsstudien.

Test komplett bestehend aus: Manual, 25 Protokollbogen, 25 Testbogen Aufmerksamkeit Selektiv, 25 Aufgabenblätter Mathematik, Auswerteprogramm, umfangreichem Testmaterial und Koffer Bestellnummer 03 147 01, € 1164,00 / CHF 1437.00


Kurzbeitrag

Qualität von Nachhilfeunterricht und ihre Korrelate Karin Guill1, Oliver Lüdtke1,2 und Olaf Köller1 1 2

Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik an der Universität Kiel Zentrum für internationale Bildungsvergleichsstudien, München

Zusammenfassung: Zur Beschreibung der Qualität von Nachhilfeunterricht unterscheidet das Rahmenmodell für außerschulische Lerngelegenheiten des Nationalen Bildungspanels (NEPS) die Dimensionen kognitive Aktivierung, unterstützendes Lernklima und Strukturierung. Dieses Modell wurde mit Daten einer NEPS-Kohorte in der 10. Jahrgangsstufe überprüft. Konfirmatorische Faktorenanalysen zeigten für die Nachhilfefächer Mathematik und Englisch eine hinreichende Passung des Modells. Die Qualitätsdimensionen hingen teilweise schwach negativ mit der Schülerleistung und Hilflosigkeit und positiv mit der Qualifikation der Nachhilfelehrkräfte (kleine bis große Effekte) zusammen. Schlüsselwörter: Nachhilfeunterricht, Instruktionsqualität Instructional Quality of Private Tutoring and its Correlates Abstract: To describe the instructional quality of private tutoring lessons, the framework for out-of-school learning environments of the German National Educational Panel Study (NEPS) differentiates between the dimensions of structure, challenge and support in private tutoring. To evaluate this framework, we used data from a NEPS student cohort in grade 10. Confirmatory factor analyses showed a sufficient fit of the model to private tutoring lessons in mathematics and English. The instructional dimensions were in part weakly negatively related to the students' achievement and their helplessness and in part positively related to the tutors' formal qualification (small to large effects). Keywords: private tutoring, shadow education, instructional quality

Viele Schüler1 in der Sekundarstufe nutzen privaten Nachhilfeunterricht (Rudolph, 2002). Unzureichend geklärt ist, ob und unter welchen Bedingungen Nachhilfeunterricht die Schulleistungen verbessert (vgl. Guill & Bos, 2014). Ein naheliegender Einflussfaktor ist seine instruktionale Qualität. Sie wird im Rahmen des Nationalen Bildungspanels (NEPS; Blossfeld, Roßbach & von Maurice, 2011) durch drei Dimensionen beschrieben. Dieses Modell wird vorgestellt und mit Daten einer Sekundarschulstichprobe des NEPS empirisch überprüft.

Qualität des Nachhilfeunterrichts Nachhilfeunterricht bezeichnet Unterricht, der sowohl außerfamiliär als auch außerhalb des Schulunterrichts stattfindet, in regelmäßiger, häufig vorübergehender Form genutzt wird, durch Lehrkräfte, Studierende, (ältere) Schüler oder andere Laien erteilt wird, in der Regel kos1

tenpflichtig ist und auf die Erfolgssicherung im Unterricht abzielt (Krüger, 1977). Typischerweise werden Hausaufgaben bearbeitet und besprochen, Unterrichtsstoff durchgenommen und für Klassenarbeiten geübt (Rudolph, 2002). Im Vergleich zum didaktischen Dreischritt einer Schulstunde fällt damit die Einstiegsphase in neuen Stoff weg, während die Phasen der vertieften Erarbeitung und der Ergebnissicherung ähnlich zu erwarten sind. Nachhilfe hat als Einzel- oder Kleingruppenunterricht zwar ein anderes Setting als der im Klassenverband, verfolgt aber dasselbe Ziel: die Anbahnung verständnisvoller Lernprozesse zur Verbesserung der Schulleistung. Das Rahmenmodell für außerschulische Lerngelegenheiten des NEPS (Bäumer, Preis, Roßbach, Stecher & Klieme, 2011) beschreibt daher die Instruktionsqualität in der Nachhilfe anhand derselben Dimensionen, mit denen die Qualität im Schulunterricht beschrieben wird. Es unterscheidet drei Dimensionen als bedeutsam für verständnisvolle Lernprozesse (vgl. auch Kunter et al., 2011): Challenge (auch: kognitive Aktivierung) meint, die Lernenden zu einer hohen mentalen

Zur Verbesserung der Lesbarkeit wird das generische Maskulinum verwendet.

© 2017 Hogrefe

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 87–93 DOI 10.1024/1010-0652/a000188


88

Aktivität anzuregen, z. B. durch die Auswahl komplexer Aufgaben oder die Aufforderung zur diskursiven Begründung und Überprüfung von Lösungsvorschlägen. Support (auch: konstruktive Unterstützung oder unterstützendes Lernklima) bezieht sich auf Merkmale der Schüler-LehrerBeziehung wie ein individuell unterstützendes Lehrerverhalten, positive und konstruktive Rückmeldungen und ein positiver und produktiver Umgang mit Schülerfehlern. Structure umfasst sowohl eine strukturierte Stoffpräsentation als auch ein effektives Klassen- und Zeitmanagement, um die verfügbare Lernzeit optimal zu nutzen. Im Schulunterricht zeigt sich im Wesentlichen, dass kognitive Aktivierung und Strukturierung prädiktiv für den Lernerfolg sind, während konstruktive Unterstützung prädiktiv für die Motivation ist (z. B. Fauth, Decristan, Rieser, Klieme & Büttner, 2014; Klieme, Steinert & Hochweber, 2010; Kunter et al., 2011). Stärken des Modells liegen in seiner Integration bisher eher unverbunden genannter Aspekte der Qualität im Nachhilfeunterricht (etwa Ausnutzung der Lernzeit als Teil von structure oder Rückmeldungen anhand einer individuellen Bezugsnorm als Teil von support; vgl. Streber, Haag & Götz, 2011) und in seiner Anschlussfähigkeit an die Forschung zur Qualität von Schulunterricht. Eine Schwäche liegt darin, Bezüge zur Forschung zum Einzelunterricht (tutoring; vgl. Graesser, D'Mello & Cade, 2011) nicht zu reflektieren. Auch hier wird die Aufgabenauswahl diskutiert, aber auch das gemeinsame Verbessern einer zunächst falschen Schülerlösung als spezifische Stärke des Einzelunterrichts betont. Als problematisch wurde ein hoher Anteil von Erklärungen des Tutors identifiziert. Solche Befunde sollten für die Ausdifferenzierung der Dimension der kognitiven Aktivierung in der Nachhilfe genutzt werden. Im Rahmen von NEPS wurden Schüler der 10. Jahrgangsstufe zu ihrem Nachhilfeunterricht befragt. Ziel dieses Beitrags ist es, zu prüfen, ob sich die Qualität dieses Unterrichts aus Schülersicht erwartungsgemäß anhand der drei Dimensionen challenge, support und structure beschreiben lässt und wie sie mit Schülermerkmalen und Rahmenbedingungen des Unterrichts zusammenhängt. Lehrkräfte von im Mittel leistungsschwächeren Lerngruppen berichten vergleichsweise wenig kognitiv aktivierenden Unterricht und häufiger eine inhaltliche Beschränkung auf das Beherrschen von Routinen (Kunter et al., 2005). Erwartet wird, dass sich dies auch auf der individuellen Ebene für leistungsschwächere und (subjektiv) hilflose Schüler in der Nachhilfe zeigt, um u. a. durch die Einübung basaler Lösungsroutinen einen Mindesterfolg im Schulunterricht zu erreichen. Am Gymnasium wird der Unterricht aus Schülerperspektive hinsichtlich der kognitiven Aktivierung kritischer beurteilt als an anderen Schulformen, was auch für die Beurteilung des NachhilfeunterZeitschrift für Pädagogische Psychologie (2017), 31 (1), 87–93

K. Guill et al., Qualität von Nachhilfe

richts durch Gymnasiasten erwartet wird (Kunter et al., 2005). Da Mädchen den Schulunterricht teilweise günstiger beurteilen als Jungen (Klieme et al., 2010), wird dies auch für die Wahrnehmung von Nachhilfeunterricht überprüft. Es gibt Hinweise, dass Lehrkräfte mit höherer Expertise im Einzelunterricht effektivere Unterrichtsmethoden einsetzen, die Rolle von Expertise ist aber nicht eindeutig geklärt (Graesser et al., 2011; Herppich, Wittwer, Nückles & Renkl, 2015). Im Schulunterricht hängen Fachwissen und fachdidaktisches Wissen von Lehrkräften positiv mit dem Ausmaß kognitiv aktivierenden Schulunterrichts zusammen (Kunter et al., 2011). Erwartet wird daher, dass formal höher qualifizierte Nachhilfelehrkräfte, die über ein höheres entsprechendes Wissen verfügen sollten, einen stärker aktivierenden Unterricht gestalten. Nachhilfeinstitute bieten im Vergleich zu anderen Settings häufiger Unterricht in Kleingruppen an. Bisherige Befunde zeigen keinen Unterschied in der global beurteilten Qualität von Einzel- und Gruppennachhilfe (Haag & Streber, 2013), was auch hier nicht erwartet wird. Die Schülereinschätzung von Unterrichtsqualität hängt positiv mit der globalen Beliebtheit der beurteilten Lehrkraft zusammen (Fauth et al., 2014). Vergleichbare Zusammenhänge werden mit der globalen Zufriedenheit in der Nachhilfe erwartet.

Daten und Methode Es wurden Daten der ersten drei Wellen einer Kohorte des NEPS (Startkohorte 4; Blossfeld et al., 2011) genutzt. Die Erhebungen fanden in Klasse 9 im Herbst 2010, im Frühjahr 2011 und anschließend in Klasse 10 im Frühjahr 2012 durch Testung bzw. schriftliche Befragung im Klassenkontext statt. Förderschulen wurden nicht berücksichtigt. Insgesamt nahmen 11 434 Schülerinnen (51.2 %) und Schüler allgemeinbildender Schulen an der dritten Welle teil, in der die Nutzung von Nachhilfeunterricht querschnittlich im Schülerfragebogen erhoben wurde. Von diesen wurden 461 (4.0 %) nicht mehr im Klassenkontext, sondern individuell postalisch befragt. 41.3 % besuchten ein Gymnasium, 2695 (23.8 %) gaben an, aktuell Nachhilfeunterricht zu erhalten. Schüler, die aktuell Nachhilfe nutzten, konnten für ihr wichtigstes Nachhilfefach die Qualifikation der Lehrkraft (fünf Kategorien) und den Unterrichtsort (sechs Kategorien) angeben. Die Qualität des Unterrichts wurde anhand vierstufiger Rating-Items (von 1 = trifft gar nicht zu bis 4 = trifft völlig zu) bewertet (vgl. Tab. 1). Die Skala structure umfasste drei Items, die Skala challenge vier Items zu Lern- und Arbeitstechniken sowie in Anlehnung an PISA 2003 (Ramm et al., 2006) zu „Kognitiv aktivierenden © 2017 Hogrefe


K. Guill et al., Qualität von Nachhilfe

Aufgaben […] beim Üben“ und zum „Anspruchsvollen Üben“, die Skala support vier Items zur Motivierung und in Anlehnung an PISA 2003 zum Umgang mit Fehlern, zur individuellen Bezugsnorm und zur Unterstützung durch die Lehrkraft. Mit einem Item wurde die Zufriedenheit erhoben. Die Mathematik- und Deutschnoten (als Proxy für die nicht erhobene Englischnote) des ersten Halbjahrs in Klasse 10 wurden von den Schülern berichtet. Die Schulformangabe wurde danach kodiert, ob ein Gymnasium oder eine andere Schulform besucht wurde. Für die Schüler in der postalischen Nachbefragung fehlte eine aktualisierte Schulformvariable. Die mathematikbezogene Hilflosigkeit wurde in der zweiten Welle erhoben (fünf vierstufige Ranking-Items (s. o.), z. B. „Ich schaffe im Fach Mathematik fast nichts von dem, was ich mir vornehme“, Skalenwert als Mittelwert, α = .91). Ein entsprechendes Maß für Englisch fehlte. Für die Fächer Mathematik und Englisch, für die eine hinreichend große Stichprobe vorlag, wurde jeweils ein Messmodell mit den drei korrelierten Faktoren structure, challenge und support spezifiziert (mit unkorrelierten

89

Fehlertermen und Fixierung der jeweils 1. Ladung auf 1, vgl. Abb. 1) und mittels konfirmatorischer Faktorenanalyse überprüft. Dies wurde in R (R Core Team, 2015) mit dem Paket lavaan 0.5–18 (Rosseel, 2012) umgesetzt. Aufgrund fehlender Werte (max. 2.2 %) wurde für das Messmodell das Full-Information-Maximum-Likelihood-Verfahren gewählt. Prädiktoren und Korrelate der latent modellierten Unterrichtsqualität wurden im nächsten Schritt mittels separater linearer Regressionen jeweils auf Basis vollständiger Fälle bei den Prädiktoren (über 99.9 %) bestimmt. Für alle Analysen wurde das in den Sozialwissenschaften übliche Signifikanzniveau von 5 % verwendet.

Ergebnisse Charakteristika des Nachhilfeunterrichts Unter den Nachhilfeschülern waren Mädchen über- und Schüler gymnasialer und nichtgymnasialer Schulformen

Tabelle 1. Skalen im Nationalen Bildungspanel (NEPS) zur Bewertung der Unterrichtsqualität in der Nachhilfe Mathematik

Englisch

M

SD

M

SD

Structure st1

Während der Nachhilfestunden gibt es meist keine unnötigen Unterbrechungen.

3.15

0.82

3.13

0.79

st2

Meine Nachhilfelehrerein oder mein Nachhilfelehrer und ich besprechen zu Beginn der Stunde den Ablauf.

2.34

0.95

2.59

0.94

st3

Am Ende der Nachhilfestunde fassen wir das Gelernte noch einmal zusammen.

2.43

0.97

2.43

0.91

ch1 Im Nachhilfeunterricht übe ich neue Arbeits- und Lerntechniken.

2.82

0.87

2.84

0.89

ch2 Wir üben im Nachhilfeunterricht auch Aufgaben, bei denen man wirklich sieht, ob man etwas verstanden hat.

3.43

0.63

3.38

0.65

ch3 Die Übungsaufgaben im Nachhilfeunterricht sind immer wieder anders, sodass man genau aufpassen muss.

2.92

0.80

3.07

0.72

ch4 Unter den Übungsaufgaben im Nachhilfeunterricht sind immer wieder Aufgaben, bei denen man wirklich nachdenken muss.

3.40

0.63

3.31

0.68

su1 Die Nachhilfelehrerin oder der Nachhilfelehrer erklärt mir alles so lange, bis ich es verstehe.

3.64

0.57

3.62

0.55

su2 Meine Nachhilfelehrerin oder mein Nachhilfelehrer vermittelt mir Freude an dem Fach.

2.77

0.80

2.88

0.76

su3 Wenn ich mich im Nachhilfeunterricht angestrengt habe, lobt mich meine Nachhilfelehrerin oder mein Nachhilfelehrer.

3.12

0.83

3.21

0.76

su4 Bei meiner Nachhilfelehrerin oder meinem Nachhilfelehrer ist Fehlermachen nichts Schlimmes.

3.59

0.63

3.57

0.62

Challenge

Support

© 2017 Hogrefe

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 87–93


90

K. Guill et al., Qualität von Nachhilfe

Tabelle 2. Schüler mit (Nmax = 2695) und ohne (Nmax = 8622) Nachhilfeunterricht mit Nachhilfe

ohne Nachhilfe

M

SD

M

SD

t

p

d

Fachnote Mathematik

3.34

0.97

2.81

1.04

24.30

< .001

0.52

Fachnote Deutsch

2.94

0.80

2.77

0.85

9.49

< .001

0.20

Geschlecht – Anteil Mädchen

0.59

-

0.49

-

9.33

< .001

0.20

Schulform – Anteil Gymnasiuma

0.39

-

0.42

-

–2.94

.003

–0.07

Anmerkungen. aohne postalisch nachbefragte Schüler.

etwa gleich repräsentiert. Nachhilfeschüler zeigten im Mittel schlechtere Noten als Schüler ohne Nachhilfe (vgl. Tab. 2). 72.8 % der Nachhilfeschüler berichteten über Nachhilfe in Mathematik, 31.9 % im Fach Englisch, 11.4 % in Deutsch, 12.0 % in einer anderen Fremdsprache, 8.4 % in den Naturwissenschaften und 1.6 % in einem anderen Fach. 1730 Schüler machten nähere Angaben zur Nachhilfe in Mathematik, 502 zu der im Fach Englisch. Der Nachhilfeunterricht in Mathematik (M) und Englisch (E) wurde zu etwa gleichen Teilen zu Hause (M: 33.0 %/E: 28.8 %), bei jemand anderem (M: 27.4 %/E: 37.4 %) oder in einem Nachhilfeinstitut (M: 26.4 %/E: 22.3 %) erteilt. Ein kleinerer Anteil wurde in der Schule (M: 11.3 %/E: 9.6 %) oder an einem anderen Ort (M / E: 1.9 %) gegeben. Der Unterricht erfolgte überwiegend durch ausgebildete Lehrkräfte (M: 37.8 %/E: 41.1 %) und Studierende (M: 30.0 %/E: 21.9 %). Ein kleinerer Anteil wurde durch Schüler (M: 14.6 %/E: 7.5 %) und nicht näher qualifizierte sonstige Personen (M: 15.7 %/E: 26.1 %) erteilt. In wenigen Fällen war die Qualifikation nicht bekannt (M: 1.9 %/E: 3.4 %). Die Zustimmung zu den einzelnen Items der Qualität des Nachhilfeunterrichts fiel überwiegend hoch aus (vgl. Tab. 1). Die Reliabilitäten der Skalen (Cronbachs α) lagen alle über .50, erreichten aber nur selten befriedigende Werte über .60 (structure: αM = .51/αE = .54; challenge: αM = .63/αE = .55; support: αM = .60/αE = .57). Die Trennschärfen der Items lagen zwischen rit = .18 und rit = .47.

Messmodelle Die Messmodelle zur Qualität im Nachhilfeunterricht wiesen eine befriedigende Modellgüte auf (vgl. Abb. 1). Die drei Dimensionen structure, challenge und support waren hoch korreliert, ließen sich jedoch abgrenzen. Alternativ spezifizierte eindimensionale Modelle zeigten eine schlechtere Anpassungsgüte (M: χ2 [df = 44] = 377.32, p < .001; CFI = .889; RMSEA = 0.066; SRMR = 0.043; Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 87–93

E: χ2 [df = 44] = 135.80, p < .001; CFI = .881; RMSEA = 0.065; SRMR = 0.047).

Prädiktoren und Korrelate der Unterrichtsqualität Im Mathematiknachhilfeunterricht gingen schlechtere (höhere) Noten und eine höhere Hilflosigkeit der Schüler mit etwas weniger wahrgenommener kognitiver Aktivierung (Note: r = –.11, p < .001; Hilflosigkeit: r = –.09, p = .006) und konstruktiver Unterstützung einher (Note: r = –.11, p < .001; Hilflosigkeit: r = –.14, p < .001). Beide Merkmale hingen nicht signifikant mit der Strukturierung zusammen. Mädchen nahmen mehr Unterstützung wahr als Jungen (M: d = 0.16, p = .016/E: d = 0.43, p = .001). Gymnasiasten beschrieben ihren Nachhilfeunterricht als weniger strukturiert (M: d = –0.23, p = .002/E: d = –0.38, p = .011) und in Mathematik auch als weniger kognitiv aktivierend als Schüler anderer Schulformen (M: d = –0.24, p < .001/E: d = –0.10, p = .466). Aufgrund der unterschiedlichen Verteilung der Nachhilfelehrkräfte über die Schulformen wurden zu Effekten der Lehrerqualifikation in Mathematik Mehrgruppenmodelle nach Schulform (Gymnasium / Nichtgymnasium) mit gleichgesetzten Faktorladungen spezifiziert. Metrische Invarianz zwischen den Gruppen war gegeben (Δχ2,[df = 8] = 7.168, p = .52, ΔCFI = 0.000). Gymnasiasten beschrieben den Unterricht durch Lehrkräfte als signifikant stärker kognitiv aktivierend als den durch Schüler (dStudierende = 0.06, p = .672; dLehrer = 0.38, p = .004; dAndere = 0.17, p = .290). Für die anderen Dimensionen und für Schüler anderer Schulformen zeigten sich keine Zusammenhänge. Aufgrund der kleinen Stichprobe waren im Fach Englisch nur Analysen für die Schüler nichtgymnasialer Schulformen möglich. Sie beschrieben den Unterricht durch Studierende als kognitiv aktivierender (dStudierende = 0.69, p = .038; dLehrer = 0.58, p = .073; dAndere = 0.52, p = .124) und den durch alle anderen Gruppen als unterstützender als den durch Schüler (dStudierende = 0.91, p = .004; dLehrer = 0.69, p = .023; © 2017 Hogrefe


K. Guill et al., Qualität von Nachhilfe

91

Ȥ² >df = 41@ = 264.88/109.06, p < .001 CFI = 0.925/0.912 RMSEA = 0.056/0.058 SRMR = 0.038/0.045

.69/.75 .70/.68

structure

challenge

.43/ .51/ .60/.63 .48 .49

st1

st2

.83/.86

st3

support

.48/ .68/ .56/ .55/.50 .57 .63 .37

ch1

ch2

ch3

ch4

.56/ .56/ .56/ .44/.39 .50 .53 .58

su1

su2

su3

su4

Abbildung 1. Konfirmatorische Faktorenanalyse zur Qualität in der Mathematik- (links) bzw. Englischnachhilfe (rechts), N = 1722/497, vollständig standardisierte Lösungen, alle Koeffizienten p < .001.

dAndere = 0.70, p = .026). Für die Dimension structure zeigten sich keine Zusammenhänge.2 Unterricht in Nachhilfeinstituten wurde in Mathematik auf den drei Dimensionen challenge (M: d = –0.15, p = .025/E: d = –0.22, p = .118), support (M: d = –0.15, p = .038/E: d = –0.34, p = .021) und structure (M: d = –0.55, p < .001/E: d = –0.14, p = .362), im Englischen bei der konstruktiven Unterstützung signifikant ungünstiger bewertet als Nachhilfe in anderen Settings (vgl. Fußnote 2). In beiden Fächern korrelierte die Zufriedenheit der Schüler wie erwartet substanziell positiv mit den drei Dimensionen der Unterrichtsqualität, challenge (M: r = .64/E: r = .53, p < .001), support (M: r = .76/E: r = .70, p < .001) und structure (M: r = .49/E: r = .50, p < .001).

Diskussion Die Qualität im Nachhilfeunterricht aus Schülersicht ließ sich anhand der drei Dimensionen challenge, support und structure beschreiben. Damit bestätigten sich Befunde,

2

wonach Schüler zu einem differenzierten Urteil über ihren Unterricht in der Lage sind. Die drei Dimensionen sind hoch korreliert, wie es sich auch im Schulunterricht auf der Klassenebene zeigt. Anscheinend gilt auch in der Nachhilfe, dass die aus Schülerperspektive zentrale unterstützende und wertschätzende Haltung der Nachhilfelehrkraft die gesamte Urteilsstruktur beeinflusst (Kunter et al., 2005). Die Reliabilitäten der einzelnen Skalen sind zum Teil unbefriedigend. Insbesondere die Skala zu structure ist inhaltlich zu heterogen. Die Items zur inhaltlichen Strukturierung passen kaum auf Nachhilfestunden, die durch schulische Themen und Hausaufgaben vorstrukturiert sind. Eine Fokussierung der Skala auf eine effiziente Stundenführung (so bei Kunter et al., 2011) wäre eine Alternative. Gleichwohl ist zu bedenken, dass unsere Analysen durchgängig die Unreliabilität korrigieren und Reliabilitäten, wie hier gefunden, nur ein Problem in der Individualdiagnostik darstellen. Die Zusammenhänge der Qualität des Nachhilfeunterrichts mit weiteren Variablen fielen überwiegend erwartungskonform aus. Gymnasiasten bewerteten ihre Nachhilfe etwas kritischer auf den Dimensionen structure und

Mehrgruppenmodelle zeigten keine substanziellen Abweichungen der sonstigen hier berichteten Zusammenhänge mit der Unterrichtsqualität zwischen den Schulformen oder den Settings.

© 2017 Hogrefe

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 87–93


92

in Mathematik auch challenge. Vermutlich haben sie einen günstigeren Referenzrahmen, da der reguläre Unterricht am Gymnasium auf beiden Dimensionen (im Lehrerurteil) positiver abschneidet als der an anderen Schulformen (Kunter et al., 2005). Anders als für Schulunterricht berichtet (Klieme et al., 2010), beurteilten Mädchen in der Nachhilfe nur die Dimension support günstiger als Jungen. Erwartungskonform berichteten leistungsschwächere und sich als hilfloser einschätzende Schüler in Mathematik über etwas weniger aktivierende und – nicht erwartet – auch über weniger unterstützende Nachhilfe. Anscheinend fällt es den Nachhilfelehrkräften bei größerem schulischem Misserfolg schwerer, ein günstiges Unterstützungsklima aufrechtzuerhalten. Entsprechende Analysen für das Fach Englisch waren aufgrund fehlender Skalen nicht möglich. Die Befunde zur Lehrerqualifikation fielen heterogen aus. Pro Schulform zeigte sich in einem Nachhilfefach ein Effekt der formalen Qualifikation. Lehrkräfte (in Mathematik) bzw. Studierende (in Englisch) erteilten kognitiv aktivierenderen Nachhilfeunterricht als Schüler. Unterschiede zwischen Lehrkräften und Studierenden ließen sich dagegen nicht nachweisen (vgl. auch Graesser et al., 2011; Streber et al., 2011). Im Englischnachhilfeunterricht wurden höher qualifizierte Lehrkräfte auch als unterstützender beschrieben, was auf ein größeres pädagogischpsychologisches Wissen zurückgeführt werden könnte (Kunter et al., 2011). Insbesondere das Befundmuster zur kognitiven Aktivierung bedarf der weiteren Klärung durch differenziertere Skalen, da diese Dimension zwar im Schulunterricht bedeutsam für den Lernerfolg ist (Kunter et al., 2011), aber Nachhilfe häufig nicht von qualifizierten Lehrkräften erteilt wird. Die große Gruppe der „anderen“ Nachhilfelehrkräfte sollte durch ein offenes Antwortformat qualifiziert werden. Erwartungswidrig etwas kritischer wurde der Unterricht in Nachhilfeinstituten beurteilt. Um zu klären, ob dies auf den dort verbreiteten Gruppenunterricht zurückzuführen ist, sollten zukünftige Studien die soziale Konstellation des Unterrichts erfassen. Zusammenfassend liegt eine Stärke des NEPS darin, dass die instruktionale Qualität im Nachhilfeunterricht vergleichsweise umfassend und differenziert, aber dennoch ökonomisch und theoretisch anschlussfähig an die Forschung zum Schulunterricht erfasst wurde. Uns ist keine andere Studie zu Nachhilfeunterricht im Bereich des Large-Scale-Assessments bekannt, die dies leistet. Grenzen liegen darin, dass im Vergleich zu expliziten Unterrichtsqualitätsstudien mit ihren weit umfangreicheren Fragebögen zu Subdimensionen der Qualität ein wenig differenziertes Instrument genutzt wurde. Die Skala zur kognitiven Aktivierung ist weitgehend auf die Aufgabenauswahl beschränkt. Items zur Interaktion von Lehrer und Schüler fehlen, obwohl die Forschung zum EinzelunterZeitschrift für Pädagogische Psychologie (2017), 31 (1), 87–93

K. Guill et al., Qualität von Nachhilfe

richt die Bedeutung von gezielten Aufforderungen zur Elaboration und verstehensorientierten Hinweisen des Lehrers (prompting und scaffolding) zur kognitiven Aktivierung der Schüler belegt (Graesser et al., 2011). Zudem wurde der Nachhilfeunterricht nur aus Schülerperspektive beurteilt. Eine Gegenüberstellung von Schüler-, Lehrer- und Beobachterurteil mit ihren spezifischen Stärken und Schwächen, wie in der Forschung zum Schulunterricht, wäre auch für Nachhilfe wünschenswert. Dies würde zur Validierung der Skalen beitragen und Vergleiche mit Befunden aus der Unterrichtsforschung stärker fundieren. So ließe sich auch klären, ob die Geschlechtsund Schulformeffekte auf die Qualitätswahrnehmung mit realen Unterschieden oder unterschiedlichen Beurteilungsmaßstäben zusammenhängen. Besonders wichtig ist dieser Abgleich für die Dimension challenge, der im Schülerurteil im Vergleich zur Lehrer- und Beobachterperspektive auf den Schulunterricht eine geringe Validität zuerkannt wird (Klieme et al., 2010; Kunter et al., 2011).

Autorenhinweise Diese Arbeit nutzt Daten des Nationalen Bildungspanels (NEPS): Startkohorte Klasse 9, doi:10.5157/NEPS:SC4:4.0.0. Die Daten des NEPS wurden von 2008 bis 2013 als Teil des Rahmenprogramms zur Förderung der empirischen Bildungsforschung erhoben, welches vom Bundesministerium für Bildung und Forschung (BMBF) finanziert wurde. Seit 2014 wird NEPS vom Leibniz-Institut für Bildungsverläufe e. V. (LIfBi) an der Otto-Friedrich-Universität Bamberg in Kooperation mit einem deutschlandweiten Netzwerk weitergeführt.

Literatur Bäumer, T., Preis, N., Roßbach, H.-G., Stecher, L. & Klieme, E. (2011). Education processes in life-course-specific learning environments. Zeitschrift für Erziehungswissenschaft, 14(2), 87–101. Blossfeld, H.-P., Roßbach, H.-G. & von Maurice, J. (Hrsg.) (2011). Education as a Lifelong Process – The German National Educational Panel Study (NEPS) (special issue). Zeitschrift für Erziehungswissenschaft, 14(2). Fauth, B., Decristan, J., Rieser, S., Klieme, E. & Büttner, G. (2014). Student ratings of teaching quality in primary school: dimensions and prediction of student outcomes. Learning and Instruction, 29, 1–9. Graesser, A. C., D’Mello, S. & Cade, W. (2011). Instruction based on tutoring. In R. E. Mayer & P. A. Alexander (Eds.) Handbook of Research on Learning and Instruction (S. 408–426). New York: Routledge. Guill, K. & Bos, W. (2014). Effectiveness of private tutoring in mathematics with regard to subjective and objective indicators of academic achievement. Journal for Educational Research Online, 6, 34–67. Zugriff am 20.06.2014. Verfügbar unter: www.j-er-o.com © 2017 Hogrefe


K. Guill et al., Qualität von Nachhilfe

93

Haag, L. & Streber, D. (2013). Einzel-Nachhilfe im Vergleich zu Gruppen-Nachhilfe – teurer! Und auch besser? Empirische Pädagogik, 27, 359–373. Herppich, S., Wittwer, J., Nückles, M. & Renkl, A. (2015). Expertise amiss: interactivity fosters learning but expert tutors are less interactive than novice tutors. Instructional Science, 44, 205 – 219. Klieme, E., Steinert, B. & Hochweber, J. (2010). Zur Bedeutung der Schulqualität für Unterricht und Lernergebnisse. In W. Bos, E. Klieme & O. Köller (Hrsg.) Schulische Lerngelegenheiten und Kompetenzentwicklung (S. 231–255). Münster: Waxmann. Krüger, R. (1977). Nachhilfe – Chance oder Skandal? Die Deutsche Schule, 69, 545–558. Kunter, M., Baumert, J., Blum, W., Klusmann, U., Krauss, S. & Neubrand, M. (Hrsg.) (2011), Professionelle Kompetenz von Lehrkräften. Münster: Waxmann. Kunter, M., Brunner, M., Baumert, J., Klusmann, U., Krauss, S., Blum, W. et al. (2005). Der Mathematikunterricht der PISASchülerinnen und -Schüler. Zeitschrift für Erziehungswissenschaft, 8, 502–520. R Core Team. (2015). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Verfügbar unter: www.R-project.org Ramm, G., Prenzel, M., Baumert, J., Blum, W., Lehmann, R. H., Leutner, D. et al. (2006). PISA 2003. Dokumentation der Erhebungsinstrumente. Münster: Waxmann.

Rosseel, Y. (2012). Lavaan: An R package for structural equation modeling. Journal of Statistical Software, 48(2), 1–36. Rudolph, M. (2002). Nachhilfe – gekaufte Bildung? Bad Heilbrunn: Klinkhardt. Streber, D., Haag, L. & Götz, T. (2011). Erfolgreiche Nachhilfe – Kann das jeder oder bedarf es besonderer Qualifikationen? Empirische Pädagogik, 25, 342–357.

Manuskript eingereicht: 23.9.2015 Manuskript angenommen: 04.7.2016 Interessenskonflikt: keine

Dr. phil. Dipl.-Psych. Karin Guill Leibniz-Institut für die Pädagogik der Naturwissenschaften und Mathematik an der Universität Kiel Olshausenstraße 62 24118 Kiel Deutschland guill@ipn.uni-kiel.de

Anzeige

Ein wichtiger Ratgeber James T. Webb et al.

Doppeldiagnosen und Fehldiagnosen bei Hochbegabung Ein Ratgeber für Fachpersonen und Betroffene 2015. 360 S., 15 Tab., Gb € 34,95 / CHF 45.50 ISBN 978-3-456-85365-9 Auch als eBook erhältlich Intellektuell und kreativ hochbegabte Menschen unterscheiden sich in ihrem Verhalten oft signifikant von ihren Mitmenschen. Immer wieder werden bei ihnen deshalb fälschlicherweise ADHS, Zwangsstörung, Asperger, Autismus oder andere Verhaltens- und affektive Störungen diagnosti-

ziert. Gerade für Ärzte, Psychologen oder Betreuer dieser Kinder und Erwachsenen ist es deshalb essenziell zu wissen, welche Verhaltensweisen für diese Menschen normal sind und welche tatsächlich auf eine psychische Störung hinweisen.

www.hogrefe.com

© 2017 Hogrefe

Zeitschrift für Pädagogische Psychologie (2017), 31 (1), 87–93


Aktuelle Sachbücher und Ratgeber Claudia Clos

Allan Guggenbühl

Gesund im Job

Die vergessene Klugheit

So stärken Sie Ihre körperliche und psychische Gesundheit am Arbeitsplatz 2016. 208 S., 21 Abb., 2 Tab., Kt € 19,95 / CHF 26.90 ISBN 978-3-456-85578-3 Auch als eBook erhältlich

Mit Fokus auf die Ressourcenaktivierung gibt Claudia Clos in diesem kompakten Ratgeber praktische und konkrete Tipps, wie Berufstätige ihren Arbeitsalltag bewusst aktiv gestalten können, um zu mehr körperlicher und psychischer Gesundheit am Arbeitsplatz zu gelangen.

2016. 272 S., Gb € 24,95 / CHF 32.50 ISBN 978-3-456-85239-3 Auch als eBook erhältlich

Trotz Ausbildung und Renommee leiden wir in gewissen Situationen unter einer eklatanten Denkschwäche. Allan Guggenbühl geht im vorliegenden Buch den Handlungen auf den Grund, die aus nüchterner Perspektive nicht nachvollziehbar sind – und unsere Intelligenz, Kompetenzen und unseren Ausbildungsgrad in Frage stellen.

Lutz Jäncke

Marti Olsen Laney

Ist das Hirn vernünftig?

Die Macht der Introvertierten

Erkenntnisse eines Neuropsychologen

Der andere Weg zu Glück und Erfolg

2., unveränd. Aufl. 2016. 328 S., 26 Abb., 1 Tab., Kt € 24,95 / CHF 32.50 ISBN 978-3-456-85653-7 Auch als eBook erhältlich

Übersetzt von Karsten Petersen. 2., unveränd. Aufl. 2016. 304 S., Gb € 24,95 / CHF 32.50 ISBN 978-3-456-85602-5

Anhand aufschlussreicher Experimente und neuester Forschungsergebnisse, aber auch mit vielen Beispielen aus seiner Praxis als weltbekannter Forscher kann Lutz Jäncke anschaulich darstellen, welch unglaublich beeindruckendes Denkorgan unser Hirn darstellt – auch wenn es keine reine “Vernunftsmaschine” ist.

www.hogrefe.com

Wie Normen uns am Denken hindern

Marti Olsen Laney ist Psychologin und Expertin für Introversion. In diesem Ratgeber klärt sie darüber auf, was es heißt introvertiert zu sein, und zeigt mit vielen praktischen Tipps für alle Lebenslagen, wie Sie als introvertierter Mensch erfolgreicher und glücklicher leben können.


Motivationspsychologische Grundlagen der Begabungsentwicklung

Gerhard Lehwald

Motivation trifft Begabung Begabte Kinder und Jugendliche verstehen und gezielt fördern 2017. 224 S., 37 Abb., 12 Tab., Kt € 24,95 / CHF 32.50 ISBN 978-3-456-85588-2 Auch als eBook erhältlich

Im Fokus dieses Sachbuches steht die Individualität begabter Kinder. Auch wenn wir von „den Begabten“ sprechen, heißt das nicht, alle wären gleich. Sie sind genauso unterschiedlich wie andere Kinder. Woher kommt die große Streubreite der Lern- und Persönlichkeitsmerkmale? Begabte Kinder fassen bekanntermaßen Inhalte schneller auf als gleichaltrige und zeigen oft andere und tiefgründigere Interessen und Lernbedürfnisse. Ausgehend von den Lern- und Motivmerkmalen begabter Kinder und Jugendlicher weckt „Motivation trifft Begabung“ das Verständnis für ihre individuellen Anlagen, individualisierte Bildung, Förderung im Elternhaus und in der Schule.

www.hogrefe.com

Dabei geht der Autor einen neuen Weg, indem er – anders als bislang in der Begabungsforschung üblich – gegenstands- und tätigkeitsbezogene Motive (Neugier, Wissbegier, Erkenntnisstreben) ins Zentrum der Betrachtung stellt. Gerhard Lehwald stellt Checklisten und Fragebögen zur Verfügung und erklärt an Fallbeispielen aus der eigenen Beratungspraxis, wie Begabungsentwicklung und Begabtenförderung erfolgreich verlaufen können. Dadurch werden nicht nur exzellente Leistungen Begabter besser erklärt, sondern auch Störungen der Begabungsentwicklung verständlich.


Umfassend und aktuell – das komplette Wissen der Psychologie

Markus Antonius Wirtz (Hrsg.)

Dorsch – Lexikon der Psychologie Unter Mitarbeit von Janina Strohmer. 18., überarb. Aufl. 2016. 1952 S., Gb € 74,95 / CHF 95.00 ISBN 978-3-456-85643-8

Der DORSCH in der 18. Auflage: mit über 2000 aktualisierten und überarbeiteten Stichwörtern – inklusive Dorsch Lexikon Online [www.hogrefe.com/dorsch]. Der Dorsch ist das Standardwerk, das eine umfassende Orientierung über Grundlagen, Konzepte und Begriffe der Psychologie ermöglicht. Das Lexikon der Psychologie wendet sich an Studierende der Psychologie sowie der Bezugsdisziplinen (z. B. Psychiatrie, Bildungs-, Gesundheits-, Neuro-, Rechts- und Wirtschaftswissenschaften), Wissenschaftler und praktizierende Fachpersonen dieser und verwandter Fächer sowie an interessierte Laien.

www.hogrefe.com

Der Dorsch bietet • rund 12 000 Stichwörter von über 600 Fachautoren aus allen Bereichen der Psychologie • eine strukturierte Aufbereitung der Inhalte in 19 Teilgebiete, die von renommierten Gebietsexperten betreut werden • 1200 Topstichwörter für vertieftes Wissen und schnellen Zugang zu allen Teilgebieten der Psychologie • den Zugang zum Dorsch Lexikon Online, das fortdauernd aktualisiert und erweitert wird • das aktuelle Wissen der Psychologie, kompakt und zitierfähig.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.