Jahrgang 34 / Heft 1 / 2020
Zeitschrift für
Pädagogische Psychologie German Journal of Educational Psychology
Herausgeber Andreas Knapp Detlef H. Rost Assoziierte Herausgeberin Nadine Spörer Assoziierter Herausgeber Heiner Rindermann Beirat Roland Brünken, Jens Möller, Martin Brunner, Jan Retelsdorf, Susanne R. Buch, Ulrich Schroeders, Oliver Dickhäuser, Tina Seufert, Roland Grabner, Jörn Sparfeldt, Samuel Greiff, Birgit Spinath, Michael Grosche, Robin Stark, Hans Gruber, Ricarda Steinmayr, Tina Hascher, Elsbeth Stern, Regina Jucks, Linda Wirthwein
Die Einführung in die Experimentalpsychologie
Oswald Huber
Das psychologische Experiment Eine Einführung 7., überarb. Aufl. 2019. 224 S., 55 schw.-w. Zeichnungen, 13 Abb., 3 Tab., Kt € 24,95 / CHF 32.50 ISBN 978-3-456-86010-7 Auch als eBook erhältlich
Die seit Jahren bewährte Einführung macht mit den elementaren Grundlagen des Experimentierens und der Prüfung von empirischen Hypothesen vertraut – konsequent anhand anschaulicher Beispiele und mit vielen praktischen Tipps. Die zahlreichen Cartoons stammen alle aus der Feder des Autors. Das Konzept des Buches entstand aus der jahrelangen Lehrtätigkeit des Autors in der Methodikausbildung. Das Lehrbuch wurde vielfach erfolgreich in der Praxis erprobt und hat schon Generationen von Studierenden begleitet.
www.hogrefe.com
Für die siebte Auflage wurde der Text ergänzt und aktualisiert. Unentbehrlich für Studierende der Psychologie und der Nachbardisziplinen, Lehrende im Bereich der Methoden lehre sowie für Nicht-Psychologen, die an einem besseren Verständnis der empirischen und experimentellen Psychologie interessiert sind.
Zeitschrift für
Pädagogische Psychologie German Journal of Educational Psychology
Jahrgang 34 / Heft 1 / 2020
Herausgeber Andreas Knapp Detlef H. Rost Assoziierte Herausgeberin Nadine Spörer Assoziierter Herausgeber Heiner Rindermann
Herausgeber
Prof. Dr. Andreas Knapp, Santa Rosa, California, GJEP@gmx.us Prof. Dr. Detlef H. Rost, Faculty of Psychology, South West University, Chongqing (CN) & Fachbereich Psychologie, Philipps-Universität Marburg, Rost@uni-marburg.de
Assoziierte Herausgeberin
Prof. Dr. Nadine Spörer, Strukturbereich Bildungswissenschaften, Universität Potsdam, Nadine.Spoerer@uni-potsdam.de
Assoziierter Herausgeber
Prof. Dr. Heiner Rindermann, Institut für Psychologie, TU Chemnitz, Heiner.Rindermann@psychologie.tu-chemnitz.de
Redaktionsassistenz
Katja Bogda, Strukturbereich Bildungswissenschaften, Universität Potsdam, ZfPP.Kontakte@uni-potsdam.de Laura Ackermann & Avelina Lovis Schmidt, Institut f. Psychologie, TU Chemnitz, ZfPP@psychologie.tu-chemnitz.de
Beirat
Roland Brünken, Saarbrücken
Jens Möller, Kiel
Martin Brunner, Berlin
Jan Retelsdorf, Hamburg
Susanne R. Buch, Wuppertal
Ulrich Schroeders, Kassel
Oliver Dickhäuser, Mannheim
Tina Seufert, Ulm
Roland Grabner, Graz
Jörn Sparfeldt, Saarbrücken
Samuel Greiff, Luxemburg
Birgit Spinath, Heidelberg
Michael Grosche, Wuppertal
Robin Stark, Saarbrücken
Hans Gruber, Regensburg
Ricarda Steinmayr, Dortmund
Tina Hascher, Bern
Elsbeth Stern, Zürich
Regina Jucks, Münster
Linda Wirthwein, Dortmund
Verlag
Hogrefe AG, Länggass-Str. 76, 3012 Bern, Tel. +41 (0) 31 300 45 00, verlag@hogrefe.ch, www.hogrefe.ch
Herstellung
Beatrix Marthaler, Tel. +41 (0) 31 300 45 38
Anzeigen
Josef Nietlispach, Tel. +41 (0) 31 300 45 69, inserate@hogrefe.ch
Satz
AZ Druck und Datentechnik GmbH, Kempten (Allgäu)
Druck
jetoprint GmbH, VS-Villingen, Deutschland
ISSN
ISSN-L 1010-0652, ISSN 1010-0652 (Print), ISSN 1664-2910 (online)
Erscheinungsweise
vierteljährlich
Indexierung
Social Sciences Citation Index, Social Scisearch, Current Contents/Social and Behavioral Sciences, PSYNDEX, PsycLIT, Contents Pages in Education, Sociological Abstracts, Linguistics and Language Behavior Abstracts, Child Development Abstracts and Bibliography, Psyc INFO, PsyJOURNALS, IBZ, IBR, Europ. Reference List for the Humanities (ERIH) und Scopus 2018 5-year Impact Factor 0.966 Journal Citation Reports (Clarivate Analytics, 2019)
Bezugsbedingungen
Jahresabonnement Institute € 285,00 / CHF 373.00 (Print only; Informationen zu den Online- Abonnements finden Sie im Zeitschriftenprospekt unter hgf.io/zftkatalog); Jahresabonnement Privat € 121,00 / CHF 163.00 (Print & online); Einzelheft € 53,50 / CHF 72.50 (Print only) zzgl. Porto- und Versandgebühren Porto und Versandgebühren Schweiz: CHF 14.– Europa: € 15,– Übrige Länder: CHF 26.– Abbestellungen spätestens zwölf Wochen vor Ablauf des Abonnements.
Elektronischer Volltext
www.econtent.hogrefe.com/loi/zpp
Zeitschrift für Pädagogische Psychologie (2020), 34 (1)
© 2020 Hogrefe
Inhalt / Contents Gasteditorial / Guest Editorial
Moving beyond the ivory tower – why researchers from the field of education should go ahead
1
Jenseits des Elfenbeinturms – warum Forscherinnen und Forscher aus dem Bildungsbereich eine Vorreiterrolle einnehmen sollen Christiane Spiel Originalarbeiten / Original Articles
Qualitätsmerkmale von Ganztagsangeboten aus der Perspektive der Schülerinnen und Schüler – Entwicklung und Validierung eines Fragebogens
9
Quality of extracurricular activities from the pupils' perspective – development and validation of a questionnaire Dennis Nowak, Fabienne Ennigkeit und Christopher Heim Wenn den Zappelphilipp die Aufschieberitis packt: Zusammenhänge zwischen ADHS-Symptomen und Prokrastination und mögliche Mediatoren
23
“When Fidgety Philip starts to postpone”: The association between ADHD-symptoms and procrastination and potential mediators Sandra Schmiedeler, Kay Khambatta, Julia Hartmann und Frank Niklas The Relationship between Alienation from Learning and Student Needs in Swiss Primary and Secondary Schools
35
Der Zusammenhang zwischen Entfremdung vom Lernen und Schüler bedürfnissen in Schweizer Primar- und Sekundarschulen Kaja Marcin, Julia Morinaj, and Tina Hascher Effekt Glückssache? Zwei teststarke, präregistrierte Replikationsstudien zum Einfluss von Glück auf kognitive Leistung
51
A matter of luck: Two high-powered preregistered replication studies on effects of superstition on cognitive performance Oliver Dickhäuser, Adrian Heinze, Marie Luisa Hamm, Anika Sophie Bales, Svenja Amelie Bellmann, Daniela Böger, Lidia Katarzyna Gagelmann, Felix Kuhlenkamp, Julia Kathleen Merger, Hanna Viehweger, Julian Ziegler und Anna von Neuenstein Buchbesprechung / Book review
Nuss, B. (2018). Base-1 method: A structural-functional approach to word, sentence and discourse readability
61
Marcus C. G. Friedrich
© 2020 Hogrefe
Zeitschrift für Pädagogische Psychologie (2020), 34(1)
Emotionen therapeutisch und diagnostisch zugänglich machen
Für d er un Kind liche d Jugen
Das von Katharina Kupper und Sonja Rohrmann entwickelte Diagnostik- und Therapieverfahren erfasst die Fähigkeit von Kindern und Jugendlichen zur Benennung, Differenzierung und Analyse der Intensität einer Bandbreite an verschiedenen grundlegenden Emotionen.
Test komplett bestehend aus: • Manual • je 5 Gefühle-Testhefte für Mädchen und Jungen • je 5 Protokollbogen Einzeltestung und Gruppentestung • 5 Selbstbeurteilungsfragebogen • 10 Auswertungsbogen • Gefühle-Memo-Spiel • je 1 Therapiematerialien-Set Mädchen und Jungen • Box Best.-Nr. 03 210 01 € 236,00 (252,52 inkl. MwSt.) CHF 299.50 (322.56 inkl. MwSt.)
www.hogrefe.com
Einsatzbereich und Besonderheiten • Für die Altersgruppe von 5 bis 16 Jahren geeignet • Für den Einsatz in der Schulpsychologie, der Kinder- und Jugendpsychotherapie sowie in der klinischen, pädagogischen und psychologischen Forschung geeignet • Kann im Einzel- oder Gruppensetting angewendet werden • Spielerischer Zugang mittels Gefühle-Memo-Spiel • Enthält vielfältiges Therapiematerial, das auf verschiedene Sitzungen verteilt werden kann • Schnelle Auswertung in nur 5 Minuten
Guest Editorial
Moving beyond the ivory tower – why researchers from the field of education should go ahead Christiane Spiel Universität Wien, Fakultät für Psychologie, Institut für Angewandte Psychologie: Arbeit, Bildung, Wirtschaft
Abstract: Since the beginning of the 21st century universities are increasingly requested to use the results produced by their first (teaching) and second mission (research) to help resolve the growing challenges societies and local communities are faced with. This obligation has been codified as the Third Mission of universities. However, research and its results often seem to remain in the so-called ivory tower and realization of successful transfer often failed. Empirical research clearly shows that the key factor for successful transfer is to involve an intensive cooperation between researchers, policymakers, and practitioners within a mutually respectful, collaborative process. However, the establishment of a high quality and fruitful cooperation among these different groups is difficult. In the paper, possible reasons for poor transfer of research findings on part of researchers, practitioners, and policymakers are discussed as well as demands for successful transfer. A systematic six-step procedure for policy impact from research is presented, which summarizes the most relevant actions to be taken and issues to be considered on the part of (individual) researchers for realizing successful transfer. Universities can provide a supportive environment through the development of a distinct Third Mission profile including criteria and incentives for transfer activities of single researchers. It is the intention of this paper to convince researchers from the field of education to go ahead in moving beyond the ivory tower and to engage in transfer of scientific knowledge. One reason is the high importance of education for society. Another reason is that the competences and experiences necessary for successful transfer of research to the wider field of policy and practice are core competences and experiences of researchers from the field of education. Keywords: Transfer, third mission of universities, ivory tower, education Jenseits des Elfenbeinturms – warum Forscherinnen und Forscher aus dem Bildungsbereich eine Vorreiterrolle einnehmen sollen Zusammenfassung: Seit dem Beginn des 21. Jahrhunderts sind Hochschulen zunehmend gefordert die Herausforderungen, die sich für Gesellschaft und Region stellen, mit diesen gemeinsam zu lösen unter Nutzung der Ergebnisse ihrer ersten und zweiten Mission (Lehre und Forschung). Dies wird als die dritte Mission („Third Mission“) von Hochschulen bezeichnet. Es zeigt sich jedoch, dass Forschung und ihre Ergebnisse oft im sogenannten „Elfenbeinturm“ verbleiben und Transferaktivitäten häufig nicht erfolgreich sind. Gemäß empirischen Befunden ist eine intensive Kooperation zwischen Forschung, Politik und Praxis in einem gemeinsam gestalteten wertschätzenden Prozess der Schlüssel für erfolgreichen Transfer. Jedoch ist die Etablierung einer qualitativ hochwertigen und erfolgreichen Kooperation zwischen diesen Gruppen offensichtlich sehr schwierig. In dem Beitrag werden Gründe für das Misslingen von Transferaktivitäten und Voraussetzungen für einen erfolgreichen Transfer auf Seiten von Forschung, Praxis und Politik diskutiert. Es wird ein sechsstufiger Prozess vorgeschlagen, der die notwendigen Schritte und Aktionen für einen erfolgreichen Transfer auf Seiten von Forscherinnen und Forscher beinhaltet. Hochschulen können hier eine unterstützende Umwelt bereitstellen, in dem sie ein Third Mission Profil entwickeln inklusive Kriterien und Incentives für Third Mission Aktivitäten individueller Forscherinnen und Forscher. Es ist Intention des Beitrags Forscherinnen und Forscher aus dem Bildungsbereich zu überzeugen, beim Verlassen des Elfenbeinturms vorauszugehen. Ein Grund dafür ist die Bedeutung von Bildung für die Gesellschaft. Ein weiterer liegt darin, dass Forscherinnen und Forscher aus dem Bildungsbereich die für erfolgreichen Transfer notwendigen Kompetenzen und Erfahrungen bereits mitbringen. Schlüsselwörter: Transfer, Third Mission von Hochschulen, Elfenbeinturm, Bildung
Since the beginning of the twenty-first century, the interface of basic research, innovation and societal / civic engagement has become increasingly important. Universities and other higher education institutions are called upon in using the results produced by their first (teaching) and second mission (research) to help resolve the growing challenges societies and local communities are facing (Bleiklie, Laredo, & Sörlin, 2007; Pinheiro, Langa, & Pausits, 2015a; Schober, Brandt, Kollmayer, & Spiel, 2016; see also Brandt, © 2019 Hogrefe
Schober, Somoza, & Spiel, 2018). This Third Mission of universities includes actively taking responsibility for society, on whose behalf they are working (European Commission, 2011). However, research and its results often seem to remain in the so-called ivory tower, which symbolizes “the perceived detachment of universities from the real needs of real people in a real world” (Random House, 1993, p. 1017). There is a huge number of publications including the term “ivory tower” in their title since 2000, Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 1–8 https://doi.org/10.1024/1010-0652/a000260
2
which indicates that researchers are considering the ivory tower respectively its overcoming as a topic of high relevance. A large proportion of these publications focus on the field of education (Schober et al., 2016) indicating the urgent need to increase transfer from science to society in this context. However, there are several examples showing that the transfer of knowledge and programs into practice and into the wider field of public policy often fails (Fixsen, Blase, Metz, & Van Dyke, 2013). It is the main intention of this paper to convince researchers from the field of education to go ahead in moving beyond the ivory tower and to engage in transfer of scientific knowledge. In doing so, in the first section I briefly describe the high importance of education as well as the gap between aspirations and actual policy-making, which is larger in the field of education compared to other sectors. In the next section, I discuss possible reasons for poor transfer of research findings on part of researchers, practitioners, and policymakers as well as demands for successful transfer. The two following sections present recommendations how successful transfer could be realized on the level of researchers and at the university level. First, a systematic six-step procedure for policy impact from research proposed by Spiel and colleagues (Spiel, Schober, & Strohmeier, 2016) is presented, which summarizes the most relevant actions to be taken and issues to be considered on the part of (individual) researchers for realizing successful transfer. Then, I discuss how the Third Mission of universities can provide a supportive environment for transfer activities of single researchers. Finally, I very briefly summarize the main arguments why researchers from the field of education should engage in transfer and why they should go ahead. Obviously, as an educational psychologist, I am primarily speaking for educational psychologists. For this paper, I systematically put together thoughts and arguments I have worked out with my colleagues and discussed in several previous papers over the last years (in particular Brandt et al., 2018; Schober et al., 2016; Spiel & Schober, 2017; Spiel et al., 2016; Spiel et al., 2018).
Education – relevance and policy Education is the process of learning and expanding culture, and, as it contributes to the improvement of the human condition through better knowledge, health, living conditions, social equity and productivity, is a central tool for social progress (Spiel et al., 2018). However, not only access to education makes the difference, but also the quality of education. More schooling is not necessarily equal to a better education (Hanushek, Schwerdt, Wiederhold, & Woessmann, 2015; Hanushek & Woessmann, Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 1–8
C. Spiel, Moving beyond the ivory tower
2012). Millions of students, mostly in low income countries, but also students in rich countries as Germany, Austria, and Switzerland, go through school without learning to read and understand a simple text, to solve a simple arithmetical problem, or to have a grasp of very simple scientific facts. Consequently, high-quality education is of high importance not only for the individual but also for society as a whole. There is a significant positive effect of educational quality on economic growth (Hanushek & Kimko, 2000; Heckman, 2008) as well as on individuals' health, job satisfaction und subjective success in life (e. g., Oreopoulos, Page, & Stevens, 2006; Oreopoulos & Salvanes, 2011). Thus, in most societies, there is strong consensus about the promises of education to contribute to social progress. More than a tool for access to public and private jobs, education came to be considered a personal right, expected to pave the way for other forms of participation, including the benefits of individual choice, good employment and income, as well as social prestige. After World War II, the right to education was enshrined in the Universal Declaration of Human Rights and embodied in the work of international organizations such as UNESCO, that not only spread the gospel of expanding education but also helped countries to organize their school systems. In 1990, the Jomtien World Conference on Education for All set the target to provide free and compulsory primary education for all children in the world, with the financial and technical support of public and private donors. This was expanded with UN Millennium Development Goal 2, which aimed to achieve universal completion of a full cycle of primary education, and by the new Sustainable Development Goal 4 of the 2030 Agenda, that emphasizes the quality and learning dimensions (see Spiel et al., 2018). However, the apparent widespread support for public education contrasts with the fact that, in many countries, persistent educational inequalities are still unresolved. Inequality in education achievement starts in the early years, and can be cumulative (Scarborough, Neumann, & Dickinson, 2009). Therefore, good quality preschool education is crucial to reduce these differences (Brady & Shankweiler, 2013; Goswami & Bryant, 1990). Nevertheless, levels of public investment in education and efforts to expand educational opportunities are often below expectations (Spiel et al., 2018). Also in Germany, Austria and Switzerland a comprehensive preschool education is lacking, in particular in the early ages (see for Germany Autorengruppe Bildungsberichterstattung, 2018; for Austria Hartel, Hollerer, Smidt, Walter-Laager, & Stoll, 2018; and for Switzerland Stamm, 2009). There are two potential explanations why the gap between aspirations and actual policy-making might be larger in education compared to other sectors. First, pub© 2019 Hogrefe
C. Spiel, Moving beyond the ivory tower
lic support for education might be less robust than assumed. Expanding educational opportunities creates benefits in the long rather than the short term, both for individuals and for society. The long-term maturation of educational investments stands in contrast to the shortterm benefits of many other social policies such as health care, social transfer programs and old age pensions (Busemeyer, Lergetporer, & Woessmann, 2017). It often takes many years to see the results of interventions in the field of education, which contrasts with politicians' needs to score quick wins with the next elections in mind. Second, political parties might agree on the need to expand education in general, but, when it comes to the details, education is a highly contested policy area that is heavily driven by ideologies. As a consequence, we witness many reforms that seem to be ill-designed “educational experiments” rather than sustainably planned change processes. This can lead to unpredictable costs for individuals and society (Woessmann & Piopiunik, 2009). In general, evidence-based knowledge from research in the field of education seems to be frequently ignored by decision-makers and practitioners. Consequently, there are repeatedly (and partly successful) claims for an evidence-based policy, which is promoted as providing a solid and more rational – namely, professional and value-neutral – basis for decision-making on matters of supervision, control, capacity, efficiency, operations and structure (Drori & Meyer 2006; Espeland & Sauder, 2007). A softer version is to give priority to “evidence-informed” rather than to “evidence-based” policies (Burns & Schuller, 2007). While few would doubt that policy decisions should be informed by research and evidence as far as possible, it is also important to be aware of its conceptual and political limitations, which are often neglected. Education is a field that is heavily driven by diverse ideological and political influences, which cannot be bridged by “facts”. A further problem lays within educational research itself. Important differences exist in the ways research is understood, created, and synthesized. This supports the influence of ideologies on political decisions. There is also no guarantee that policy solutions proposed by experts and researchers will automatically be supported by the public. Thus, to advance educational reforms promoting social progress, it is not sufficient to identify good policy solutions, but also to ensure that these policies will be supported by public and influential stakeholders (see also Spiel et al., 2018). In other words: it is not enough to produce knowledge, it is also important to spread it out widely and consistently. There is a need for engagement of researchers in the field of education. If this engagement should be successful, it is important to consider the reasons for poor transfer and to know how to overcome it. © 2019 Hogrefe
3
Reasons for poor transfer of research findings and conditions for successful transfer Empirical research clearly shows that the key factor for successful transfer is to involve an intensive cooperation between researchers, policymakers, and practitioners (see Roland 2000; Spiel & Strohmeier, 2011) within a mutually respectful, collaborative process (Shonkoff & Bales, 2011). However, the establishment of a high quality and fruitful cooperation of researchers, practitioners, and policymakers is difficult for various reasons. In the following these reasons are specified according to Spiel and Schober (2017) based on insights from several intervention and prevention projects, in which we aimed for implementation into practice explicitly involving policymakers and practitioners (see Spiel, Schober, Strohmeier, & Finsterwald, 2011; Spiel & Strohmeier, 2012; Spiel, Wagner, & Strohmeier, 2012). From our experience, there are reasons for poor transfer on part of all parties involved. These reasons are discussed separately for researchers, practitioners, and policymakers as well as conditions for successful transfer. Researchers more often explore mechanisms than practical actions in concrete situations. They tend to disregard translational research in comparison to basic research, which has higher impact in the scientific community (Fixsen, Blase, & Van Dyke, 2011). Consequently, they often have a lack of knowledge about field conditions. However, if transfer should work, researchers are forced to communicate their research findings in the language of practitioners and politicians and to consider their perspectives. In order to implement research findings into public policy, stable alliances both with policymakers and practitioners as well as with the relevant institutions e. g., schools are needed. Respective networks should be built in advance. We further recommend the inclusion of people from the media in such networks. Cooperation with media provides the opportunity to inform the public about research findings and possible reforms. However, the main demand for researchers is that their studies are conducted in accordance with standards of evidence (see e. g., Flay etal., 2005; for a more detailed discussion see e. g., Spiel, Lösel, & Wittmann, 2009; Spiel & Strohmeier, 2012). Additionally researchers, research institutions, the scientific community as a whole as well as policymakers are asked to reconsider the already established quality criteria for scientific success that are more oriented to basic research using experiments than on longitudinal intervention studies involving evaluation and implementation. Practitioners do usually not have very much knowledge about standards, criteria, and methods of research, which causes difficulties in communication with researchers. As Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 1–8
4
they are busy with many other concrete challenges and tasks, they are often not highly motivated to increase their knowledge by means of research findings. However, for successful transfer practitioners need to require knowledge about research in general and research findings related to the intended interventions and programs specifically (see also Beelmann, 2011). Interventions can only work in the field, if practitioners are able to see and accept the necessity of changes. But the demand to change attitudes and behavior provokes resistance not only because of the investment in changes but also because it signals a need to improve the hitherto existing behavior. Resistance against change, therefore, also protects self-worth. To increase the probability for successful transfer practitioners also need to prepare themselves and their institutions for an intervention. For example, in schools, it is of high importance to reach high consensus among the teachers about education, teaching, and achievement and that teachers are cooperatively planning these issues (see e. g., Scheerens, 1990). Furthermore, readiness for intervention also requires high responsibility and willingness for engagement on both the school and the single teacher level. Working teams have to be established with a majority of consensus in the institution and with administrative support (see e. g., Spiel & Strohmeier, 2011). Further promotable conditions for success are the establishment of basic evaluation attitudes in teachers and a school culture where failures are seen as learning opportunities. Furthermore, supportive community networks are helpful and should be established. Policymakers, similar to practitioners, commonly have poor knowledge about standards, criteria, and methods of research, which causes very comparable problems. As a consequence, the consideration of scientific findings into political argumentation often is missed. Furthermore, research results might contradict political programs and ideologies. Consequently, demands on policymakers to meet the requirements for successful and sustainable transfer of research findings are partly similar as on practitioners (Beelmann, 2011). Again, the demands concern changes in attitudes but also measures to provide a transfer supportive context. Policymakers should advocate for evidence in policy. That means, for example, that policy decisions about programs are based on evaluations and cost-benefit analyses. Furthermore, policymakers have to provide opportunities to make institutions and practitioners ready for intervention and programs. Important prerequisites to make schools ready for interventions are evidence-based teacher education, leadership training for principals, and the establishment of quality assurance systems in schools (see e. g., Schober, Klug, Finsterwald, Wagner, & Spiel, 2012; Senge et al., 2000). Last but not least, policymakers are forced to promote the acceptance of evidence-based prevention and intervention programs in the public. Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 1–8
C. Spiel, Moving beyond the ivory tower
In sum, there are challenges for successful cooperation and transfer in all parties involved. In the following section, I describe the most relevant actions to be taken and issues to be considered on the part of (individual) researchers. For that, the PASCIT approach is presented proposed by Spiel and colleagues (Spiel et al., 2016; see also Brandt et al., 2018; Schober & Spiel, 2016; Spiel & Schober, 2017).
PASCIT: A six-step procedure supporting successful transfer on the part of researchers PASCIT is a systematic six-step procedure to encourage research impact on policy (Spiel et al., 2016). None of the PASCIT steps refers to a completely new consideration or demand (see e. g., Glasgow, Vogt, & Boles, 1999), but very often they are not considered in an integrated and coordinated way. This can be assumed as one important reason for their prevailing lack of substantial success. (For an example, illustrating the application of the PASCIT steps see Spiel et al., 2016).
Step 1: Mission-driven Problem recognition Researchers are used to identify scientific problems and desiderates for new insights. However, in the case of transfer of scientific knowledge and policy impact of research, the focus is not primarily on problems arising in basic research but on problems in society. Consequently, in order to identify such problems and in order to be generally willing to take action, researchers must not only be curiositydriven but also mission-driven, combining the quest for fundamental understanding with a consideration of practical use (Stokes, 1997). In other words, this first step requires socio-political responsibility as a basic mindset.
Step 2: Ensuring Availability of robust knowledge on how to handle the problem The availability of robust and sound scientific knowledge and evidence is a fundamental precondition for working on an identified problem. Moreover, it is a prerequisite for any kind of transfer (Spiel et al., 2009). Consequently, researchers have to be experts in the relevant field with excellent knowledge of theory, methods, empirical findings, and limitations. This also includes the political dimension of research in the sense of defining and financing corresponding research topics. © 2019 Hogrefe
C. Spiel, Moving beyond the ivory tower
Step 3: Identification of reasonable Starting points for action A wide body of research has made it clear that many intervention programs and measures do not work everywhere and at all times (Meyers, Durlak, & Wandersman, 2012). As a result, the identification of a problem and the availability of relevant insights for initiating changes is not enough if one doesn't succeed in identifying promising starting points for interventions and their implementation. Here again, a necessary condition is high expertise in the relevant scientific field. This has to be combined with a differentiated view of prevailing cultural and political conditions. Researchers need knowledge and experience in the relevant practical field and its contextual conditions. This also includes knowledge about potential problems and limitations. Researchers need to know whether the respective institutions are ready for intervention and if not, how to prepare them.
Step 4: Establishment of a Cooperation process with policymakers This step is a very crucial one. Successful transfer (in particular in the field of education having the specific conditions in mind, see above) requires cooperation, persistence, time, and money. As research often follows its own, very intrinsic logic, which clearly differs from political thinking, a very deliberate process of establishing cooperation and building alliances is necessary. Researchers have to be aware of policymakers' scope of action and have to consider that there are other influences on government and policy, beyond evidence (Davies, 2004, 2012). In particular, they have to be aware of the ideologies at work. They have to keep in mind that policymaking is highly embedded in a bureaucratic culture and is forced to respond quickly to everyday contingencies. Finally, researchers have to consider that policymaking is always a matter of what works at what costs and with what outcomes (Davies, 2004, 2012). Hence, researchers are forced to integrate evidence with all these factors. Consequently, the establishment of such a cooperation process with policy makers requires that researchers make their voice heard, and that they are sometimes very insistent.
Step 5: Coordinated development of Intervention and Implementation So far, intervention and implementation research have not yet been systematically connected. Either the need © 2019 Hogrefe
5
for the involvement of implementation researchers is completely overlooked from policy makers or implementation researchers are given mandates to take on the implementation of already existing interventions (Fixsen et al., 2011). That means that different research groups with different research traditions are involved in intervention research and in implementation research. This might be a key reason why translating interventions into widespread community practice is so difficult (Spoth et al., 2013). Therefore, we strongly recommend for a systematic integration of intervention and implementation research (Spiel et al., 2016). The whole conceptualization of an intervention as well as its evaluation and implementation should systematically consider the needs of the field (Spiel et al., 2011) in an integrated way (Beelmann & Karing, 2014). The challenge in this step is to find a good balance between realizing a wide participation and at the same time maintaining scientific criteria and standards of evidence (Schober & Spiel, 2016).
Step 6: Transfer of program implementation In the course of an increasing use of theoretical approaches to better understand how and why implementation succeeds (or not), several models and guidelines have been proposed by implementation science for this final scale-up step (e. g., Fixsen et al., 2013; Meyers et al., 2012; Nilsen, 2015). According to the review provided by Meyers and colleagues (2012), the implementation process again consists of a temporal series of interrelated steps, which are critical to quality implementation. Obviously, realizing all PASCIT steps successfully is very challenging for individual researchers. It needs time and high engagement and there might be drawbacks e. g., if governments change and other ideologies are at work because of new elections. Therefore, universities are forced to take up their Third Mission and to provide a supportive environment for transfer activities of single researchers.
The Third Mission of universities – providing a supportive environment for transfer When debating universities' role in relation to society, reference is frequently made to the implicit social contract between science and society (Schober et al., 2016). While not a new debate (Castells, 2001), particularly Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 1–8
6
since the beginning of the 21st century universities are increasingly requested to use the results produced by their first (teaching) and second mission (research) to help resolve the growing challenges societies and local communities are faced with (Bleiklie et al., 2007; Pinheiro, Langa, & Pausits, 2015b; Schober et al., 2016). This obligation has been codified as the Third Mission of universities. Third Mission may be understood as a collective term for activities, which use scientific knowledge to help shape societal development. This involves taking responsibility, actively and consciously, for the society on whose behalf universities are working (European Commission, 2011). The Third Mission has two key priorities (Schober et al., 2016): (1) Targeted use and transfer of scientific knowledge to help resolve diverse societal challenges; (2) transfer of technologies and innovations in the form of cooperation with public and private enterprises. It can be argued that not all scientific fields or universities have the same need to change or expand their focus with regard to these priorities. For example, applied universities or applied university programs are thematically better aligned with the Third Mission since their research per definition focuses on the development of applications, the majority of which are intended to meet societal demands (Jaeger & Kopper, 2014; OECD, 2012). In addition, many of the methods and approaches adopted in Third Mission activities appear to be little more than accentuations of already established paradigms such as action and participatory research and transdisciplinarity of technology transfer (Trencher, Yarime, McCormick, Doll, & Kraines, 2014). However, what appears new is the combination of these various modes into a systematic response to the growing public challenges. In this view, the lack of a distinct Third Mission profile, conceptualized as a deliberate and programmatic direction to face the high complexity of societal challenges, is not only applicable in the case of research universities but also many applied universities (Roessler, Duong, & Hachmeister, 2015). Particularly at large universities, a rich variety of Third Mission activities are already being carried out in research or teaching. However, most of them have not been formally identified as such and are not interconnected. Furthermore, there is a lack of criteria and incentives for Third Mission activities. Obviously, the development of a distinct Third Mission profile for a large research university is a big challenge, which needs clear support from the rectorate and a participatory approach involving the diverse stakeholders within the university. But there is a growing number of universities that are successfully taking up this challenge (for an example see Brandt et al., 2018; Brandt, Schober, Schultes, Somoza, & Spiel, 2018). Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 1–8
C. Spiel, Moving beyond the ivory tower
Why researchers from the field of education should go ahead? In this paper, many reasons are discussed for the relevance of an engagement in the transfer of scientific knowledge, especially in the field of education, and recommendations are presented how successful transfer can be realized by researchers and universities. In this final section, I briefly point out the two main arguments, why researchers from the field of education, and in particular educational psychologists should go ahead. The first reason, as mentioned above, is the high importance of education. Besides the strong consensus about the promises of education to contribute to social progress persistent educational inequalities are still unresolved. This might be caused by the long-term maturation of educational investments as well as by ideologies. The 2030 Agenda emphasizes the need and requirement for international and interdisciplinary (research) cooperation as well as close collaboration with policy makers, practitioners and other stakeholders to provide solutions to sustainable development challenges. Intensive cooperation between researchers, policy makers, and practitioners has been identified as the key factor for successfully and sustainably implementing research-based innovations and programs. Following the PASCIT steps might be helpful in realizing the required cooperation and reaching successful transfer. The second reason is, that the competences and experiences necessary for successful transfer of research to the wider field of policy and practice are core competences and experiences of researchers from the field of education; I know this for sure for educational psychologists. Participatory research, intervention research, implementation research, action research etc. are belonging to the canon of research in the field of educational psychology including the respective methodologies needed for realization. Knowledge and experience in action research and implementation research are very helpful tools for successfully realizing transfer of research and knowledge. Obviously, many of our colleagues are engaged in transfer activities in respective projects or as members of advisory boards in the field of education for local, national, and international governments or organizations. However, in addition to single activities and voices we need to have a common voice and should be visible and recognized as a discipline of high relevance. One opportunity to do so is to take guidance for the Third Mission at the own university. Another opportunity is the establishment of a national (or supra national) expert advisory board for educational issues similar to the expert advisory boards in the field of economy (see Frey, 2009). Researchers from the © 2019 Hogrefe
C. Spiel, Moving beyond the ivory tower
field of education have the knowledge and experience to do so and should go ahead for realization.
References Autorengruppe Bildungsberichterstattung. (2018). Frühe Bildung, Betreuung und Erziehung. In Autorengruppe Bildungsberichterstattung (Eds.), Bildung in Deutschland 2018: Ein indikatorengestützter Bericht mit einer Analyse zu Wirkungen und Erträgen von Bildung. Retrieved from https://www.bildungsbericht.de/ de/bildungsberichte-seit-2006/bildungsbericht-2018/pdfbildungsbericht-2018/kapitel-c-2018.pdf Beelmann, A. (2011). The scientific foundation of prevention. The status quo and future challenges of developmental crime prevention. In T. Bliesener, A. Beelmann, & M. Stemmler (Eds), Antisocial behavior and crime: Contributions of developmental and evaluation research to prevention and intervention (pp. 137 – 164). Cambridge, MA: Hogrefe International. Beelmann, A., & Karing, C. (2014). Implementationsfaktoren und -prozesse in der Präventionsforschung: Strategien, Probleme, Ergebnisse, Perspektiven [Implementation factors and processes in prevention research: Strategies, problems, findings, prospects]. Psychologische Rundschau, 65(3), 129 – 139. https://doi. org/10.1026/0033-3042/a000215 Bleiklie, I., Laredo, P., & Sörlin, S. (2007). Conclusion. Higher Education Policy, 20(4), 495 – 500. https://doi.org/10.1057/palgrave. hep.8300171 Brady, S. A., & Shankweiler, D. P. (Eds.). (2013). Phonological processes in literacy: A tribute to Isabelle Y. Liberman. New York: Routledge. Brandt, L., Schober, B., Schultes, M., Somoza, V. & Spiel, C. (2018). Supporting Third Mission activities at Universities: Deans´ opinions and recommendations. Zeitschrift für Hochschulentwicklung, 13(3), 21 – 40. https://doi.org/10.3217/zfhe-13-02/02 Brandt, L., Schober, B., Somoza, V. & Spiel, C. (2018). Capacity Building for Sustainable Development: Coherent Concepts of Universities' Third Mission as a Parameter. In S. Verma & A. C. Petersen (Eds), Developmental Science and Sustainable Development Goals for Children and Youth (pp. 391 – 406). Cham: Springer. https://doi.org/10.1007/978-3-319-96592-5 Burns, T., & Schuller, T. (2007). The Evidence Agenda. In OECD (Ed.), Evidence in education: linking research and policy (pp. 15 – 32). Paris: OECD. Busemeyer, M., Lergetporer, P., & Woessmann, L. (2017). Public opinion and the acceptance and feasibility of educational reforms (European Expert Network on Economics Education Report). Luxembourg: Publications Office of the European Union. Castells, M. (2001). Universities as dynamic systems of contradictory functions. In Challenges of Globalisation: South African Debates with Manuel Castells (pp. 206 – 223). Cape Town: Maskew Miller Longman. Davies, P. (2004, February). Is evidence-based government possible? Jerry Lee lecture 2004. Paper presented at the 4th Annual Campbell Collaboration Colloquium, Washington, DC. Davies, P. (2012). The state of evidence-based policy evaluation and its role in policy formation. National Institute Economic Review, 219(1), 41 – 52. https://doi.org/10.1177/00279501122 1900105 Drori, G. S., & Meyer, J. W. (2006). Global scientization: an environment for expanded organization. In G. S. Drori, J. W. Meyer, & H. Hwang (Eds.), Globalization and Organization (pp. 50 – 68). Oxford: Oxford University Press. © 2019 Hogrefe
7
Espeland, W. N., & Sauder, M. (2007). Rankings and reactivity: How public measures recreate social worlds. American Journal of Sociology, 113(1), 1 – 40. European Commission (2011). A renewed EU strategy 2011 – 14 for corporate social responsibility. Brussels. Retrieved from http:// www.eurocommerce.eu/media/7237/position-csr-renewed_ csr_strategy_2011-14-07.03.2012.pdf Fixsen, D., Blase, K., Metz, A., & Van Dyke, M. (2013). Statewide implementation of evidence-based programs. Exceptional Children, 79(2), 213 – 230. https://doi.org/10.1177/00144029 1307900206 Fixsen, D. L., Blase, K. A., & Van Dyke, M. K. (2011). Mobilizing communities for implementing evidence-based youth violence prevention programming: A commentary. American Journal of Community Psychology, 48(1 – 2), 133 – 137. https://doi.org/10. 1007/s10464-010-9410-1 Flay, B. R., Biglan, A., Boruch, R. F., Castro, F. G., Gottfredson, D., Kellam, S., … & Ji, P. (2005). Standards of evidence: Criteria for efficacy, effectiveness and dissemination. Prevention Science, 6(3), 151 – 175. https://doi.org/10.1007/s11121-005-5553-y Frey, D. (2009). Einige Assoziationen zum Theorie-Praxis-Austausch in der Psychologie: Über die Notwendigkeit, unsere Zukunft durch psychologisches Know-how mitzugestalten. Psychologische Rundschau, 60(4), 249 – 250. https://doi.org/10.1026/0033 -3042.60.4.249 Glasgow, R. E., Vogt, T. M., & Boles, S. M. (1999). Evaluating the public health impact of health promotion interventions: the RE-AIM framework. American Journal of Public Health, 89(9), 1322 – 1327. https://doi.org/10.2105/AJPH.89.9.1322 Goswami, U., & Bryant, P. (1990). Phonological skills and learning to read. Wiley Online Library. Hanushek, E. A., & Kimko, D. D. (2000). Schooling, Labor-Force Quality, and the Growth of Nations. American Economic Review, 90(5), 1184 – 1208. https://doi.org/10.1257/aer.90.5.1184 Hanushek, E. A., Schwerdt, G., Wiederhold, S., & Woessmann, L. (2015). Returns to skills around the world: Evidence from PIAAC. European Economic Review, 73, 103 – 130. https://doi.org/10. 1016/j.euroecorev.2014.10.006 Hanushek, E. A., & Woessmann, L. (2012). Schooling, educational achievement, and the Latin American growth puzzle. Journal of Development Economics, 99(2), 497 – 512. https://doi.org/10. 1016/j.jdeveco.2012.06.004 Hartel, B., Hollerer, L., Smidt, W., Walter-Laager, C., & Stoll, M. (2018). Elementarpädagogik in Österreich. Voraussetzungen und Wirkungen elementarer Bildung. Nationaler Bildungsbericht Österreich, 2, 183 – 224. https://doi.org/10.17888/nbb2018-2-5 Heckman, J. J. (2008). Schools, skills, and synapses. Economic Inquiry, 46(3), 289 – 324. https://doi.org/10.1111/ecin.2008.46. issue-3 Jaeger, A., & Kopper, J. (2014). Third mission potential in higher education: measuring the regional focus of different types of HEIs. Review of Regional Research, 34(2), 95 – 118. https://doi. org/10.1007/s10037-014-0091-3 Meyers, D. C., Durlak, J. A., & Wandersmann, A. (2012). The quality implementation framework: A synthesis of critical steps in the implementation process. American Journal of Community Psychology, 50(3 – 4), 462 – 480. https://doi.org/10.1007/s10464012-9522-x Nilsen, P. (2015). Making sense of implementation theories, models and frameworks. Implementation Science, 10(53), 1 – 13. https://doi.org/10.1186/s13012-015-0242-0 OECD (2012). OECD territorial reviews: The Chicago tri-state metropolitan area, United States 2012. Paris: Author. Oreopoulos, P., Page, M., & Stevens, A. (2006). The Intergenerational Effects of Compulsory Schooling. Journal of Labor Economics, 24(4), 729 – 760. https://doi.org/10.1086/506484 Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 1–8
8
Oreopoulos, P., & Salvanes, K. G. (2011). Priceless: The Nonpecuniary Benefits of Schooling. Journal of Economic Perspectives, 25(1), 159 – 184. https://doi.org/10.1257/jep.25.1.159 Pinheiro, R., Langa, P. V., & Pausits, A. (2015a). One and two equals three? The third mission of higher education institutions. European journal of higher education, 5(3), 233 – 249. https://doi.org/ 10.1080/21568235.2015.1044552 Pinheiro, R., Langa, P. V., & Pausits, A. (2015b). The institutionalization of universities' third mission: Introduction to the special issue. European Journal of Higher Education, 5(3), 227 – 232. https://doi.org/10.1080/21568235.2015.1044551 Random House (1993). Webster's unabridged dictionary (2nd ed.). New York, NY: Author. Roessler, I., Duong, S., & Hachmeister, C.-D. (2015). Welche Missionen haben Hochschulen? [What are higher educations'missions?] Retrieved March 25, 2018, from https://www.che.de/downloads/ CHE_AP_182_Third_Mission_an_Fachhochschulen.pdf Roland, E. (2000). Bullying in school: Three national innovations in Norwegian schools in 15 years. Aggressive Behavior, 26(1), 135 – 143. https://doi.org/10.1002/(SICI)1098-2337 Scarborough, H. S., Neuman, S., & Dickinson, D. (2009). Connecting early language and literacy to later reading (dis) abilities: Evidence, theory, and practice. In F. Fletcher-Campbell, J. Soler, & G. Reid (Eds.), Approaching difficulties in literacy development: Assessment, pedagogy and programmes (pp. 23 – 38). London: Sage. Scheerens, J. (1990). School effectiveness and the development of process indicators of school functioning. School Effectiveness and School Improvement, 1(1), 61 – 80. https://doi.org/10.1080/ 0924345900010106 Schober, B., Brandt, L., Kollmayer, M., & Spiel, C. (2016). Overcoming the ivory tower: Transfer and societal responsibility as crucial aspects of the Bildung-Psychology approach. European Journal of Developmental Psychology, 13(6), 636 – 651. https://doi.org/ 10.1080/17405629.2016.1231061 Schober, B., Klug, J., Finsterwald, M., Wagner, P., & Spiel, C. (2012). Ergebnisorientierte Qualitätsentwicklung von Schule: Spezifische Kompetenzen von Lehrkräften, Schulleiterinnen und Schulleitern [Output-oriented quality development of schools: Specific competences of teachers and administrators.]. In M. Bruneforth, B. Herzog-Punzenberger & L. Lassnigg (Eds), Nationaler Bildungsbericht Österreich: Indikatoren und Themen im Überblick (pp. 111 – 142). Graz, Austria: Leykam. Schober, B., & Spiel, C. (2016). Enabling improvements: Combining intervention and implementation research. In R.A. Scott, S. M. Kosslyn, & M. Buchmann (Eds), Emerging Trends in the Social and Behavioral Sciences. Hoboken, NJ: John Wiley & Sons. https://doi.org/10.1002/9781118900772.etrds0412 Senge, P., Cambron-McCabe, N., Lucas, T., Smith, B., Dutton, J., & Kleiner, A. (2000). Schools that learn. London: Nicholas Brealey Publishing. Shonkoff, J. P., & Bales S. N. (2011). Science does not speak for itself: translating child development research for the public and its policymakers. Child Development, 82(1), 17 – 32. https://doi.org/ 10.1111/j.1467-8624.2010.01538.x Spiel, C., Lösel, F., & Wittmann, W. W. (2009). Transfer psychologischer Erkenntnisse – eine notwendige, jedoch schwierige Aufgabe [Transfer of psychological knowledge – an essential, but complex task]. Psychologische Rundschau, 60(4), 241 – 242. https:// doi.org/10.1026/0033-3042.60.4.241 Spiel, C., & Schober, B. (2017). Lessons learned for policy impact from research and interventions. In A. Petersen, S. Koller, F. MottiStefanidi, & S. Verma (Eds.), Positive Youth Development in Global Contexts of Social and Economic Change (pp. 267 – 278). New York and London: Routledge.
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 1–8
C. Spiel, Moving beyond the ivory tower
Spiel, C., Schober, B., & Strohmeier, D. (2016). Implementing intervention research into public policy – the “I3-Approach”. Prevention Science, 19(3), 337 – 346. https://doi.org/10.1007/s11121016-0638-3 Spiel, C., Schober, B., Strohmeier, D., & Finsterwald, M. (2011). Cooperation among researchers, policy makers, administrators, and practitioners: Challenges and recommendations. ISSBD Bulletin 2011, 2(60), 11 – 14. Spiel, C., Schwartzman, S., Busemeyer, M., Cloete, N., Drori, G., Lassnigg, L., Schober, B., Schweisfurth, M., & Verma, S. (2018) The contribution of education to social progress. In: International Panel on Social Progress (Ed.), Rethinking Society for the 21st Century: Report of the International Panel for Social Progress (pp. 753 – 778). Cambridge University Press: Cambridge. https:// doi.org/10.1017/9781108399661.006 Spiel, C., & Strohmeier, D. (2011). National strategy for violence prevention in the Austrian public school system: Development and implementation. International Journal of Behavioral Development, 35(5), 412 – 418. https://doi.org/10.1177/0165025411 407458 Spiel, C., & Strohmeier, D. (2012). Evidence-based practice and policy: When researchers, policy makers, and practitioners learn how to work together. European Journal of Developmental Psychology, 9(1), 150 – 162. https://doi.org/10.1080/17405629. 2011.616776 Spiel, C., Wagner, P., & Strohmeier, D. (2012). Violence prevention in Austrian schools: Implementation and evaluation of a national strategy. International Journal of Conflict and Violence, 6(2), 176 – 186. https://doi.org/10.4119/ijcv-2910 Spoth, R., Rohrbach, L. A., Greenberg, M., Leaf, P., Brown, C. H., Fagan, A. et al. (2013). Addressing core challenges for the next generation of type 2 translation research and systems: The translation science to population impact (TSci Impact) framework. Prevention Science, 14(4), 319 – 351. https://doi.org/10. 1007/s11121-012-362-6 Stamm, M. (2009). Frühkindliche Bildung in der Schweiz: Eine Grundlagenstudie im Auftrag der Schweizerischen UNESCOKommission. Université de Fribourg. Retrieved from http://doc. rero.ch/record/11652/files/Zusammenfassung_UNESCOStudie _Sperrfrist.pdf Stokes, D. E. (1997). Pasteur's Quadrant: Basic science and technological innovation. Washington, D. C.: Brookings Institution Press. Trencher, G., Yarime, M., McCormick, K., Doll, C., & Kraines, S. (2014). International Institute for Industrial Environmental Economics (IIIEE). Science and Public Policy, 41(2), 151 – 179. https://doi.org/10.1093/scipol/sct044 Woessmann, L., & Piopiunik, M. (2009). Was unzureichende Bildung kostet. Eine Berechnung der Folgekosten durch entgangenes Wirtschaftswachstum (Bertelsmann Stiftung). Retrieved from https://www.elternlobby.ch/wp-content/uploads/2016/05/ FolgekostenWoessmannD.pdf Onlineveröffentlichung: 16.12.2019
Univ.Prof. Dr. Dr. Christiane Spiel Universität Wien Fakultät für Psychologie Institut für Angewandte Psychologie: Arbeit, Bildung, Wirtschaft Universitätsstraße 7 A-1010 Wien christiane.spiel@univie.ac.at
© 2019 Hogrefe
Originalarbeit
Qualitätsmerkmale von Ganztags angeboten aus der Perspektive der Schülerinnen und Schüler – Entwicklung und Validierung eines Fragebogens Dennis Nowak, Fabienne Ennigkeit und Christopher Heim Goethe-Universität Frankfurt am Main
Zusammenfassung: Wie Schülerinnen und Schüler die Qualität von Ganztagsangeboten (AGs) beurteilen, wurde bislang mithilfe von Merkmalen erfasst, die aus der empirischen Unterrichtsforschung bzw. der Sozialpädagogik abgeleitet sind. Dabei standen vornehmlich unterrichtsnahe Angebote im Mittelpunkt, wodurch die deutlich stärker nachgefragten freizeitbezogenen Angebote (z. B. aus dem Bereich Sport oder Musik) kaum berücksichtigt wurden. Im Rahmen des vorliegenden Beitrags wird mit der Skala zur Erfassung AG-spezifischer Qualitätsmerkmale (GAINS-AG-Skala) ein Instrument vorgestellt, mit dem die Qualität aller Angebotstypen im Rahmen des Ganztags erfasst werden kann. Die Ergebnisse aus insgesamt drei Studien ergeben, dass die 28 Items des Fragebogens die vier Faktoren Lernförderlichkeit, Interesse, pädagogische Unterstützung und Lerngemeinschaft abbilden, die sich auch an einer unabhängigen Stichprobe replizieren lassen. Zudem sprechen die Ergebnisse für Konstruktvalidität und Test-Retest-Reliabilität der Skala. Mit dem vorliegenden Beitrag wird nicht nur eine Anschlussfähigkeit an die aktuelle Debatte um Qualitätsmerkmale ganztägiger Angebote hergestellt, sondern mit den Subskalen Interesse und Lerngemeinschaft erfolgt auch eine Erweiterung des bisherigen Qualitätsverständnisses um zwei wesentliche Aspekte. Schlüsselwörter: Ganztagsangebote, Angebotsqualität, Ganztagsschule, Fragebogen, Evaluation Quality of extracurricular activities from the pupils' perspective – development and validation of a questionnaire Abstract: The quality of extracurricular activities (AGs) in German all-day schools from a pupil's perspective has so far been assessed by dimensions derived mainly from empirical teaching research and social pedagogy. Until now, the main focus has been on activities related to academic achievement. Therefore, the more popular leisure-related extracurricular activities (e. g. sports or music) have barely been taken into account. The aim of this article is to introduce the Skala zur Erfassung AG-spezifischer Qualitätsmerkmale (GAINS-AG-Skala), a questionnaire which allows to assess the quality of all types of extracurricular activities. The results of three studies show that the 28-item scale reflects the four factors of learning support, interest, educational support and learning community, which were also replicated in an independent sample. In addition, the results indicate construct validity and test-retest reliability of the scale. This research links to the recent German debate on qualitative aspects of extracurricular activities. Besides, the subscales interest and learning community extend the existing quality models by two essential dimensions. Keywords: Extracurricular activities, quality, german all-day schools, questionnaire, evaluation
Im Mittelpunkt des Forschungsinteresses zu Ganztagsschulen stand bis vor Kurzem die Überprüfung der Frage, inwieweit eine Teilnahme am Ganztagsbetrieb die individuelle Förderung und soziale Integration der Schülerinnen und Schüler (SuS) begünstigt sowie deren Chancengleichheit erhöht. Dabei wurde das aus der Unterrichtsforschung
stammende Input-Prozess-Output-Modell auf den Ganztagskontext übertragen (Fischer, Kuhn & Tillack, 2016). Nach diesem Modell steht die Prozessqualität der Ange bote1 in wechselseitiger Beziehung zur Qualität des Inputs sowie insbesondere zur Ergebnisqualität. Als zentrales Ergebnis der bisherigen Diskussion lässt sich festhalten, dass
1 Im Folgenden werden unter (Ganztags-)Angeboten außerunterrichtliche, pädagogisch gerahmte Bildungssettings im ganztagsschulischen Kontext verstanden. Die als Synonym aufzufassende Begriffsverwendung „AG“ (Arbeitsgemeinschaft) im Rahmen der Entwicklung des Fragebogens resultiert aus der häufigeren Verbreitung dieses Ausdrucks im einzelschulischen Kontext. © 2019 Hogrefe
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21 https://doi.org/10.1024/1010-0652/a000245
10
Ganztagsschulen grundsätzlich das Potenzial besitzen, diese weitgehend normativ aufgeladenen Forderungen zu erfüllen. Maßgeblich dafür scheint jedoch die von den SuS wahrgenommene Qualität der Ganztagsangebote zu sein (StEG-Konsortium, 2016), wodurch in jüngerer Zeit Fragen zu Qualitätsmerkmalen von Ganztagsangeboten in den Mittelpunkt der empirischen Ganztagsschulforschung rücken. Während im angloamerikanischen Sprachraum Qualitätsmerkmale von extracurricular activities bereits Anfang der 2000er Jahre beschrieben wurden (z. B. Eccles & Gootman, 2002; Mahoney, Larson & Eccles, 2005), existiert in Deutschland hierzu noch kein Konsens. In der Diskussion wurden zunächst die drei Basisdimensionen guten Unterrichts (strukturierte, klare und störungspräventive Unterrichtsführung; schülerorientiertes, unterstützendes Sozialkli ma; kognitiv aktivierende Frage- und Aufgabenstellungen; Klieme & Rakoczy, 2008) auf den Ganztagskontext übertragen (Radisch, Stecher, Klieme & Kühnbach, 2008). Dabei wurde davon ausgegangen, dass diese Kriterien die psychologischen Grundbedürfnisse nach Autonomie, Kompetenz und sozialer Eingebundenheit befriedigen, wie sie in der Selbstbestimmungstheorie formuliert werden (Deci & Ryan, 2000). Da Ganztagsangebote inhaltlich deutlich hetero gener ausgestaltet sind als Unterricht und fächerüber greifende Lernziele (z. B. Erwerb sozialer Kompetenzen, Demokratielernen) ein höheres Gewicht erhalten, wurden in der Folge die aus der Unterrichtsforschung adaptierten Qualitätsdimensionen für Ganztagsangebote um Merkmale aus den Erkenntnissen der Sozialpädagogik bzw. Jugend arbeit ergänzt (Sauerwein, 2017). Aktuell wird die Qualität von Ganztagsangeboten mithilfe einer aus 27 Items bestehenden Skala gemessen, die die acht Subskalen Zeitnutzung, kognitive Aktivierung, Autonomieerleben, Partizipation, Alltagsweltorientierung, emotionale, individuelle und rechtliche Anerkennung mit internen Konsistenzen zwischen α = .57 und α = .93 umfasst (Sauerwein, 2017). Die Überprüfung der Faktorstruktur dieser Skala ergab, dass das achtfaktorielle Modell die Daten besser abbildet als ein einfaktorielles Modell. Ob dies allerdings die Aussage zulässt, dass SuS in der Lage sind, die Qualität von pädagogisch gerahmten Settings differenziert einzuschätzen, kann vor dem Hintergrund gegenteiliger Befunde aus Unterrichts- und Ganztagsschulforschung (z. B. Clausen, 2002; Radisch et al., 2008) bisher nicht abschließend beurteilt werden. Dies mag auch in der eingeschränkten Aussagekraft aufgrund der wenigen von Sauerwein (2017) berücksichtigten Angebotskategorien (Lesen, Medien und soziales Lernen) sowie der relativ geringen Stichprobengrößen (je nach Angebot bzw. Messzeitpunkt 72 ≤ n ≤ 142) begründet liegen. Der Autor selbst weist daher darauf hin, dass das von ihm vorgeschlagene Qualitätsmodell „idealerweise in Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21
D. Nowak et al., Qualitätsmerkmale von Ganztagsangeboten
weiteren Studien und aus verschiedenen Perspektiven validiert und ergänzt werden“ sollte (Sauerwein, 2016, S. 76). In der vorliegenden Studie wird dieser Forderung nachgekommen, indem eine alternative Skala zur Erfassung der Qualität ganztägiger Angebote aus der Perspektive der SuS entwickelt und empirisch geprüft wird. Mit dieser Skala soll die aktuelle Debatte um weitere bzw. von der bisherigen Strukturierung abweichende Dimensionen bereichert werden. Unter Berücksichtigung des bisherigen Forschungsstands sowie den Annahmen der Selbstbestimmungstheorie (Deci & Ryan, 2000) werden zur Beurteilung der Prozessqualität sowohl unterrichtsnaher als auch freizeitbezogener Ganztagsangebote folgende sieben Dimensionen zugrunde gelegt: Lernförderlichkeit: Die Förderung fachlicher und überfachlicher Kompetenzen der SuS durch eine veränderte Lehr- und Lernkultur stellt ein zentrales Ziel des ganztagsschulischen Konzepts dar. In den Angeboten sollen – wie im Regelunterricht auch – Lerngelegenheiten geschaffen werden, die bei den SuS Verhaltensänderungen initiieren bzw. provozieren (Weinert, 2010). Diese Dimension fokussiert daher den subjektiv wahrgenommenen Unterrichts- und Schulleistungsnutzen, aber auch den Nutzen bezüglich einer Alltagsweltorientierung und ist daher eher der Ergebnis- als der Prozessqualität der Angebote zuzuordnen. Interesse: Die Herausbildung von Interessen stellt in pädagogisch-normativer Betrachtungsweise ein (wünschenswertes) Erziehungsziel dar. Interesse wird für die Entstehung und Aufrechterhaltung intrinsischer Lernmotivation verantwortlich gemacht (Schiefele, 2008), da sich die SuS bei einem hoch ausgeprägten Interesse aktiv mit den Inhalten auseinandersetzen und engagiert mitarbeiten. In der Interessensforschung werden eine emotionale und eine wertbezogene Komponente unterschieden (Krapp, 2010): yy Emotionales Interesse geht mit dem Erleben positiver Gefühle wie Kompetenz und Freude während der Rea lisierung, der Erinnerung oder der Erwartung an künftige Auseinandersetzungen einher. Die SuS sollen daher ein Angebot mit positiv konnotierten Emotionen verbinden. yy Wertbezogenes Interesse bezieht sich auf die herausgehobene Bedeutung bzw. Wichtigkeit des Interessensgegenstands für die Person. Ein besuchtes Angebot soll daher von den SuS als persönlich bedeutsam erlebt werden. Das Konstrukt Interesse wurde in vorhergehenden Arbeiten zu Qualitätsmerkmalen von Ganztagsangeboten nicht berücksichtigt. Klima: Aus der Unterrichtsforschung ist bekannt, dass ein positiv getöntes Klima (z. B. wertschätzender Umgang der Peers untereinander, unterstützendes Verhalten durch © 2019 Hogrefe
D. Nowak et al., Qualitätsmerkmale von Ganztagsangeboten
erwachsene Bezugspersonen) die affektiv-motivationale und psychosoziale Entwicklung der SuS sowie deren Lernerfolg begünstigt (Lipowsky, 2009). Zusätzlich zur Betrachtung der Interaktionsqualität der beteiligten Akteure soll der Blick auch auf allgemeine Merkmale des Unterrichts bzw. die Lernhaltungen der SuS gerichtet werden, wodurch all diejenigen Kategorien Berücksichtigung finden, die in den gängigen Klimainventaren (Eder, 2010) enthalten sind: yy Beziehung zur AG-Leitung: Diese Dimension fokussiert das individualisiert-unterstützende Verhalten durch die Angebotsleitung. Die Vermittlung eines Gefühls der Sicherheit und Wertschätzung motiviert die SuS intrinsisch und begünstigt soziale Lerneffekte (Reindl & Gniewosz, 2017). yy Beziehung zwischen SuS: Soziale Interaktionen zwischen den SuS stellen eine wesentliche Voraussetzung für den Erwerb sozialer Kompetenzen dar (Satow, 1999). Daher adressiert diese Dimension das Maß an wahrgenommener sozialer Unterstützung und Geborgenheit zwischen den SuS und ihren Peers. Im Gegensatz zu den vertikalhierarchisch angelegten Beziehungen zwischen SuS und Lehrkräften bzw. Angebotsleitungen wird im vorliegenden Beitrag erstmalig auch die horizontale Beziehungsebene in den Blick genommen. yy Zeitnutzung: Eine strukturierte und störungsfreie Gestaltung der Lernumgebung ist notwendig, damit die vorhandene Zeit in Ganztagsangeboten möglichst optimal zur Kompetenzerweiterung der SuS eingesetzt werden kann (Kunter & Trautwein, 2013). Aus den verschiedenen Faktoren gelungenen classroom managements wurde mit der effektiven Zeitnutzung das Merkmal ausgewählt, welches sich am anschlussfähigsten an das bisherige Qualitätsverständnis ganztägiger Angebote erweist. yy Partizipation: Ausreichende Mitbestimmungsmöglichkei ten in pädagogischen Settings können dazu beitragen, übergeordnete Ziele wie Demokratie- und Autonomie erleben sowie Verantwortungsübernahme zu erreichen (Sting & Sturzenhecker, 2013). Daher steht im Zentrum dieser Dimension, inwiefern die SuS in einem Angebot Möglichkeiten zur Mitbestimmung erleben. Zusammenfassend besteht das Ziel dieses Beitrags darin, eine Skala zu entwickeln, mit der die Qualität ganztägiger Bildungssettings aus der Perspektive der SuS erfasst werden kann. Die Skala soll dabei für verschiedene Jahrgangsstufen und Schulformen, aber auch für die Beurteilung sowohl unterrichtsnaher als auch freizeitorientierter Angebote einsetzbar sein. Im Vordergrund steht die Frage,
11
ob sich die sieben postulierten Dimensionen auch empirisch abbilden lassen oder ob eine andere Faktorstruktur besser geeignet ist. Zudem sollen bei Vorliegen einer akzeptablen Faktorlösung mit der konvergenten Validität sowie der Test-Retest-Reliabilität weitere Gütekriterien überprüft werden.
Entwicklung der GAINS-AG-SKALA Im Rahmen der Konstruktion des Fragebogens Ganztag – Interne Evaluation für Schulen (GAINS)2 wurde die Skala zur Erfassung AG-spezifischer Qualitätsmerkmale (GAINSAG-Skala) entwickelt und überprüft. Um zu vermeiden, dass die Bewertungen der SuS vonseiten der Lehrkräfte bzw. der außerschulischen Anbieter an den teilnehmenden Schulen als Personenevaluationen missverstanden werden, erfolgt die Auswertung der GAINS-AG-Skala anhand der Angebotskategorien (1) Förderangebote, (2) Bewegungs-, Spiel- und Sportangebote (BeSS), (3) musischkünstlerische Angebote (MuKu), (4) mathematisch- informatisch-naturwissenschaftlich-technische Angebote (MINT) sowie (5) Fremdsprachenangebote. Bei der Rekrutierung der Stichproben in den verschiedenen Entwicklungsphasen wurde ein Fokus auf Gymnasien und Gesamtschulen gelegt, da nahezu 75 Prozent aller deutschen SuS diese Schulformen besuchen (Autorengruppe Bildungsberichterstattung, 2018). Der Schwerpunkt lag auf Kindern und Jugendlichen der Jahrgangsstufen 5 bis 7, da in dieser Altersklasse sowohl die höchste Teilnahmequote am Ganztagsangebot als auch die breiteste Palette an angebotenen AGs zu verzeichnen ist (StEG-Konsortium, 2016). Deskriptive und manifeste Analysen wurden mit SPSS 24 durchgeführt, konfirmatorische Analysen mit Mplus 8 (Muthén & Muthén, 2017). Die Überprüfung der faktoriellen Validität sowie die Optimierung der Skala wurde in Anlehnung an Brown (2006) sowie Kline (2011) realisiert. Die Testung der konvergenten Validität und der Test-Retest-Reliabilität erfolgte gemäß Moosbrugger und Kelava (2012).
PHASE I: Vorarbeiten Zur Operationalisierung der angenommenen sieben Qualitätsdimensionen wurde nach Sichtung von Fragebögen aus dem Bereich der empirischen Bildungsforschung ein Itempool auf Grundlage von Instrumenten aus der Studie
2 GAINS stellt ein onlinebasiertes Instrument dar, das vorrangig zum Zwecke der ressourcenschonenden und datengeleiteten internen Evaluation des schuleigenen Ganztagsprogramms aus der Perspektive der SuS entwickelt wurde. Damit soll das einzelschulische Qualitätsmanagement bzw. eine gelingende Schulentwicklung unterstützt werden (Nowak, 2019; Nowak, Ennigkeit & Heim, 2019). © 2019 Hogrefe
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21
12
zur Entwicklung von Ganztagsschulen (StEG; Furthmüller, 2014a, 2014b), der StEG – Sekundarstufe (StEG-S; Sauerwein, 2017), der Internationalen Grundschul-LeseUntersuchung (IGLU 2006; Bos et al., 2010), des Programme for International Student Assessment (PISA 2000; Kunter et al., 2002) sowie aus Materialien des Instituts für Qualitätsentwicklung Hessen (2010) generiert. Die insgesamt 38 Items (vgl. ESM-1) wurden teilweise adaptiert und um eigens formulierte Aussagen ergänzt, wobei zwischen vier und sechs Aussagen für die Abbildung eines Konstrukts verwendet wurden. Verankert wurden die Items mit einer vierfach abgestuften Likert-Skala (1 = stimmt gar nicht, 2 = stimmt eher nicht, 3 = stimmt eher, 4 = stimmt genau). Um die Qualität des Fragebogeninstruments zu verbessern und die inhaltliche Validierung des Instruments durch kommunikative Überprüfung vorzunehmen, wurden im Rahmen eines Zwei-Phasen-Pretests (Prüfer & Rexroth, 2005) sowohl kognitive Interviewtechniken eingesetzt als auch ein Standard-Pretest mit acht SuS der Jahrgangsstufen 5 bis 12 durchgeführt.
PHASE II: Studie 1 Methode Ziel dieser Studie war die Prüfung der faktoriellen Validität der Skala mittels konfirmatorischer Faktorenanalyse sowie eine ggf. daraus resultierende notwendige Optimierung der Skala. Die vorläufige Version der GAINS-AG-Skala mit 38 Items wurde von N = 276 SuS (52.5 % weiblich) der Jahrgangsstufen 5 bis 7 (Jahrgangsstufe 5: 45.6 %, 6: 27.4 %, 7: 25.9 %) eines Gymnasiums beantwortet. Bewertet wurde vorrangig die Qualität von BeSS- (42.0 %), gefolgt von MuKu- (17.0 %), MINT- (16.3 %), Förder- (15.6 %) sowie Fremdsprachenangeboten (9.1 %). Nachdem die SuS im Computerraum zu Thema und eingesetzten Antwortformaten instruiert wurden, erfolgte die Daten erhebung online im Klassenverband während einer dafür vorgesehenen Unterrichtsstunde am Vormittag. Die durchschnittliche Bearbeitungsdauer des Fragebogens betrug 22:28 Minuten (SD = 7:58 Minuten). Für die Prüfung der Faktorstruktur wurde auf den in Mplus implementierten robusten Weighted Least-Squares with Mean and Variance Adjustments-Schätzer zurückgegriffen, da aufgrund der vierstufig skalierten Antwortskala die Annahme multivariater Normalverteilung nicht haltbar ist (Finney & DiStefano, 2006) und bei nur vier Skalenstufen nicht von einer Intervallskalierung ausgegangen werden kann (Li, 2016). Das erste Item pro Faktor wurde auf Eins fixiert, die Fehlervarianzen der Items sowie die Varianzen der latenten Faktoren wurden frei geschätzt. Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21
D. Nowak et al., Qualitätsmerkmale von Ganztagsangeboten
Zur Beurteilung der Modellgüte wurden konventionelle Fit-Indizes herangezogen (Byrne, 2012): Beim Comparative Fit Index (CFI) und dem Tucker-Lewis Index (TLI) sprechen Werte > .90 für eine akzeptable und Werte > .95 für eine gute Modellanpassung. Für den Root Mean Square Error of Approximation (RMSEA) gelten Werte < .05 als gut und Werte < .08 als akzeptabel. Die Optimierung der Skala erfolgte im Falle einer schlechten Modellanpassung durch eine Inspektion der standardisierten Faktorladungen sowie der Interkorrelationen zwischen den latenten Faktoren. So ist davon auszugehen, dass Faktoren, die hohe Korrelationen aufweisen, keine distinkten Konstrukte abbilden (Brown, 2006; Kline, 2011). Für den Vergleich genesteter Modelle wurde der χ2-Differenztest herangezogen. Zusätzlich wurden die deskriptiven Fit-Indizes sowie im Besonderen die Veränderungen des CFI betrachtet (Chen, 2007; Cheung & Rensvold, 2002). Als Reliabilitätsmaß wurde für die finalen Faktoren McDonald's ω berechnet. Aus Gründen der besseren Vergleichbarkeit mit anderen Studien wird zusätzlich Cronbachs α angegeben.
Ergebnisse und Diskussion Insgesamt fehlten 11.8 % der Werte, die sich allerdings völlig zufällig auf die 38 Items verteilen (MCAR-Test nach Little: χ2(3203) = 3290.52, p = .137). Die konfirmatorische Faktorenanalyse ergab für das ursprünglich postulierte siebenfaktorielle Modell eine schlechte Anpassung (χ2(644) = 2504.56, p < .001, CFI = .862, TLI = .849, RMSEA = .102). Die Faktorladungen bewegten sich zwischen λ = –.360 und λ = .955, die Interskalenkorrelationen zwischen r = .570 und r = .989. Dabei bestanden in drei Fällen sehr hohe Zusammenhänge zwischen jeweils zwei latenten Konstrukten (Klima: Beziehung zur AG-Leitung und Klima: Partizipation: r = .98, Interesse: emotional und Interesse: wertbezogen: r = .99, Klima: Beziehung zwischen SuS und Klima: Zeitnutzung: r = .99). Die anschließende Optimierung des Modells erfolgte sukzessive, indem für die Faktorladungen zunächst ein Cut-off-Wert von λ = .400 (Brown, 2006) und später ein Wert von λ = .600 (Matsunaga, 2010) herangezogen wurde. In Anlehnung an Kline (2011) wurden bezüglich der Interkorrelationen Faktoren mit r > .900 jeweils zu einem Faktor zusammengefasst. Zudem wurde bei der Elimination von Items deren Augenscheinvalidität betrachtet. Insgesamt wurden zehn Items ausgeschlossen, darunter alle acht negativ gepolten. Aus diesem Vorgehen resultierte ein vierfaktorielles Modell mit 28 Items (vgl. Tabelle 1) und guten Fitwerten (χ2(344) = 876.85, p < .001, CFI = .955, TLI = .950, RMSEA = .075). Dabei wurden zum bereits bestehenden Faktor Lernförderlichkeit die beiden interessenbezogenen (emotional / wertbezogen) sowie jeweils zwei klimabezoge© 2019 Hogrefe
D. Nowak et al., Qualitätsmerkmale von Ganztagsangeboten
13
Tabelle 1. Finale Items und Faktoren der GAINS-AG-Skala Items der vier Subskalen
Nr.
Lernförderlichkeit Ich lerne in dieser AG Dinge, die mir im normalen Unterricht helfen.
1
Ich lerne in dieser AG Dinge, die meine Noten verbessern.
4
Ich lerne in dieser AG vieles, was ich im Unterricht vermisse.
6
Ich lerne in dieser AG Dinge, die mir im täglichen Leben helfen.
9
Ich lerne in dieser AG Dinge, die ich vorher noch nicht wusste.
11
In dieser AG lerne ich viel.
12
Interesse In dieser AG strenge ich mich an.
2
Diese AG macht mir Spaß.
3
Ich freue mich auf diese AG.
5
In dieser AG bringe ich mich ein.
7
Die Themen und Inhalte dieser AG interessieren mich meistens sehr.
8
In dieser AG bin ich konzentriert bei der Sache.
10
Pädagogische Unterstützung Mit meinem AG-Leiter komme ich gut aus.
13
Mein AG-Leiter geht auf unsere Vorschläge ein.
14
Mein AG-Leiter bietet mir die Möglichkeit, zu zeigen was ich kann.
15
Mein AG-Leiter weckt bei mir oft Begeisterung und Interesse für Neues.
16
Mein AG-Leiter lässt uns häufig über die Themen mitentscheiden.
17
Mein AG-Leiter nimmt mich ernst.
18
Mein AG-Leiter achtet darauf, dass möglichst alle Schüler aktiv mitarbeiten.
19
Mein AG-Leiter kümmert sich um mich.
20
Mein AG-Leiter fragt uns häufig nach unserer Meinung, wenn etwas entschieden oder geplant werden soll.
21
Mein AG-Leiter lobt mich.
22
Lerngemeinschaft In dieser AG wird fast immer konzentriert gearbeitet.
23
In dieser AG finde ich schnell jemanden, der mit mir zusammenarbeitet.
24
In dieser AG kommen wir immer sofort zur Sache.
25
In dieser AG fühle ich mich wohl.
26
In dieser AG helfen wir uns gegenseitig.
27
In dieser AG haben wir eine gute Gemeinschaft.
28
© 2019 Hogrefe
ne Subskalen (Beziehung zwischen SuS mit Zeitnutzung und Beziehung zur AG-Leitung mit Partizipation) zusammengefasst (vgl. Abbildung 1). Die finalen Faktoren der GAINS-AG-Skala lassen sich damit wie folgt bestimmen: yy Die Subskala Lernförderlichkeit (α = .84, ω = .84) erfasst das Ausmaß, in dem die SuS die Angebote im Hinblick auf deren Nutzen sowohl für ihren Alltag als auch das schulische Vorankommen einschätzen. Angebote, die einen hohen Wert in dieser Subskala aufweisen, zeichnen sich durch einen hohen durch die SuS wahrgenommenen Lernzuwachs aus. yy Die Subskala Interesse (α = .90, ω = .91) erfasst das Ausmaß, in dem die SuS mit dem Angebot positiv konnotierte Emotionen verbinden und die Angebotsinhalte als persönlich bedeutsam wahrnehmen. In einem Angebot, das sich durch eine hohe Ausprägung der Dimension Interesse auszeichnet, setzen sich die SuS aus eigenem Antrieb aktiv mit den Inhalten auseinander und arbeiten engagiert mit. yy Die Subskala Pädagogische Unterstützung (α = .94, ω = .94) erfasst das Ausmaß, in dem die Beziehung zwischen SuS und Angebotsleitung emotional positiv getönt ist und die Gestaltung des Angebots durch die SuS als autonomieunterstützend wahrgenommen wird. In einem Angebot mit hoch empfundener pädagogischer Unterstützung sind die SuS an der demokratischen Gestaltung des Angebots in hohem Maße beteiligt und erfahren eine hohe Wertschätzung durch die Angebotsleitung. yy Die Subskala Lerngemeinschaft (α = .89, ω = .89) erfasst, in welchem Ausmaß in einem Angebot eine gute und am Lernen orientierte Gemeinschaft existiert. In einem Angebot „mit ausgeprägter Lerngemeinschaft bestehen emotional positive Beziehungen zwischen den Schülern [und Schülerinnen] und zugleich eine an Lernen und Leistung orientierte Grundhaltung“ (Eder & Mayr, 2000, S. 14). Bei diesem vierfaktoriellen Modell zeigten sich wie im zuvor geprüften siebenfaktoriellen Modell nach wie vor hohe Skaleninterkorrelationen (.59 ≤ r ≤ .87), was den Vergleich mit einem hierarchischen Modell mit dem übergeordneten Faktor AG-Qualität sowie mit einem eindimensionalen Modell nahelegte. Für das eindimensionale Modell ergaben sich jedoch unzufriedenstellende Gütemaße (χ2(350) = 1507.82, p < .001, CFI = .901, TLI = .894, RMSEA = .109). Dagegen zeigte sich für das hierarchische Modell eine akzeptable bis gute Anpassungsgüte (χ2(346) = 865.21, p < .001, CFI = .956, TLI = .952, RMSEA = .074), wobei die Faktorladungen nahezu identisch mit denen des vierfaktoriellen Modells waren (.612 ≤ λ ≤ .939). Die latenten Faktoren luden auf dem Faktor zweiter Ordnung hoch (.73 ≤ r ≤ .95; vgl. ESM-2). Der χ2-Differenztest zeigte zwar eine signifikant Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21
14
D. Nowak et al., Qualitätsmerkmale von Ganztagsangeboten
einem eindimensionalen Modell, der auch mit theoretischen Überlegungen gut vereinbar ist. Im Gegensatz zu einem bei SuS-Befragungen häufig anzutreffenden Globalurteil (z. B. Clausen, 2002) können daher mithilfe der GAINS-AG-Subskalen sowohl in der Schulpraxis als auch in der Forschung präzisere Aussagen über die Qualität der Angebote getroffen werden. Das hierarchische Modell legt zudem nahe, dass ein übergeordneter Faktor zusätzliche Varianz aufklären könnte, was insbesondere für die Weiterentwicklung von Qualitätsmerkmalen ganztägiger Bildungssettings von Interesse ist. Einschränkend muss für Studie 1 sowohl die für eine konfirmatorische Analyse relativ geringe Stichprobengröße als auch das explorative Vorgehen im Rahmen der Skalenoptimierung benannt werden, das von Zufallsbefunden abhängig sein und eine Replikation erschweren kann (z. B. MacCallum, Roznowski & Necowitz, 1992). Dies macht es notwendig, die gebildeten Faktoren an einer unabhängigen sowie größeren Stichprobe zu be stätigen.
PHASE III: Studie 2 Methode
Abbildung 1. Faktorladungen (alle ps < .001) und Interskalenkorrelationen (alle ps < .001) der konfirmatorischen Faktorenanalyse für das optimierte vierfaktorielle Modell im Rahmen von Studie 1 (N = 276; Items siehe Tabelle 1).
schlechtere Passung des hierarchischen Modells auf die Daten als das vierfaktorielle Modell (Δχ2(2) = 6.78; p = .034), die deskriptiven Gütemaße unterschieden sich allerdings nur unwesentlich und fielen beim hierarchischen Modell sogar etwas besser aus. Die aus dieser Studie resultierenden vier Faktoren bilden somit einen guten Kompromiss zwischen der ursprünglich postulierten siebenfaktoriellen Struktur und
Zusätzlich zur Replikation der Faktorstruktur war es Ziel dieser Studie, erneut einen Modellvergleich zwischen dem nichthierarchischen vierfaktoriellen Faktormodell und dem hierarchischen Modell durchzuführen. An der Studie nahmen N = 781 SuS (Geschlecht: 52.0 % weiblich) aus fünf verschiedenen Schulen bzw. Schulformen (Gymnasien, integrierte Gesamtschulen) teil. Davon entfielen n = 652 auf die Unterstufe (Jahrgangsstufe 5: 35.7 %, 6: 27.2 %, 7: 21.1 %) sowie n = 124 auf die Mittelstufe (Jahrgangsstufe 8: 11.5 %, 9: 1.5 %, 10: 3.0 %). Etwa gleich häufig bewertet wurden MuKu- (28.2 %), BeSS(23.9 %) sowie Förderangebote (23.9 %). Während der Großteil der SuS den kompletten GAINS-Fragebogen analog zum Vorgehen in Studie 1 online beantwortete, beinhaltete die Stichprobe auch n = 268 Datensätze, die im Rahmen einer Paper-and-Pencil-Befragung bei einem isolierten Einsatz der GAINS-AG-Skala erhoben wurden (vgl. Studie 3).3 Das statistische Vorgehen erfolgte analog zu Studie 1.
3 Eine Überprüfung der Messinvarianz zwischen der online- und der papierbasierten Messung ergab zufriedenstellende Kennwerte für die drei Messmodelle (konfigurales Modell: χ²(688) = 2129.92, p < .001, CFI = .917, TLI = .909, RMSEA = .077; metrisches Modell: χ²(712) = 2124.71, p < .001, CFI = .919, TLI = .914, RMSEA = .075; skalares Modell: χ²(762) = 2254.20, p < .001, CFI = .914, TLI = .915, RMSEA = .074). Die Ergebnisse sprechen bei Betrachtung der χ²-Differenztests gegen die Annahme metrischer (Δχ²(688) = 2129.92, p < .001) und skalarer Invarianz (Δχ²(50) = 227.26, p < .001). Allerdings kann aufgrund der Veränderungen im CFI nach den Empfehlungen von Chen (2007) davon ausgegangen werden, dass sowohl metrische (ΔCFI = .002) als auch skalare Invarianz (ΔCFI = .005) vorliegt. Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21
© 2019 Hogrefe
D. Nowak et al., Qualitätsmerkmale von Ganztagsangeboten
Abbildung 2. Faktorladungen (alle ps < .001) und Interskalenkorrela tionen (alle ps < .001) der konfirmatorischen Faktorenanalyse für das finale vierfaktorielle Modell im Rahmen von Studie 2 (N = 781).
Ergebnisse und Diskussion Die Replikation der in Studie 1 entwickelten Faktorstruktur zeigte für das vierfaktorielle Modell Gütemaße, die die akzeptablen Cut-off-Werte knapp unter- bzw. überschreiten (χ2(344) = 2276.98, p < .001, CFI = .893, TLI = .883, RMSEA = .085; vgl. Abbildung 2). Gleiches ist für das hierarchische Modell festzustellen (χ2(346) = 2208.61, p < .001, CFI = .897, TLI = .888, RMSEA = .083). Dies überrascht aufgrund des zunächst explorativen Vorgehens durch datengeleitetes Optimieren der Skala in Studie 1 wenig. Sofern die konventionellen Cut-off-Kriterien zugrunde gelegt werden, sind die Fitindizes als unzureichend zu bewerten, wobei diese jedoch nur sehr knapp nicht erreicht wurden. Unter Berücksichtigung der Tatsache, dass es sich sowohl um die erste Replikationsstudie handelt als auch der im Vergleich zu Studie 1 deutlich heterogeneren Stichprobe soll© 2019 Hogrefe
15
ten die beiden Modelle daher nicht direkt verworfen werden. Dies gilt umso mehr, als die auf Simulationsstudien basierenden empfohlenen Cut-off-Werte von einigen Autoren als zu konservativ angesehen werden und dass weitere Parameter zur Beurteilung der Güte des Modells herangezogen werden sollten (Brown, 2006): Die zusätzliche Betrachtung der Faktorladungen, Interskalenkorrelationen sowie der internen Konsistenzen deutet grundsätzlich darauf hin, dass sich die Skala als vierfaktorielles Modell abbilden lässt, zumal in der vorliegenden Studie der Forderung von Bentler und Chou (1987) nach mindestens fünf Fällen pro geschätztem Parameter nachgekommen wurde. Im Hinblick auf den Vergleich des hierarchischen mit dem nichthierarchischen Modell ergab der χ2-Differenztest eine nicht signifikant schlechtere Passung des hierarchischen Modells auf die Daten als die des nichthierarchischen vierfaktoriellen Modells (χ2(2) = 3.98; p = .137). Auf deskriptiver Ebene unterschieden sich die Gütemaße dagegen nur unwesentlich. Die internen Konsistenzen für das vierfaktorielle Modell lagen im akzeptablen bis sehr guten Bereich (Lernförderlichkeit: α = .73, ω = .86; Interesse: α = .84, ω = .79; Lerngemeinschaft: α = .83, ω = .94; Pädagogische Unterstützung: α = .90, ω = .95). Die Zusammenschau der Ergebnisse von Studie 1 und 2 zeigt, dass weitere Studien zur Replikation der Faktorstruktur an anderen Stichproben notwendig sind. Denkbar ist beispielsweise, dass das Modell Gültigkeit nur für bestimmte AG-Kategorien oder Schulformen besitzt (siehe hierzu auch Nowak, 2019). Allerdings sprechen die bisherigen Ergebnisse dafür, dass grundsätzlich von einer vierfaktoriellen Struktur ausgegangen werden kann. Diese wird auch in der folgenden Validierungsstudie (Studie 3) unterstellt. Bezüglich der hierarchischen Modellierung zeigt sich bislang keine eindeutige Bevorzugung eines der beiden Modelle. Daher könnte je nach Einsatzzweck die GAINS-AG-Skala entweder als nichthierarchisch oder als hierarchisch modelliert werden. Während es sich für die Ganztagsschulforschung anbietet, einen zusätzlichen übergeordneten Faktor anzunehmen, sollte für die einzelschulische Evaluationspraxis aus pragmatischen Gründen auf die nichthierarchische Variante zurückgegriffen werden. Aufgrund des primären Einsatzzweckes von GAINS wird für die Überprüfung weiterer Gütekriterien im Folgenden letzteres Modell zugrunde gelegt.
PHASE IV: Studie 3 Methode Die Ziele dieser Studie bestanden in der Untersuchung der konvergenten Validität sowie der Test-Retest-Reliabilität des finalen vierfaktoriellen Modells. Der Überprüfung der Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21
16
konvergenten Validität lagen die an zwei Gymnasien erhobenen Daten der Paper-and-Pencil-Teilstichprobe aus Studie 2 zugrunde (N = 268; 50.4 % weiblich). Davon entfielen n = 178 SuS auf die Unterstufe (Jahrgangsstufe 5: 22.0 %, 6: 22.4 %, 7: 22.0 %) sowie n = 90 SuS auf die Mittelstufe (Jahrgangsstufe 8: 20.5 %, 9: 4.5 %, 10: 8.6 %). Die meisten SuS bewerteten MuKu-Angebote (47.4 %), gefolgt von BeSS- (23.5 %), MINT- (18.7 %), Förder- (5.2 %) und Fremdsprachenangeboten (5.2 %). Für die Berechnung der Test-Retest-Reliabilität konnten die Angaben von n = 211 SuS (53.6 % weiblich) herangezogen werden, von denen Angaben zu beiden Messzeitpunkten vorlagen. Sowohl die Verteilung auf die Jahrgangsstufen als auch auf die Angebotskategorien blieb dabei vergleichbar mit denen des ersten Messzeitpunkts. Für die Untersuchung der konvergenten Validität wurden thematisch verwandte Inventare aus der empirischen Bildungsforschung gesichtet, im Hinblick auf eine möglichst hohe Konformität zu den Faktoren der GAINS-AGSkala ausgewählt und sprachlich auf den Angebots kontext adaptiert. Zur Validierung der Subskala Lernförderlichkeit wurden die situativen Prozessmerkmale aus dem Fragebogen zur Messung gemäßigt konstruktivistischer Prozessmerkmale (α = .85; Urhahne, Marsch, Wilde & Krüger, 2011) mit fünf Items eingesetzt (Bsp.Item: „In dieser AG lerne ich etwas, was mir im Leben weiterhilft“). Die Gültigkeit der Subskala Interesse wurde mit der ebenfalls fünf Items umfassenden Dimension „Interesse Mathematik“ aus der PISA-Studie 2003 (α = .86; Ramm et al., 2006) geprüft (Bsp.-Item: „Wenn ich mich mit den Inhalten dieser AG beschäftige, vergesse ich manchmal alles um mich herum“). Zur Validierung der GAINS-AG-Subskala Pädagogische Unterstützung wurden mit den Subskalen „Positives Verhältnis zu der Fachlehrkraft (Deutsch)“ aus dem Fragebogen zu Kompetenzen und Einstellungen von Schülerinnen und Schülern der Jahrgangsstufe 7 (KESS 7) mit fünf (α = .89; Bos, Bonsen, Gröhlich, Guill & Scharenberg, 2009) sowie „Schülerorientierung (Deutsch)“ aus der Studie „Deutsch Englisch Schülerleistungen International“ (DESI) mit sechs Items (α = .87; Wagner, Helmke & Rösner, 2009) zwei Instrumente herangezogen. Dieses Vorgehen resultierte daraus, dass die in der GAINS-AG-Subskala adressierten Aspekte der Partizipation sowie der Beziehung zwischen SuS und erwachsener Bezugsperson in keinem der gesichteten Instrumente gleichermaßen abgebildet werden. Exemplarische Formulierungen lauten „Ich habe großes Vertrauen zu meinem AG-Leiter“ (KESS 7) und „Mein AG-Leiter lässt uns Themen oder Aufgaben auswählen“ (DESI). Die Subskala Lerngemeinschaft wurde mit den zehn Items der Dimension „Ausmaß der Cliquenbildung“ aus den Landauer Skalen zum Sozialklima (LASSO 4 – 13; α = .85; von Saldern & Littig, 1987) validiert (Bsp.-Item: „Die Schüler Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21
D. Nowak et al., Qualitätsmerkmale von Ganztagsangeboten
arbeiten gleich gut mit allen Mitschülern zusammen“). Um das Antwortformat zu vereinheitlichen, wurde für alle eingesetzten Skalen auf das den Items der GAINS-AGSkala zugrundeliegende vierstufige Antwortformat zurückgegriffen. Damit wird die Übertragbarkeit der Gütekriterien der Originalversionen zwar eingeschränkt; allerdings erfordert das Alter der Zielgruppe eine möglichst einfach zu verstehende Präsentation der Fragebogeninhalte. Zudem berichten z. B. Aiken (1983) sowie Colman, Norris und Preston (1997) lediglich von sehr geringen Abweichungen bezüglich der Gütekriterien durch die Veränderung des Antwortformats. Im Rahmen dieser Studie erfolgte die Datenerhebung aus organisatorischen Gründen nicht online. Stattdessen bearbeiteten die SuS sowohl GAINS-AG-Skala als auch Validierungsskalen papierbasiert im Rahmen ihrer AG. Zur Ermittlung der Test-Retest-Reliabilität bearbeiteten dieselben SuS den Fragebogen im Abstand von 14 Tagen erneut. Es wurde darauf geachtet, dass weder Ferien noch Feiertage oder schulische Veranstaltungen zwischen beiden Messzeitpunkten lagen, die Einfluss auf die Datenqualität hätten nehmen können. Für die Beurteilung der konvergenten Validität sowie der Test-Retest-Reliabilität wurde der Korrelationskoeffizient nach Pearson zugrunde gelegt. Zur Bestimmung der Test-Retest-Reliabilität wird dessen alleinige Verwendung in der Literatur jedoch stellenweise kritisiert, da hohe Korrelationen auch infolge konstanter Abweichungen zu beiden Messzeitpunkten zustande kommen können (Weir, 2005). Aus diesem Grund wurde zusätzlich der Intra-Class-Korrelationskoeffizient (ICC; Modell: zweifach gemischt; Typ: absolute Übereinstimmung; einzelne Maße; Koo & Li, 2016) berechnet. Die Interpretation erfolgte dabei nach den Richtlinien von Cicchetti (1994).
Ergebnisse und Diskussion Im Hinblick auf die konvergente Validität zeigten sich zwischen den GAINS-AG-Subskalen Lernförderlichkeit, Interesse und Pädagogische Unterstützung und den jeweiligen Validierungsskalen Korrelationen in erwarteter Höhe (.60 ≤ r ≤ .72; vgl. Tabelle 2). Dabei fiel der Zusammenhang mit den jeweils übrigen Validierungsskalen theoriekonform deutlich geringer aus: Dies bestätigt auch ein inferenzstatistischer Vergleich der Korrelationskoeffizienten (alle ps ≤ .001). Für die Subskala Lerngemeinschaft konnte dieses Muster nicht bestätigt werden, da vergleichbar hohe Korrelationen (.35 ≤ r ≤ .41) mit allen eingesetzten Validierungsskalen vorlagen, die sich auch nicht signifikant voneinander unterscheiden (alle ps ≥ .497). © 2019 Hogrefe
D. Nowak et al., Qualitätsmerkmale von Ganztagsangeboten
17
Tabelle 2. Interkorrelationen der GAINS-AG-Subskalen mit den Validierungsskalen (Gesamtstichprobe, N = 276) 1 1 GAINS LF
2
3
4
5
6
7
8
9
.30** .40** .39** .60** .26** .38** .33** .10
2 GAINS Int
.39** .38** .26** .68** .28** .26** .21*
3 GAINS PU
.41** .31** .37** .72** .69** .26**
4 GAINS LG
.36** .41** .35** .40** .40** .35** .38** .31** .22**
5 LF
a
.45** .30** .27**
6 Intb 7 PU-1
c
8 PU-2
d
.81** .20* .27**
9 LGe Anmerkung: LF = Lernförderlichkeit, Int = Interesse, PU = Pädagogische Unterstützung, LG = Lerngemeinschaft. Die Korrelationen zwischen der GAINSSubskala und der jeweils zugehörigen Validierungsskala (bzw. den beiden Validierungsskalen bei der Pädagogischen Unterstützung) sind fett hervorgehoben. a Validierungsskala für Lernförderlichkeit nach Urhahne et al. (2011) b Validierungsskala für Interesse nach Ramm et al. (2006) c Validierungsskala für Pädagogische Unterstützung nach Wagner et al. (2009) d Validierungsskala für Pädagogische Unterstützung nach Bos et al. (2009) e Validierungsskala für Lerngemeinschaft nach von Saldern und Littig (1987) * p ≤ .01, ** p ≤ .001
Insgesamt sprechen die Ergebnisse der Validierung dafür, dass die drei erstgenannten Subskalen zur Messung der Qualität einzelschulischer AGs tatsächlich die intendierten Konstrukte abbilden. Obwohl die vier Faktoren der GAINS-AG-Skala hohe Interkorrelationen aufwiesen, zeigten sich umso positiver zu bewertende differenzierte Validierungseffekte. Die unerwartet niedrig ausfallende Korrelation zwischen der Subskala Lerngemeinschaft und der entsprechenden Validierungsskala kann einerseits methodisch, andererseits aber auch theo retisch begründet werden: Verständnisschwierigkeiten aufseiten der SuS waren fast ausschließlich auf Items der Validierungsskala zurückzuführen. Zudem enthält diese Skala als einzige n egativ gepolte Items, wodurch ein inkonsistentes Antwortverhalten besonders bei Jüngeren begünstigt wird (Leeuw, Borgers & Smits, 2004). In theo retischer Hinsicht kann unterstellt werden, dass die Subskala Lerngemeinschaft eine Sonderstellung einnimmt: Wird das soziale Miteinander der SuS als zentrale Determinante „für Leistungen, Befinden, Verhalten und Persönlichkeitsentwicklung der Schüler in der Schule“ (Eder, 2010, S. 697) betrachtet, kann dieses als Voraussetzung für weitere Qualitätsmerkmale verstanden werden. Vergleichbar hohe Zusammenhänge mit allen anderen betrachteten Konstrukten wären somit erklärbar. Sollten sich auch beim Einsatz einer besser geeigneten Validierungsskala zukünftig nicht die erwarteten Korrelationsmuster zeigen, müssten die Items der GAINS-AGSkala revidiert werden. Einschränkend muss an dieser Stelle festgehalten werden, dass die Validierungsskalen © 2019 Hogrefe
aufgrund fehlender Instrumente mit Ganztagsbezug vom Unterrichts- auf den Angebotskontext adaptiert wurden. Die Übertragbarkeit der für die Originalskalen berichteten Gütekriterien auf die eigene Untersuchung bleibt daher ungeklärt, wenngleich die für die eigene Untersuchung berechneten internen Konsistenzen mit den in der Literatur angegebenen Koeffizienten vergleichbar sind. Die Test-Retest-Reliabilität lag für alle GAINS-AG-Subskalen in einem vergleichbaren Bereich. Dies galt sowohl für die Pearson-Korrelationskoeffizienten (Lernförderlichkeit: rtt = .65, Interesse: rtt = .66, Pädagogische Unterstützung: rtt = .64, Lerngemeinschaft: rtt = .65) als auch für den ICC (Lernförderlichkeit: ICC = .65, Interesse: ICC = .65, Pädagogische Unterstützung: ICC = .62, Lerngemeinschaft: ICC = .61). Zur Einordnung dieser Kennwerte ist zunächst festzuhalten, dass die Beurteilung der Test-Retest-Reliabilität stark von inhaltlichen Überlegungen hinsichtlich der Stabilität des Konstrukts abhängt. Im Gegensatz zu stabilen Dispositionen wie Intelligenz sind für die gemessenen Qualitätsmerkmale daher per se geringere Überein stimmungen zu erwarten. Zudem fällt die Test-RetestReliabilität umso höher aus, je mehr Antwortoptionen zur Verfügung stehen (Weng, 2016), weshalb bei dem eingesetzten vierstufigen Antwortformat in der GAINSAG-Skala sehr hohe Koeffizienten nicht erwartbar sind. Weiterhin ist bekannt, dass SuS der untersuchten Altersklassen ihre Urteile stark auf kürzlich zurückliegende Ereignisse beziehen, sodass das Antwortverhalten häufig durch die letzte Erfahrung mit dem Angebot geprägt gewesen sein könnte (Lam & Bengo, 2003). Generell muss betont werden, dass für Fragebögen in pädagogischen Settings nur selten Angaben zur Stabilität der gemessenen Merkmale über die Zeit vorliegen; bei den eingesetzten Validierungsskalen gilt dies nur für LASSO 4 – 13 (z. B. von Saldern & Littig, 1987). Dies schränkt die Vergleichbarkeit der Test-Retest-Kennwerte stark ein. Gleichwohl ist festzuhalten, dass in den wenigen berichteten Fällen ähnliche Werte erzielt werden (z. B. .60 ≤ rtt ≤ .74 mit ebenfalls 14-tägigem Zeitabstand in den Skalen zur Erfassung der Lern- und Leistungsmotivation; Spinath, Stiensmeier-Pelster, Schöne & Dickhäuser, 2012).
Übergreifende Diskussion Ziel des vorliegenden Beitrags war es, eine Skala zu Qualitätsmerkmalen außerunterrichtlicher Bildungssettings zu konzipieren, mit der die Qualität unterrichtsnaher und freizeitorientierter Angebote durch die SuS beurteilt werden kann. Unter Berücksichtigung des bisherigen Forschungsstands sollten dabei sowohl bereits etablierte DiZeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21
18
mensionen aufgegriffen als auch zusätzliche Faktoren in die Debatte eingebracht werden. Für die im Rahmen der Entwicklung eines internen Evaluationsinstruments für Ganztagsschulen erstellte GAINS-AG-Skala wurden Faktorstruktur, konvergente Validität sowie Test-Retest-Reliabilität geprüft. Im Verlauf der ersten Studie wurde der ursprüngliche Itempool skuzessive von 38 auf final 28 Items reduziert, da die Annahme einer siebenfaktoriellen Struktur nicht haltbar war. Auffällig hierbei war die negative Polung so gut wie aller ausgeschlossenen Items. Die Modellierung eines Methodenfaktors in den konfirmatorischen Analysen zur Verbesserung der Güte der Skala wäre zwar zunächst naheliegend gewesen, allerdings schien der Verbleib ausschließlich positiver Items in der Skala im Hinblick auf die Zielgruppe passender zu sein: Jüngere Kinder weisen kein einheitliches Antwortverhalten bei Items unterschiedlicher Polung auf (z. B. Leeuw, 2011). In Bezug auf die Faktorstruktur zeigte sich, dass ein vierfaktorielles Modell mit den Subskalen Lernförderlichkeit, Interesse, pädagogische Unterstützung sowie Lerngemeinschaft die Daten deutlich besser abbildet als das ursprünglich angenommene Modell mit sieben theoretisch begründeten Qualitätsdimensionen. Als Erklärung kann angeführt werden, dass die Wahrnehmungen von SuS selten strukturell ausdifferenziert sind. Dieser aus der Unterrichtsforschung bekannte Befund (z. B. Clausen, 2002) kann wohl auch auf Ganztagsangebote übertragen werden (Radisch et al., 2008). Damit könnten die teilweise hohen Interskalenkorrelationen in den Studien 1 und 2 erklärt werden. Die Überprüfung eines eindimensionalen Modells der Angebotsqualität führte allerdings zu unzufriedenstellenden Gütemaßen. Sowohl in Studie 1 als auch in Studie 2 konnte der niedrigste Zusammenhang zwischen den Subskalen Lernförderlichkeit und Pädagogische Unterstützung ausgemacht werden. Dagegen waren die höchsten Zusammenhänge zwischen den Subskalen Interesse und Lerngemeinschaft bzw. Pädagogische Unterstützung und Lerngemeinschaft zu verzeichnen. Der Vergleich des aus den insgesamt hohen Korrelationen resultierenden hierarchischen Modells mit dem nichthierarchischen Modell führte jedoch zu ähnlichen Anpassungsmaßen. Dies spricht dafür, dass die Bildung eines übergeordneten Faktors AG-Qualität grundsätzlich zulässig ist, wenngleich dies für den Einsatz an der Einzelschule aufgrund der notwendigen Bildung von Faktorscores wenig zielführend erscheint. Hinsichtlich der konvergenten Validität deuten die erwartet hohen Zusammenhänge der Subskalen Lernförderlichkeit, Interesse und Pädagogische Unterstützung mit den jeweiligen Validierungsskalen darauf hin, dass die Bildung von Mittelwerten auf Ebene der Subskalen spezifischere Informationen liefert als ein eindimensionales Modell. Obwohl somit geneZeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21
D. Nowak et al., Qualitätsmerkmale von Ganztagsangeboten
rell von einer hohen Konstruktvalidität der GAINS-AGSkala ausgegangen werden kann, steht eine endgültige Bestätigung der konvergenten Validität der Subskala Lerngemeinschaft noch aus. Hingegen erwiesen sich alle vier Dimensionen in gleichem Maße als mittelstark stabil über die Zeit. Die aus den hier vorgestellten Studien resultierenden vier Qualitätsmerkmale von Ganztagsangeboten sind in theoretischer Hinsicht mit den Überlegungen gut vereinbar, die zu den ursprünglich postulierten sieben Faktoren geführt haben. yy Die Lernförderlichkeit erwies sich über alle Studien hinweg als eigenständige Dimension. Dies könnte darin begründet liegen, dass sie als einzige Subskala eher die Ergebnis- und weniger die Prozessqualität adressiert. Die Dimension scheint nicht nur für unterrichtsnahe Angebote (z. B. Radisch et al., 2008; Sauerwein, 2017), sondern auch für freizeitbezogene Angebotstypen relevant zu sein. yy Um gegenüber außerschulischen Angeboten zu bestehen (Burow & Pauli, 2013), müssen Ganztagsangebote so attraktiv wie möglich gestaltet sein. Die Subskala Interesse erweitert damit das Qualitätsverständnis von Ganztagsangeboten um ein wesentliches Merkmal, das eine zentrale Determinante der Lernmotivation darstellt (Krapp, 1999). Die Unterscheidung in eine emotionale und eine wertbezogene Komponente erwies sich allerdings – wie in anderen Studien auch – als nicht haltbar (z. B. Kölbach, 2011). Ein übergeordneter Interessensfaktor scheint zur Erklärung der Antwortvarianz ausreichend. yy Bezüglich der ursprünglich formulierten Klimadimensionen wurden aufgrund der hohen Interkorrelationen die Subskalen Beziehung zur AG-Leitung und Partizipation zum Faktor pädagogische Unterstützung sowie die Subskalen Beziehung zwischen SuS und Zeitnutzung zum Faktor Lerngemeinschaft zusammengefasst. Die Beziehung zur Angebotsleitung und partizipatorische Aspekte als Bestandteile der pädagogischen Unterstützung haben sich bereits als Qualitätsmerkmale etabliert (z. B. Sauerwein, 2017). Dem in der Subskala Lerngemeinschaft enthaltenen Aspekt der Beziehung zwischen SuS wurde allerdings bislang kaum Beachtung geschenkt. Dies erstaunt umso mehr, als sich ein Gefühl sozialer Eingebundenheit sowohl positiv auf die Motivation (Reindl, Berner, Scheunpflug, Zeinz & Dresel, 2015) als auch auf die Selbstwirksamkeit (Nelson & DeBacker, 2008) auswirkt. Mit dem hier vorgeschlagenen Modell wird die Debatte um Qualitätsmerkmale ganztagsschulischer Angebote um wesentliche Aspekte erweitert. Insbesondere können damit mehr Angebotskategorien als bisher vergleichend © 2019 Hogrefe
D. Nowak et al., Qualitätsmerkmale von Ganztagsangeboten
bewertet werden, darunter die am stärksten verbreiteten und nachgefragten Angebote aus dem Bereich Bewegung, Spiel und Sport sowie Musik (StEG-Konsortium, 2016). Es bleibt aber dennoch festzuhalten, dass die Forschung zur Qualität von Ganztagsangeboten noch relativ am Anfang steht und daher bislang auch keine Einigkeit über Anzahl und Benennung von Qualitätskriterien besteht. Unter Berücksichtigung der nämlichen Debatte in der Unterrichtsforschung (Eder, 2010) ist allerdings auch nicht davon auszugehen, dass in diesem Feld in absehbarer Zukunft ein Konsens gebildet wird. Vor dem Hintergrund einer noch größeren Heterogenität bei der Ausgestaltung ganztägiger Angebote ist zudem fraglich, inwieweit ein für alle Angebotstypen gültiges One size fits all-Modell tatsächlich der Beurteilung von Qualität zugrunde gelegt werden sollte (Fischer, Radisch, Theis & Züchner, 2012). Alternativ wäre es denkbar, entweder (1) je nach untersuchtem Angebotstyp (z. B. Förderangebote vs. Bewegungs-, Spiel- und Sportangebote) eigene Qualitätsmerkmale heranzuziehen oder (2) einen „Kern“ qualitativer Merkmale für alle Arten von Angeboten zu verwenden, der je nach beurteilter Angebotskategorie um spezifische Faktoren erweitert wird – dieses Vorgehen würde zumindest in Bezug auf diese Kerndimensionen Qualitätsvergleiche zwischen verschiedenen Angeboten bzw. zwischen Angeboten und Unterricht erlauben. Bisherige Befunde deuten allerdings darauf hin, dass sich Qualitätsmerkmale eher nicht als invariant zwischen verschiedenen Angebotskategorien erweisen (Nowak, 2019; Sauerwein, 2017). Unter Berücksichtigung des eingangs erwähnten InputProzess-Output-Modells sollten darüber hinaus die zugrundeliegenden Wirkmechanismen berücksichtigt werden, welche die intendierten Effekte der Ganztagsteilnahme begründen. So besteht nach wie vor Unklarheit darüber, inwieweit einzelne Qualitätsmerkmale verschiedene Arten von Output begünstigen. Im Hinblick auf die in diesem Beitrag vorgestellten Dimensionen ist z. B. denkbar, dass eine hohe Ausprägung der Lerngemeinschaft eher soziale Kompetenzen fördert, wohingegen eine hohe Ausprägung des Interesses eher langfristige motivationale Wirkungen im Sinne von Berufserfolg erwarten lässt. Zudem stellt sich die Operationalisierung der angenommenen sozialen, motivationalen oder affektiven Outputvariablen der Ganztagsschulteilnahme deutlich schwieriger dar als die der lern- bzw. unterrichtsbezogenen Effekte in der Unterrichtsforschung (v. a. Schulleistung). Darüber hinaus erscheint perspektivisch die Berücksichtigung weiterer Moderatorvariablen zielführend (z. B. pädagogische Ausbildung der Angebotsleitung, didaktisch-methodische Ausgestaltung, Zusammensetzung der Schülerschaft). Zusammenfassend liegt der maßgebliche Erkenntnisgewinn des vorliegenden Beitrags besonders in der Auswei© 2019 Hogrefe
19
tung des Verständnisses von Qualität in Ganztagsangeboten. Gute Angebote zeichnen sich demnach durch ein hohes Maß an Lernförderlichkeit, eine das Interesse der SuS adressierende inhaltliche Ausgestaltung, eine hohe Wertschätzung durch die Angebotsleitung (pädagogische Unterstützung) sowie emotional positive Beziehungen zwischen den SuS im Sinne einer Lerngemeinschaft aus. Auch die Überprüfung der konvergenten Validität der entwickelten Subskalen ist positiv hervorzuheben, da diese für vergleichbare Instrumente nur selten vorgenommen wird. Einschränkend müssen Art und Umfang der untersuchten Stichproben erwähnt werden. So wurden ausschließlich Daten von SuS des gesamtschulischen bzw. gymnasialen Bildungsgangs zweier Schulamtsbezirke innerhalb eines Ballungsraums herangezogen, vorrangig der Jahrgangsstufen 5 bis 7. Es bleibt somit unklar, inwiefern die berichteten Ergebnisse Gültigkeit für SuS anderer Altersklassen, Schulformen und Schulamtsbezirke besitzen. Daher sollten zukünftig zusätzliche Überprüfungen der Güte des Fragebogens an weiteren, repräsentativen Stichproben folgen. Zudem muss darauf hingewiesen werden, dass die Gütemaße bei der Replikation der Faktorstruktur an einer unabhängigen Stichprobe (Studie 2) nicht an jene aus Studie 1 heranreichen. Dies überrascht jedoch unter Berücksichtigung der datengeleiteten Vorgehensweise bei der Modellentwicklung nicht. So ist grundsätzlich nicht auszuschließen, dass sich trotz der sowohl inhaltlich plausiblen sowie theoretisch fundierten Faktorstruktur die Items der GAINS-AG-Skala durch ein alternatives Faktormodell noch besser abbilden ließen. Bei der Ermittlung von Merkmalen zur Einschätzung der Qualität von Ganztagsangeboten liegt der Fokus bisher vorrangig auf der Perspektive der SuS. Wenngleich die Sicht dieser Hauptakteure für die Ganztagsschulforschung im Mittelpunkt steht (Radisch et al., 2008), sollte die Güte ganztägiger Angebote auch aus anderen Erhebungsperspektiven (z. B. Angebotsleitung, außenstehende Beobachter) in den Blick genommen werden. So zeigt sich, dass je nach untersuchtem Kriterium die Urteile verschiedener Personengruppen prognostisch unterschiedlich aussagekräftig sind (Clausen, 2002). Mit dem vorliegenden Beitrag wurde die Forderung von Sauerwein (2016) nach einer Validierung und Ergänzung des von ihm vorgeschlagenen Qualitätsmodells aus einem anderen Blickwinkel aufgegriffen. Zudem wurden unterrichtsnahe sowie freizeitorientierte Angebote gleichwertig behandelt. Vor dem Hintergrund der Komplexität und Heterogenität ganztägiger Angebote als auch der vielfältigen Wirkungen, die der Ganztagsteilnahme zugeschrieben werden, erscheint es allerdings wahrscheinlich, dass weitere Dimensionen zur Erfassung der Angebotsqualität von Relevanz sind. Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21
20
Elektronische Supplemente (ESM) Die elektronischen Supplemente sind mit der Online- Version dieses Artikels verfügbar unter https://doi. org/010.1024/1010-0652/a000245 ESM 1. Ursprünglicher Itempool der GAINS-AG-Skala (PDF) ESM 2. Faktorladungen und Interskalenkorrelationen der CFA für das hierarchische Modell zweiter Ordnung mit vier Faktoren erster Ordnung (PDF)
Literatur Aiken, L. R. (1983). Number of response categories and statistics on a teacher rating scale. Educational and Psychological Measurement, 43, 397 – 401. Autorengruppe Bildungsberichterstattung (2018). Bildung in Deutschland 2018. Verfügbar unter: https://www.bildungsbericht. de/de/bildungsberichte-seit-2006/bildungsbericht-2018/pdfbildungsbericht-2018/bildungsbericht-2018.pdf Bentler, P. M. & Chou, C.-P. (1987). Practical issues in structural equation modeling. Sociological Methods and Research, 16, 78 – 117. Bos, W., Bonsen, M., Gröhlich, C., Guill, K. & Scharenberg, K. (2009). KESS 7 – Skalenhandbuch zur Dokumentation der Erhebungsinstrumente. Münster: Waxmann. Bos, W., Strietholt, R., Goy, M., Stubbe, T. C., Tarelli, I. & Hornberg, S. (2010). IGLU 2006. Dokumentation der Erhebungsinstrumente. Münster: Waxmann. Brown, T. A. (2006). Confirmatory factor analysis for applied research. New York: Gilford Press. Burow, O.-A. & Pauli, B. (2013). Ganztagschule entwickeln. Von der Unterrichtsanstalt zum kreativen Feld. Schwalbach: Debus Pädagogik. Byrne, B. M. (2012). Structural equation modeling with Mplus. New York: Routledge. Chen, F. F. (2007). Sensitivity of goodness of fit indexes to lack of measurement invariance. Structural Equation Modeling, 14 (3), 464 – 504. doi:10.1080/10705510701301834 Cheung, G. W. & Rensvold, R. B. (2002). Evaluating goodness-of-fit indexes for testing measurement invariance. Structural Equation Modeling: A Multidisciplinary Journal, 9 (2), 233 – 255. https:// doi.org/10.1207/S15328007SEM0902_5 Cicchetti, D. V. (1994). Guidelines, criteria, and rules of thumb for evaluating normed and standardized assessment instruments in psychology. Psychological Assessment, 6 (4), 284 – 290. https:// doi.org/10.1037/1040-3590.6.4.284 Clausen, M. (2002). Unterrichtsqualität: Eine Frage der Perspektive? Münster: Waxmann. Colman, A. M., Norris, C. E. & Preston, C. C. (1997). Comparing rating scales of different lengths. Psychological Reports, 80 (2), 355 – 362. https://doi.org/10.2466/pr0.1997.80.2.355 Deci, E. L. & Ryan, R. M. (2000). The „what” and „why” of goal pursuits. Human needs and the self-determination of behavior. Psychological Inquiry, 11 (4), 227 – 268. https://doi.org/10.1207/ S15327965PLI1104_01 Eccles, J. S. & Gootman, J. A. (Eds.). (2002). Community programs to promote youth development. Washington: National Academy Press. Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21
D. Nowak et al., Qualitätsmerkmale von Ganztagsangeboten
Eder, F. (2010). Schul- und Klassenklima. In H. D. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (S. 694 – 703). Weinheim: Beltz. Eder, F. & Mayr, J. (2000). Linzer Fragebogen zum Schul- und Klassenklima für die 4.-8. Klassenstufe (LFSK 4 – 8). Göttingen: Hogrefe. Finney, S. J. & DiStefano, C. (2006). Non-normal and categorical data in structural equation modeling. In G. R. Hancock & R. O. Mueller (Eds.), Structural Equation Modeling: A Second Course (pp. 269 – 314). Greenwich: Information Age Publishing. Fischer, N., Kuhn, H. P. & Tillack, C. (Hrsg.). (2016). Was sind gute Schulen? Teil 4: Theorie, Praxis und Forschung zur Qualität von Ganztagsschulen. Immenhausen: Prolog. Fischer, N., Radisch, F., Theis, D. & Züchner, I. (2012). Qualität von Ganztagsschulen – Bedingungen, Wirkungen und Empfehlungen. Expertise für die SPD Bundestagsfraktion. Verfügbar unter: http://www.pedocs.de/volltexte/2012/6794/pdf/Fischer_ etal_2012_Qualitaet_von_GTS.pdf Furthmüller, P. (2014a). Codebuch Schüler / innen der Sekundarstufe I. Dokumentation der Fragebögen 2005 bis 2009. StEG. Verfügbar unter: https://www.iqb.hu-berlin.de/fdz/studies/ StEG/StEG_CB_s.pdf Furthmüller, P. (2014b). Skalenverzeichnis. Skalen und Indizes der Scientific-Use-Files 2005 bis 2009. Verfügbar unter: https:// www.iqb.hu-berlin.de/fdz/studies/StEG/StEG_SV.pdf Institut für Qualitätsentwicklung Hessen (2010). Fragebogen zum Klassenklima. Verfügbar unter: https://lehrkraefteakademie. hessen.de/sites/lehrkraefteakademie.hessen.de/files/ 047%20Fragebogen_Klima_Sch%C3%BClerIn_Sek_I.pdf Klieme, E. & Rakoczy, K. (2008). Empirische Unterrichtsforschung und Fachdidaktik. Outcome-orientierte Messung und Prozessqualität des Unterrichts. Zeitschrift für Pädagogik, 54 (2), 222 – 237. Kline, R. B. (2011). Principles and practice of structural equation modeling. New York: Gilford Press. Kölbach, E. (2011). Kontexteinflüsse beim Lernen mit Lösungsbeispielen. Berlin: Logos. Koo, T. K. & Li, M. Y. (2016). A guideline of selecting and reporting intraclass correlation coefficients for reliability research. Journal of Chiropractic Medicine, 15 (2), 155 – 163. https://doi. org/10.1016/j.jcm.2016.02.012 Krapp, A. (1999). Intrinsische Lernmotivation und Interesse. Forschungsansätze und konzeptuelle Überlegungen. Zeitschrift für Pädagogik, 45, 387 – 406. Krapp, A. (2010). Interesse. In H. D. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (S. 311 – 323). Weinheim: Beltz. Kunter, M., Schümer, G., Artelt, C., Baumert, J., Klieme, E., Neubrand, M. et al. (2002). PISA 2000: Dokumentation der Erhebungsinstrumente. Berlin: Max-Planck-Institut für Bildungs forschung. Kunter, M. & Trautwein, U. (2013). Psychologie des Unterrichts. Paderborn: Schöningh. Lam, T. C. M. & Bengo, P. (2003). A comparison of three retrospective self-reporting methods of measuring change in instructional practice. American Journal of Evaluation, 24 (1), 65 – 80. https:// doi.org/10.1177/109821400302400106 Leeuw, E. D. d. (2011). Improving data quality when surveying children and adolescents: Cognitive and social development and its role in questionnaire construction and pretesting. Verfügbar unter: http://www.aka.fi/globalassets/awanhat/documents/tiedostot/ lapset/presentations-of-the-annual-seminar-10-12-may-2011/ surveying-children-and-adolescents_de-leeuw.pdf Leeuw, E. D. d., Borgers, N. & Smits, A. (2004). Pretesting questionnaires for children and adolescents. In S. Presser, J. M. Rothgeb, M. P. Couper, J. T. Lessler, E. Martin, J. Martin & E. Singer (Eds.), Methods for testing and evaluating survey questionnaires (pp. 409 – 429). New York: Wiley. © 2019 Hogrefe
D. Nowak et al., Qualitätsmerkmale von Ganztagsangeboten
Li, C.-H. (2016). Confirmatory factor analysis with ordinal data. Comparing robust maximum likelihood and diagonally weighted least squares. Behavior Research Methods, 48 (3), 936 – 949. doi: 10.3758/s13428-015-0619-7 Lipowsky, F. (2009). Unterricht. In E. Wild & J. Möller (Hrsg.), Pädagogische Psychologie (S. 73 – 101). Heidelberg: Springer. MacCallum, R. C., Roznowski, M. & Necowitz, L. B. (1992). Model modifications in covariance structure analysis. The problem of capitalization on chance. Psychological Bulletin, 111 (3), 490 – 504. https://doi.org/10.1037/0033-2909.111.3.490 Mahoney, J. L., Larson, R. W. & Eccles, J. S. (2005). Organized activities as contexts of development. Extracurricular activities, after-school and community programs. Mahwah: Lawrence Erlbaum. Matsunaga, M. (2010). How to factor-analyze your data right. Do's, don'ts, and how-to's. International Journal of Psychological Research, 3 (1), 97 – 110. https://doi.org/10.21500/20112084.854 Moosbrugger, H. & Kelava, A. (2012). Testtheorie und Fragebogenkonstruktion. Berlin: Springer. Muthén, L. K. & Muthén, B. O. (2017). Mplus User's Guide. Los Angeles: Muthén & Muthén. Nelson, R. M. & DeBacker, T. K. (2008). Achievement motivation in adolescents: the role of peer climate and best friends. The Journal of Experimental Education, 76 (2), 170 – 189. Nowak, D. (2019). Entwicklung und Evaluation eines onlinebasierten Fragebogens zur Analyse ganztägiger Schulangebote aus der Perspektive der Schülerinnen und Schüler. Unveröffentlichte Dissertation, Goethe-Universität Frankfurt. Nowak, D., Ennigkeit, F. & Heim, C. (2019). Ganztagsschulqualität aus Sicht der Lernenden – Zum Einsatz eines onlinebasierten Fragebogens für die Schulentwicklung. Lernende Schule, 85, 42 – 45. Prüfer, P. & Rexroth, M. (2005). Kognitive Interviews. ZUMA How-toReihe, Nr. 15. Verfügbar unter http://www.gesis.org/fileadmin/ upload/forschung/publikationen/gesis_reihen/howto/How_ to15PP_MR.pdf Radisch, F., Stecher, L., Klieme, E. & Kühnbach, O. (2008). Unterrichts- und Angebotsqualität aus Schülersicht. In H. G. Holtappels, E. Klieme, T. Rauschenbach & L. Stecher (Hrsg.), Ganztagsschule in Deutschland: Ergebnisse der Ausgangserhebung der „Studie zur Entwicklung von Ganztagsschulen“ (StEG) (S. 227 – 260). Weinheim: Beltz. Ramm, G., Prenzel, M., Baumert, J., Blum, W., Lehmann, R., Leutner, D. et al. (2006). PISA 2003: Dokumentation der Erhebungsinstrumente. Münster: Waxmann. Reindl, M. & Gniewosz, B. (2017). Prima Klima: Schule ist mehr als Unterricht. Berlin: Springer. https://doi.org/10.1007/978-3662-50353-9 Reindl, M., Berner, V.-D., Scheunpflug, A., Zeinz, H. & Dresel, M. (2015). Effect of negative peer climate on the development of autonomous motivation in mathematics. Learning and Individual Differences, 38, 68 – 75. https://doi.org/10.1016/j.lindif. 2015.01.017 Saldern, M. von & Littig, K. E. (1987). Landauer Skalen zum Sozialklima (LASSO 4 – 13). Weinheim: Beltz. Satow, L. (1999). Klassenklima und Selbstwirksamkeitsentwicklung: Eine Längsschnittstudie in der Sekundarstufe I. Dissertationsschrift, Freie Universität Berlin. Verfügbar unter: http://
© 2019 Hogrefe
21
www.edocs.fu-berlin.de/diss/servlets/MCRFileNodeServlet/ FUDISS_derivate_000000000271/00_satow.pdf Sauerwein, M. N. (2016). Qualitätsmerkmale in Ganztagsangeboten aus Perspektive der Schüler / innen. In N. Fischer, H. P. Kuhn & C. Tillack (Hrsg.), Was sind gute Schulen? Teil 4: Theorie, Praxis und Forschung zur Qualität von Ganztagsschulen (S. 60 – 80). Immenhausen: Prolog. Sauerwein, M. N. (2017). Qualität in Bildungssettings der Ganztagsschule. Weinheim: Beltz. Schiefele, U. (2008). Lernmotivation und Interesse. In W. Schneider & M. Hasselhorn (Hrsg.), Pädagogische Psychologie (S. 38 – 49). Göttingen: Hogrefe. Spinath, B., Stiensmeier-Pelster, J., Schöne, C. & Dickhäuser, O. (2012). Skalen zur Erfassung der Lern- und Leistungsmotivation. Göttingen: Hogrefe. StEG-Konsortium. (2016). Ganztagsschule: Bildungsqualität und Wirkungen außerunterrichtlicher Angebote. Ergebnisse der Studie zur Entwicklung von Ganztagsschulen 2012 – 2015. Verfügbar unter: http://www.projekt-steg.de/sites/default/files/StEG_ Brosch_FINAL.pdf Sting, S. & Sturzenhecker, B. (2013). Bildung und Offene Kinderund Jugendarbeit. In U. Deinet & B. Sturzenhecker (Hrsg.), Handbuch Offene Kinder- und Jugendarbeit (S. 375 – 388). Wiesbaden: Springer. Urhahne, D., Marsch, S., Wilde, M., Krüger, D. (2011). Die Messung konstruktivistischer Unterrichtsmerkmale auf der Grundlage von Schülerurteilen. Psychologie in Erziehung und Unterricht, 58 (2), 116 – 127. https://doi.org/10.2378/peu2011.art06d Wagner, W., Helmke, A. & Rösner, E. (2009). Deutsch Englisch Schülerleistungen International. Dokumentation der Erhebungsinstrumente für Schülerinnen und Schüler, Eltern und Lehrkräfte. Materialien zur Bildungsforschung (Bd. 25/1). Frankfurt am Main: GFPF / DIPF. Weinert, F. E. (2010). Entwicklung, Lernen, Erziehung. In H. D. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (S. 132 – 143). Weinheim: Beltz. Weir, J. P. (2005). Quantifying test-retest reliability using the intraclass correlation coefficient and the SEM. Journal of Strength and Conditioning Research, 19 (1), 231 – 240. Weng, L.-J. (2016). Impact of the number of response categories and anchor labels on coefficient alpha and test-retest reliability. Educational and Psychological Measurement, 64 (6), 956 – 972. https://doi.org/10.1177/0013164404268674
Historie Manuskript eingereicht: 07.09.2018 Manuskript nach Revision angenommen: 15.03.2019 Onlineveröffentlichung: 05.08.2019 Dennis Nowak Goethe-Universität Frankfurt am Main Institut für Sportwissenschaften Ginnheimer Landstraße 39 60487 Frankfurt nowak@sport.uni-frankfurt.de
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 9–21
Ja zu ADHS
Ruth Huggenberger
ADHS in der Familie Strategien für den Alltag Bearbeitet von Angelika Pfaller. 2019. 256 S., 18 Abb., 11 Tab., € 24,95 / CHF 32.50 ISBN 978-3-456-85798-5 Auch als eBook erhältlich
Wird bei einem Kind die Diagnose ADHS gestellt, sind die Eltern zumindest anfangs oft erleichtert. Sie haben nun die Gewissheit, dass die „Andersartigkeit“ ihres Kindes einen Namen hat. Doch wie geht es danach weiter? Die erfahrene Psychotherapeutin Ruth Huggenberger liefert konkrete Anregungen und Ratschläge, die Eltern von ADHS-betroffenen Kindern helfen, anhand von adäquaten Strategien das gesamte Familiensystem zu entlasten. ADHS betrifft oftmals die gesamte Familie – immer häu-
www.hogrefe.com
figer wird die Störung auch bei Erwachsenen festgestellt. Auch Eltern können unter einer Aufmerksamkeitsdefizitstörung leiden. Sie finden in diesem Buch wertvolle Hinweise, wie auch ihre Ressourcen gestärkt und wie sie mit den Symptomen im Alltag zurechtkommen. Die Autorin zeigt, wie sich die Störung vom Vorschulalter bis ins Erwachsenenalter auswirken kann und gibt praktische Tipps, welche Strategien in der Erziehung und im Alltag erfolgreich sein können.
Originalarbeit
Wenn den Zappelphilipp die Aufschieberitis packt: Zusammen hänge zwischen ADHS-Symptomen und Prokrastination und mögliche Mediatoren Sandra Schmiedeler1, Kay Khambatta2, Julia Hartmann2 und Frank Niklas2 Begabungspsychologische Beratungsstelle der Universität Würzburg Lehrstuhl für Psychologie IV der Universität Würzburg, Würzburg
1
2
Zusammenfassung: Die Aufmerksamkeitsdefizit- / Hyperaktivitätsstörung (ADHS) scheint mit prokrastinierendem Verhalten in Verbindung zu stehen und beides kann den individuellen Bildungserfolg beeinträchtigen. Weitere Studien weisen zudem auf Zusammenhänge zwischen den beiden Konstrukten und Selbstkontrolle sowie Perfektionismus hin. In der vorliegenden Arbeit wurde anhand von zwei verschiedenen Stichproben (Ngesamt = 762) untersucht, ob Zusammenhänge zwischen ADHS-Symptomen und Prokrastination bestehen und ob diese Zusammenhänge durch Selbstkontrolle und Perfektionismus mediiert werden. Die Ergebnisse zeigen positive Assoziationen zwischen Prokrastination und den ADHS-Subskalen für beide Stichproben (Unaufmerksamkeit: r = .67 bzw. r = .66; Hyperaktivität / Impulsivität: r = .35 bzw. r = 0.22). Dabei wurden indirekte Effekte von der ADHS-Gesamtskala sowie den beiden Subskalen Unaufmerksamkeit und Hyperaktivität / Impulsivität auf Prokrastination über Selbstkontrolle deutlich. Zudem zeigte sich ein indirekter Effekt von Hyperaktivität / Impulsivität auf Prokrastination über sozial vorgeschriebenen Perfektionismus. Ein Teil des Zusammenhangs zwischen ADHS-Symptomen und Prokrastination kann demnach durch indirekte Effekte über dritte Konstrukte erklärt werden. Schlüsselwörter: Prokrastination, ADHS, Selbstkontrolle, Perfektionismus “When Fidgety Philip starts to postpone”: The association between ADHD-symptoms and procrastination and potential mediators Abstract: Attention deficit hyperactivity disorder (ADHD) seems to be associated with procrastination and both may hinder academic success. Further, research indicates that both constructs are associated with self-regulation and perfectionism. In this study, we used data of two samples (Ntotal = 762) to test possible associations of ADHD-symptoms with procrastination and to test possible mediators for such an association. Results showed indeed positive associations between procrastination and ADHD-subscales for both samples (inattention: r = .67 and r = .66; hyperactivity / impulsivity: r = .35 and r = .22). Indirect effects of inattention on procrastination via self-regulation and indirect effects of hyperactivity / impulsivity on procrastination via self-regulation and socially prescribed perfectionism were found. The association between ADHDsymptoms and procrastination thus can partly be explained by indirect effects via other constructs. Keywords: Procrastination, ADHD, self-regulation, perfectionism
Aufmerksamkeitsdefizit- / Hyperaktivitätsstörung (ADHS) und Prokrastination Die Aufmerksamkeitsdefizit- / Hyperaktivitätsstörung (ADHS) mit Symptomen von Unaufmerksamkeit und Hyperaktivität / Impulsivität gehört mit einer Prävalenz © 2019 Hogrefe
von etwa 5 % bis 7 % zu den häufigsten Störungen im Kindes- und Jugendalter (Polanczyk, Willcutt, Salum, Kieling & Rohde, 2014). Auch wenn die Symptomatik im Jugendalter und insbesondere im Erwachsenenalter zurückgeht, erfüllt die Mehrheit der Kinder (60 – 8 5 %) bis ins Jugendalter hinein die Diagnosekriterien der ADHS (Barkley, Fischer, Edelbrock & Smallish, 1990). Nach einer Metaanalyse von Faraone, Biederman und Mick Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 23–34 https://doi.org/10.1024/1010-0652/a000248
24
(2006) wird die Persistenz der Störung ins Erwachsenenalter auf 15 % bis 65 % geschätzt. Somit sind Erwachsene noch mit ca. 3.1 % bis 4.7 % betroffen (de Zwaan et al., 2012). Prokrastination beschreibt die irrationale Tendenz, geplante Handlungen, Aufgaben oder Entscheidungen auf „später“ zu verschieben (Helmke & Schrader, 2000; Steel, 2007) und ist ein weitverbreitetes Phänomen: Etwa 80 % bis 95 % der Collegestudierenden (und davon ca. 20 – 40 % in einem problematischen Ausmaß) und 15 % bis 25 % aller Erwachsenen sind chronisch betroffen (O'Brien, 2002; Ferrari, Díaz-Morales, O'Callaghan, Día & Argumedo, 2007; vgl. Steel, 2007). Dabei findet ein Aufschub trotz des Wissens statt, dass der Nutzen (Interessen, Präferenzen, Ziele) durch das Aufschieben nicht maximiert wird (Rustemeyer & Callies, 2013; Steel, 2007). Auch wenn die Stimmung kurzfristig durch das Umgehen unangenehmer Aufgaben verbessert werden kann, ist langfristig von einem Absinken der Stimmung auszugehen (Solomon & Rothblum, 1984; Steel, Brothen & Wambach, 2001). Dies erklärt, warum 95 % der Betroffenen ihr Prokrastinationsverhalten gerne reduzieren würden (O'Brien, 2002).
ADHS, Prokrastination und Bildungserfolg Sowohl ADHS als auch Prokrastination können den Bildungserfolg Betroffener beeinträchtigen. Kinder und Jugendliche mit ADHS tragen ein erhöhtes Risiko für Lernstörungen, Sitzenbleiben, Klassenwiederholungen und Schulabbrüche (Barbaresi, Katusic, Colligan, Weaver & Jacobsen, 2007; Barkley et al., 1990). Zudem besuchen sie überzufällig häufig (30 – 40 %) Förderschulen mit den Schwerpunkten Lern- und Erziehungshilfe (Mähler, Hasselhorn & Grube, 2008), weisen im Verlauf der Schulzeit dann auch seltener einen Highschool-Abschluss auf und besuchen seltener das College als nicht betroffene Jugendliche (Barkley, Fischer, Smallish & Fletcher, 2006). Bei jungen Erwachsenen mit ADHS führt die Symptomatik zu Schwierigkeiten in der beruflichen und sozialen Anpassung (Barkley et al., 2006). Mit Blick auf Prokrastination finden sich neben positiven Assoziationen mit Ängstlichkeit und Depression (z. B. Schulz, 2008) auch negative Zusammenhänge zwischen selbst berichtetem prokrastinierendem Verhalten und akademischem Erfolg (Beswick, Rothblum & Mann, 1988). Auch längsschnittlich betrachtet ist prokras tinierendes Verhalten ein wesentlicher Prädiktor für akademische Leistung (Steel et al., 2001; Wesley, 1994). Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 23–34
S. Schmiedeler et al., ADHS und Prokrastination
Zusammenhänge zwischen ADHS und Prokrastination Betrachtet man die Beschreibung typischer Probleme von Patienten mit ADHS, werden die Hinweise auf einen Zusammenhang mit Prokrastination deutlich: Betroffene Patienten haben oftmals Schwierigkeiten, (Schul-)Aktivitäten zu organisieren und Langzeitprojekte zu vollenden und sie vermeiden häufig unangenehme, anstrengende oder uninteressante Entscheidungen oder Aufgaben (Ame rican Psychiatric Association, 2013; Langberg, Epstein & Graham, 2008). Dieses Verhalten führt überdies auch dazu, dass Personen mit ADHS negative Erfahrungen machen und negatives Feedback erhalten, was in der Folge zu einem geringen Selbstwirksamkeitserleben beitragen kann; dadurch könnte Prokrastination bei Herausforderungen wiederum als Kompensationsstrategie dienen (Ramsay & Rostain, 2003; Niermann & Scheres, 2014). Gleichzeitig ist Prokrastination kein anerkanntes Symptom von ADHS, sodass über die Beziehung zwischen beiden noch relativ wenig bekannt ist. Die wenigen wissenschaftlichen Studien, die es zum Thema gibt, belegen den Zusammenhang zwischen ADHS und Prokrastination, wobei einige Studien jedoch nur Zusammenhänge für einen der Symptombereiche Unaufmerksamkeit bzw. Hyperaktivität / Impulsivität aufweisen konnten. Ferrari (2000) untersuchte an Studenten den Zusammenhang von ADHS-Symptomen und Prokrasti nationstendenzen und fand mittelhohe Korrelationen zwischen Prokrastination und einem Aufmerksamkeitsdefizit (r = .43 bis r = .60), während die Assoziationen mit Impulsivität (r = .26 bis r = .32) und Hyperaktivität (r = .13 bis r = .19) geringer ausfielen. Eine im Anschluss durchgeführte Faktorenanalyse belegte trotz des hohen Zusammenhangs zwischen Unaufmerksamkeit und Prokrastination zwei getrennte Faktoren: Prokrastination konnte nicht durch ADHS-Symptome erklärt werden. In einer Studie im deutschen Raum untersuchten Rist, Pedersen, Höcker und Engberding (2011) den Zusammenhang der beiden Konstrukte und fanden nur geringe Korrelationen zwischen ADHS-Symptomen und Prokrastination (r = 0.13 bis r = 0.24). Wurden die ADHS-Subskalen berücksichtigt, fiel der Zusammenhang von Prokrastination mit der Aufmerksamkeitssubskala höher aus (r = 0.51). Die Autoren prüften auch, inwiefern jeweils Auffälligkeiten in einem Bereich mit Auffälligkeiten in dem anderen einhergingen: Von den Probanden, bei denen der Trennwert der ADHS-Skala überschritten worden war und somit ein ADHS-Verdacht vorlag, wurde etwa die Hälfte auch als „Prokrastinierer“ eingestuft, wobei bei den „Prokrastinierern“ nur in etwa 20 % der Fälle ein ADHS-Verdacht manifest wurde. Dies deckt sich mit Befunden von Ferrari und Sander (2006), © 2019 Hogrefe
S. Schmiedeler et al., ADHS und Prokrastination
wonach Erwachsene mit einer diagnostizierten ADHS deutlich häufiger von Prokrastinationsverhalten berichteten als eine vergleichbare gesunde Kontrollgruppe. In einer weiteren Studie fanden Niermann und Scheres (2014) mittlere bis hohe Korrelationen zwischen Unaufmerksamkeitswerten und verschiedenen Prokrastina tionsskalen nach Selbstbericht, wohingegen die Autoren den Zusammenhang zwischen Hyperaktivität / Impul sivität und Prokrastination nicht eindeutig bestätigen konnten. Insbesondere zeigten sich die Zusammenhänge nicht mehr, wenn die Unaufmerksamkeit mittels Partialkorrelation berücksichtigt wurde. Dies ist insofern erstaunlich, da beide Verhaltensweisen, Prokrastination und Impulsivität, mit einer gemeinsamen Hirnregion, dem linken dorsolateralen präfrontalen Kortex, verknüpft zu sein scheinen (Morris, 2017). Auch nach Steel (2007) ist Impulsivität ein zentrales Merkmal für Prokrastinationsverhalten. Entsprechend sind die Forschungsdaten zum Zusammenhang von ADHS-Symptomen und Prokrastination nicht ganz geklärt. Während der Zusammenhang mit Unaufmerksamkeit recht konsistent im mittelhohen Bereich liegt, ist insbesondere für die selbst berichtete Impulsivität die Datenlage nicht eindeutig. Eine Rolle könnte hierbei auch die unterschiedliche Erfassung der Konstrukte spielen (vgl. z. B. Svartdal et al., 2016). Daneben stellt sich die Frage, welche Faktoren die Zusammenhänge zwischen ADHS und Prokrastination möglicherweise erklären können.
Mögliche Wirkmechanismen: Selbstkontrolle und Perfek tionismus Als mögliche Mediatorvariablen zwischen den Konstrukten ADHS und Prokrastination sind verschiedene denkbar wie Selbstwirksamkeit, Erlernte Hilflosigkeit, Bewertungsangst, Emotionsregulation oder auch Variablen wie Zeitmanagement und Interesse (Helmke & Schrader, 2000; Rustemeyer & Callies, 2013; Rustemeyer & Rausch, 2007; Wypych, Matuszewski & Dragan, 2018). Bislang sind die verschiedenen Wirkmechanismen, die zu Prokrastination führen können, noch nicht abschließend analysiert und geklärt. Aufgrund von Befunden, die eine Assoziation von ADHS und Prokrastination mit perfektionistischen Persönlichkeitstendenzen (Pychyl & Flett, 2012; Strohmeier, Rosenfield, DiTomasso & Ramsay, 2016) und insbesondere mit Defiziten in der Selbstkontrolle (Gawrilow, Schmitt & Rauch, 2011; Rabin, Fogel & Nutter-Upham, 2011) in Verbindung setzen, liegt die Vermutung nahe, dass diese beiden Variablen als Mediatoren fungieren könnten. © 2019 Hogrefe
25
Selbstkontrolle beschreibt dabei die Fähigkeit, unerwünschte Emotionen, Wünsche und Handlungen zugunsten erwünschter Alternativen zu unterdrücken (Casey, 2015). ADHS wird auch als Störung der selbstregulativen Fähigkeiten bezeichnet, da Betroffene große Defizite in der Selbstkontrolle und den Exekutiven Funktionen z eigen (Gawrilow et al., 2011). Passend dazu erklärt das neuro psychologische Modell von Barkley (1997) Selbstkontrolldefizite durch eine Störung des präfrontalen Kortex, die wiederum sekundäre Defizite auslöst und so letztlich zu Problemen in der Selbstkontrolle und Verhaltenssteuerung führt. Mit Blick auf Prokrastination ist auch hier der Bezug zu Selbstkontrolle nachvollziehbar: Selbstkontrollfehler gehören zu den stärksten und konsistentesten Prädiktoren für Prokrastination (Rabin et al., 2011), sodass Prokrastination bei verringerter Selbstkontrolle auch häufiger auftritt (Schouwenburg & Groenewoud, 2001). Demnach wird Prokrastination auch als eine besondere Form der Störung der Selbstregulation bezeichnet (Helmke & Schrader, 2000; Rustemeyer & Callies, 2013; Schouwenburg, 2004) bzw. als „Quintessenz selbstregulatorischer Fehler“ (Steel, 2007) angesehen. Somit scheinen Selbstkontrollfehler Kernmerkmale sowohl von ADHS als auch von Prokrastination zu sein. Wir gehen demnach davon aus, dass Selbstkontrolle den Zusammenhang zwischen ADHS-Symptomen und Prokrastination erklären kann, weiterhin jedoch auch spezifische Assoziationen unabhängig von Selbstkontrolle zwischen ADHS und Prokrastina tion bestehen. Nicht so eindeutig und weniger offensichtlich ist Perfektionismus für den Zusammenhang zwischen ADHS und Prokrastination zu diskutieren. Unter Perfektio nisten werden Personen verstanden, die extrem hohe Ansprüche an die eigenen Handlungen stellen, sehr besorgt sind, Fehler zu machen, und ihre Selbstbewertung danach ausrichten, wie sehr sie diese hohen Maßstäbe erfüllen (Flett & Hewitt, 2002). Hewitt und Flett (1991b) beschreiben in ihrem multidimensionalen Modell drei Dimensionen des Perfektionismus, die sich untereinander nicht ausschließen und auch gleichzeitig und in verschiedenen Ausprägungen vorkommen können: Selbst orientierte Perfektionisten setzen sich selbst (übertrieben) anspruchsvolle Standards und üben eine strenge Bewertung des eigenen Verhaltens. Fremdorientierter Perfektionismus weist ein ähnliches Muster auf, jedoch mit einer anderen Ausrichtung: Fremdorientierte Perfektionisten setzen unrealistische Standards für Bezugspersonen und legen Wert auf die Perfektion anderer. Sozial vorgeschriebener Perfektionismus wird von der Wahrnehmung bestimmt, dass Bezugspersonen unrealistisch hohe Standards an einen selbst richten, die eigenen Handlungen entsprechend streng bewertet werden und dabei der Zwang besteht, diesen Erwartungen gerecht werden zu Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 23–34
26
müssen. In der Literatur finden sich zahlreiche Hinweise auf einen Zusammenhang zwischen Prokrastination und Perfektionismus, wobei hier insbesondere der sozial vorgeschriebene Perfektionismus relevant ist (Flett, Hewitt & Martin, 1995; Flett, Blankstein, Hewitt & Koledin, 1992; Kağana, Çakırb, İlhan & Kandemir, 2010; Pychyl & Flett, 2012). So scheint es nach Flett et al. (1992) insbesondere die Antizipation von Missbilligung anderer zu sein, die das Aufschiebeverhalten begünstigt. Da ADHSPatienten in ihrer Biografie häufig berichten, dass ihre Handlungen (z. B. von Eltern oder Lehrkräften) kritisch beurteilt wurden (Döpfner, 2011), könnte hier die Entwicklung eines sozial vorgeschriebenen Perfektionismus begünstigt werden und Prokrastinationsverhalten wiederum verstärkt auftreten. Allerdings sind Studien zu Assoziationen zwischen ADHS und Perfektionismus rar. Strohmeier und Kollegen (2016) untersuchten den Zusammenhang von ADHS zu den von den Patienten selbst eingeschätzten kognitiven Verzerrungen: Die Autoren fanden, dass die erwachsenen ADHS-Patienten am häufigsten Perfektionismus als kognitive Verzerrung (55 %) berichteten. Ähnlich fanden Martel, Goth-Owens, Martinez-Torteya und Nigg (2010) in ihrer Studie sogar eine „perfektionistische Gruppe“ als eine von vier verschiedenen Gruppen, in die Kinder und Jugendliche mit ADHS unterteilt werden konnten.
Die vorliegende Untersuchung Mehrere Hinweise sprechen für einen Zusammenhang zwischen ADHS und dem weitverbreiteten Phänomen der Prokrastination. Dennoch gibt es keine ausreichenden Erkenntnisse über die Zusammenhänge, wenn die der ADHS zugrunde liegenden Dimensionen Unaufmerksamkeit vs. Hyperaktivität / Impulsivität einzeln betrachtet werden. Hier stellt sich auch die Frage, ob sich der Befund von Niermann und Scheres (2014) replizieren lässt, wonach sich der Zusammenhang von Prokrastination und Impul sivität bei Kontrolle der Unaufmerksamkeit verringert. Daneben soll untersucht werden, ob diese Zusammenhänge von anderen Faktoren beeinflusst werden. Zum einen ist die Annahme nahe liegend, dass Selbstkontrollfähigkeiten die Assoziation zwischen ADHS und Prokrastination beeinflussen können. Zum anderen gibt es Hinweise, dass Verbindungen zwischen Perfektionismus und ADHS bzw. Prokrastination bestehen. Ob sich diese Verbindungen jedoch auch auf die Beziehung zwischen ADHS und Prokrastination auswirken, ist bislang unbekannt. Da hinter Perfektionismus ein multidimensionales Konstrukt steht, sollten die Dimensionen des Perfektionismus einzeln betrachtet werden. Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 23–34
S. Schmiedeler et al., ADHS und Prokrastination
Da ADHS-Symptome i. d. R . sehr früh in der Entwicklung von Kindern auftreten und eine hohe genetische Komponente haben (Faraone et al., 2005), während für die Entwicklung von Prokrastination eher lerntheore tische, motivationale und kognitive Erklärungsansätze herangezogen werden (Schulz, 2008), ist davon auszugehen, dass ADHS eher ursächlich für Prokrastination ist und nicht umgekehrt. Wir erwarten, dass ein direkter Zusammenhang zwischen den Symptomen der ADHS und einer allgemein gemessenen Prokrastination besteht. Die Unaufmerksamkeit sollte dabei gegenüber der Hyperakti vität / Impulsivität größere Vorhersagekraft für Prokrastination besitzen. Weiterhin hängen sowohl ADHS als auch Prokrastination mit Selbstkontrolle und perfektionistischen Persönlichkeitstendenzen zusammen. Personen mit ADHS weisen Funktionsstörungen in ihren exekutiven Funktionen und ganz allgemein in der Handlungskon trolle auf. Solche selbstregulatorischen Defizite wiederum sind gute Prädiktoren für Prokrastination. Genauso scheint eine ADHS in vielen Fällen mit perfektionistischen Persönlichkeitstendenzen einherzugehen, während die antizipierte Missbilligung durch andere und damit sozial vorgeschriebener Perfektionismus Prokrastination verstärken kann. Deshalb soll in einem explorativen Ansatz überprüft werden, ob eventuelle Zusammenhänge zwischen ADHS und Prokrastination zumindest teilweise über Selbstkontrolle und Perfektionismus, und hier insbesondere über den sozial vorgeschriebenen Perfektionismus, erklärt werden können, die in diesem Fall als Mediatoren wirken würden.
Methode Stichprobenbeschreibung Die Daten wurden insgesamt an zwei Stichproben mittels eines Onlinefragebogens erhoben. Die Teilnahme war freiwillig und anonym. Die erste Stichprobe wurde über soziale Netzwerke und E-Mail-Verteiler rekrutiert (Teilnahme ohne Vergütung). Vollständige Datensätze lagen von insgesamt N = 559 (412 Frauen, 147 Männer) mit einem durchschnittlichen Alter von M = 26,46 Jahren (SD = 8,19 Jahre) vor. Der Bildungsstand der Befragten war hoch: Die Mehrheit gab die Allgemeine Hochschulreife (n = 280) oder einen Fachhochschul- oder Hochschulabschluss (n = 181) als höchsten formalen Bildungsabschluss an. Da die bisherigen Studien zur Assoziation zwischen ADHS und Prokrastination hauptsächlich an studentischen Personengruppen erhoben wurden und auch unsere Stichprobe aus der Allgemeinbevölkerung einen sehr hohen Bildungsstand, geringes Alter und wenig ADHS© 2019 Hogrefe
S. Schmiedeler et al., ADHS und Prokrastination
Symptome aufwies, wurde zur Verallgemeinerung der Befunde eine weitere Stichprobe mit vorwiegend ADHSSymptomen gewonnen. Hierzu wurden in einer zweiten Studie 132 ADHS-Onlineforen, Selbsthilfegruppen und weitere therapeutische Gruppen und Praxen in Deutschland, Österreich und der Schweiz kontaktiert und gebeten, einen Aushang zur Studie unter ADHS-Betroffenen zu machen. Dadurch konnten von insgesamt N = 203 Per sonen (135 Frauen, 67 Männer, 1 anderes / sonstiges) vollständige Datensätze gewonnen werden (Teilnahme ohne Vergütung). Das Alter war höher als in der ersten Stich probe (M = 41.6 Jahre, SD = 11.6 Jahre). Der Bildungsstand war erneut relativ hoch: Die meisten Personen gaben als höchsten formalen Bildungsabschluss wieder die Allgemeine Hochschulreife (n = 50) oder einen Fachhochschuloder Hochschulabschluss (n = 73) an. Es wurde in dieser Stichprobe zusätzlich nach dem Einkommen gefragt: Dabei gaben 17 % an, kein eigenes Einkommen zu haben, bei 20 % belief sich das Einkommen unter 1000 Euro, bei 26.5 % unter 2000 Euro, bei 16.5 % unter 3000 Euro, bei 7.5 % unter 4000 Euro und 12.5 % gaben an, dass ihr Einkommen über 4000 Euro lag. Unter den Teilnehmenden der zweiten Erhebung wiesen 177 Personen (ca. 87 %) wahrscheinlich ADHS-Symptome (d. h. einen Wert ≥ 17 in der Selbstberichtsskala für Erwachsene mit ADHS) auf.
Erhebungsinstrumente ADHS-Symptome. Bei der Selbstberichtsskala für Erwachsene mit ADHS (ASRS-v1.1) handelt es sich um die deutsche Übersetzung der Adult ADHD Self-Report Scale (ASRS), welche in Zusammenarbeit mit der World Health Organization (WHO) erstellt wurde (Kessler et al., 2005). In diesem Fragebogen sollen 18 Aussagen hinsichtlich des persönlichen Erlebens während der vergangenen sechs Monate auf einer 5-stufigen Likert-Skala eingeschätzt werden. Neben der Gesamtskala gibt es auch eine Unterteilung in die beiden Subskalen Unaufmerksamkeit und Hyperaktivität / Impulsivität mit jeweils neun Items. Dabei weist ein Punktwert von 17 – 23 Punkten darauf hin, dass wahrscheinlich ADHS-Symptome vorliegen und ein Wert ab 24 Punkte, dass sehr wahrscheinlich Symptome vorliegen. Cronbachs Alpha liegt für die Gesamtskala mit α = .88 sowie die Subskalen Unaufmerksamkeit (α = .88) und Hyperaktivität / Impulsivität (α = .83) im guten Bereich (Mörstedt, Corbisiero & Stieglitz, 2016). In der vorliegenden Arbeit wurden für die Gesamtstichprobe für die Subskala Unaufmerksamkeit M = 18.3 (SD = 6.67) und α = .86 (ωh = .75) sowie für die Subskala Hyperaktivität / Impulsivität M = 16.55 (SD = 6.47) und α = .83 (ωh = .68) berechnet. Zur Überprüfung der Modellgüte des zugrunde liegenden Modells von ADHS mit den Dimensionen Un© 2019 Hogrefe
27
aufmerksamkeit und Hyperaktivität / Impulsivität wurde zusätzlich eine konfirmatorische Faktorenanalyse mittels R durchgeführt und eine gute Modellgüte gefunden (X2 (127) = 359.37, CFI = .953, RMSEA = .049). Prokrastination. Zur Erfassung von Prokrastination als allgemeinem dysfunktionalen Handlungsaufschub wurde die 10 Items umfassende KRAS – Prokrastination von Schwarzer (1999) verwendet. Die Items decken wichtige definitorische Kriterien von Prokrastination ab, wie vernunftwidriges (irrationales) Verhalten, den Aufschub einer intendierten (zielgerichteten) Handlung, obwohl dem Individuum durch die Verzögerung potenzielle Nachteile entstehen, sowie Zeitdruck oder affektives Unbehagen (Wieland, Grunschel, Limberger, Schlotz, Ferrari & EbnerPriemer, 2018). Die Probanden sollen auf einer 4-stufigen Likert-Skala bewerten, wie stark sie den Aussagen zustimmen (z. B. „Ich habe oft ein schlechtes Gewissen, weil ich wichtige Dinge vor mir herschiebe.“). Die Autoren geben für ihre Stichprobe mit N = 293 (M = 28.29, SD = 4.97) eine gute Reliabilität an (α = .84). Diese Kennwerte konnten in der vorliegenden Gesamtstichprobe (N = 762) weitest gehend wiedergefunden werden (M = 26.26, SD = 6.05, α = .86, ωh = .80). Bei der Überprüfung des eindimensionalen Modells von Prokrastination mithilfe einer konfirmatorischen Faktorenanalyse ergab sich eine akzeptable Modellgüte mit X2 (34) = 146.3, CFI = 0.958 und RMSEA = 0.066. Selbstkontrolle. Es wurde die deutsche Adaptation der Kurzform der Self-Control Scale (SCS-K-D; Bertrams & Dickhäuser, 2009) genutzt. Hierbei sollen 13 Aussagen anhand einer 5-stufigen Likert-Skala bewertet werden (z. B. „Ich bin gut darin, Versuchungen zu widerstehen.“). Die SCS-K-D basiert auf dem englischen Original von Tangney, Baumeister und Boone (2004) und bietet mit 13 Items eine ökonomische Alternative zur Gesamtskala, welche 36 Items umfasst. Die interne Konsistenz der deutschen Übersetzung wird mit α = .79 bis α = .80 angegeben (Bertrams & Dickhäuser, 2009). Die in der vorliegenden Studie erhobenen Daten (N = 762, M = 36.99, SD = 9.06, α = .86, ωh = .68) sprechen ebenfalls für eine ausreichende bis gute interne Konsistenz. Die mittels konfirmatorischer Faktorenanalyse untersuchte Modellgüte für Selbstkontrolle als eindimensionalem Faktor ist jedoch nicht optimal (X2 (59) = 378.53, CFI = .890, RMSEA = .084). Perfektionismus. Perfektionistische Tendenzen wurden mittels einer unveröffentlichten deutschen Fassung der Multidimensional Perfectionism Scale (CMPS) erhoben (Hewitt & Flett, 1991a). Dem Fragebogen liegt ein drei dimensionales Modell des Perfektionismus mit den Dimensionen selbstorientierter (SO), fremdorientierter (FO) und sozial vorgeschriebener (SV) Perfektionismus zugrunde. Zu jeder der drei Dimensionen werden im Fragebogen 15 Aussagen auf einer 6-stufigen Likert-Skala bewertet (z. B. SO Perfektionismus: „Eines meiner Ziele ist es, in Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 23–34
28
S. Schmiedeler et al., ADHS und Prokrastination
llem was ich tue, perfekt zu sein.“; FO Perfektionismus: a „Wenn ich jemanden darum bitte, etwas zu tun, erwarte ich, dass das Geleistete keine Fehler aufweist.“, SV Perfektionismus: „Ich habe das Gefühl, dass andere zu viel von mir fordern.“). Angelehnt an Cox, Enns und Clara (2002) wurde der Fragebogen zunächst auf insgesamt 15 Items gekürzt. Die Autoren geben eine interne Konsistenz für SO von Cronbachs α = .84, für FO von α = .66 und für SV von α = .85 an. Im Rahmen unserer ersten Studie wiesen die ermittelten Kennwerte jedoch darauf hin, dass die Modellgüte insbesondere durch Items des FO eingeschränkt wurde. Daher wurden in der zweiten Erhebung mit Fokus auf ADHS-Betroffene weitere Items zum FO Perfektionismus miteingeschlossen, sodass hier jeweils fünf Items für SO und SV Perfektionismus, aber zehn Items für FO Perfek tionismus abgefragt wurden. Die für die vorliegende Stichprobe ermittelten Kennwerte betrugen für SO (N = 762) M = 20.64, SD = 5.16, α = .85, ωh = .77, für FO (N = 203), M = 33.52, SD = 7.45, α = .79, ωh = .64 und für SV (N = 762) M =
14.52, SD = 4.91, α = .80, ωh = .74. Eine konfirmatorische Faktorenanalyse zur Überprüfung der Modellgüte des dem HF-MPS zugrunde liegenden dreidimensionalen Modells von Perfektionismus ergab eine akzeptable Modellgüte (X2 (162) = 294.57, CFI = .902, RMSEA = .063).
Statistische Auswertungen Die vorab berichteten Skalenanalysen wurden mittels R berechnet. Die weiteren statistischen Datenanalysen wurden mithilfe von SPSS durchgeführt. Mögliche Zusammenhänge der einzelnen Variablen wurden mittels Punkt-MomentKorrelation nach Pearson berechnet. Partialkorrelationen zwischen den beiden ADHS-Subskalen und Prokrastination dienten dazu, die um die jeweils andere Subskala bereinigten Zusammenhänge zu berechnen. Zur Beantwortung der Frage, ob der Zusammenhang zwischen ADHS und Prokrastination durch Selbstkontrolle und Perfektionismus
Tabelle 1. Korrelationen und deskriptive Statistiken aller Studienvariablen 1 Geschlecht (1) Alter in Jahren (2)
2
3
4
5
6
7
8
11
M
SD
.07
.15
–.13
–.11
–.13
.01
.01
–.01
.13
–.05
0.68
0.50
.09
.27
–.19
–.23
.03
.05
.07
.28
–.22
41.58
11.56
.12
–.14
–.11
.01
.12
–.07
.16
.05
6.79
1.67
–.17
–.11
.15
.06
–.07
.22
–.19
5.65
3.15
.63
.07
.16
.37
–.74
.67
23.62
7.21
.25
.34
.34
–.53
.35
21.13
7.62
.43
.32
–.07
.02
3.35
0.75
.39
–.07
.08
4.43
0.96
–.35
.26
3.30
1.05
–.70
2.58
0.76
3.02
0.60
–.02
Formale Bildung (3)
.01
Einkommen (4)
–
Unaufmerksamkeit (5) Hyperaktivität / Impulsivität (6)
–.11
9
10
–
–
.05
–.12
–.02
–
.07
–.10
–.04
–
.44
Perfektionismus-FO# (7)
-.03
–.04
–.09
–
–.15
.09
Perfektionismus-SO# (8)
.02
–.01
.04
–
–.05
.18
.21
Perfektionismus-SV# (9)
.00
.09
–.04
–
.17
.23
.08
.43
Selbstkontrolle# (10)
.02
.23
.02
–
–.63
–.28
.13
.15
–.14
Prokrastination# (11)
.01
–.16
-.03
–
.66
.22
-.16
-.05
.14
-.66
M
0.74
26.46
7.04
16.37
14.88
3.38
4.02
2.76
2.94
2.48
SD
0.44
8.19
1.03
5.27
5.06
0.80
1.04
0.91
0.65
0.54
Anmerkungen: Unterhalb der Diagonalen: 1. Stichprobe, N = 559; oberhalb der Diagonalen: 2. Stichprobe mit N = 203. Fett gedruckte Korrelationen sind auf dem Niveau von 0.05 (2-seitig) signifikant. FO: fremdorientierter, SO: selbstorientierter und SV: sozial vorgeschriebener Perfektionismus. Geschlecht: 0 = männlich, 1 = weiblich. # gemittelte Werte.
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 23–34
© 2019 Hogrefe
S. Schmiedeler et al., ADHS und Prokrastination
29
Abbildung 1. Mediationsanalyse ADHS-Gesamtskala auf Prokrastination über selbstorientierten (SO), fremdorientierten (FO) und sozial vorgeschriebenen (SV) Perfektionismus sowie Selbstkontrolle. Die durchgezogene Linie entspricht einem direkten Zusammenhang, die unterbrochenen Linien entsprechen den Mediationen. Die Signifikanzprüfung des indirekten Effekts erfolgte mittels Bootstrapping. Fett gedruckte Korrelationen sind auf dem Niveau von 0.05 (2-seitig) signifikant. Es sind die standardisierten b-Koeffizienten dargestellt. 1) 1. Stichprobe ohne Ausreißer mit N = 536; 2) 2. Stichprobe ohne A usreißer mit N = 191.
Abbildung 2. Mediationsanalyse der Subskala Unaufmerksamkeit auf Prokrastination über selbstorientierten (SO), fremdorientierten (FO) und sozial vorgeschriebenen (SV) Perfektionismus sowie Selbstkontrolle. Die durchgezogene Linie entspricht einem direkten Zusammenhang, die unterbrochenen Linien entsprechen den Mediationen. Die Signifikanzprüfung des indirekten Effekts erfolgte mittels Bootstrapping. Fett gedruckte Korrelationen sind auf dem Niveau von 0.05 (2-seitig) signifikant. Es sind die standardisierten b-Koeffizienten dargestellt. 1) 1. Stichprobe ohne Ausreißer mit N = 536; 2) 2. Stichprobe ohne Ausreißer mit N = 191.
mediiert wird, wurden Mediatoranalysen durchgeführt. Dazu wurde das SPSS-Makro PROCESS genutzt (Hayes, 2013). Einer der Vorteile von PROCESS ist, dass automatisch eine Zentrierung der Variablen erfolgt. Die Zentrierung von Variablen erfolgt u. a. in der moderierten Regressionsanalyse, um die Multikollinearität zu verringern und die Interpretation der Ergebnisse zu erleichtern (Eid, Gollwitzer & Schmitt, 2010). Berichtet werden die standardisierten b-Koeffizienten, die 95 %-Konfidenzintervalle sowie t-Werte für die direkten Effekte. Die Signifikanzprüfung des indirekten Effekts erfolgte durch Bootstrapping (num© 2019 Hogrefe
ber of bootstrapping = 5000) und es wird Kappa-Quadrat (κ²) als Effektstärkemaß berichtet mit kleinen Effekten ab .01, mittleren Effekten ab .09 und großen Effekten ab .25 (Preacher & Kelley, 2011). Die Berechnungen wurden jeweils für beide Stichproben separat durchgeführt. Vor den Mediationsanalysen wurden Ausreißer mittels Boxplots für die Variablen der ADHS-Skalen, Perfektionismus-Skalen, Prokrastination und Selbstkontrolle ermittelt. Hierdurch fielen 23 Datensätze in der ersten Stichprobe und 12 weitere Datensätze in der zweiten Stichprobe weg. Es wurde angenommen, dass der Zusammenhang in beiden StichproZeitschrift für Pädagogische Psychologie (2020), 34 (1), 23–34
30
S. Schmiedeler et al., ADHS und Prokrastination
Abbildung 3. Mediationsanalyse der Subskala Hyperaktivität / Impulsivität auf Prokrastination über selbstorientierten (SO), fremdorientierten (FO) und sozial vorgeschriebenen (SV) Perfektionismus sowie Selbstkontrolle. Die durchgezogene Linie entspricht einem direkten Zusammenhang, die unterbrochenen Linien entsprechen den Mediationen. Die Signifikanzprüfung des indirekten Effekts erfolgte mittels Bootstrapping. Fett gedruckte Korrelationen sind auf dem Niveau von 0.05 (2-seitig) signifikant. Es sind die standardisierten b-Koeffizienten dargestellt. 1) 1. Stichprobe ohne Ausreißer mit N = 536; 2) 2. Stichprobe ohne Ausreißer mit N = 191.
ben ähnlich hoch ausfällt sowie der Mediationseffekt von Selbstkontrolle und Perfektionismus sowohl in der Stichprobe aus der Allgemeinbevölkerung als auch in der Stichprobe mit Probanden mit vorwiegend ADHS-Symptomen bestätigt werden kann.
Ergebnisse Tabelle 1 zeigt die Korrelationen und deskriptiven Statistiken für alle Studienvariablen, die für beide Subgruppen getrennt berechnet wurden. Die formale Bildung der Probanden korrelierte lediglich mit Unaufmerksamkeit signifikant (r = –.14), während das Einkommen in Stichprobe 2 negative Korrelationen mit Unaufmerksamkeit (r = –.17) und Prokrastination (r = –.19) aufwies. Der Zusammenhang von Prokrastination mit der Subskala Unaufmerksamkeit fiel in beiden Stichproben deutlich höher aus (r = .67 bzw. r = .66) als mit Hyperaktivität / Impulsivität (r = .35 bzw. r = .22). Prokrastination korrelierte auch mit Selbstkontrolle (r = –.70 bzw. r = –.66). Zwischen ADHS-Symptomen und Selbstkontrolle fanden sich ebenfalls bedeutsame Zusammenhänge, wobei die Werte wiederum für Unaufmerksamkeit höher ausfielen (r = –.74 bzw. r = –.53) als für Hyperaktivität / Impulsivität (r = –.63 bzw. r = –.28). Es fanden sich bzgl. Perfektionismus jeweils die höchsten Zusammenhänge zwischen der Subkomponente SV und sowohl den ADHS-Subskalen (Unaufmerksamkeit: r = .37 bzw. r = .17; Hyperaktivität / Impulsivität: r = .34 bzw. r = .23) als auch der Prokrastination (r = .26 bzw. r = .14), während die Korrelationen mit den anderen beiden Facetten des Perfektionismus Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 23–34
zum Teil nicht bedeutsam oder entgegen der erwarteten Richtung ausfielen. In einem zweiten Schritt wurden Partialkorrelationen berechnet, bei denen jeweils der Zusammenhang zwischen Prokrastination und einer der Subkomponenten der ADHS-Symptomatik unter Berücksichtigung der jeweils anderen Subkomponente ermittelt wurden. Es zeigte sich erwartungskonform, dass sich der Zusammenhang zwischen Unaufmerksamkeit und Prokrastination auch unter Kontrolle der Hyperaktivität / Impulsivität kaum veränderte (r = .64 bzw. r = .63), während sich umgekehrt der Zusammenhang zwischen Hyperaktivität / Impulsivität und Prokrastination unter Kontrolle der Unaufmerksamkeit sogar umdrehte (r = –.10 bzw. r = –.13). Die drei Abbildungen präsentieren letztlich die Ergebnisse der Mediatoranalysen. Zunächst blieben für alle Operationalisierungen der ADHS (Gesamtskala, Unaufmerksamkeit und Hyperaktivität / Impulsivität) direkte Effekte auf Prokrastination auch unter Berücksichtigung der möglichen Mediatoren bestehen, wobei diese Effekte am geringsten für Hyperakti vität / Impulsivität ausfielen. Darüber hinaus zeigten sich indirekte Effekte der ADHS-Gesamtskala sowie der Sub skalen Unaufmerksamkeit und Hyperaktivität / Impulsivität auf Prokrastination über Selbstkontrolle in beiden Stichproben, die auf einen großen indirekten Effekt hinweisen. Zusätzlich wurde bei Hyperaktivität / Impulsivität ein indirekter Effekt auf Prokrastination über den sozial vorgeschriebenen Perfektionismus in beiden Stichproben deutlich (kleine Effekte). In Stichprobe 1 wurden zudem die indirekten Effekte von Unaufmerksamkeit und Hyperaktivität / Impulsivität auf Prokrastination über fremdorientierten Perfektionismus signifikant (jeweils kleine Effekte). © 2019 Hogrefe
S. Schmiedeler et al., ADHS und Prokrastination
Diskussion Die vorliegende Studie untersuchte den Zusammenhang von ADHS und Prokrastination und dabei erstmals Selbstkontrolle und Perfektionismus als mögliche Mediatorva riablen zur Erklärung dieses Zusammenhangs. Da die bisherigen Studien zur Assoziation zwischen ADHS und Prokrastination hauptsächlich an studentischen Personengruppen erhoben wurden, wurde in der vorliegenden Arbeit auch eine Stichprobe mit höherem Alter und vorwiegend auffälligen ADHS-Werten untersucht. Beide Störungsbilder sind weitverbreitet und haben vielfältige Auswirkungen – für die Person selbst und ihren Bildungserfolg, aber auch h insichtlich eines volkswirtschaftlichen Hintergrundes. Durch geringere Arbeitsleistungen oder den Aufschub von Entscheidungen können ggf. hohe Kosten verursacht werden (vgl. Rustemeyer & Callies 2013). Daneben scheint es besonders kritisch, wenn beide Störungen gemeinsam auftreten, denkt man z. B. bei den hohen Komorbiditätsraten von ADHS an den Aufschub von Untersuchungen oder Behandlungen (Kroese & de Ridder, 2016). So ist es von großer Bedeutung, den Zusammenhang zwischen Prokrastination und ADHS genauer zu verstehen.
Zusammenfassung und Interpretation der Ergebnisse Zunächst konnte der erwartete Zusammenhang zwischen ADHS und Prokrastination in beiden Stichproben bestätigt werden. Dabei hing die Subskala Unaufmerksamkeit hoch mit Prokrastination zusammen, während die Assoziation mit Hyperaktivität / Impulsivität geringer ausfiel. Erwartungskonform und analog zu Niermann und Scheres (2014) blieb der Zusammenhang zwischen Prokrastina tion und Unaufmerksamkeit auch dann hoch, wenn die gemeinsame Varianz mit der Subskala Hyperaktivität / Impulsivität mittels Partialkorrelation berücksichtigt wurde. Hingegen fiel die Korrelation zwischen Prokrastination und Hyperaktivität / Impulsivität kaum noch relevant und sogar in entgegengesetzter Richtung aus, wenn die Subskala Unaufmerksamkeit berücksichtigt wurde. Somit ist der Zusammenhang zwischen Unaufmerksamkeit und Prokrastination der stabilste Befund, zumal er auch in der Stichprobe mit Probanden zutraf, die in 87 % der Fälle auffällige ADHS-Werte aufwiesen. Die Befunde bestätigen somit, dass es einen Zusammenhang zwischen beiden Störungsbildern und letztlich auch eine gewisse Komorbidität gibt, dass aber eine Differenzierung insbesondere auch mit Blick auf die ADHS-Subtypen sinnvoll ist. © 2019 Hogrefe
31
Weiterhin zeigte sich, dass der höchste Bildungsabschluss negativ mit der Unaufmerksamkeit zusammenhing und das Einkommen negativ mit Unaufmerksamkeit und Prokrastination assoziiert war. Insgesamt ist zu berücksichtigen, dass in der Stichprobe ein hoher sozioökonomischer Status mit relativ geringer Varianz vorlag. Somit ist die Bedeutung sowohl der ADHS-Symptomatik als auch des prokrastinierenden Verhaltens für den Bildungserfolg zu betonen, auch wenn hier lediglich kleine Zusammenhänge aufgezeigt werden konnten. In den Mediationsanalysen stellte sich hypothesenkonform die Selbstkontrolle als ein zentraler gemeinsamer Mechanismus heraus: Sowohl für die ADHS-Gesamtskala als auch für die Subskalen Unaufmerksamkeit und Hyperaktivität / Impulsivität wurde Selbstkontrolle als Mediator in beiden Stichproben signifikant und zeigte durchweg einen großen indirekten Effekt. Selbstkontrolle scheint demnach als indirekte Verbindung zwischen den ADHS-Subskalen und Prokrastination zu dienen und entspricht dem Bild, dass mangelnde Selbstkontrolle sowohl als Kernstück von Prokrastination als auch von ADHS angesehen werden kann (Rueda, Posner & Rothbart, 2011; Steel, 2007). Jedoch blieb der direkte Zusammenhang zwischen ADHS und Prokrastination auch bei Berücksichtigung von Selbstkontrolle bestehen, sodass hier eine spezifische Assoziation, die über Selbstkontrolle hinausgeht, angenommen werden kann. Für Perfektionismus hingegen ergab sich nur bei der Subskala Hyperaktivität / Impulsivität und nur für den sozial vorgeschriebenen Perfektionismus ein kleiner indirekter Effekt über beide Stichproben hinweg. Während der selbstorientierte Perfektionismus gar keinen indirekten Effekt aufwies, wurde lediglich für die erste (vorwiegend studentische) Stichprobe der Zusammenhang von Unaufmerksamkeit sowie von Hyperaktivität / Impulsivität auf Prokrastination über den fremdorientierten Perfektio nismus mediiert. Dass die beiden Dimensionen des Perfektionismus in der zweiten Stichprobe keine signifikante Rolle spielten, kann auch in der geringeren Stichprobengröße begründet sein. Zwar liegt die Stichprobengröße über dem von Fritz und MacKinnon (2007) genannten Median hinsichtlich der Stichprobengröße von Studien, die Mediationshypothesen untersuchen (N = 187), allerdings betonen die Autoren, dass dieser Richtwert vermutlich zu gering zur Überprüfung von kleinen Effekten ist. Wie Rustemeyer und Callies (2013) herausarbeiten, scheint Aufschiebeverhalten dann verstärkt vorzukommen, wenn Konflikte zwischen den eigenen Erwartungen und den Erwartungen, die andere stellen, wahrgenommen werden. In diesem Kontext kann auch die Rolle des sozial vorgeschriebenen Perfektionismus gesehen werden. Es ist zu betonen, dass die Daten lediglich explorativ, querschnittlich und korrelativ ausgewertet wurden und daher keine kausalen Schlüsse zu ziehen sind. Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 23–34
32
Limitationen Die gefundenen Ergebnisse unterliegen einigen Einschränkungen. Zunächst ist anzumerken, dass die Verwendung von Fragebögen zwar eine sehr ökonomische Durchführung der Studie ermöglicht, aber gleichzeitig verschiedene Nachteile mit sich bringt. Dies ist mit Blick auf die Erfassung von Prokrastination insofern bedeutsam, da die Assoziation zwischen selbst berichteter Prokrastination und externalen Indikatoren je nach Studie unterschiedlich und teils nicht allzu hoch ausfällt (Rotenstein, Davis & Tatum, 2009; Wieland et al., 2018) und Personen dazu tendieren, ihre Prokrastination in Selbstauskünften zu übertreiben (Kim & Seo, 2015). Zudem wäre es wichtig, auch tatsächliches Verhalten im Alltag zu erfassen, was sowohl für Prokrastinationstendenzen als auch für ADHS-Symptomatik relevant wäre, auch wenn Befunde darauf hinweisen, dass die über Fragebögen ganz allgemein erfasste Prokrastina tion einen engen Zusammenhang mit tatsächlicher Prokrastination in konkreten Alltagssituationen aufweisen kann (Wieland et al., 2018). Damit einhergehend wurde in dieser Arbeit zwar eine Stichprobe mit insgesamt auffälligen ADHS-Werten erfasst, eine formale ADHS-Diagnose wurde jedoch nicht gestellt. Weitere Einschränkungen ergeben sich durch den hohen Frauenanteil (über 70 %) sowie den hohen Bildungsstatus der Teilnehmenden (76,6 % der Versuchspersonen gaben Hochschulreife oder einen (Fach-)Hochschulabschluss als höchsten formalen Bildungsabschluss an). Um einen hohen Bildungsstatus zu erreichen, sind zwangsläufig Strategien und Methoden nötig, um etwaige Tendenzen zu dysfunktionalem Handlungsaufschub oder Symptome der Unaufmerksamkeit und Hyperaktivität / Impulsivität zu kompensieren. Da sich in unserer Studie jedoch auch zahlreiche Personen mit hohen ADHS-Werten befanden und auch die Prokrastinationstendenzen im Mittel nicht beträchtlich von denen anderer Stichproben abwichen (Schwarzer, 1999), ist dennoch von einem relativ repräsentativen Zusammenhang auszu gehen. Trotzdem müssen diese Einschränkungen bei der Interpretation der Ergebnisse berücksichtigt werden. Des Weiteren war das Alter der Teilnehmenden in der größeren ersten Stichprobe eher gering, was womöglich auf die Art der Studiendurchführung und -verbreitung als Onlinestudie zurückgeht. Dies ist bedauerlich, da insbesondere hinsichtlich des hohen Erwachsenenalters große Lücken in der Forschung sowohl zu ADHS als auch zu Prokrastination bestehen. Allerdings deckten sich die Befunde für beide Stichproben weitgehend, obwohl in der kleineren zweiten Stichprobe die Befragten stärker von ADHS betroffen und zudem älter waren. Dies deutet daraufhin, dass die Ergebnisse relativ unabhängig vom Alter und dem Ausmaß der ADHS-Symptome gültig sein könnten. Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 23–34
S. Schmiedeler et al., ADHS und Prokrastination
Implikationen für Forschung und Praxis Trotz der genannten Einschränkungen zeigen die vorliegenden Daten, dass von einem relevanten Zusammenhang zwischen Prokrastination und ADHS ausgegangen werden kann, der zum Teil durch Selbstkontrolle und Perfektionismus mediiert wird. Hier sollten in zukünftigen Arbeiten noch weitere Personenmerkmale zur Erklärung des Zusammenhangs berücksichtigt werden. Personen mit ADHS berichten häufig, dass sie das Gefühl haben, hinter ihren Fähigkeiten zurückzubleiben und zu versagen. Bei der Kombination von ADHS und Prokrastination ist es daher möglich, dass bei Betroffenen eine negative Spirale geringerer Selbstwirksamkeit und daraus resul tierend wiederum mehr Prokrastination entstehen kann (Steel et al., 2001; Newark & Stieglitz, 2010). Entsprechend sollten in zukünftigen Studien Konzepte der Selbstwirksamkeit oder auch das der Erlernten Hilflosigkeit mituntersucht werden (Helmke & Schrader, 2000; Rustemeyer & Callies, 2013). Gleichzeitig wäre interessant, Aspekte der Leistungs- oder Bewertungsangst zu erfassen, die mit Prokrastination zusammenhängen (Helmke & Schrader, 2000; Rustemeyer & Callies, 2013) und auch bei ADHS eine Rolle spielen. Auch Variablen wie Zeitmanagement oder das Interesse wie z. B. am Studienfach sollten miterfasst werden (Rustemeyer & Rausch, 2007). Da wir in unserer Studie lediglich einen korrelativen Zusammenhang darstellen konnten, wäre zudem wünschenswert, die Assoziation zwischen Prokrastination und ADHS auch längsschnittlich abzubilden, um mögliche kausale Schlüsse ziehen zu können. Wie Rist und Kollegen (2011) aus ihrer Studie schlussfolgern, ist bei Patienten, die v. a. von Problemen in der Organisation und Selbststeuerung ihrer Arbeiten berichten, neben einer ADHS auch immer an Prokrastination zu denken, und dass die Problematik der Patienten ggf. sogar besser als Prokrastination erklärt werden kann. Entsprechend ist die Therapie dann eher auf die Verbesserung der Organisation und Reduzierung des Aufschiebeverhaltens zu konzentrieren (für einen Überblick an Trainings zur Prokrastination siehe Rustemeyer & Callies, 2013). Dabei scheinen Trainings, in denen die Betroffenen üben, Zeit, Aufgaben und Materialien zu organisieren, vielversprechende Ansätze zu sein, um neben prokrastinierendem Verhalten auch ADHS-Symptome zu reduzieren (Langberg et al., 2008). Zudem scheint es ebenso wichtig, gemeinsam mit Betreuern / Lehrkräften oder auch Vorgesetzten Fristen für Teilziele zu formulieren, diese ggf. auch schriftlich festzuhalten und insgesamt auf eine transparente Zeitplanung zu achten (Hoppe, Prokop & Rau, 2018). Transparenz und die Unterteilung in Teilziele könnten © 2019 Hogrefe
S. Schmiedeler et al., ADHS und Prokrastination
terteilung in Teilziele könnten auch Ansatzpunkte sein, um sehr perfektionistische Personen zu unterstützen. Da die Daten der vorliegenden Studie einen Zusammenhang von (insbesondere des sozial vorgeschriebenen) Perfektionismus sowohl mit Prokrastination als auch mit ADHSSymptomen zeigen, sollte dieser Aspekt bei Interventionen berücksichtigt werden. Dabei könnten Interventionen auch in Abhängigkeit des ADHS-Symptombildes unterschiedlich aufgebaut sein. So könnte es bei Interventionen für primär hyperaktiv-impulsive K lienten zusätzlich förderlich sein, Tendenzen zu sozial vorgeschriebenem Perfektionismus zu thematisieren, um Prokrastination und ADHS-Symptome weiter abzuschwächen. Um in solchen und anderen Bereichen bestmögliche Unterstützungen und Interventionen leisten zu können, genügt die Vielzahl bestehender Ratgeber und ähnlichem nicht, sondern es bedarf eines breiteren und fundierten Wissens über Zusammenhänge und Wirkmechanismen der Prokrastination.
Literatur American Psychiatric Association (2013). Diagnostic and Statisti cal Manual of Mental Disorders, (5th ed.). Washington, DC: American Psychiatric Association. Barbaresi, W. J., Katusic, S. K., Colligan, R. C., Weaver, A. L. & Jacobsen, S. J. (2007). Long-term school outcomes for children with attention-deficit / hyperactivity disorder: A population-based perspective. Journal of Developmental & Behavioral Pediatrics, 28, 265 – 273. Barkley, R. A. (1997). Behavioral inhibition, sustained attention, and executive functions: Constructing a unifying theory of ADHS. Psychological Bulletin, 121 (1), 65 – 94. Barkley, R. A., Fischer, M., Edelbrock, C. S. & Smallish, L. (1990). The adolescent outcome of hyperactive children diagnosed by research criteria: I. An 8-year prospective follow-up study. Journal of Abnormal Child Psychology, 29 (4), 546 – 557. Barkley, R. A., Fischer, M., Smallish, L. & Fletcher, K. (2006). Young adult outcome of hyperactive children: Adaptive functioning in major life activities. Journal of the American Academy of Child and Adolescent Psychiatry, 45 (2), 192 – 202. Bertrams, A. & Dickhäuser, O. (2009). Messung dispositioneller Selbstkontroll-Kapazität: Eine deutsche Adaptation der Kurzform der Self-Control Scale (SCS-K-D). Diagnostica, 55 (1), 2 – 10. Beswick, G., Rothblum, E. D. & Mann, L. (1988). Psychological antecedents of student procrastination. Australian Psychologist, 23, 207 – 217. Casey, B. J. (2015). Beyond simple models of self-control to circuitbased accounts of adolescent behavior. Annual Review of Psy chology, 66, 295 – 319. Cox, B. J., Enns, M. W. & Clara, I. P. (2002). The multidimensional structure of perfectionism in clinically distressed and college student samples. Psychological Assessment, 14 (3) 365 – 373. de Zwaan, M., Gruss, B., Müller, A., Graap, H., Martin, A., Glaesmer, H. et al. (2012). The estimated prevalence and correlates of adult ADHD in a German community sample. European Archives of Psychiatry and Clinical Neuroscience, 262, 79 – 86. © 2019 Hogrefe
33
Döpfner, M. (2011). ADHS von der Kindheit bis ins Erwachsenenalter. PiD – Psychotherapie im Dialog, 12 (3), 212 – 216. Eid, M., Gollwitzer, M. & Schmitt, M. (2010). Statistik und Forschungs methoden. Weinheim: Beltz. Faraone, S. V., Perlis, R. H., Doyle, A. E., Smoller, J. W., Goralnick, J. J., Holmgren, M. A. et al. (2005). Molecular genetics of attentiondeficit / hyperactivity disorder. Biological Psychiatry, 57, 1313 – 1323. Faraone, S. V., Biederman, J. & Mick, E. (2006). The age-dependent decline of attention deficit hyperactivity disorder: A meta-ana lysis of follow-up studies. Psychological Medicine, 36, 159 – 165. Ferrari, J. R. (2000). Procrastination and attention: Factor analysis of attention deficit, boredomness, intelligence, self-esteem and task delay frequencies. Journal of Social Behavior and Person ality, 15, 185 – 196. Ferrari, J. R., Díaz-Morales, J. F., O'Callaghan, J., Día, K. & Argumedo, D. (2007). Frequent behavioral delay tendencies by adults: International prevalence rates of chronic procrastination. Jour nal of Cross-Cultural Psychology, 38, 458 – 464. Ferrari, J. R. & Sander, S. E. (2006). Procrastination rates among non-clinical and clinical adults with ADHD: A pilot study. Coun seling and Clinical Psychology Journal, 3, 2 – 9. Flett, G. L., Blankstein, K. R., Hewitt, P. L. & Koledin, S. (1992). Components of perfectionism and procrastination in college students. Social Behavior and Personality: An International Journal, 20 (2), 85 – 94. Flett, G. L. & Hewitt, P. L. (2002). Perfectionism. Washington, DC: American Psychological Association. Flett, G. L., Hewitt, P. L. & Martin, T. R. (1995). Dimensions of perfectionism and procrastination. In J. R. Ferrari, J. L. Johnson & W. G. McCown (Eds.), Procrastination and task avoidance. Theory, research, and treatment (pp. 113 – 136). New York, NY: Plenum Press. Fritz, M. S. & MacKinnon, D. P. (2007). Required sample size to detect the mediated effect. Psychological Science, 18 (3), 233 – 239. Gawrilow, C., Schmitt, K. & Rauch, W. (2011). Kognitive Kontrolle und Selbstregulation bei Kindern mit ADHS. Kindheit und Ent wicklung, 20 (1), 41 – 48. Hayes, A. F. (2013). Introduction to mediation, moderation, and con ditional process analysis: A regression-based approach. New York, NY: Guilford Press. Helmke, A. & Schrader, F.-W. (2000). Procrastination im Studium – Erscheinungsformen und motivationale Bedingungen. In U. Schiefele & K.-P. Wild (Hrsg.), Interesse und Lernmotivation. Untersuchungen zu Entwicklung, Förderung und Wirkung (S. 207 – 225). Münster: Waxmann. Hewitt, P. L. & Flett, G. L. (1991a). MPS – Multidimensional Perfec tionism Scale. Unveröffentlichte Übersetzung zu Forschungszwecken durch Christine Altstötter-Gleich, Universität Koblenz-Landau. Hewitt, P. L. & Flett, G. L. (1991b). Perfectionism in the self and social contexts: conceptualization, assessment, and association with psychopathology. Journal of Personality and Social Psychology, 60(3), 456 – 470. Hoppe, J., Prokop, P. & Rau, R. (2018). Empower, not impose! Preventing Academic Procrastination. Journal of Prevention & Intervention in the Community, 46 (2), 184 – 198. Kağana, M., Çakırb, O., İlhan, T. & Kandemir, M. (2010). The explanation of the academic procrastination behaviour of university students with perfectionism, obsessive-compulsive and five factor personality traits. Procedia Social and Behavioral Sciences, 2, 2121 – 2125. Kessler, R. C., Adler, L., Ames, M., Demler, O., Faraone, S., Hiripi, E. et al. (2005). The World Health Organization Adult ADHD SelfReport Scale (ASRS): A short screening scale for use in the general population. Psychological Medicine, 35 (2), 245 – 256. Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 23–34
34
Kim, K. R. & Seo, E. H. (2015). The relationship between procras tination and academic performance: A meta-analysis. Persona lity and Individual Differences, 82, 26 – 33. Kroese, F. M. & de Ridder, D. T. D. (2016). Health behaviour procrastination: A novel reasoned route towards self-regulatory failure. Health Psychology Review, 10 (3), 313 – 325. Langberg, J. M., Epstein, J. N. & Graham, A. J. (2008). Organizational-skills interventions in the treatment of ADHD. Expert Review of Neurotherapeutics, 8 (10), 1549 – 1561. Mähler, C., Hasselhorn, M. & Grube, D. (2008). Schulversagen. In F. Petermann & W. Schneider (Hrsg.), Theorie und Forschung (Enzyklopädie der Psychologie, Serie Entwicklungspsychologie, Bd. 7, S. 413 – 447). Göttingen: Hogrefe. Martel, M. M., Goth-Owens, T., Martinez-Torteya, C. & Nigg, J. T. (2010). A person-centered personality approach to heterogeneity in attention-deficit / hyperactivity disorder (ADHD). Journal of Abnormal Psychology, 119 (1), 186 – 196. Mörstedt, B., Corbisiero, S. & Stieglitz, R.-D. (2016). Normierung der Adult ADHD Self-Report-Scale-V1.1 und der ADHS Selbstbeurteilungsskala an einer repräsentativen deutschsprachigen Stichprobe. Diagnostica, 62, 199 – 211. Morris, E. (2017). Impulsivity and procrastination. Science, 357 (6357), 1251. Newark, P. & Stieglitz, R.-D. (2010). Therapy-relevant factors in adult ADHD from a cognitive behavioural perspective. Attention Deficit and Hyperactivity Disorders, 2, 59 – 72. Niermann, H. & Scheres, A. (2014). The relation between procrastination and symptoms of attention-deficit hyperactivity disorder (ADHD) in undergraduate students. International Journal of Methods in Psychiatric Research, 23 (4), 411 – 421. O'Brien, W. K. (2002). Applying the transtheoretical model to aca demic procrastination. Dissertation Abstracts International: Section B: The Sciences and Engineering, 62 (11-B), 5359. Polanczyk, G. V., Willcutt, E. G., Salum, G. A., Kieling, C. & Rohde, L. A. (2014). ADHD prevalence estimates across three decades: an updated systematic review and meta-regression analysis. International Journal of Epidemiology, 43, 434 – 442. Preacher, K. J. & Kelley, K. (2011). Effect sizes measures for mediation models: Quantitative strategies for communicating indirect effects. Psychological Methods, 16 (2), 93 – 115. Pychyl, T. A. & Flett, G. L. (2012). Procrastination and selfregulatory failure: An introduction to the special issue. Journal of Rational Emotive and Cognitive Behaviour Therapy, 30, 203 – 212. Rabin, L. A., Fogel, J. & Nutter-Upham, K. E. (2011). Academic procrastination in college students: The role of self-reported executive functioning. Journal of Clinical and Experimental Neu ropsychology, 33, 344 – 357. Ramsay, J. R. & Rostain, A. L. (2003). A cognitive therapy approach for adult attention-deficit / hyperactivity disorder. Journal of Cognitive Psychotherapy, 17, 319 – 334. Rist, F., Pedersen, A., Höcker, A. & Engberding, M. (2011). Patholo gisches Aufschieben und die Aufmerksamkeitsdefizit- / Hyperaktivitätsstörung. PiD-Psychotherapie im Dialog, 12 (3), 217 – 220. Rotenstein, A., Davis, H. Z. & Tatum, L. (2009). Early birds versus just-in-timers: The effect of procrastination on academic performance of accounting students. Journal of Accounting Edu cation, 27 (4), 223 – 232. Rueda, M. R., Posner, M. I. & Rothbart, M. K. (2011). Attentional control and self-regulation. In R. F. Baumeister & K. D. Vohs (Eds.), Handbook of self regulation: Research, theory, and appli cations (2nd ed., pp. 284 – 299). New York, NY: Guilford Press. Rustemeyer, R. & Callies, C. (2013). Aufschieben, Verzögern, Ver meiden. Einführung in die Prokrastination. Darmstadt: WBG. Rustemeyer, R. & Rausch, A. (2007). Akademisches Aufschiebeverhalten: Zusammenhang mit Erwartungs- und Wert-Variablen. Psychologie in Erziehung und Unterricht, 54, 47 – 58. Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 23–34
S. Schmiedeler et al., ADHS und Prokrastination
Schouwenburg, H. C. (2004). Procrastination in academic settings: General introduction. In H. C. Schouwenburg, C. H. Lay, T. A. Pychyl & J. R. Ferrari (Eds.), Counseling the procrastinator in academic settings (pp. 3 – 17). Washington DC: American Psychology Association. Schouwenburg, H. C. & Groenewoud, J. (2001). Study motivation under social temptation: Effects of trait procrastination. Per sonality and Individual Differences, 30 (2), 229 – 240. Schulz, N. (2008). Procrastination und Planung – Eine Unter suchung zum Einfluss von Aufschiebeverhalten und Depres sivität auf unterschiedlichen Planungskompetenzen. Münster: Westfälische Wilhelms-Universität zu Münster. Schwarzer, R. (1999). KRAS – Prokrastination. In R. Schwarzer & M. Jerusalem (Hrsg.), Skalen zur Erfassung von Lehrer- und Schülermerkmalen. Dokumentation der psychometrischen Ver fahren im Rahmen der Wissenschaftlichen Begleitung des Mo dellversuchs selbstwirksame Schulen (S. 90 – 91). Freie Universität Berlin. Solomon, L. J. & Rothblum, E. D. (1984). Academic procrastination: Frequency and cognitive behavioral correlates. Journal of Coun seling Psychology, 31 (4), 503 – 509. Steel, P. (2007). The nature of procrastination: A meta-analytic and theoretical review of quintessential self-regulatory failure. Psy chological Bulletin, 133 (1), 95 – 94. Steel, P., Brothen, T. & Wambach, C. (2001). Procrastination and personality, performance, and mood. Personality and Individual Differences, 30 (1), 95 – 106. Strohmeier, C. W., Rosenfield, B., DiTomasso R. A. & Ramsay, J. R. (2016). Assessment of the relationship between self-reported cognitive distortions and adult ADHD, anxiety, depression, and hopelessness. Psychiatry Research, 238, 153 – 158. Svartdal, F., Pfuhl, G., Nordby, K., Foschi, G., Klingsieck, K. B., Rozental, A. et al. (2016). On the measurement of procrastination: Comparing two scales in six European countries. Frontiers in Psychology, 7, 1307. Tangney, J. P., Baumeister, R. F. & Boone, A. L. (2004). High selfcontrol predicts good adjustment, less pathology, better grades, and interpersonal success. Journal of Personality, 72 (2), 271 – 324. Wesley, J. C. (1994). Effects of ability, high school achievement, and procrastinatory behavior on college performance. Educational and Psychological Measurement, 54, 404 – 408. Wieland, L. M., Grunschel, C., Limberger, M. F., Schlotz, W., Ferrari, J. R. & Ebner-Priemer, U. W. (2018). The ecological momentary assessment of procrastination in daily life: Psychometric properties of a five-item short scale. North American Journal of Psychology, 20 (2), 315 – 339. Wypych, M., Matuszewski, J. & Dragan, W. L. (2018). Roles of impulsivity, motivation, and emotion regulation in procrastination – path analysis and comparison between students and non- students. Frontiers in Psychology, 9, 1 – 1.
Historie Manuskript eingereicht: 19.04.2018 Manuskript nach Revision angenommen: 19.02.2019 Onlineveröffentlichung: 07.10.2019
Sandra Schmiedeler Julius-Maximilians-Universität Würzburg Begabungspsychologische Beratungsstelle Röntgenring 10 97070 Würzburg s.schmiedeler@psychologie.uni-wuerzburg.de © 2019 Hogrefe
Originalarbeit
The Relationship between Alienation from Learning and Student Needs in Swiss Primary and Secondary Schools Kaja Marcin, Julia Morinaj, and Tina Hascher University of Bern, Switzerland
Abstract: Previous studies have shown that secondary schools are less successful than primary schools in responding to student needs. Simultaneously, students seem to detach themselves during secondary schooling. Based on this, the present study investigated alienation from learning and its relationship with students' perception of needs support by teachers and peers by analyzing data from 486 primary and 550 secondary school students in Switzerland. Multigroup structural equation modeling was employed to analyze the relevance of each independent variable for alienation from learning within and across the two subsamples. Teacher injustice as an indicator for the teacher-student relationship was significantly associated with alienation from learning for both subsamples, whereas there was a significant effect for competence support only in secondary schools. The findings highlight the importance of just and supportive teachers in preventing students' alienation from learning in school. Keywords: School alienation, autonomy and competence support, social relatedness, teacher (in-)justice, student needs Der Zusammenhang zwischen Entfremdung vom Lernen und Schülerbedürfnissen in Schweizer Primar- und Sekundarschulen Zusammenfassung: Forschungsergebnissen zufolge berücksichtigen Sekundarschulen die Bedürfnisse der Schüler_innen weniger gut als Primarschulen. Zugleich distanzieren sich die Jugendlichen zunehmend von der Schule. Entsprechend untersuchte die Studie mit 486 Primarund 550 Sekundarschüler_innen den Zusammenhang zwischen Entfremdung vom Lernen und den Bedürfnissen von Schüler_innen. Multigroup-Strukturgleichungsmodellierung wurde verwendet, um die Relevanz der unabhängigen Variablen für die Entfremdung vom Lernen innerhalb und zwischen den beiden Teilstichproben zu analysieren. Es zeigte sich bei beiden Teilstichproben ein signifikanter Zusammenhang zwischen der Entfremdung vom Lernen und Ungerechtigkeitserfahrungen durch Lehrpersonen, verstanden als Indikator für fehlende soziale Eingebundenheit. Kompetenzunterstützung hingegen konnte nur bei den Sekundarschüler_innen einen signifikanten Anteil der Varianz in der Entfremdung vom Lernen erklären. Die Ergebnisse unterstreichen die Bedeutsamkeit gerechter und unterstützender Unterrichtsgestaltung für die Prävention der Entfremdung vom schulischen Lernen. Schlüsselwörter: Schulentfremdung, Autonomie- und Kompetenzunterstützung, Soziale Eingebundenheit, (Un-)Gerechtigkeitserfahrungen, Schüler_innenbedürfnisse
Secondary schools are generally considered to be less supportive of student needs than primary schools, with students who are often less motivated and more detached from learning (e. g., Symonds & Hargreaves, 2016). There is a general consensus that many negative school phenomena evolve as students move from primary to secondary school (e. g., Stern, 2012). It has been shown that negative attitudes toward school arise over the course of students' educational trajectory, and particularly in secondary school, which can manifest into school alienation (e. g., Brown, Higgins & Paulsen, 2003; Hascher & Hagenauer, 2010). School alienation refers to the development of students detaching and withdrawing from school in various domains: School alienation can form towards a) the learning process, b) the teachers and c) their classmates (Ha© 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
scher & Hadjar, 2018). The focus in this paper is on a) alienation from learning (AL). Students alienated from the learning process at school experience a wide range of emotional and psychological difficulties (Johnson, 2005), which may result in behavioral disorders in school. From the perspective of schools, disciplinary problems and minimal student participation in class are some of the main issues (Demanet & van Houtte, 2011; Hascher & Hadjar, 2018; Johnson, 2005; Tarquin & Cook-Cottone, 2008). Based on AL, students may also develop alienation from any form of institutionalized learning (i. e., academic alienation), which can eventually lead to their exclusion from “the community of learners in our learning society” (Hascher & Hagenauer, 2010, p. 2 20). To prevent or to mitigate such detrimental consequences, we Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49 https://doi.org/10.1024/1010-0652/a000249
36
need to better understand AL and its relationship with factors related to the context it evolves in—that is, the school and classroom setting. So far, studies investigating AL in different educational settings (e. g., contrasting the settings of primary and secondary schools) are lacking (see also Hascher & Hadjar, 2018). In this article, we have investigated the relationships between proximal, non-cognitive variables and AL in two different school contexts. By investigating variables linked to the fulfillment of student needs and their association with AL in grade 4 (when students are not yet affected by any selection processes of the primary-to-secondary school transition) and in grade 7 (when transition effects should already have manifested themselves), we seek to deepen our understanding of school alienation from the learning process in both primary and secondary school.
From Alienation toward School Alienation to Alienation from Learning The original concept of alienation can be traced back to Karl Marx's term “estranged labour” (1844), which denotes an unfavorable relationship between people and their work or the products thereof (Hascher & Hadjar, 2018). In the school context, alienation has been described as “the estrangement of the learner from what they should be engaged in, namely the subject and process of study itself ” (Mann, 2001, p. 8). Other studies have addressed the construct of alienation as a subcomponent of academic amotivation (Legault, Green-Demers, & Pelletier, 2006), as the opposite of engagement (Case, 2008; Glanville & Wildhagen, 2007), and as a mere synonym for disengagement (Altenbaugh, Engel, & Martin, 1995). It has also been suggested, however, that alienation is not a prerequisite for disengagement (Barnhardt & Ginns, 2014). Until recently, we lacked a clear definition of what lies at the core of school alienation, and a profound discourse on how it differs from other similar constructs and how it should be measured was missing. A recent study reviewed the corpus of alienation literature, considering the plethora of definitions, conceptualizations, and operationalizations of school alienation (Hascher & Hadjar, 2018). Based on theoretical and empirical findings, the authors addressed school alienation as a multidimensional and domain-specific construct. In our study, we follow Hascher and Hadjar's (2018) conceptualization of school alienation as consisting of negative attitudes that develop in a domain-specific manner, encompassing both cognitive and affective components: Students can be alienated (a) from learning processes at school and / or (b) from social actors at school (i. e., their classmates as their peer community (c) and / or their teachers as part of the social environment and representaZeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
K. Marcin et al., Alienation from Learning and Student Needs
tives of the school community. The cognitive component refers to students' perceptions, assumptions, and beliefs in relation to learning, classmates, and teachers, while the affective component is related to students' feelings toward these three domains of schooling. As shown by the validation study on the School Alienation Scale (Morinaj et al., 2017), emotion and cognition can be viewed as interrelated psychological processes, given relatively high positive correlations between emotional and cognitive aspects. The same study showed that the school alienation domains can be considered as relatively independent but interrelated dimensions. Additionally, the degree of alienation may differ depending on the domain measured—that is, students may be more alienated from one domain, e. g., from their teachers, for instance, than from another domain, e. g. from their peers (e. g., Brown et al., 2003). We assume that not only the degree but also the underlying causes and the ensuing consequences vary across the different domains. In the current study, the focus lies on the learning domain of school alienation, i. e., alienation from learning. Alienation from learning (AL), as one of three domains of school alienation, refers to students' negative perception of the learning environment, the learning tasks and the learning process, cumulating in students' complete withdrawal from learning in school. AL has been differentiated into a process “characterized by discrepancies that a student perceives between his or her preferred vs. actual experience as a learner, or between a student's own activity vs. affect (selfestrangement) as a learner” (Barnhardt & Ginns, 2014, p. 973), while an alienated state is “a sense of disconnection between one's self and the task of meaningful learning, and / or between one's own activity and affect (self-estrangement) in relation to the task of meaningful learning” (Barnhardt & Ginns 2014, p. 973). AL can thus change in terms of a state and ultimately solidify in terms of a trait (see also Hascher & Hadjar, 2018). We have followed Hascher and Hadjar (2018) and conceptualized AL as a set of negative attitudes towards learning at school, while alienated behaviors (e. g., low student participation, deviancy) or alienated forms of learning motivation are considered to be causes and / or consequences of this phenomenon. Students alienated from learning struggle to find any relationship between the school's curriculum and their social realties outside the educational institution (Çağlar, 2013). In this regard, AL shows similarities to the utility value construct (as conceptualized in expectancy-value theory), which refers to how well a certain learning task fits with students' future plans and how useful for future endeavors they believe it to be (Wigfield & Eccles, 2000). In line with previous findings on the development of school alienation, children's subjective values of school tasks tend to decline as they go through school, and to be most vulnerable to declines after school transitions and structural © 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
K. Marcin et al., Alienation from Learning and Student Needs
changes in the school environment (Watt, 2004). However, the declines in utility values were found to vary across different school subjects (e. g., Wigfield et al., 1997). Although a few studies have recently theoretically outlined AL as a generalized negative orientation toward learning in school (see also Hascher & Hadjar 2018; Morinaj et al., 2017), or in other words, a more general negative attitudinal phenomenon across different subjects in a school syllabus, this topic requires further investigation. AL at school may contribute to the growth of negative attitudes toward education in general and result in an even broader sense of academic alienation (i. e., students becoming alienated from various kinds of institutionalized learning).
Toward a Conceptualization of Student Needs An array of needs-related theories (e. g., Alderfer, 1972; Maslow, 1943; McClelland, 1961; Murray, 1938) has constituted the theoretical basis for past and current empirical psychological studies. The needs concept is often positively connoted as a nutriment; a human being is said to require the fulfillment of both physiological and psychological needs for their optimal growth, health, and wellbeing (Ryan & Deci, 2017). In other approaches the term “need” is negatively associated with deprivation, lack, harm or discrepancy and needs to be avoided, or it is used as a place-holder for goals, drives, and potential which cannot be categorized as either positive or negative such as in Maslow's hierarchical sets of goals, drives or motivators of human behavior (Watkins & Kavale, 2014). According to Ryan and Deci (2017), the concept of human psychological needs has often been conflated with other motivational concepts such as wants, motives, desires, or preferences—all of which represent motivating forces in people; however, to be called a basic psychological need, its satisfaction must foster well-being, and its deprivation significantly cause harm in the individual, which is not necessarily the case for mere wants or desires. To be a student need, its fulfillment must, thus, lead to observable, positive consequences for students' learning outcomes and well-being in school, or its nonfulfillment must cause significant harm. Most needs theories in psychology (e. g., Maslow's Hierarchy of needs or Deci and Ryan's Basic Psychological Needs Theory) focus on individual-level needs; nevertheless, there are also group-specific needs, and the definition of needs, thus, must be placed within its context, ranging from micro- to meso-level (e. g., social groups, organizations, institutions, but also entire societies may have their own set of needs) (Kaufman, 2011; Watkins & Kavale, 2014). Consequently, a school constitutes one particular context and the students of a school form a particular group with their own particular needs.” © 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
37
The Role of the School Context and Student Needs in AL School Context and AL AL may begin in the early grades (Finn, 1989), but increases in particular during adolescence, and is aggravated by the educational transition from primary to secondary school (Hascher & Hadjar, 2018). Following initial curiosity and high expectations along with positive feelings and thoughts about the new secondary school (Booth & Gerard, 2014), a downward spiral seems to set in (Wang & Eccles, 2012). This phase is associated with students' loss of enjoyment of learning and engagement at school, which is often accompanied by a decline in their achievement within the new educational setting and thus has become an issue of great international educational concern (e. g., McGee, Ward, Gibbons, & Harlow, 2003; OECD, 2004, 2017). Explanations for this decrease in students' interest and the emergence of more negative orientations in secondary school may be drawn from the stage-environment fit theory (SEF; Eccles & Midgley, 1989). According to SEF theory, negative changes in young adolescent students' lives do not merely result from maturational processes but also partly from an increasing misfit between the adolescents' educational environment and their developmental needs. Such students are in a developmental stage, growing from children into adolescents, but very often schools do not respond to the associated changes. The resulting misfit can lead to a decline in mental wellbeing and school engagement, triggering feelings of estrangement which, in turn, may result in a drop in the affected students' performance (Eccles & Midgley, 1989). As students enter secondary education, they face substantial changes in their school environment. Primary school environments are typically smaller, with classroom teacher systems and stable peer groups, whereas the new secondary schools more often are bigger and characterized by a less familiar atmosphere (Eccles & Midgley, 1989). In addition, ability grouping or tracking not only makes school days more demanding for most secondary students, but also results in diverse organizational structures and classroom practices that vary considerably from school to school (Eccles & Midgley, 1989). Students may experience their new secondary school settings quite differently depending on how the schools and their teachers in particular assist them in adapting to the new school environment (Hagenauer, Reitbauer, & Hascher, 2013) and support them in fulfilling their needs. While some research has concluded that students' perceptions of school with regard to need fulfillment indeed change for the worse when students enter secondary school (e. g., Barber, & Olsen, 2004), another study could not find proof that there was an abrupt change in students' perception of needs support associated Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
38
with the transition phase, but rather an age-related linear downwards trend throughout students' school trajectories (e. g., Bru, Stornes, Munthe, & Thuen, 2010). Student Needs and AL The satisfaction of the basic psychological needs for competence, autonomy, and relatedness, as defined in self-determination theory (SDT), has been identified as an important predictor for individuals' wellbeing, the development of intrinsic motivation, integrity, and growth (Deci & Ryan, 2000). If students' needs are not satisfied in educational settings, intrinsic motivation will be undermined, leading to a so-called “‘alienated’ type of extrinsic motivation that is associated with low student persistence, interest, and involvement” (Ryan & Deci, 2000, p. 56). Alienation may ensue from indifferent, unstable motivational dispositions combined with situationally demotivating school experiences (Legault et al., 2006). Hence, from the perspective of SDT, the development of AL can be explained as the severe outcome of educational settings that hinder or do not allow students to fulfill their basic psychological needs (Ryan & Deci, 2000). When the basic needs are not met, reduced motivation or alienated extrinsic motivation can follow, ultimately causing an overall sense of alienation and anomie (Deci & Ryan, 2000). Studies have shown that alienation in a school setting can arise from recurrent negative school experiences and low achievement (Eccles & Roeser, 2009; Hascher & Hagenauer, 2010; Tarquin & Cook-Cottone, 2008). Low achievers have been found to be particularly at risk for school alienation (Hascher & Hagenauer, 2010) and to generally experience less competence in their daily school lives. Students are accustomed to referring to their school grades in the construction of competence views about their own academic abilities (Gniewosz, Eccles, & Noack, 2012). Hence, if students repeatedly receive negative feedback in the form of low grades, it can affect their self-efficacy beliefs, consequently causing students to withdraw from the learning process (Eccles et al., 1993; Legault et al., 2006). Although the secondary school learning environments vary as to how well students are provided with the optimal structure and feedback necessary for them to experience competence (Wang & Eccles, 2012), students seem generally to experience less competence in secondary than in primary school due to higher academic demands in the new school setting (Alspaugh, 1998; McGee et al., 2003). Moreover, in secondary school, students are allocated to different school tracks based on prior academic achievement in primary school. Those students that have not been assigned to the desired educational program might move to their new schools already with a sense of school failure. Together with low school grades, achievement tracking may be another factor in students' school experiences trigZeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
K. Marcin et al., Alienation from Learning and Student Needs
gering the development of alienation in secondary school (Reilly & Mitchell, 2010). In addition, students may perceive the decision-making process regarding their allocation to a particular school track as externally determined and, as a result, their basic need for autonomy—naturally desired by maturing adolescent students (Eccles et al., 1993)—may be particularly thwarted in secondary school. Secondary schools are also said to be generally more controlling than primary schools, possibly due to prevailing stereotypes about early adolescents (Midgley, Feldhaufer, & Eccles, 1988) and because the subject teacher system and larger classes in most secondary schools make it harder for the teachers to get to know and trust the students than it is for their colleagues in primary school. At the same time, young adolescents are confronted with the task of finding a balance between wanting to belong to a peer group and being rejected or isolated from a social group; according to Newman and Newman (2003), this makes early adolescence (i. e., ages 13 – 17) a phase of particular vulnerability to alienation. Deci and Ryan (2000) further contend that a sense of relatedness is a necessary precondition for students to cherish certain classroom values that are important for student motivation, learning, and goal pursuit. If students are deprived of this function of the school (i. e., not able to share their values, beliefs, and fears with peers), and if they cannot fulfill their need for relatedness, alienation may ensue, impacting students' attitudes toward all aspects of schooling. Students who feel disconnected from their classmates tend to be less motivated to study and perform well at school (e. g., Skues, Cunningham, & Pokharel, 2005). In the same vein, teachers perceived by the students as neglectful, disrespectful, unfair, and unmotivated have been found to reinforce student feelings of alienation from school and the learning process (Dalbert, 2011; Hascher & Hagenauer, 2010; Murdock, 1999; Osterman, 2000). Accordingly, prior empirical research has shown that the student-teacher relationship and peer integration have a particularly powerful impact on school alienation (Hascher & Hagenauer, 2010). Teacher (In-)justice and AL Early on, nonsatisfaction of student needs and injustice perceptions were considered key factors in the process of alienation (Finn, 1989). Similar to nonsatisfaction of basic needs, perceptions of injustice can negatively affect students' wellbeing, motivation, attitudes toward, and actual behavior at school (Hascher, 2004; Resh & Sabbagh, 2014), whilst perceptions of basic needs support and justice can both foster engagement (Tyler & Blader, 2003). Justice and its effects on individuals' behavior and development in a social context have been fairly well re© 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
K. Marcin et al., Alienation from Learning and Student Needs
searched in organizational psychology (e. g., Colquitt, Greenberg, & Zapata-Phelan, 2005). Only recently has justice, as a factor in students' wellbeing, engagement, and ultimately learning, received more attention in the educational sciences (e. g., Dalbert, 2013). Nevertheless, a sound theory which incorporates justice is still lacking and empirical investigations into the potential impacts of perceptions of (in-)justice on student learning, motivation or attitudes are scarce. Despite referring to justice several times in the development of his theory of human needs and motivation, Maslow (1943) did not declare it to be a basic human need. Recent research, however, has suggested giving this neglected factor its due status as a basic psychological human need (Taylor, 2017). Whether and how justice is linked to the three psychological basic needs—autonomy, competence, and relatedness—is yet to be determined. Research in occupational psychology has shown that justice plays a key functional role in regulating autonomy satisfaction during decision-making procedures (van Prooijen, 2009). Autonomy dissatisfaction may go hand in hand with students feeling treated unfairly. In other words, students may feel unfairly treated if they think they are not given a voice during any decision-making processes at school or lack autonomy in their daily school lives. In recent empirical studies, students' perceptions of fairness have been found to be highly correlated with students' expressions of alienation (Çağlar, 2013; Dalbert, 2011; Mahmoudi, Brown, Saribagloo, & Dadashzadeh, 2015; Pretsch et al., 2016). Teachers play a crucial role in this relationship, as they are primarily in charge of providing rewards, individual learning opportunities, feedback, evaluations, and needs support in the classroom and, thus, can be viewed as the main sources of (in-)justice in the school context (Resh & Sabbagh, 2014). Relatedness in the classroom is associated with students feeling that their teachers genuinely like, value, and respect them (Niemiec & Ryan, 2009). A positive teacher-student relationship, characterized by mutual respect and recognition, cannot be established when students perceive that teachers treat them unfairly. Thus, perceived teacher injustice can also be viewed as an indicator of students' perception of the teacher-student relationship, which has been found to be a substantial factor in students' feelings of overall integration in the classroom and ultimately their sense of belongingness in the entire school environment (e. g., Donat, Umlauft, Dalbert, & Kamble, 2012; Jiang, Liu, Ding, Zhen, Sun, & Fu, 2018), or the lack thereof (Hascher & Hagenauer, 2010). Therefore, students' perception of teacher injustice is considered to be an indicator of a lack of teacherstudent relatedness. Similar to the universality of the three basic psychological needs (Deci & Ryan, 2000), justice in general seems to © 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
39
be a matter of significance for all human beings at any stage in their life (Taylor, 2017). But the little empirical evidence on justice in an educational context implies that there are vast individual differences in perceptions of justice and that these vary across school contexts and student age cohorts (Peter, Donat, Umlauft, & Dalbert, 2013). The period of adolescence is characterized by changes in social behavior: social interactions become more prosocial and less competitive (Eisenberg, Miller, Shell, McNalley, & Shea, 1991; Steinberg, 2005). Students' prosocial behavior and concerns grow with the increasing ability to adopt perspectives other than their own (Eisenberg et al., 1991; Martin, Sokol, & Elfers, 2008). Consequently, as students enter adolescence and at the same time move to secondary school, they may become more sensitive to issues of fairness or justice in the classroom as compared to when they were still at primary school. Indeed, empirical studies have shown such age-related changes in awareness and concerns about fairness issues (Güroğlu, van den Bos, & Crone, 2009). Accordingly, increased AL in secondary school, accompanied by a lack of interest in and enjoyment of school, as well as a lack of learning and achievement motivation, can be viewed as the consequence of educational settings that do not allow students to fulfill their basic psychological needs (i. e., their need to experience competence, autonomy, and relatedness), and fail to prevent or foster perceptions of injustice.
Aim of Research and Hypotheses The aim of the study was twofold. First, we aimed at exploring whether grade 4 and grade 7 students significantly differed in AL, with higher levels in secondary school (Hypothesis 1). We expected grade 7 students to exhibit higher AL due to the onset of early adolescence and students' move to secondary schools that often fail to meet students' needs (Eccles & Midgley, 1989). Secondly, we aimed at investigating the association between student needs fulfillment (as reflected by teacher competence and autonomy support, peer integration, and teacher injustice perceptions) and AL. Previous findings have shown that students' attitudes toward school and students' perceptions of needs support in the learning environments are correlated (e. g., Çağlar, 2013; Mahmoudi et al., 2015). The current study went beyond prior research by examining the quality of the associations between the aforementioned constructs and AL in two different school contexts (i. e., primary and secondary school). Based on the theoretical considerations and previous empirical findings presented earlier, we proposed that competence support, autonomy support, and peer integraZeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
40
tion were negatively associated with AL (Hypotheses 2a– 2c), whereas teacher injustice (as an indicator for a lack of teacher-student relatedness) was positively associated with AL (Hypothesis 2d). Because students are used to referring to their school grades in the construction of competence views about their academic abilities, we controlled their mean school grades. We further controlled students' gender, as boys have been found to be more strongly alienated than girls (Hadjar & Lupatsch, 2010; Hascher & Hagenauer, 2010). We assume that the proposed associations can be found for both school contexts (Hypothesis 3), because these needs are theorized to be universal in nature and need to be fulfilled and supported for students among all age groups in order for them to become fully engaged at school (Deci & Ryan, 2000; Taylor, 2017). However, due to differences in the school contexts, and because adolescent secondary school students are more concerned with and increasingly aware of their own needs and their teachers' role in supporting needs fulfillment than primary school student (e. g., Eccles & Midgley, 1989), these needs may be perceived as supported and fulfilled to a different level across the different school contexts. Hence, we expect to find lower mean scores for all needs-related variables in secondary rather than in primary school (Hypothesis 4).
Method Participants and Sampling The sample included 486 students from Swiss primary schools in grade 4 (Mage = 10.36 years [SD = .98]; 47.3 % male) and 550 secondary school in grade 7 (Mage = 13.00 years [SD = .55]; 45.2 % male). Data was collected within the framework of the binational research project “School Alienation in Switzerland and Luxembourg“ (SASAL) using a standardized paper-and-pencil questionnaire, personally administered by trained personnel during normal school hours at the beginning of the second school semester in the Swiss canton of Bern in 2016. Within this project, a priori power analyses were conducted to determine the minimum sample size to test complex models, using the power analysis program for statistical tests G*Power (Faul et al. 2007). The analyses were based on the amount of error we were willing to tolerate (i. e., +/– 5 %) and indicated that 400 subjects per group were needed in order to detect small effects with reasonable power when employing the .05 criterion of statistical significance. Schools, teachers, and students were solicited by convenience sampling. Random sampling of schools and classes was considered impossible, because the Bernese schools Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
K. Marcin et al., Alienation from Learning and Student Needs
have been subject to many empirical studies and interventions in recent years. Nevertheless, a great effort was made to include a range of urban, suburban, and rural schools in order to generate a well-balanced sample. In a first step, school principals and class teachers were approached and given information about the goals and benefits of the research project. In a second step, class teachers asked their students to participate and distributed consent forms to be signed by parents. Students were assured of anonymity and confidentiality as well as given incentives to increase participation. In total 31 primary and 30 secondary school classes from 40 schools participated in the study with a participation rate of 85 % to 100 % of students per class. The Swiss education system is quite diverse, because the responsibility for education mainly lies with the 26 cantons and the local municipalities that run the schools (EDK, 2017), leading to inter-cantonal and local differences. Children enter primary school in most cantons when they are about six years old and, depending on the canton / municipality, stay in primary school until grade 4, 5, or 6 (EDK, 2017). In lower secondary education, students are taught in ability groups for all or some subjects and are allocated to different school tracks. In the canton of Bern, the Real (the lower) track usually leads to vocational training, whereas the Sek (the middle) and the Spez-Sek (the upper) tracks may conclude in academic training at grammar schools (Kantonsschule or Gymnasium), which prepare students for further studies at the university level, the Spez-Sek track being the most direct path. In 2015/16, 35 % of Bernese students were in the Real track, 60 % in the Sek or Spez-Sek tracks, and the remaining 5 % in private schools or classes with special-needs support (Allraum, Marti, Wassmer, & Bucher, 2016). The majority of the secondary students in our sample (64 %) were students from the Sek and Spez-Sek tracks, while the remaining 36 % attended the Real track, approximating the distribution in the population in the Swiss canton of Bern.
Measures The dependent variable, AL, is one of three subscales of the newly developed School Alienation Scale (SALS) (Hascher & Hadjar, 2018; Morinaj et al., 2017). A validation study has provided empirical support for a three-factor structure of school alienation (i. e., alienation from learning, alienation from teachers, and alienation from classmates), and the SALS was found to be a reliable measure of school alienation in all three domains (Morinaj et al., 2017). AL is defined as a specific set of negative attitudes toward learning in a school setting, including both emotional and cognitive elements. This measure was derived from students' responses to statements describing their learning experiences. AL scores were derived from eight items (e. g., “Learning at school is a com© 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
K. Marcin et al., Alienation from Learning and Student Needs
plete waste of time” (cognitive aspect); “I don't find pleasure in learning at school” (emotional aspect); α = .87 and ω = .87 for grade 4, and α = .88 and ω = .88 for grade 7). The following explanatory variables were included. The competence support and autonomy support scales were adapted from Müller and Thomas (2011). Each scale was composed of five items measuring students' perceptions of how well their teachers support them in gaining a sense of mastery over learning content (e. g., “My teachers explain the learning content really well” for the competence support scale) and how well they understand their perspectives and encourage them in expressing their own thoughts (e. g., “My teachers are responsive to our suggestions and ideas” for the autonomy support scale). Internal consistency reliability of both scales ranged between α = .78 and ω = .79, and α = .83 and ω = .83 for both grade 4 and grade 7. The peer integration scale consisted of seven items adapted from Rauer and Schuck's (2003) questionnaire on emotional and social experiences at school (FEESS 3 – 4). Including items such as “My classmates are kind to me”, it captures the extent to which students feel accepted and supported by their classmates. High scores on this scale, thus, indicate a strong sense of relatedness in class. Internal consistency reliability was good, with α = .89 and ω = .89 for grade 4, and α = .88 and ω = .89 for grade 7. The scale teacher injustice comprised four items, adapted from Dalbert und Stöber's (2002) Just School Climate scale. It measured students' feelings of unfairness at school, at the hands of teachers (e. g., “My teachers do not treat me fairly”; α = .70 and ω = .73 for grade 4, and α = .74 and ω = .74 for grade 7). For each item, participants rated their agreement on a four-point Likert scale ranging from 1 (not true) to 4 (true). Factor analyses have proven adequate construct validity of all measures in both groups (i. e., grade 4 and grade 7). Included in the analysis were the covariates: gender (female = 0, male = 1) and mean school grades as one indicator of academic achievement. The mean scores reflecting students' current school performance were based on their final grades in German, French, and mathematics (the main subjects in Swiss schools) at the end of the second semester, as provided by their teachers. In Switzerland, a sixpoint grading scale is used, where 6 represents the highest and 1 the lowest possible grade.
Analytic Strategy The present study aimed at examining relationships across two different school contexts, i. e., primary and secondary school. By applying structural equation modeling (SEM) using a multigroup approach, the relationships between the dependent variable AL and the independent variables © 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
41
were analyzed at the student level within each school context. Moreover, it was investigated whether the relationships between AL and the independent variables are similar across the two subsamples. Lastly, we compared the latent mean scores of all factors across the two groups–given scalar invariance. Before performing SEM, the frequency distributions of AL were checked for normality and the missing data patterns were evaluated. The percentage of missing values due to student nonresponse varied between 0.4 % and 32.7 % (i. e., autonomy support being the variable with the highest amount of missing values followed by competence support with 29.8 %) in grade 4 and 0.2 % and 5.5 % in grade 7 at the item level. The full information maximum likelihood (FIML) estimation was used as a means for handling the missing data. It produces accurate standard errors by retaining the sample size (Schlomer, Bauman, & Card, 2010). With FIML, parameters are estimated based on the available complete data and the implied values of the missing data (Enders, 2006). The distribution of AL as assessed by the ShapiroWilk' s test (p < .05) and inspection of Q-Q plots deviated from normality in both samples; hence we applied an estimator with robust standard errors (i. e., robust maximum likelihood estimation method) to obtain reliable statistical results (Brown, 2015). In order to identify the most appropriate statistical technique for the main analytic procedure, we explored to what extent AL and the independent factors were individually experienced and / or classroom phenomena. Although there was a significant amount of variance between classrooms, the intraclass correlation coefficient (ICC) for AL indicated that most of the variance in AL can be attributed to withinclassroom differences (i. e., 89 % in grade 4 and 87 % in grade 7). The same applies to the independent factors, with ICCs ranging between .01 and .10, indicating that 90 – 99 % of the variation in the independent factors is to be attributed to individual differences (see Table 1). Based on this considerable amount of variability at the student level and because the focus of this study is on students' individual and subjective perceptions of their situation in the classroom, SEM seemed to be an appropriate method of analysis. Stratification, non-independence of observations, and unequal probability of selection due to data from students nested in classrooms were taken into account and the standard errors and chi-squared test of model fit were adjusted accordingly (command type is complex) (Muthén & Muthén, 1998 – 2012). The main analyses contained two major steps. We first conducted measurement invariance (MI) tests, as MI is a prerequisite for valid group comparison (e. g., Millsap, 2012). We applied multigroup confirmatory factor analysis (CFA), a well-recognized approach for testing MI across particular groups of interest (Steenkamp & Baumgartner, Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
42
K. Marcin et al., Alienation from Learning and Student Needs
1998). A step-up procedure was employed, following Christ and Schlütter (2017): First, separate measurement models for AL and the independent factors for each group were constructed to test for configural invariance (to test whether the same CFAs were valid for both grade 4 and grade 7). None of the parameters were constrained to be equal across the groups in the configural models, and their fit indices served as baseline values for all subsequent models in testing for MI. Second, factor loadings were held equal across groups, but the intercepts were allowed to differ to test for metric invariance. As metric invariance, or at least partial metric invariance—a prerequisite for further MI testing (Vandenberg & Lance, 2000)—was confirmed, scalar invariance or partial scalar invariance, respectively, was tested by keeping the earlier specified constraints in addition to constraining item intercepts to be the same across groups. Lastly, we conducted Satorra-Bentler scaled difference chisquared tests between the non-restricted and restricted models (Satorra & Bentler, 2001). A non-significant result of the chi-square difference test would indicate invariance between the models. In addition, following the guidelines for testing measurement invariance with an adequate sample size (i. e., total N > 300; Chen, 2007), for testing metric and scalar invariance, a change of ≥ –.010 in CFI indicate noninvariance. The difference in CFI (ΔCFI) was chosen as the main criterion to define invariance, representing the empirically best supported criterion for determining evidence of measurement invariance (Chen, 2007; Cheung & Rensvold, 2002; Hirschfeld & von Brachel, 2014). In the next step, we addressed our hypotheses regarding the relations between students' gender, achievement, perceived competence and autonomy support, teacher injustice, peer integration, and AL, using multigroup SEM. To test whether some of the structural path coefficients differed significantly for primary and secondary school stu-
dents, we ran two models, one with the paths held equal and a second one with the paths not constrained to be equal. A chi-squared difference test of the unstandardized coefficients was subsequently run to determine whether the associations between the investigated variables were significantly different across primary and secondary schools. For both MI and SEM analyses, we assessed the goodness of fit of our statistical models based on several fit indices: Chi-square, the Comparative Fit Index (CFI), the Root Mean Square Error of Approximation (RMSEA), and the Standardized Root Mean Square Residual (SRMR). RMSEA and SRMR values of close to 0.05 or less indicate a close fit of the model in relation to the degrees of freedom (Hu & Bentler, 1999; Schermelleh-Engel, Moosbrugger, & Müller, 2003) and CFI values close to 1 a very good fit (Browne & Cudeck, 1993; Schermelleh-Engel et al., 2003). Finally, based on the results of the MI analyses, we further conducted the test of factor mean differences between the groups. We compared the model in which the factor means were fixed to zero in both groups to the model in which the factor means were fixed to zero only in one group (Muthén & Muthén, 1998 – 2012). The fit of the two models was then compared using chi-square difference testing (Satorra & Bentler, 2001).
Results Sample Description The descriptive statistics and intercorrelations of the variables for grade 4 and grade 7 are shown in Table 1. Significant relationships were found between AL and all independent
Table 1. Descriptive Statistics and Intercorrelations of the Study's Variables
Variable 1. Male (female)
Grade 4
Grade 7
M (SD)
M (SD)
.47 (.50)
.45 (.50)
1
2 –.20**
3
4
–.01
–.05
5 –.11*
2. Mean school grades
5.04 (.55)
4.73 (.46)
–.16**
3. Competence support b
3.58 (.48)
3.33 (.50)
–.03
.13*
4. Autonomy support
3.43 (.51)
3.23 (.52)
–.05
.05
3.43 (.60)
3.42 (.58)
.01
.09
.20**
.28**
1.50 (.57)
1.50 (.53)
.04
–.25**
–.35**
–.37**
–.27**
1.54 (.53)
1.83 (.56)
.11*
–.05
–.34**
–.32**
–.20**
a
5. Peer integration
b
b
6. Teacher injustice b 7. Alienation from learning
b
.09*
6
7
.24**
.11**
.07
.12**
–.25**
–.13**
.61**
.28**
–.39**
–.45
.24**
–.40**
–.42**
–.27**
–.15**
.58**
.42**
.32**
Intraclass correlation coefficient grade 4
.10
.04
.03
.05
.11
Intraclass correlation coefficient grade 7
.14
.09
.09
.10
.13
Notes: Grade 4 correlations are below the diagonal (N = 486); grade 7 correlations are above the diagonal (N = 550); *p < .05, **p < .01. a Variable coding: 1 = lowest grade … 6 = highest grade. b Variable coding: 1 = not true … 4 = true.
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
© 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
K. Marcin et al., Alienation from Learning and Student Needs
43
variables in both grades. The patterns of correlation were as expected, also supporting the proposed direction of the association between basic needs support and AL.
Measurement Invariance Measurement invariance was tested separately for all latent factors, applying the multigroup CFA method. All tests of measurement invariance were conducted via a series of hierarchically nested models (configural, metric, and scalar invariance models). The fit indices for the models that tested measurement invariance for AL are presented in Table 2. The model fit of the unconstrained configural model indicated that the same CFAs of AL are valid for both grade 4 and grade 7 (see Table 2). When testing for metric invariance, the chi-squared difference test (accompanied by testing for the difference in CFI (ΔCFI) between the baseline model and the metric invariance model indicated a significant decline in model fit. Hence, we proceeded to test for partial metric invariance. In this model, the factor loading of one item of the cognitive aspect of AL (i. e., AL_9 “What we learn at school, does not help me in life”) was allowed to vary across the two groups. The chi-squared test was significant (χ2 = 89.65, df = 37, p < .001), but as the chi-squared test is very sensitive to sample size and is not the sole indicator for acceptance or rejection (Browne & Cudeck, 1993; Schermelleh-Engel et al., 2003), we assumed partial metric invariance based on a change of CFI = .00. An acceptable fit was also indicated by the overall fit indices CFI, RMSEA, and SRMR (see Table 2). Partial scalar invariance, however, could not be established as both indicated by the significant chi-squared test and the significant change of .03 in CFI. The test of measurement invariance was also conducted separately for the independent variables, including autonomy and competence support, teacher injustice, and peer integration, through a series of hierarchically nested models (configural, metric, and scalar invariance models). The fit indices for the models that tested measurement invariance are presented in Table 3. Each of the three invari-
ance models produced an acceptable fit. The series of model comparisons in regard to autonomy and competence support indicated that metric and scalar invariance between primary and secondary school students was confirmed, indicating the equivalence of factor loadings and intercepts, because the chi-square test was not significant and ΔCFI was below .01 (Chen, 2007). In regard to injustice, the baseline model was just-identified with zero degrees of freedom. The model was compared to other nested models with zero degrees of freedom (zero was used for both chi-square and for the degrees of freedom). Model comparisons revealed that the factor loadings could be assumed to be equal (the chi-square test was not significant and ΔCFI was below .01). However, scalar invariance could not be established, revealing non-equivalence of intercepts between the two groups. After inspecting modification indices, potential sources for noninvariance were not detected. Testing measurement invariance of peer integration, the results indicated metric invariance across primary and secondary school students. However, neither scalar nor partial scalar invariance could be established. Our findings, confirming scalar invariance for autonomy and competence support, metric invariance for injustice and peer integration, and partial metric invariance for AL between primary and secondary school students, suggest that differences in relationships between the two groups involving AL and student needs can be evaluated; however, this does not allow us to analyze mean differences for AL, injustice, and peer integration, as at least partial scalar invariance would be needed (e. g., Christ & Schlütter, 2012). Although the average scores for AL imply higher levels of alienation in grade 7 (M = 1.83, SD = .56) than in grade 4 (M = 1.54, SD = .54), we therefore had to refrain from testing Hypothesis 1 (i. e., grade 4 and grade 7 students significantly differ in AL, with higher levels of alienation in secondary school). Hypothesis 4 (i. e., grade 7 students have higher mean scores across all independent factors than grade 4 students) could only partly be addressed: Based on the scalar invariance in regard to autonomy and competence support between primary and secondary students, we further conducted
Table 2. Measurement Invariance Tests across Primary and Secondary School Students for Alienation from Learning Model
Overall Fit Indices χ2
df
CFI
RMSEA
SRMR
Model Comparison
Primary (n = 453) and secondary (n = 497) school students 1. Configural invariance 2. Metric invariance
94.50
30
.98
.06
.04
–
149.65
38
.96
.08
.08
2 vs. 1
Comparative Fit Indices Δ χ2
Δdf
–
–
–
8
.01
53.06*
ΔCFI
3. Partial metric invariance
108.29
37
.97
.06
.05
3 vs. 2
37.61*
5
.00
4. Partial scalar invariance
188.99
43
.94
.08
.07
4 vs. 3
115.57*
6
.03
Notes: CFI = Comparative Fit Index; RMSEA = Root Mean Squared Error of Approximation; SRMR = Standardized Root Mean Square Residual; Δ = Difference between the comparison and nested model. ΔCFI ≥ –.010 indicates noninvariance; *p < .001.
© 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
44
K. Marcin et al., Alienation from Learning and Student Needs
Table 3. Measurement Invariance Tests across Primary and Secondary School Students for Autonomy and Competence Support, Injustice, and Peer Integration Model
Overall Fit Indices χ2
Autonomy Support
df
CFI
RMSEA
SRMR
.99
.02
.02
Model Comparison
Comparative Fit Indices Δ χ2
Δdf
ΔCFI
–
–
–
Primary (n = 329) and secondary (n = 539) school students 1. Configural invariance
9.12
8
–
2. Metric invariance
12.19
13
.99
.00
.04
2 vs.1
2.59
5
.00
3. Scalar invariance
21.20
17
.99
.02
.05
3 vs. 2
9.49
4
.00
.97
.07
.03
–
–
–
–
Competence Support Primary (n = 341) and secondary (n = 540) school students 1. Configural invariance
40.37
10
2. Metric invariance
42.44
15
.97
.06
.07
2 vs.1
4.07
5
.00
3. Scalar invariance
49.88
19
.97
.06
.08
3 vs. 2
7.21
4
.00
1.00
.00
.00
–
–
–
–
Injustice Primary (n = 452) and secondary (n = 543) school students 1. Configural invariancea
0
0
2. Metric invariance
3.41
3
.99
.02
.03
2 vs.1
3.41
3
.00
3. Scalar invariance
13.61
5
.97
.06
.04
3 vs. 2
14.52*
2
.03
.99
.03
.02
–
–
–
–
Peer Integration Primary (n = 453) and secondary (n = 497) school students 1. Configural invariance
30.03
20
2. Metric invariance
46.41
27
.99
.04
.07
2 vs.1
16.03
7
.00
3. Scalar invariance
77.18
33
.98
.05
.08
3 vs. 2
37.20*
6
.01
Notes: aThe model is just-identified with zero degrees of freedom. CFI = Comparative Fit Index; RMSEA = Root Mean Squared Error of Approximation; SRMR = Standardized Root Mean Square Residual; Δ = Difference between the comparison and nested model. ΔCFI ≥ –.010 indicates non invariance. *p < .001.
the test of factor mean differences between the groups. The model in which the factor means were fixed to zero in both groups was compared to the model in which the factor means were fixed to zero in one group and set free in the other group (Muthén & Muthén, 1998 – 2012). On the basis of chi-square difference testing between the models, the results revealed a significant mean difference across the groups in regard to both autonomy and competence support (Δχ2 = 30.39, Δdf = 1, p < .01 and Δχ2 = 20.53, Δdf = 1, p < .01, respectively). Grade 7 students' average scores for autonomy and competence support (M = 3.23, SD = .52 and M = 3.33, SD = .50, respectively) are significantly lower than the grade 4 scores (M = 3.43, SD = .51 and M = 3.58, SD = .48, respectively).
Alienation from Learning, Basic Needs, and Teacher Injustice To analyze the relevance of variables related to student need fulfillment and teacher injustice for AL (HypotheZeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
ses 2 – 3), we used multigroup SEM, in which we also controlled gender and students' mean school grades as an indicator for their achievement at school. In a first step, a joint unconstrained model for both groups was estimated (i. e., coefficients were allowed to vary freely across grade 4 and grade 7). In the unconstrained model, the structural relationships were equally specified for both groups, but the coefficients in the relationships were estimated independently. Variances, error variances, and covariances of the latent variables were not constrained to be equal but freely estimated for each group. Factor loadings were held equal across groups. The resulting model fit the data well (see Table 4). The unconstrained models for both grade 4 and grade 7 are presented in Figure 1. We found a significant negative association between students' perceived competence support from their teachers and AL in secondary school (β = –.30, p < .05), partly confirming Hypothesis 2a. No significant association with autonomy support or peer integration was found; thus, Hypo© 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
K. Marcin et al., Alienation from Learning and Student Needs
45
did not differ significantly from each other (Hypothesis 3 is accepted). In other words, there are no significant differences in the associations between the independent variables and AL across grades 4 and 7, implying that the relationship structure between basic needs support and AL is similar across both primary and secondary school.
Discussion
Figure 1. Unconstrained multigroup model of alienation from learning. Dashed lines represent non-significant relationships; p > .05. Standardized parameter estimates are presented next to the non-standardized estimates in brackets.
theses 2b and 2c, respectively, are rejected. A significant positive relationship was found between perceptions of teacher injustice and AL in both primary (β = –.24, p < .05) and secondary school (β = –.24, p < .001), confirming Hypothesis 2d. The total variance accounted for in AL was approximately 26 % in grade 4 and 33 % in grade 7. We found no significant gender or school grade effect. In a second step, we estimated a joint constrained model in which the structural paths and factorial structure were constrained to be equal for both groups. A comparison of the goodness of fit statistics between the constrained and unconstrained model shows that the two models measured equally well (see Table 4), implying that the relationships between AL and the independent variables are similar for primary and secondary school. In a last step, we compared the fit of the two models using the Satorra-Bentler scaled chi-square difference test. Because this test did not reveal significant differences between the constrained and unconstrained model (p > .05; see Table 4), and ΔCFI was explicitly below the recommended cutoff values, it can be concluded that the models
The main purpose of this cross-sectional study was to examine the relationships between students' AL and their perceptions of teachers' and peers' basic needs support across primary and secondary school. This investigation has addressed a lack of studies in alienation research by focusing on non-cognitive variables related to the specific social context in which alienation evolves: that is, the classroom setting. The current study initially aimed at exploring differences in AL across primary and secondary school contexts, assuming higher alienation in secondary rather than in primary school (Hypothesis 1). However, due to a lack of scalar measurement invariance, we could not test latent mean differences in AL across grade level. Although the mean scores indicated that grade 7 students exhibited slightly higher levels of AL than grade 4 students, further research is needed to investigate if AL is more salient in secondary than in primary schools. Moreover, longitudinal studies are necessary to prove that AL is in line with other negative developmental trends that indicate decreases in learning enjoyment (e. g., Hagenauer & Hascher, 2014) and engagement (e. g., Symonds & Hargreaves, 2016; Van Ophuysen, 2008) as students enter and proceed through secondary school. In keeping with the assumption that AL may be related to a misfit between students' needs and their school environments (Eccles & Midgley, 1989), we subsequently conducted multigroup SEM to investigate the relationships between basic needs support by teachers and peers and student AL in both primary and secondary school contexts. We found that perception of teacher injustice as an
Table 4. Global Goodness of Fit Comparison Model
Overall Fit Indices χ
2
df
CFI
RMSEA
SRMR
Model Comparison
Primary (n = 453) and secondary (n = 497) school students
Comparative Fit Indices Δ χ2
Δdf
ΔCFI
1. Unconstrained model
1280.34
779
.94
.04
.06
–
–
–
–
2. Constrained model
1283.63
785
.94
.04
.06
2 vs. 1
4.79
6
.00
Notes: CFI = Comparative Fit Index; RMSEA = Root Mean Squared Error of Approximation; SRMR = Standardized Root Mean Square Residual; Δ = Difference between the comparison and nested model. ΔRMSEA and ΔSRMR were explicitly below the recommended cutoff values.
© 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
46
indicator for a lack of student-teacher relatedness was significantly positively related to AL in both grade 4 and grade 7 (confirming Hypothesis 2d), whereas competence support was found to be negatively associated with AL only in grade 7 (partly confirming Hypothesis 2a). Neither in grade 4 nor in grade 7 was teacher autonomy support or peer relatedness significantly associated with AL. One possible explanation for the finding that a significant effect between teacher competence support and AL could only be found in grade 7 can be drawn from stage-environmentfit theory, positing that secondary students are generally less supported by their teachers in fulfilling their basic needs to experience competence in daily school life (e. g., Eccles et al., 1993). In addition, first-year secondary students, struggling with the demanding task of adjusting to their new school environment, tend to harbor more selfdoubt (Newman & Newman, 2003). This finding supports our hypothesis that students who do not feel competent in school withdraw and distance themselves from the learning process. Although they may establish their competence in another domain (e. g., within their peer community) to protect their overall self-esteem and to sustain their basic self-confidence (e. g., Newman & Newman, 2003), this development is harmful, as students need to experience competence in the learning domain in order to become actively engaged and motivated at school (Eccles & Wang, 2012). Despite the assumptions from various influential theories on motivation and adolescent development (e. g., Deci & Ryan, 2000; Eccles et al., 1993; Reeve, 2012), our results did not reveal a significant negative effect between students' perceptions of their teachers' autonomy support and AL in either secondary or primary school. Our study focused on students that have only just entered both adolescence and secondary schooling. Autonomy may become more relevant as students mature and, thus, may only be of importance to students later on in in their secondary school trajectories. A study comparing further age cohorts could be beneficial in shedding more light on this complex relationship. We further hypothesized that if the need for relatedness cannot be fulfilled, students' attitudes toward learning will be affected and AL could follow. Contrary to theoretical premises and previous empirical findings indicating that students will become more involved in learning activities at school if their need for relatedness to their classmates is met (e. g., Mahmoudi et al., 2015; Wang & Eccles, 2012), we found that students' perception of peer relatedness was unrelated to AL in both primary and secondary schools. A possible explanation for this result could be that students draw on other sources to meet their need for relatedness, such as their teachers, parents, or peers outside of school (e. g., Malecki & Demaray, 2003). This is partly supported Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
K. Marcin et al., Alienation from Learning and Student Needs
by the next finding, which underpins the relevance of the student-teacher relationship for students' involvement in the learning process at school. We found a positive effect between students' perceptions of teacher injustice and AL in both grades, confirming our hypothesis and replicating earlier empirical findings (Çağlar, 2013). Injustice perceptions are of importance with regard to students' orientation toward learning at school; hence, future studies may want to investigate this neglected aspect more closely, for example by distinguishing different forms of (in-)justice (i. e., distributive, procedural, and interactional) and their individual effects on AL. Based on the premises that AL may already be found in the earliest grades (Finn, 1989), and that the basic needs as well as the need for justice are universal in nature across different age spans (e. g., Taylor, 2017), we expected to find similar relationships across both groups (Hypothesis 3). Our results indicate no significant differences in the quality of the proposed associations between AL and the needsrelated variables (including injustice experiences) across grade level (i. e., Hypothesis 3 was accepted). This finding implies that the relational structure between basic needs support, injustice experiences, and AL is as previously asserted (e. g., Deci & Ryan, 2000; Taylor, 2017) similar across the different developmental periods. The unanimous pattern of results across school grades further supports the assumption of domain-specificity of alienation (i. e., alienation from social and / or academic aspects of school) as has been theoretically outlined by Hascher and Hadjar (2018). However, due to differences in school context and students' developmental stage, we expected lower scores in students' perception of need support in grade 7 than in grade 4 (Hypothesis 4). Hypothesis 4 could only partly be addressed due to scalar noninvariance for some of the variables. Perception of autonomy and competence support (for which scalar invariance was supported) significantly differed across the two student groups (Hypothesis 4 was partly accepted). Our results support those earlier empirical findings that have found students' perceptions of need support by teachers are worsening as students' progress in school and grow from children into adolescents (e. g., Barber & Olsen, 2004). The final SEM could explain a substantial amount of variance in AL (i. e., 26 % and 33 % for grade 4 and grade 7, respectively). The remaining amount of unexplained variance indicates that other factors, possibly also outside the school setting, may play a crucial role in AL, such as family support. As this was to the best of our knowledge the first study to explore potential non-cognitive determinants and precursors of AL, we exclusively focused on factors related to individual students' perceptions of basic needs support by teachers and peers. Being aware that AL is a multi-causal phenomenon and that factors related to this process © 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
K. Marcin et al., Alienation from Learning and Student Needs
might go far beyond the classroom, we suggest future studies apply a systemic approach, considering other individual, developmental, and environmental aspects, in addition to aspects beyond a school's institutional reach (e. g., students' socialization, their socio-economic and sociocultural backgrounds). Further limitations of this research lie in its cross-sectional design. It is impossible to infer causality and patterns of individual development regarding AL from the findings of this study. Hence, there is a need for both longitudinal studies that follow students throughout their school careers and over the primary-secondary school transition, and for studies combining quantitative and qualitative approaches. In the presence of scalar noninvariance in regard to particular variables, some hypotheses could not be addressed. Hence, there is a need for an improvement of the measurement instruments and testing of these scales across further contexts. Researchers could also consider mediation and moderation effects between the different basic needs. Of particular significance in the current study is the finding that AL is primarily related to the teacher-student relationship (as shown by the significant effects between AL and competence support or teacher injustice), whereas peer relationships (as shown by the insignificant effects between AL and peer integration) seem to be of less importance both for primary and secondary school students. This lack of a significant association between peer support and AL further supports the assumption of domain-specificity of AL. In contrast, teacher injustice and a lack of student competence support correlates negatively with teachers' relationships with students and might ultimately negatively affect students' orientation toward the learning process at school. In this light, it seems important for teachers to establish a positive relationship with their students, characterized by competence support and mutual trust and fairness in the classroom through transparent evaluation practices and a respectful, appreciative, and supportive relationship with students. From a theoretical perspective, our findings imply that there is an effect between perception of teacher injustice and AL independently of and in addition to the effects of perceived competence and autonomy support. While teacher injustice can be regarded as an indicator for a lack of students' relatedness to their teachers, considering this factor could be viewed as a first step toward integrating the much-neglected construct of justice in research on basic needs and motivation.
References Alderfer, C. P. (1972). Existence, relatedness, and growth: Human needs in organizational settings. New York, NY, US: Free Press. © 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
47
Allraum, J., Marti, K., Wassmer, C., & Bucher, M. (2016). Bildungs statistik Kanton Bern: Basisdaten 2015. Bern: Abteilung Bildungsplanung und Evaluation, Erziehungsdirektion des Kanton Bern. Alspaugh, J. (1998). Achievement loss associated with the transition to middle school and high school. Journal of Educational Research, 92(1), 20 – 25. https://doi.org/10.1080/00220679809597572 Altenbaugh, R. J., Engel, D. E., & Martin, D. T. (1995). Caring for kids: A critical study of urban school leavers. London: The Falmer Press. https://doi.org/10.2307/369924 Barber, B. K., & Olsen, J. A. (2004). Assessing the transitions to middle and high school. Journal of Adolescent Research, 19(1), 3 – 30. https://doi.org/10.1177/0743558403258113 Barnhardt, B., & Ginns, P. (2014). An alienation-based framework for student experience in higher education: New interpretations of past observations in student learning theory. Higher Education, 68, 789 – 805. https://doi.org/10.1007/s10734-014-9744-y Booth, M. Z., & Gerard, J. M. (2014). Adolescents' stage-environment fit in middle and high school: The relationship between students' perceptions of their schools and themselves. Youth & Society, 46(6), 735 – 755. https://doi.org/10.1177/0044118X12451276 Brown, T. A. (2015). Confirmatory factor analysis for applied re search. New York, NY: Guilford Publications. Browne, M. W., & Cudeck, R. (1993). Alternative ways of assessing model fit. In K.A. Bollen & J. S. Long (Eds.), Testing structural equation models (pp. 136 – 162). Newbury Park, CA: Sage. Bru, E., Stornes, T., Munthe, E., & Thuen, E. (2010). Students' perceptions of teacher support across the transition from primary to secondary school. Scandinavian Journal of Educational Research, 54(6), 519 – 533. https://doi.org/10.1080/00313831.2 010.522842 Çağlar, Ç. (2013). The relationship between the perceptions of the fairness of the learning environment and the level of alienation. Eurasian Journal of Educational Research, 50, 185 – 206. Case, J. M. (2008). Alienation and engagement: Development of an alternative theoretical framework for understanding student learning. Higher Education, 55, 321 – 332. https://doi.org:10.1007/ s10734-007-9057-5 Chen, F. F. (2007). Sensitivity of goodness of fit indexes to lack of measurement invariance. Structural equation modeling, 14(3), 464 – 504. https://doi.org/10.1080/10705510701301834 Cheung, G. W., & Rensvold, R. B. (2002). Evaluating goodness-offit indexes for testing measurement invariance. Structural equation modeling, 9(2), 233 – 255. https://doi.org/http://dx.doi. org/10.1207/S15328007SEM0902_5 Christ, O., & Schlüter, E. (2012). Strukturgleichungsmodelle mit Mplus: Eine praktische Einführung. Munich, Germany: Oldenbourg Verlag. Colquitt, J. A., Greenberg, J., & Zapata-Phelan, C. P. (2005). What is organizational justice? A historical overview. In J. Greenberg & J. A. Colquitt (Eds.), The handbook of organizational justice (pp. 3 – 56). Mahwah, NJ: Erlbaum. Dalbert, C. (2011). Warum die durch die Schüler und Schülerinnen individuell und subjektiv erlebte Gerechtigkeit des Lehrer handelns1 wichtig ist. Zeitschrift Für Pädagogische Psychologie, 25(1), 81 – 82. https://doi.org/10.1024/1010-0652/a000033 Dalbert, C. (Ed.). (2013). Gerechtigkeit in der Schule. Wiesbaden: Springer-Verlag. Dalbert, C., & Stöber, J. (2002). Strukturierung und Autonomie unterstützung durch die Lehrerinnen. In J. Stöber, Skalendoku mentation “Persönliche Ziele von SchülerInnen” (pp. 27 – 29). Halle (Saale), Germany: Martin-Luther-Universität Halle-Wittenberg. Deci, E. L., & Ryan, R. M. (2000). The “what” and “why” of goal pursuits: Human needs and the self-determination of behavior. Psychological Inquiry, 11(4), 227 – 286. https://doi.org/10.1207/ S15327965PLI1104_01 Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
48
Demanet, J., & van Houtte, M. (2011). School belonging and school misconduct. Journal of Youth and Adolescence, 41(4), 499 – 514. https://doi.org/10.1007/s10964-011-9674-2 Donat, M., Umlauft, S., Dalbert, C., & Kamble, S. V. (2012). Belief in a just world, teacher justice, and bullying behavior. Aggressive Behavior, 38(3), 185 – 193. https://doi.org/10.1002/ab.21421 Eccles, J. S., & Midgley, C. (1989). Stage / environment fit: Developmentally appropriate classrooms for early adolescents. In R. E. Ames & C. Ames (Eds.), Research on motivation in education, Vol. 3 (pp. 139 – 186). San Diego, CA: Academic Press. Eccles, J. S., & Roeser, R. W. (2009). Schools, academic motivation, and stage-environment fit. In R. M. Lerner & Steinberg (Eds.), Handbook of adolescent psychology, 3rd ed. (pp. 404 – 434). Hoboken, NJ: John Wiley & Sons. Eccles, J. S., Wigfield, A., Midgley, C., Reuman, D., MacIver, D., & Feldhaufer, H. (1993). Negative effects of traditional middle schools on students' motivation. The Elementary School Journal, 93(5), 553 – 574. https://doi.org/10.1086/461740 Eccles, J. S., & Wang, M. T. (2012). Part I commentary: So what is student engagement anyway? In S. L. Christenson, A. L. Reschly, & C. Wylie (Eds.), Handbook of research on student engagement (pp. 133 – 148). New York, NY: Springer. EDK. (2017). The Swiss education system. Retrieved from: http:// www.edk.ch Eisenberg, N., Miller, P. A., Shell, R., McNalley, S., & Shea, C. (1991). Prosocial development in adolescence: A longitudinal study. Developmental Psychology, 27(5), 849 – 857. https://doi.org/10. 2307/1131806 Enders, C. K. (2006). Analyzing structural equation models with missing data. In G. R. Hancock & R. O. Mueller (Eds.), Structural Equation Modeling: A Second Course (pp. 313 – 342). Greenwich, CT: Information Age Publishing. Faul, F., Erdfelder, E., Lang, A.G., & Buchner, A. (2007). G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Me thods, 39, 175 – 191. Finn, J. D. (1989). Withdrawing from school. Review of Educational Research, 59(2), 117 – 142. https://doi.org/10.3102/003465430 59002117 Glanville, J. L., & Wildhagen, T. (2007). The measurement of school engagement: Assessing dimensionality and measurement invariance across race and ethnicity. Educational and Psychological Measurement, 67, 1019 – 1041. https://doi.org/10.1177/0013164 406299126 Gniewosz, B., Eccles, J. S., & Noack, P. (2012). Secondary school transition and the use of different sources of information for the construction of the academic self-concept. Social Development, 21(3), 537 – 557. https://doi.org/10.1111/j.1467-9507.2011.00635.x Güroğlu, B., van den Bos, W., & Crone, E. A. (2009). Fairness considerations: Increasing understanding of intentionality during adolescence. Journal of Experimental Child Psychology, 104(4), 398 – 409. https://doi.org/10.1016/j.jecp.2009.07.002 Hadjar, A., & Lupatsch, J. (2010). Der Schul(miss)erfolg der Jungen. Kölner Zeitschrift für Soziologie und Sozialpsychologie, 62(4), 599 – 622. https://doi.org/10.1007/s11577-010-0116-z Hagenauer, G., & Hascher, T. (2014). Early adolescents' enjoyment experienced in learning situations at school and its relation to student achievement. Journal of Education and Training S tudies, 2(2), 20 – 30. https://doi.org/10.11114/jets.v2i2.254 Hagenauer, G., Reitbauer, E., & Hascher, T. (2013). “It's cool but challenging”: The relevance of basic need fulfillment for students' school enjoyment and emotional experiences at the transition from primary to secondary education. Orbis Scholae, 7(2), 23 – 42. https://doi.org/0.14712/23363177.2015.19 Hascher, T. (2004). Wohlbefinden in der Schule. Münster: Waxmann Verlag. Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
K. Marcin et al., Alienation from Learning and Student Needs
Hascher, T., & Hadjar, A. (2018). School alienation: Theoretical approaches and educational research. Educational Research, 60, 1 – 18. https://doi.org/10.1080/00131881.2018.1443021 Hascher, T., &, Hagenauer, G. (2010). Alienation from school. Inter national Journal of Educational Research, 49, 220 – 232. https:// doi.org/10.1016/j.ijer.2011.03.002 Hirschfeld, G., & von Brachel, R. (2014). Multiple-Group confirmatory factor analysis in R-A tutorial in measurement invariance with continuous and ordinal indicators. Practical Assessment, Research & Evaluation, 19(7), 1 – 12. Hu, L. T., & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural equation modeling: a multidisciplinary journal,6(1),1 – 55.https://doi.org/10.1080/10705519909540118 Jiang, R., Liu, R. D., Ding, Y., Zhen, R., Sun, Y., & Fu, X. (2018). Teacher justice and students' class identification: Belief in a just world and teacher-student relationship as mediators. Frontiers in Psychology, 9: 802. https://doi.org/10.3389/fpsyg.2018.00802 Johnson, G. M. (2005). Student alienation, academic achievement, and WebCT use. Educational Technology and Society, 8(2), 179 – 189. Kaufman, R. (2011). A manager's pocket guide to strategic thinking and planning. Amherst, MA: HRD Press. Legault, L., Green-Demers, I., & Pelletier, L. (2006). Why do high school students lack motivation in the classroom? Journal of Educational Psychology, 98(3), 567 – 582. https://doi.org/10.1037/ 0022-0663.98.3.567 Mahmoudi, H., Brown, M. R., Saribagloo, J. A., & Dadashzadeh, S. (2015). The role of school culture and basic psychological needs on Iranian adolescents' academic alienation. Youth & Society, 50(1), 116 – 136. https://doi.org/10.1177/0044118X15593668 Malecki, C. K., & Demaray, M. K. (2003). What type of support do they need? Investigating student adjustment as related to emotional, informational, appraisal, and instrumental support. School Psychology Quarterly, 18(3), 231 – 252. https://doi. org/10.1521/scpq.18.3.231.22576 Mann, S. J. (2001). Alternative perspectives on student learning. Studies in Higher Education, 26(1), 7 – 19. https://doi.org/10.1080/ 03075070020030689 Martin, J., Sokol, B. W., & Elfers, T. (2008). Taking and coordinating perspectives: From prereflective interactivity, through reflective intersubjectivity, to metareflective sociality. Human Develop ment, 51(5 – 6), 294 – 317. https://doi.org/10.1159/000170892 Marx, K. (1844). Estranged labour. In Economic and philosophic manuscripts of 1844: Marx-Engels Collected Works, Vol. 3, 1932. Maslow, A. H. (1943). A theory of human motivation. Psychological review, 50(4), 370 – 396. https://doi.org/10.1037/h0054346 McClelland, D. C. (1961). The Achieving Society. New York: Van Nostrand Reinhold. McGee, C., Ward, R., Gibbons, J., & Harlow, A. (2003). Transition to secondary school: A literature review. Report to the Ministry of Education. New Zealand: The Ministry of Education. Midgley, C., Feldhaufer, H., & Eccles, J. S. (1988). The transition to junior high school: Beliefs of pre-and post-transition teachers. Journal of Youth and Adolescence, 17(6), 543 – 562. https://doi. org/10.1007/BF01537831 Millsap, R. E. (2012). Statistical approaches to measurement invariance. New York: Routledge. Morinaj, J., Scharf, J., Grecu, A., Hadjar, A., Hascher, T., & Marcin, K. (2017). School alienation: A construct validation study. Frontline Learning Research, 5(2), 36 – 59. https://doi.org/10.14786/flr. v5i2.298 Müller, F., & Thomas, A. (2011). Skalen zur wahrgenommenen Basic Needs Unterstützung von Schüler / innen, Klagenfurt: Institut für Unterrichts – und Schulentwicklung. Alpen-Adria-UniversitätKlagenfurt. © 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
K. Marcin et al., Alienation from Learning and Student Needs
Murdock, T. B. (1999). The social context of risk. Journal of Educational Psychology, 91(1), 62 – 75. https://doi.org/10.1037/00220663.91.1.62 Murray, H. A. (1938). Explorations in Personality. New York: Oxford University Press. Muthén, L. K., and Muthén, B. O. (1998 – 2012). Mplus user's guide (7th ed.). Los Angeles, CA: Muthén & Muthén. Newman, B. M., & Newman, P. R. (2003). Development through life (8th ed.). Belmont, CA: Wadsworth. Niemiec, C. P., & Ryan, R. M. (2009). Autonomy, competence, and relatedness in the classroom: Applying self-determination theory to educational practice. School Field, 7(2), 133 – 144. https://doi.org/10.1177/1477878509104318 OECD. (2004). Learning for tomorrow's world. Paris, France: OECD Publishing. OECD. (2017). PISA 2015 results (Volume III): Students' well-being. Paris: OECD Publishing. https://doi.org/10.1787/9789264273856-en Osterman, K. F. (2000). Students' need for belonging in the school community. Review of Educational Research, 70(3), 323 – 367. https://doi.org/10.3102/00346543070003323 Peter, F., Donat, M., Umlauft, S., & Dalbert, C. (2013). Einführung in die Gerechtigkeitspsychologie. In C. Dalbert (Hrs.), Gerechtigkeit in der Schule (S. 11 – 28). Wiesbaden, Deutschland: Springer VS. Pretsch, J., Ehrhardt, N., Engl, L., Risch, B., Roth, J., Schumacher, S., & Schmitt, M. (2016). Injustice in school and students' emotions, wellbeing, and behavior: A longitudinal study. Social Justice Research, 29(1), 119 – 138. https://doi.org/10.1007/s11211-015-0234-x Rauer, W., & Schuck, K. D. (2003). FEESS 3 – 4: Fragebogen zur Erfassung emotionaler und sozialer Schulerfahrungen von Grundschulkindern dritter und vierter Klassen: Manual. Beltz Test. Reeve, J. (2012). A self-determination theory perspective on student engagement. In S.L. Christenson, A. L. Reschly, & C. Wylie (Eds.), Handbook of research on student engagement (pp. 149 – 172). New York, NY: Springer. https://doi. org/10.1007/978-1-4614-2018-7_7 Reilly, R. C., & Mitchell, S. N. (2010). The clash of the paradigms: Tracking, cooperative learning, and the demolition of the zone of proximal development. Alberta Journal of Educational Research, 56(4), 419 – 435. Resh, N., & Sabbagh, C. (2014). Sense of justice in school and civic attitudes. Social Psychology of Education, 17(1), 51 – 72. https:// doi.org/10.1007/s11218-013-9240-8 Ryan, R. M., & Deci, E. L. (2000). Intrinsic and extrinsic motivations: Classic definitions and new directions. Contemporary Educational Psychology, 25(1), 54 – 67. https://doi.org/10. 1006/ceps.1999.1020 Ryan, R. M., & Deci, E. L. (2017). Self-determination theory: Basic psychological needs in motivation, development, and wellness. Guilford Publications. Satorra, A., & Bentler, P. M. (2001). A scaled difference chi-square test statistic for moment structure analysis. Psychometrika, 66, 507 – 514. https://doi.org/10.1007/BF02296192 Schermelleh-Engel, K., Moosbrugger, H., & Müller, H. (2003). Eva luating the fit of structural equation models: Tests of signi ficance and descriptive goodness-of-fit measures. Methods of Psychological Research Online, 8(2), 23 – 74. Skues, J. L., Cunningham, E. G., & Pokharel, T. (2005). The influence of bullying behaviours on sense of school connectedness, motivation and self-esteem. Journal of Psychologists and Counsellors in Schools, 15(1), 17 – 26. https://doi.org/10.1375/ ajgc.15.1.17 Steenkamp, J. B. E., & Baumgartner, H. (1998). Assessing measurement invariance in cross-national consumer research. Journal of Consumer Research, 25(1), 78 – 90. https://doi.org/10.1086/209528 Steinberg, L. (2005). Cognitive and affective development in adolescence. Trends in Cognitive Sciences, 9(2), 69 – 74. https://doi. org/10.1016/j.tics.2004.12.005 © 2019 Hogrefe Veröffentlicht unter der Hogrefe OpenMind-Lizenz (https://doi.org/10.1026/a000002)
49
Stern, M. (2012). Evaluating and promoting positive school attitude in adolescents. New York, NY: Springer. https://doi.org/10.1007/9781-4614-3427-6 Symonds, J., & Hargreaves, L. (2016). Emotional and motivational engagement at school transition: A qualitative stage-environment fit study. The Journal of Early Adolescence, 36(1), 54 – 85. https://doi.org/10.1177/0272431614556348 Tarquin, K., & Cook-Cottone, C. (2008). Relationships among aspects of student alienation and self-concept. School Psychology Quarterly, 23(1), 16 – 25. https://doi.org/10.1037/10453830.23.1.16 Taylor, A. J. W. (2017). Affirming the importance of justice as a basic human need. Journal of Psychology and Cognition, 2(1). Tyler, T. R., & Blader, S. L. (2003). The group engagement model: Procedural justice, social identity, and cooperative behavior. Personality and social psychology review, 7(4), 349 – 361. Vandenberg, R. J., & Lance, C. E. (2000). A review and synthesis of the measurement invariance literature: Suggestions, practices, and recommendations for organizational research. Organizational research methods, 3(1), 4 – 70. https://doi.org/10.1177/10944281 0031002 van Ophuysen, S. (2008). Zur Veränderung der Schulfreude von Klasse 4 bis 7. Eine Längsschnittanalyse Schulformspezifischer Effekte von Ferien und Grundschulübergang. Zeitschrift Für Pädagogische Psychologie, 22(3 – 4), 293 – 306. https://doi. org/10.1024/1010-0652.22.34.293 Van Prooijen, J. W. (2009). Procedural justice as autonomy regulation. Journal of Personality and Social Psychology, 96(6), 1166 – 1180. https://doi.org/10.1037/a0014153 Wang, M. T., & Eccles, J. S. (2012). Adolescent behavioral, emotional, and cognitive engagement trajectories in school and their differential relations to educational success. Journal of Research on Adolescence, 22(1), 31 – 39. https://doi.org/10.1111/j.1532-7795. 2011.00753.x Watkins, R., & Kavale, J. (2014). Needs: Defining what you are assessing. New Directions for Evaluation, 2014(144), 19 – 31. Watt, H. M. (2004). Development of adolescents' self-perceptions, values, and task perceptions according to gender and domain in 7th-through 11th-grade Australian students. Child development, 75(5), 1556 – 1574. https://doi.org/10.1111/j.1467-8624. 2004.00757.x Wigfield, A., & Eccles, J. S. (2000). Expectancy–value theory of achievement motivation. Contemporary educational psychology, 25(1), 68 – 81. https://doi.org/10.1006/ceps.1999.1015 Wigfield, A., Eccles, J. S., Yoon, K. S., Harold, R. D., Arbreton, A. J., Freedman-Doan, C., & Blumenfeld, P. C. (1997). Change in children's competence beliefs and subjective task values across the elementary school years: A 3-year study. Journal of educational psychology, 89(3), 451. https://doi.org/10.1037/ 0022-0663.89.3.451
History Received November 27, 2017 Accepted after revision May 15, 2019 Published online August 20, 2019
Kaja Marcin Universität Bern Institut für Erziehungswissenschaft Fabrikstrasse 8 3012 Bern Schweiz kaja.marcin@gymneufeld.ch Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 35–49
Psychological Test Adaptation and Development Official Open Access Organ of the European Association of Psychological Assessment (EAPA)
“PTAD will be an important outlet for everyone interested in assessment!” Mathias Ziegler, Editor-in-Chief, Humboldt University Berlin
Volume 1 / Number 1 / 2020
Psychological Test Adaptation and Development
Psychological Test Adaptation and Development
Editor-in-Chief Matthias Ziegler
Official Open Access Organ of the European Association of Psychological Assessment
OA New al Journ
About the journal PTAD is the first open access, peer-reviewed journal publishing papers which present the adaptation of tests to specific needs (e. g., cultural), test translations or the development of existing measures. Moreover, the focus is on the empirical testing of the psychometric quality of these measures. The journal provides a paper template, and registered reports are strongly encouraged. It is a unique outlet for research papers portraying adaptations (e. g., translations) and developments (e. g., state to trait) of individual tests – the backbone of assessment. The expert editor-in-chief is supported by a stellar cast of internationally renowned associate editors. A generous APC waiver program is available for eligible authors. Benefits for authors: • Clear guidance on the structure of papers helps you write good papers • Fast peer-review, aided by the clear structure of your paper • With the optional registered report format you can get expert advice from seasoned reviewers to help improve your research • Open access publication, with a choice of Creative Commons licenses • Widest possible dissemination of your paper – and thus of qualified information about your test and your research • Generous APC waiver program and discounts for members of selected associations The journal welcomes your submissions! All manuscripts should be submitted online via Editorial Manager, where full instructions to authors are also available: https://eu.hogrefe.com/j/ptad
Originalarbeit
Effekt Glückssache? Zwei teststarke, präregistrierte Replikationsstudien zum Einfluss von Glück auf kognitive Leistung Oliver Dickhäuser, Adrian Heinze, Marie Luisa Hamm, Anika Sophie Bales, Svenja Amelie Bellmann, Daniela Böger, Lidia Katarzyna Gagelmann, Felix Kuhlenkamp, Julia Kathleen Merger, Hanna Viehweger, Julian Ziegler und Anna von Neuenstein Universität Mannheim, Fakultät für Sozialwissenschaften
Zusammenfassung: Damisch, Stoberock und Mussweiler (2010) zeigten in einer Reihe von Experimenten, dass die Induktion von abergläubigen Glücksüberzeugungen im Vergleich zu einer Kontrollgruppe zu einer besseren Leistung in unterschiedlichen kognitiven und motorischen Aufgaben führt. Wir führten zwei konzeptuelle Replikationen (NStudie 1 = 101, NStudie 2 = 175) eines der Experimente durch, in denen wir untersuchten, ob Versuchspersonen in einer Online-Studie durch die Induktion Glück zu haben, bessere Leistungen beim Lösen von Anagrammaufgaben zeigten als die Kontrollgruppe und untersuchten dabei in Studie 2 mit einem anderen Manipulationsstimulus zusätzlich den Effekt von Pech induktion auf die Leistung. Des Weiteren wurde in beiden Studien der Effekt der Induktion auf die Selbstwirksamkeitserwartung untersucht. Den Hypothesen widersprechend zeigte sich kein statistisch signifikanter Effekt der Glücks- bzw. Pechinduktion auf die Leistung. Auf die Selbstwirksamkeitserwartung zeigte sich nur in Studie 2 ein kleiner Effekt. Zu geringe Teststärke und nicht erfolgreiche Manipulation können in beiden Studien als Ursache für die erfolglose Replikation ausgeschlossen werden. Wir diskutieren, dass Effekte von Glücks-Induktionen auf Leistung offensichtlich nur unter sehr spezifischen, oft nicht replizierbaren Randbedingungen gezeigt werden können. Schlüsselwörter: Glück, Leistung, Selbstwirksamkeitserwartung, Replikation, Teststärke A matter of luck: Two high-powered preregistered replication studies on effects of superstition on cognitive performance Abstract: In a series of experiments, Damisch, Stoberock and Mussweiler (2010) showed that the induction of superstitious beliefs in luck compared to a control group leads to better performance in various cognitive and motor tasks. We performed two conceptual replications of one of the experiments (Nstudy 1 = 101, Nstudy 2 = 175), in which we investigated whether participants performed better after an induction of luck in solving anagram tasks than the control group. Additionally, we investigated the effect of a bad luck induction on performance in study 2 with a different manipulation stimulus. Furthermore, both studies investigated the effect of the induction on self-efficacy expectations. Contrary to the preregistered hypotheses, there was no statistically significant effect of luck or bad luck induction on performance. Only study 2 showed a small effect on the expectation of self-efficacy. Insufficient power and unsuccessful manipulation can be excluded as causes of unsuccessful replication in both studies. We discuss that effects of luck induction on performance can obviously only be shown under very specific, often nonreplicable conditions. Keywords: Luck, performance, self-efficacy expectation, replication, statistical power
Theoretischer Teil Abergläubige Überzeugungen lassen sich in sehr vielen Kulturen und Epochen nachweisen (Jahoda, 1969; Vyse, 2013). Einer Umfrage in Deutschland aus dem Jahr 2000 zufolge gab über ein Drittel der befragten Personen an, der Glaube an vierblättrige Kleeblätter, Sternschnuppen oder einen Schornsteinfeger habe für sie Bedeutung (IfD Allensbach, 2000). Dies macht deutlich, dass nicht wenige Personen der Überzeugung sind, dass vermeintlich Glück © 2020 Hogrefe
oder Pech bringende Handlungen oder Gegenstände Aus wirkungen auf den Verlauf ihres Lebens haben. Eine Web site für den Verkauf von Glücksbringern für Prüfungs situationen (http://www.gluecksbringer-finden.de) wirbt für den Verkauf dieser mit den Worten „Um den Prüflin gen ihre Angst und Anspannung zu nehmen werden dabei gerne von nahestehenden Menschen, Freunden und der Familie Glücksbringer verschenkt. Diese geben dem Prüf ling Sicherheit und Selbstvertrauen für seine bevorstehen den Aufgaben.“ Eine zentrale Frage in diesem Zusammen Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 51–60 https://doi.org/10.1024/1010-0652/a000263
52
hang ist, inwieweit die Überzeugung, ein Glücksbringer könne in einer Prüfung helfen einen direkten oder indirek ten ursächlichen Effekt auf die Leistung haben kann. Die Ergebnisse aus vier Studien von Damisch, Stobe rock und Mussweiler (2010) weisen darauf hin, dass dies tatsächlich der Fall sein könnte. Die Glücksmanipulation führte in einem ersten Experiment (N = 28) zu einem Un terschied beim Erfolg in einer motorischen Aufgabe (Put ten eines Golfballes). In der Experimentalgruppe wurden die Teilnehmer vor der Aufgabe instruiert, dass sie einen Glücksball hätten, wohingegen der Kontrollgruppe ledig lich gesagt wurde, dass ihr Ball bisher auch von jedem an deren benutzt wurde. Diese Glücksmanipulation führte im Vergleich zur Kontrollgruppe zu einer signifikant höheren Anzahl erfolgreicher Putts (d = 0.83). Diesen Effekt einer Glücks-Induktion auf Leistung konn ten Damisch et al. (2010) in drei weiteren Experimenten mithilfe einer Geschicklichkeits-, Gedächtnis- und Ana grammaufgabe nachweisen. Diese Studien nutzten auch andere Formen der Induktion von Glücksüberzeugungen, etwa ein Glückwunsch („Ich drücke Dir die Daumen“) durch den Versuchsleiter (Studie 2; N = 51) oder die Anbzw. Abwesenheit eines persönlichen Glücksbringers (Stu die 3, N = 41 und Studie 4, N = 31). Unabhängig von Aufga ben- und Induktionsart zeigten sich bei Versuchspersonen in den Glücksbedingungen statistisch signifikant höhere Leistungen als in einer Vergleichsgruppe. In Studie 3 und 4 gingen Damisch et al. (2010) auch der Frage nach, welcher Mechanismus dem Effekt von Glücks überzeugung auf Leistung zugrunde liegt. Die Autoren vermuteten, dass Selbstwirksamkeit (Bandura, 1997) – also die Überzeugung in die eigenen Fähigkeiten, bevorstehende Aufgaben erfolgreich absolvieren zu können – eine vermit telnde Rolle in dem Prozess spielt. Durch die Aktivierung von abergläubigen Überzeugungen erhöhe sich die Selbst wirksamkeitserwartung, was wiederum eine verbesserte Leistung bewirke. Zur Prüfung dieser Vermutung erfass ten sie nach der Instruktion das Niveau der Selbstwirk samkeitserwartungen hinsichtlich der bevorstehenden Aufgabe. Analog zu den Leistungsunterschieden zeigten sowohl bei der Gedächtnis- (d = 0.96; Studie 3), als auch bei der Anagrammaufgabe (d = 0.75; Studie 4) die Ver suchspersonen der Glücksgruppe eine signifikant höhere Selbstwirksamkeitserwartung. Bootstrapping-Analysen zeigten in beiden Fällen, dass die Selbstwirksamkeitser wartung den Effekt von Glück auf Leistung mediierte. Die Befunde von Damisch et al. (2010) erfuhren eine große Beachtung, auch in der Öffentlichkeit. So titelte etwa die Tageszeitung „Express“: „Kölner Forscher haben es bewiesen – Glücksbringer helfen wirklich“. Diese große Aufmerksamkeit für die Befunde ist vermutlich auch darin begründet, dass die Ergebnisse unser Verständnis davon, was „Aberglaube“ ist, auf den Kopf stellen. Abergläubige Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 51–60
O. Dickhäuser et al., Effekt Glückssache?
Überzeugungen, wie etwa die, dass ein bestimmter Glücks bringer die Leistung in einer wichtigen Klausur verbes sere, sind gerade dadurch definiert, dass sie unzutreffend sind, die Verwendung des Glücksbringers also eigentlich gerade keinen Effekt auf die nachfolgende Leistung hat. Stellt sich nun heraus, dass die Überzeugung, durch die Verwendung bestimmter Glücksbringer tatsächlich Glück zu haben, eben tatsächlich leistungszuträglich ist, kann man diese Überzeugung nicht mehr abergläubig nennen. An verschiedenen Stellen ist in der vergangenen Zeit auf die dringende Notwendigkeit von Replikationsstudien hingewiesen worden (Schmidt, 2009; speziell für die Pä dagogische Psychologie Rost & Bienefeld, 2019). Entspre chend versuchten Calin-Jagemann und Caldwell (2014), den Effekt der Glücks-Induktion auf Leistung in einer Putting-Aufgabe direkt zu replizieren. Im Gegensatz zu Damisch et al. (2010) führte nicht stets dieselbe Person die Aufgabe mit den Teilnehmern durch, sondern es wur den drei verschiedene Versuchsleiterinnen genutzt, die hier auch blind gegenüber den Hypothesen waren. Zusätz lich wurde eine Analyse der Teststärke durchgeführt. Es wurde durch die Anzahl der rekrutierten Personen eine Teststärke von d = 0.83 für die untere Grenze des Konfi denzintervalls um die Effektstärkenschätzung der DamischStudien erreicht. Außerdem erfolgten zwei Manipulations checks nach Absolvieren der Putting-Aufgabe. Zunächst sollten die Versuchspersonen frei wiedergeben, was die Versuchsleiterinnen vor dem Putten zu ihnen sagten und Teilnehmer der Experimentalgruppe wurden beim Nennen von Glück oder ähnlichen Begriffen in die Analyse aufge nommen, wohingegen Teilnehmer der Kontrollgruppe beim Nennen solcher Begriffe von der Analyse ausge schlossen wurden. Danach schätzten sie das Zutreffen fol gender Aussagen ein: „Bevor ich die Aufgabe begann, glaubte ich, dass der mir zugeteilte Ball Glück bringt“ und „Jetzt nach Absolvieren der Aufgabe glaube ich, dass der mir zugeteilte Ball Glück bringt“. Obwohl die Instruktion korrekt erinnert wurde und der Manipulationscheck so wohl bei der ersten (d = 0.47), als auch der zweiten Aus sage (d = 0.37) signifikant höhere Überzeugungen von Glück in der Experimentalgruppe zeigte, war der Unter schied in der Leistung beim Putten zwischen den Gruppen statistisch nicht signifikant (d = 0.05). In einem zweiten Experiment mit gleichem Versuchs ablauf verwendeten Calin-Jagemann und Caldwell (2014) eine stärkere Manipulation. Die Teilnehmer nahmen sich nun selbst die Golfbälle aus einem Beutel mit acht Bällen, von denen vier mit einem Glücksklee bedruckt waren. Der Experimentalgruppe wurde daraufhin gesagt „Wow! Du wirst den Glücksball benutzen“ und der Kontrollgruppe „Dies ist der Ball den du benutzen wirst“. Trotz stärkerer Manipulation zeigten sich keine statistisch signifikanten Unterschiede in der Anzahl erfolgreicher Putts (d = 0.05). © 2020 Hogrefe
O. Dickhäuser et al., Effekt Glückssache?
Die Autoren führten außerdem eine Meta-Analyse der be kannten Studien zu den Effekten von Glück auf Leistung durch und fanden eine signifikante Heterogenität der Effektstärken mit einem Range zwischen d = −0.15 und d = 0.95. Ziel der im nun vorliegenden Manuskript beschriebe nen zwei Experimenten war es, den Effekt einer GlücksInduktion auf Leistung in einer kognitiven Aufgabe zu rep lizieren. Dabei wollten wir auch die dabei vermittelnde Rolle von Selbstwirksamkeitserwartungen untersuchen. Die Replikation des Effektes auf Leistung bei kognitiven Aufgaben erfolgt hier erstmalig und ist primär durch die hohe pädagogisch-psychologische Relevanz der Untersu chung der Effekte auf diese Art von Aufgaben begründet. Kognitive Aufgaben spielen in Bildungssituationen oft eine deutlich größere Rolle als physische Aufgaben (wie die in den Studien von Jagemann und Caldwell genutzte Puttingaufgabe). Es gibt in der Arbeit von Damisch et al. (2010) keine Hinweise darauf, dass der Effekt bei kognitiven Aufgaben (d = 0.77) wesentlich größer oder kleiner war als etwa bei physischen Aufgaben (Golfball putten, 0.83) oder bei einer Gedächtnis- (0.66) oder Geschicklichkeitsaufgabe (0.72). Wir strebten eine teststarke konzeptuelle Replikation der Studien von Damisch et al. (2010) an und verwendeten die gleichen kognitiven (Anagramm-)Aufgaben wie diese in ihrer Studie 4. Im Gegensatz zu den Originalstudien und zu den Studien von Calin-Jagemann und Caldwell (2014) führten wir jedoch kein Laborexperiment durch, in dem Versuchsleiter mit den Versuchspersonen interagierten, sondern realisierten – auch um mögliche VersuchsleiterErwartungseffekte als Ursache für die Befunde (vgl. Rosen thal, 1976) völlig auszuschließen1 – jeweils ein Online- Experiment. Über die bisherigen Studien hinausgehend war es ein weiteres Ziel der vorliegenden Arbeit, auch die Wirkung von Pechinduktionen auf Selbstwirksamkeit und Leis tung zu untersuchen. Dies untersuchten wir vor dem Hin tergrund, dass viele der von Personen gehegten abergläu bigen Überzeugungen sich nicht nur darauf beziehen, unter bestimmten Bedingungen Glück zu haben, sondern auch darauf, unter bestimmten Bedingungen Pech zu haben. Solche Überzeugungen über vermeintliche Un heilsbringer oder Unglück bringende Situationen sind oft gegensätzlich zu Überzeugungen über Glücksbringer aufgebaut, wie etwa der volksmündliche Spruch über schwarze Katzen „Von links nach rechts bringt's Schlechts, von rechts nach links Glück bringt's“ ausdrückt. Dieser 1
53
Gegensätzlichkeit folgend könnten nicht nur Glücks- Induktionen zu höherer Selbstwirksamkeit und Leistung führen als eine neutrale Vergleichsbedingung, sondern entsprechend sollten sich auch Pechinduktionen in nied rigerer Selbstwirksamkeitserwartung und Leistung nie derschlagen. Diese Überlegung ist auch darin begründet, dass abergläubige Überzeugungen oder Handlungen wie etwa die Verwendung persönlicher Glücksbringer im Kern mit der illusionären Annahme von Kontrolle ver bunden sind (Vyse, 2013) und entsprechend das Konzept „Pech“ mit geringer Kontrolle und negativem Ergebnis assoziiert wird. Beide hier vorgestellten Experimente wurden präregist riert und wir planten a priori die Stichprobengröße, um eine hohe Power sicherzustellen. Dies ist insbesondere deshalb wichtig, weil die Power in den Originalstudien von Damisch et al. insgesamt gering war (sie lag zwischen .55 und .71 bei einer angenommenen tatsächlichen Effektstärke von d = .83; vgl. Calin-Jageman & Caldwell, 2014). Wir testeten in Studie 1 die folgenden Replikations hypothesen: 1. Die Induktion von Glück führt verglichen mit einer neu tralen Bedingung zu höherer Leistung in einer kogni tiven Aufgabe. 2. Die Induktion von Glück führt verglichen mit einer neu tralen Bedingung zu einem Anstieg der aufgabenspezifi schen Selbstwirksamkeitserwartung. 3. Die Leistungsunterschiede zwischen Gruppen sind durch die differenziellen Veränderungen unter Selbst wirksamkeitserwartung mediiert. In Studie 2 prüften wir nunmehr zusätzlich auch den vermuteten Effekt einer Induktion von Pech. Die folgen den Replikationshypothesen wurden geprüft: 4. Die Induktion von Glück führt verglichen mit einer neu tralen Bedingung zu höherer Leistung und die Indukti on von Pech verglichen mit einer neutralen Bedingung zu einer niedrigeren Leistung in einer kognitiven Auf gabe. 5. Die Induktion von Glück führt verglichen mit einer neu tralen Bedingung zu höherer aufgabenspezifischer Selbstwirksamkeitserwartung und die Induktion von Pech verglichen mit einer neutralen Bedingung zu einer niedrigeren aufgabenspezifischen Selbstwirksamkeits erwartung. 6. Die Leistungsunterschiede zwischen Gruppen sind durch die Unterschiede in der Selbstwirksamkeitserwartung mediiert.
In der Publikation von Damisch et al. (2010) wird nicht explizit erwähnt, ob die Versuchsleiter/-innen blind gegenüber den Hypothesen waren. Ein Versuchsleitereffekt kann nicht ausgeschlossen werden, auch weil selbst im Falle von hypothesenunkundigen Versuchsleitern (wie etwa auch in der Studie von Calin-Jagemann und Caldwell, 2014) angesichts der offensichtlichen Art der Manipulation die Hypothesen vom Versuchsleiter einfach erschlossen werden könnten.
© 2020 Hogrefe
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 51–60
54
Experiment 1 In Experiment 1 verwendeten wir zum Nachweis des Effekts von Glück auf Leistung die gleichen Aufgaben wie in Studie 3 und 4 der Arbeit von Damisch et al. (2010). Die Präregistrierung der Studie findet sich unter https://aspre dicted.org / fy3e4.pdf.
Methode Versuchspersonen Eine a priori Planung der Stichprobengröße auf Grundlage der durchschnittlichen Stärke des Effekts von Glück auf Leistung von d = 0.83 (vgl. Calin-Jagemann & Caldwell, 2014) ergab, dass wir für eine Teststärke von 0.99 bei dem vorliegenden Zwei-Gruppen-Design 50 Versuchspersonen pro Gruppe benötigten. An der Studie nahmen 101 Perso nen (68 Frauen) aus der Universität und dem persönlichen Umfeld der Autorinnen und Autoren teil, die größtenteils über eine Facebook-Gruppe akquiriert wurden. Die Teil nahme erfolgte ohne Vergütung. Eine Person wurde aus geschlossen, weil sie angab, noch nicht volljährig zu sein. Das Alter der Versuchspersonen betrug im Mittel 27.30 Jahre (SD = 12.54). Die Stichprobe umfasste 64 % Studie
O. Dickhäuser et al., Effekt Glückssache?
rende, 24 % Erwerbstätige, 5 % Auszubildende, 1 % Schü ler (6 % Sonstiges). 98 der 100 Personen gaben Deutsch als ihre Muttersprache an. Überblick Die Versuchspersonen erhielten über einen Link Zugang zur Studie und bearbeiteten sie in einem Durchgang. Im Laufe des Experiments wurden sie per Zufall entweder der Kontrollgruppe (n = 51) oder der Bedingung GlücksInduktion (n = 49) zugewiesen. Die abhängigen Variablen waren die Leistung in einer Anagrammaufgabe und die wahrgenommene Selbstwirksamkeit. Letzteres wurde ein mal vor und einmal nach der Manipulation gemessen. Hinsichtlich der Selbstwirksamkeit liegt ein gemischtes 2 × 2 Design mit einem Zwischensubjekt- (Glück vs. Kont rollgruppe) und einem Innersubjektfaktor (Messung vor und nach der Glücks-Induktion) vor. Hinsichtlich Leistung liegt ein einfaktorielles Design mit den Stufen GlücksInduktion und Kontrollgruppe vor. Vor der Manipulation wurden außerdem einige Ablenkungsitems vorgegeben. Material und Durchführung Das Experiment wurde online mittels SoSciSurvey durchge führt. Nach der Abgabe einer Einverständniserklärung be arbeiteten die Versuchspersonen zunächst eine Beispielauf
Abbildung 1. Stimulus der Experimental- (links) und Kontrollgruppe (rechts) in Studie 1 (Abbildung 1a) sowie Art der Induktion in Studie 2 (Abbildung 1b: Glücks-Induktion [links], keine Induktion von Glück bzw. Pech [Mitte], Pechinduktion [rechts]). Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 51–60
© 2020 Hogrefe
O. Dickhäuser et al., Effekt Glückssache?
gabe, bei der die Bildung von Wörtern aus einem Anagramm mit acht Buchstaben geübt werden sollte. Anschließend er folgte die Messung der aufgabenspezifischen Selbstwirk samkeit. Hierzu dienten zwei adaptierte Items aus der All gemeine Selbstwirksamkeit Kurzskala (Beierlein, Kovaleva, Kemper & Rammstedt, 2013). Die Items lauteten „Bei sol chen Aufgaben kann ich mich auf meine Fähigkeiten verlas sen“ und „Auch anstrengende und komplizierte Aufgaben dieser Art kann ich in der Regel gut lösen“. Mittels eines Schiebereglers mit einer Reichweite zwischen 1 („stimme nicht zu“) und 101 („stimme zu“) konnten die Versuchsper sonen den Grad ihrer Zustimmung angeben. Die zwei Items korrelierten zu r = .75. Aus den Antworten auf beide Items wurde der Mittelwert berechnet. Anschließend bearbeiteten die Versuchspersonen als Ablenkungsaufgabe insgesamt 18 Items einer leicht abge wandelten deutschen Fassung der Lockwood-Skala (Lock wood, Jordan & Kunda, 2002). Danach wurden die Teilnehmer randomisiert der Kont rollgruppe oder der Gruppe mit Glücks-Induktion zuge wiesen. Die Glücks-Induktion erfolgte durch die Anzeige eines Bildes mit dem Wortlaut „Bei der folgenden Aufgabe wünschen wir Ihnen viel Glück!“ und einem vierblättrigen Kleeblatt; der Kontrollgruppe wurde eine Sprechblase mit den Worten „Los geht's!“ angezeigt (siehe Abbildung 1a). Bei beiden Gruppen erschien nach sechs Sekunden der Weiter-Button. Im Anschluss folgte erneut die Messung der Selbstwirk samkeit mit denselben Items wie zu Beginn (rbeide Items = .82). Zur Erfassung der Leistung in der Anagrammaufgabe wurde wie folgt instruiert: „Bei der folgenden Aufgabe geht es darum, dass Sie aus einer Menge an acht Buchstaben so viele deutsche Wörter wie möglich bilden. Die gebildeten Wörter können dabei zwischen zwei und acht Buchstaben haben. Die einzige Vorgabe ist, dass es sich um ein Wort der deutschen Sprache handeln muss. Sie dürfen aus den Buchstaben auch Namen bilden. Bitte nehmen Sie sich nun einige Minuten Zeit. Sie dürfen bei der Aufgabe so lange nachdenken, wie Sie möchten und bis Sie keine neuen Wörter mehr finden. Der Weiter-Button erscheint erst nach Ablauf einiger Minuten. Nach je 25 Nennungen wird die selbe Buchstabenfolge noch einmal angezeigt.“ Allen Versuchspersonen lag, wie bei Damisch et al. (2010, Studie 3 und 4) das gleiche Anagramm (D S E T R N I E) in gleicher Buchstabenabfolge vor. Auf der Seite wurden vier Boxen mit jeweils zwei Zeilen angezeigt, die nach jeder Eingabe um eine Zeile erweitert wurden bis 25 Zeilen er reicht waren. Außerdem wurde der Experimentalgruppe in der oberen rechten Bildschirmecke ein vierblättriges Klee blatt mit dem Ausspruch „Viel Glück!“ (siehe elektronisches Supplement 1) angezeigt und der Kontrollgruppe das gleiche Bild aus der Manipulation. Zur Ermittlung der Leistung wurde die Anzahl korrekt gebildeter Wörter gezählt. © 2020 Hogrefe
55
Danach folgte eine Manipulationskontrolle, bei der die Versuchspersonen aus der Experimentalbedingung das Bild mit dem vierblättrigen Kleeblatt und dem Ausspruch „Bei der folgenden Aufgabe wünschen wir Ihnen viel Glück!“ und die Versuchspersonen der Kontrollgruppe das Bild der Sprechblase mit den Worten „Los geht's!“ wieder erkennen und anklicken mussten. Die Frage lautete: „Wel che Abbildung kommt Ihnen aus dieser Studie bekannt vor?“ Es wurden stets beide Abbildungen und ein Distrak torbild (siehe elektronisches Supplement 2) angezeigt. Zum Schluss machten die Versuchspersonen Angaben zu Geschlecht, Alter, Beruf und ihrer Muttersprache. Außerdem erfassten wir das Ausmaß abergläubiger Über zeugung, indem die Versuchspersonen mit einem Schiebe regler die Frage „Für wie abergläubig halten Sie sich?“ an hand einer Analogskala mit den Endpunkten „überhaupt nicht“ (1) bis „stark abergläubig“ (101) beantworteten.
Ergebnisse Das Ausmaß selbst berichteten Aberglaubens zeigte zwi schen Experimental- (M = 22.76, SD = 18.77) und der Kont rollgruppe (M = 21.61, SD = 17.29) keinen statistisch signi fikanten Unterschied (t(98) = 0.32, p = .75, d = 0.06), sodass davon auszugehen ist, dass die Randomisierung im Hinblick auf diese Variable erfolgreich war. In der Experi mentalbedingung erkannten sieben Versuchspersonen nicht das Bild wieder, das ihnen während der Manipula tion angezeigt wurde. In der Kontrollgruppe erkannten alle Versuchspersonen das korrekte Bild wieder. Um zu überprüfen, ob die Induktion von Glück im Ver gleich zur Kontrollbedingung eine höhere Anagrammleis tung verursacht, führten wir einen t-Test für unabhängige Stichproben durch. Entgegen der Replikationshypothese zeigte sich zwischen der Experimentalbedingung (M = 29.88, SD = 16.41) und Kontrollgruppe (M = 30.20, SD = 20.17) kein statistisch signifikanter Unterschied in den Mittelwerten der generierten Wörter (t(98) = –0.09, p = .93, d = –0.02). Um auszuschließen, dass der erwartete Ef fekt aufgrund unzureichender Wahrnehmung des Mani pulationsstimulus ausblieb, schlossen wir die sieben Ver suchspersonen der Experimentalgruppe aus, die das Bild zur Glücks-Induktion nicht korrekt wiedererkannt hatten. Auch in dieser reduzierten Stichprobe war die mittlere Leistung der Experimentalbedingung mit Glücksinduktion (M = 28.76, SD = 14.53) jedoch niedriger als in der Kontroll bedingung. Wir berechneten eine zweifaktorielle Varianzanalyse mit dem Zwischensubjektfaktor Glücks-Induktion und dem Innersubjektfaktor Zeitpunkt (vor vs. nach der Glücks- Induktion), um zu testen ob die Induktion von Glück eine Auswirkung auf die Veränderung der Selbstwirksamkeits Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 51–60
56
O. Dickhäuser et al., Effekt Glückssache?
erwartung (SWE) hatte. Tabelle 1 zeigt die mittlere SWE in Abhängigkeit der Gruppenzuweisung und des Messzeit punkts. Es zeigte sich weder ein Haupteffekt von Glück auf die Selbstwirksamkeitserwartung (F(1, 98) = 3.43, p = .07, η2 = .03), noch ein Effekt des Messzeitpunkts (F(1, 98) = 0.67, p = .42, η2 = .01) und auch kein Interaktionseffekt der Faktoren (F(1, 98) = 1.00, p = .32, η2 = .01). Um zu testen, ob der Effekt aufgrund unzureichender Wahrnehmung des Manipulationsstimulus ausblieb, schlossen wir hier eben falls die sieben Versuchspersonen der Experimentalgruppe aus, die die Manipulationskontrolle nicht bestanden. Un abhängig vom Messzeitpunkt war die mittlere SWE in der Glücksbedingung etwas höher als in der Kontrollgruppe (F(1, 91) = 4.54, p = .04, η2 = .05). Ein statistisch signifikan ter Effekt des Messzeitpunktes (F(1, 91) = 0.38, p = .54, η2 = .004) und der erwartete Interaktionseffekt der Faktoren (F(1, 91) = 1.17, p = .28, η2 = .01) zeigten sich nicht. Auf wei tere Mediationsanalysen wurde angesichts der Befunde verzichtet.
Experiment 2 Ziel von Studie 2 war es, über die bisherigen Studien hin ausgehend die Wirkung von Pechinduktionen auf Selbst wirksamkeit und Leistung zu untersuchen. Der Gegen sätzlichkeit von Glücks- und Pechüberzeugungen folgend sollte dabei wie dargestellt nicht nur eine Glücks-Induktio nen zu höherer Selbstwirksamkeit und Leistung führen als eine neutrale Vergleichsbedingung, sondern entsprechend sollten sich auch Pechinduktionen in niedrigerer Selbst wirksamkeitserwartung und Leistung niederschlagen. Zur Prüfung dieser Vermutung wurde ein Design mit drei Gruppen realisiert (Pech vs. Kontrollgruppe vs. Glück). Die Präregistrierung der Studie findet sich unter https://as predicted.org/id9cu.pdf.
Tabelle 1. Deskriptive Statistiken der Prä-Post-Messung von Selbstwirksamkeitserwartung in Studie 1 Glück-Bedingung
Mittelwert
Standardabweichung
Glück-Induktion vor der Manipulation
73.27 (74.40)
23.35 (21.18)
Kontrollgruppe vor der Manipulation
65.37
24.35
Glück-Induktion nach der Manipulation
73.43 (74.47)
23.34 (20.57)
Kontrollgruppe nach der Manipulation
63.76
25.22
Anmerkung: Probanden nach Ausschluss nicht bestandenen Manipula tionschecks in Klammern.
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 51–60
Methode Versuchspersonen Eine a priori Planung der Stichprobengröße auf Grundlage der durchschnittlichen Stärke des Effekts von Glück auf Leistung von d = 0.83 aus der Meta-Analyse von Calin- Jagemann und Caldwell (2014) ergab, dass wir für eine Teststärke von 0.99 bei dem vorliegenden Drei-GruppenDesign 50 Versuchspersonen pro Gruppe benötigten. Es wurde schlussendlich eine Gesamtstichprobe von 175 Ver suchspersonen realisiert, welche über soziale Medien ak quiriert wurden. Davon wurden sechs Personen vor der Analyse aus dem Datensatz ausgeschlossen, weil vier das Einschlusskriterium der Volljährigkeit nicht erfüllten und zwei die Instruktion nicht richtig befolgten, da die konst ruierten Wörter mehr Buchstaben hatten als erlaubt bzw. nicht im Anagramm beinhaltete Buchstaben verwendet wurden. Insgesamt machten 169 Versuchspersonen gül tige Angaben, davon waren 65 männlich und 102 weiblich, 2 Personen ordneten sich keinem dieser beiden Ge schlechter zu. Im Durchschnitt waren die Versuchsper sonen 27.33 Jahre alt (SD = 10.82). Davon waren 52 % Studierende, 34 % Erwerbstätige, 7 % Auszubildende, 1 % Schüler und die restlichen 6 % kreuzten Sonstiges an. Die Bearbeitung der Studie dauerte etwa 10 Minuten. Die Versuchspersonen erhielten für die Teilnahme keine Vergütung. Überblick Die Versuchspersonen erhielten über einen Link Zugang zur Studie, die ohne Unterbrechung bearbeitet werden musste. Vor der Bearbeitung wurden sie randomisiert einer der drei Bedingungen („Glück“, n = 56; Kontroll gruppe, n = 58 oder „Pech“, n = 55) zugeteilt. Außerdem wurden sie vor Bearbeitung der Anagrammaufgabe bezüg lich ihrer aufgabenspezifischen Selbstwirksamkeit befragt. Der Studie lag ein einfaktorielles Zwischensubjekt- Design mit drei Stufen zugrunde. Faktor war die Art der Glücks-Induktion. Den Vpn der Glücks-Bedingung wurde vor der Anagrammaufgabe Glück induziert, in der Kont rollgruppe gab es keine Induktion von Glück oder Pech und in der Pech-Bedingung wurde Pech induziert. Abhän gige Variable war die Leistung in einer Anagrammaufgabe operationalisiert durch die Anzahl der generierten Wörter. Zusätzlich wurde als abhängige Variable und mögliche Mediatorvariable wiederum (anders als in Experiment 1 jedoch nur nach der Glücks-Induktion) die aufgabenspe zifische Selbstwirksamkeitserwartung erfasst. Material und Durchführung Die technische Realisierung der Studie und das Vorgehen zur Herstellung eines informed consent war identisch zu Studie 1. Den Versuchspersonen wurde nach deren Einwil © 2020 Hogrefe
O. Dickhäuser et al., Effekt Glückssache?
ligung zur Teilnahme geschildert, dass sie im Folgenden eine von drei hinsichtlich Schwierigkeitsgrad und Bearbei tungsdauer gleichen Aufgaben bearbeiten würden. Die Versuchspersonen wurden gebeten, sich für einen von drei identischen Würfelbechern zu entscheiden, angeblich, um so die Art und Nummer der nachfolgend zu bearbeitenden Aufgaben auszulosen. Randomisiert befand sich nach Auswahl des Würfelbechers entweder ein vierblättriges Kleeblatt (Glücksbedingung), ein Haus (Kontrollgruppe) oder die Aufschrift „Niete“ (Pechbedingung) auf dem per sönlichen Los (vgl. Abbildung 1b). Unabhängig hiervon gab es nachfolgend nur eine einzige Aufgabe, der alle Ver suchspersonen zugeteilt wurden. Auf der nächsten Seite wurde beschrieben, dass es sich bei der bevorstehenden Aufgabe um eine Anagrammauf gabe handeln würde. Dann wurde anhand einer adaptierten Version der „Allgemeinen Selbstwirksamkeit Kurzskala“ (Beierlein et al., 2013) die Selbstwirksamkeitserwartung in Bezug auf diese spezifische Aufgabe erfasst. Eines der Items aus Studie 1 wurde minimal verändert, ein zusätz liches Item mit dem Wortlaut „Aufgaben wie diese kann ich aus eigener Kraft gut meistern“ wurde ergänzt. Das Antwortformat war identisch zu dem in Studie 1. Diese Skala wies eine interne Konsistenz von α = .90 auf. Die An gaben der Versuchspersonen wurden über die drei Items gemittelt.2 Daraufhin folgte der Ablauf der Aufgabe und die Kriteri en für Wortbildungen aus dem Anagramm aus Studie 1. Es wurde allerdings ein anderes Anagramm mit gleicher Buch stabenanzahl verwendet (R M I D E N E L). Das persönliche Los wurde ab dieser Seite und während der Bearbeitung der Aufgabe durchgehend rechts oben eingeblendet (siehe elektronisches Supplement 3). Ansonsten war das Vorgehen zur Erfassung der Leistung identisch zu dem in Studie 1. Schließlich machten die Versuchspersonen demogra phische Angaben. Analog zur Studie 1 diente als Mani pulationscheck die Frage: „Was war auf Ihrem Los abge bildet oder geschrieben?“ Versuchspersonen sollten ihre Antwort in einem freien Antwortfeld eingeben. Wenn die Induktion korrekt erinnert und wiedergegeben wurde, galt der Check als bestanden. Ergänzend zur Studie 1 antworteten die Versuchspersonen auf die Frage „Hatten Sie das Gefühl, dass Sie während der Bearbeitung der Aufgabe Glück oder Pech hatten?“). Dieses Glücks- bzw. Pechempfinden sollte mit einem Schieberegler auf einer Skala von „Pech“ [1] bis „Glück“ [101] angegeben werden. Schließlich folgte eine Frage nach dem Aberglauben der Versuchsperson, bei der ein Schieberegler von „Ich halte mich für gar nicht abergläubig“ [1] bis „Ich halte mich für stark abergläubig“ [101] bewegt werden sollte. 2
57
Ergebnisse Es zeigten sich keine statistisch signifikanten Unterschie de im Aberglauben zwischen den drei Bedingungen (F(2,158) = 0.43, p = .65, d = 0.14). Somit war sichergestellt, dass die Randomisierung mit Blick auf abergläubige Über zeugungen erfolgreich war. Insgesamt wurde die Induktion von Glück bzw. Pech durch das persönliche Los nach Bearbeitung der Ana grammaufgabe von 153 Versuchspersonen korrekt erinnert, während sich 16 Versuchspersonen (10 aus der Kontroll gruppe und 6 aus der Glücksbedingung) nach Bearbeitung der Aufgabe nicht korrekt an ihr persönliches Los erinner ten. Um zu überprüfen, ob die Induktion von Glück oder Pech im Vergleich zur Kontrollgruppe einen Einfluss auf die Leistung in der Anagrammaufgabe hatte, wurde eine einfaktorielle Varianzanalyse gerechnet. Faktor war die Art der Induktion (Glück vs. keine Induktion vs. Pech), ab hängige Variable war die Anzahl richtiger generierter Wör ter in der Anagrammaufgabe (vgl. Tabelle 2). Es zeigte sich kein signifikanter Effekt der Art der Induktion auf die Leis tung (F(2,166) = 2.39, p = .09, d = 0.34), weshalb sich die Prüfung der nachfolgenden Frage nach einer möglichen Mediation dieses Effekts erübrigte. Zum Nachweis der Wirkung der Induktion auf die Selbstwirksamkeitserwartung wurde eine einfaktorielle Varianzanalyse gerechnet. Faktor war die Art der Induk tion (Glück vs. keine Induktion vs. Pech), abhängige Varia ble war die Selbstwirksamkeit. Es zeigte sich ein statistisch signifikanter Effekt der Bedingungszuweisung auf die Selbstwirksamkeitserwartung (F(2,166) = 3.48, p = .03). Es handelte sich dabei insgesamt um einen kleinen Effekt (d = 0.41). Die deskriptiven Statistiken sind ebenfalls Ta belle 2 zu entnehmen. Ein Post-Hoc Tukey-Test zeigte, dass lediglich die Glücksbedingung eine signifikant größere Selbstwirksam keitserwartung aufwies als die Pechbedingung (p = .03). Weder die Glücksbedingung noch die Pechbedingung unterschied sich in der aufgabenspezifischen Selbstwirk samkeitserwartung signifikant von der Kontrollgruppe (Glücksbedingung: p = .14, Pechbedingung: p = .78). Um zu testen, ob Teile des Ausbleibens der erwarteten Effekte ihre Ursachen in der zum Teil nicht korrekt erin nerten Induktion hatten, wurden die 16 Versuchsperso nen, die den Manipulationscheck nicht bestanden hatten, aus der Stichprobe ausgeschlossen und die Analysen be züglich Leistung und Selbstwirksamkeitserwartung erneut durchgeführt. Weiterhin war der Effekt auf Leistung statis tisch nicht signifikant (F(2,150) = 1.77, p = .17, d = 0.31) und
Die Skala wurde für die vorliegende Studie entwickelt und im Vorfeld nicht separat pilotiert. Für die psychometrische Güte der Skala spricht, daß eine explorative Faktorenanalyse dieser drei Items klar eine einfaktorielle Lösung (83 Prozent Varianzaufklärung) liefert.
© 2020 Hogrefe
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 51–60
58
O. Dickhäuser et al., Effekt Glückssache?
es verblieb ein kleiner, statistisch signifikanter Effekt der Art der Induktion auf die aufgabenspezifische Selbstwirk samkeitserwartung (F(2,150) = 3.45, p = .03; d = 0.43). Es zeigte sich weiter, dass die Art der Induktion (Glück vs. keine Induktion vs. Pech) keinen signifikanten Effekt darauf hatte, wie sehr die Versuchspersonen während der Bearbeitung der Anagrammaufgabe Glück oder Pech empfanden (F(2,166) = 0.02, p = .978, d = 0.02). Auch nach Ausschluss der Versuchspersonen, die den oben beschrie benen Manipulationscheck nicht bestanden haben, waren die Unterschiede im Empfinden von Glück und Pech wäh rend des Bearbeitens der Anagrammaufgabe nicht signifi kant (F(2,150) = 0.05, p = .95, d = 0.05).
Diskussion Ziel der vorliegenden zwei Experimente war es, mögliche Effekte einer Glücks-Induktion auf kognitive Leistung zu replizieren. Trotz einer sehr hohen Teststärke in beiden Experimenten, konnten wir den Effekt einer Glücks- Induktion auf Leistung in einer kognitiven Aufgabe nicht replizieren und auch die Induktion von Pech führte nicht zu einer signifikant schlechteren Leistung im Vergleich zur Kontrollgruppe. Auch konnten wir in Experiment 1 nicht den erwarteten stärkeren Anstieg der Selbstwirksamkeitserwartung in der Experimentalgruppe im Vergleich zu einer neutralen Be dingung feststellen. Die Tatsache, dass wir weder einen Effekt von Glück auf Leistung, noch eine Steigerung von Selbstwirksamkeit bei der Glück-Gruppe fanden und im zweiten Experiment zwar ein signifikanter Unterschied zwischen Glück- und Pech-Gruppe in der Selbstwirksam keit bestand, aber auch hier die experimentelle Manipula tion keinen Einfluss auf die Leistung in der Anagrammauf gabe hatte, führte dazu, dass auch die aufgestellten Mediationshypothesen verworfen wurden. Möglicherweise könnte das Ausbleiben eines Effekts in den aktuellen Untersuchungen im Gegensatz zum gefun denen Effekt von Damisch et al. (2010) auf das Nicht
vorhandensein von Versuchsleitereffekten aufgrund des Online-Designs zurückzuführen sein. Sowohl in der Repli kation von Calin-Jageman und Caldwell (2014), als auch in unserer Untersuchung konnten Versuchsleitereffekte aus geschlossen werden. Demgegenüber steht die Original studie von Damisch et al. (2010), in der nicht bekannt ist, ob Versuchsleiter über die Hypothesen informiert waren. Es kann also nicht ausgeschlossen werden, dass sich die Versuchsleiter hier jeder Versuchsperson gegenüber unab hängig von der zugeteilten Bedingung absolut identisch verhalten haben. Es ist zu diskutieren, inwieweit die erwarteten Effekte u. U. wegen einer Unwirksamkeit der Manipulation aus blieben. Hierzu ist festzustellen, dass auch dann nicht die erwarteten Effekte beobachtet werden konnten, wenn wir Personen ausschlossen, die die Instruktion nicht korrekt erinnerten. Allerdings gab es beim zweiten Experiment keine Gruppenunterschiede in dem wahrgenommenen Glück: Versuchspersonen, die ein Kleeblatt sahen, fühlten sich nicht so, als hätten sie mehr Glück gehabt, als Ver suchspersonen in der Kontroll- und der Pechbedingung. Wir interpretieren diesen Befund nicht als einen Hinweis auf die Wirkungslosigkeit der Induktion. Es liegt nahe, dass die Beantwortung dieser Frage (anders als die Erin nerung der erhaltenen Instruktion) ganz wesentlich durch die Güte der Bearbeitung der Aufgaben beeinflusst wird, was den Effekt der Manipulation abschwächen sollte. Vor allem aber dürfte das Gefühl, Glück gehabt zu haben ganz wesentlich davon abhängen, inwieweit eine Person über haupt abergläubige Überzeugungen hegt (und beispiels weise an die Wirkung eines Glücksklees glaubt). An keiner Stelle der Originalarbeit jedoch stellen Damisch et al. (2010) die Behauptung auf, dass es eine notwendige Vor aussetzung für die Wirksamkeit von Glückinduktionen sei, dass die Person selbst abergläubig ist. Vor dem Hintergrund dieser Überlegungen stellt sich allerdings die Frage, was genau durch die in der Literatur verwendeten Glücksinduktionen manipuliert wurde (selbst wenn keine der Damisch et al-Studien einen Mani pulationscheck umfasste). Wir denken, dass es zu weitrei chend ist, anzunehmen, dass man durch Glücksinduktio
Tabelle 2. Mittelwerte (M) und Standardabweichung (SD) der Anzahl generierter Wörter (Leistung) und Selbstwirksamkeitserwartung in Abhängigkeit der zugeteilten Bedingung in Studie 2 Leistung Bedingung
Selbstwirksamkeitserwartung
N
M
SD
M
SD
Glück
56 (50)
23.70 (24.54)
10.32 (9.54)
73.57 (74.22)
19.32 (19.43)
Kontrollgruppe
58 (48)
26.88 (26.73)
9.19 (9.41)
66.46 (67.19)
19.42 (20.52)
Pech
55 (00)
23.18
9.78
63.93
21.25
Gesamt
169 (153)
24.62 (24.74)
9.85 (9.64)
67.99 (68.45)
20.30 (20.40)
Anmerkung: Probanden nach Ausschluss nicht bestandenen Manipulationsschecks in Klammern.
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 51–60
© 2020 Hogrefe
O. Dickhäuser et al., Effekt Glückssache?
nen (wie etwa dem Wunsch des Versuchsleiters „Viel Glück“ oder dem Erhalt eines mit einem Glücksklee be druckten Golfballs) die Überzeugung der Versuchsperso nen steigert, nun Glück zu haben, denn, wie dargestellt dürfte diese Überzeugung ganz wesentlich von abergläu bigen Überzeugungen der Person abhängen (wollte man diese Position vertreten und prüfen, dann gelte es, die abergläubigen Überzeugungen auf Personseite zu mani pulieren). Am theoretisch sparsamsten ist es u. E. anzu nehmen, dass durch die genannten Induktionen das Kon zept Glück geprimed wird (siehe z. B. Tulving, Schacter & Stark; 1982). Grundsätzlich illustrieren diese Überlegun gen, wie herausfordernd Überlegungen über die wirkliche Natur der Induktion sind, wenn die Induktion keine Un terschiede bewirkt hat. Wir möchten hier jedoch die Posi tion vertreten, dass Überlegungen über die Natur von In duktionen von fundamentaler Bedeutung sind für das theoretische Verständnis der untersuchten Mechanismen. Der Nachweis des Effekts einer Induktion entbindet nicht von der Notwendigkeit, solche Überlegungen anzustellen. Erst wenn solche Überlegungen explizit gemacht werden, können sie Gegenstand weiterer empirischer Prüfung wer den. Bei der Suche nach möglichen Einflussgrößen auf die Heterogenität der Effekte ist zu erwägen, ob ein Effekt von Glücksinduktionen auf nachfolgende Leistung u. U. von der Schwierigkeit der Aufgabe abhängt. Matute (1994) vermutet, dass die Umstände oder die bevorstehende Auf gabe herausfordernd genug sein müssen, um die Wirkung von Aberglauben auf Leistung überhaupt beobachten zu können. Auch für den vermuteten Mediator Selbstwirk samkeitserwartung ist in der Literatur angenommen und gezeigt worden, dass dies vor allem bei Schwierigkeiten nachfolgendes Verhalten beeinflusst (Bandura, 1997). Al lerdings geben die Daten der vorliegenden und existieren den Studien keine Hinweise darauf, dass das Auffinden oder Ausbleiben eines Effektes von Glückinduktion auf Leistung systematisch von der Schwierigkeit der Aufgabe abhängt. So liegen die mittleren Selbstwirksamkeitserwar tungen in den vorliegenden zwei Studien (in denen der Ef fekt ausblieb) ebenso über dem theoretischen Mittelpunkt der Skala wie in den Studien 3 und 4 bei Damisch et al. (2010), in denen der Effekt nachgewiesen werden konnte. Vergleicht man die Studien, in denen ein Effekt von abergläubigem Priming auf Leistung beobachtet wurde mit solchen, die diesen Effekt nicht fanden, so sieht man, dass erstere häufiger methodische Probleme ausweisen als letztere. Zukünftige Untersuchungen sollten vor die sem Hintergrund mögliche Artefakte wie Versuchsleiter effekte oder Typ 1 Fehler ausschließen können. Außerdem sollten Studien sicherstellen, dass die Manipulation wirk sam genug ist und die Versuchspersonen den Stimulus ver arbeitet haben. © 2020 Hogrefe
59
Als Limitationen der vorliegenden zwei Studien ist zu nächst zu diskutieren, dass der Vorteil der Online-Studien (Ausschließen von Versuchsleitereffekten) auch eine ge ringe situationale Kontrolle mit sich brachte. Auch wenn wir (etwa aufgrund der Bearbeitungszeiten) keine Hinweise auf zu geringe Gewissenhaftigkeit der Bearbeitung der Aufgaben hatten, würden sich für zukünftige Studien möglicherweise andere Designs mit stärkerer Kontrolle der Erhebungssituation anbieten. Dies gilt insbesondere, wenn in weiteren Studien mögliche Moderatoren der Heterogenität der Effekte geprüft werden sollten, was in den vorliegenden zwei Studien nicht erfolgt ist. Sollte in solchen Studien auch Selbstwirksamkeit als vermittelnde Variable getestet werden, empfiehlt sich, entsprechende Skalen im Vorfeld zu pilotieren. Wie unabhängig von diesen Limitationen deutlich ge worden ist, gibt es für eine potentielle Wirkung abergläu biger Bräuche und Überzeugungen offensichtlich sehr enge Grenzen. Diese erschweren nicht nur deren Replika tion, sondern sie lassen es mit Blick auf den Leistungs bereich (etwa in Schule und Hochschule) als keine gute Strategie erscheinen, sich für die nächste Prüfung auf sei ne Glücksbringer zu verlassen. Insbesondere sollte das Vertrauen in das eigene Glück kein Ersatz dafür sein, zu Maßnahmen (etwa dem Aufbau relevanten Vorwissens oder konzentriertem, ausdauerndem Arbeiten; vgl. Hattie, 2008) zu greifen, deren positiver Einfluss auf die Leistung verlässlicher ist als der von Glück.
Elektronische Supplemente (ESM) Die elektronischen Supplemente sind mit der Online- Version dieses Artikels verfügbar unter https://doi.org/ 10.1024/1010-0652/a000263 ESM 1. Anzeige für Experimentalgruppe während der Auf gabe in Studie ESM 2. Distraktorbild bei Qualitätscheck in Studie 1 ESM 3. Anagrammaufgabe in der Glücksbedingung, Stu die 2
Literatur Bandura, A. (1997). Self-efficacy: The exercise of control. New York: Freeman. Beierlein, C., Kemper, C. J., Kovaleva, A., & Rammstedt, B. (2013). Kurzskala zur Erfassung allgemeiner Selbstwirksamkeits erwartungen (ASKU). Methoden, Daten, Analysen (mda), 7, 251 – 278. Calin-Jageman, R. J., & Caldwell, T. L. (2014). Replication of the superstition and performance study by Damisch, Stoberock, Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 51–60
60
O. Dickhäuser et al., Effekt Glückssache?
and Mussweiler (2010). Social Psychology, 45, 239 – 245. https:// doi.org/10.1027/1864-9335/a000190 Damisch, L., Stoberock, B., & Mussweiler, T. (2010). Keep your fingers crossed! How superstition improves performance. Psychological Science, 21, 1014 – 1020. https://doi.org/10.1177/0956 797610372631 Hattie, J. (2008). Visible learning: A synthesis of over 800 metaanalyses relating to achievement. London: Routledge. IfD Allensbach. (2000). Welcher Aberglaube hat für Sie eine Bedeutung, auf welchen geben Sie selbst immer acht? [Chart]. In Statista. Verfügbar unter https://de.statista.com/statistik/daten/ studie/830/umfrage/persoenlich-bedeutsamer-aberglauben/ Jahoda, G. (1969). The psychology of superstition. London: Penguin. Lockwood, P., Jordan, C. H., & Kunda, Z. (2002) Motivation by positive or negative role models: Regulatory focus determines who will best inspire us. Journal of Personality and Social Psychology, 83, 854 – 864. https://doi.org/10.1037//0022-3514.83.4.854 Matute, H. (1994). Learned helplessness and superstitious behavior as opposite effects of uncontrollable reinforcement in humans. Learning and Motivation, 25, 216 – 232. https://doi.org/10.1006/ lmot.1994.1012 Rosenthal, R. (1976). Experimenter effects in behavioral research. New York: Wiley. Rost, D.H. & Bienefeld, M. (2019). Nicht replizieren: publizieren!? Zeitschrift für Pädagogische Psychologie, 33, 163 – 176. https:// doi.org/10.1024/1010-0652/a000253 Schmidt, S. (2009). Shall we really do it again? The powerful concept of replication is neglected in the social sciences. Review of
General Psychology, 13, 90 – 100. https://doi.org/10.1037/a00 15108 Vyse, S. (2013). Believing in magic. Oxford: Oxford University Press. Tulving, E., Schacter, D. L., & Stark, H. A. (1982). Priming effects in word-fragment completion are independent of recognition memory. Journal of Experimental Psychology: Learning, Memory, and Cognition, 8, 336 – 342. https://doi.org/10.1037/0278-7393. 8.4.336 Historie Manuskript eingereicht: 02.04.2019 Manuskript nach Revision angenommen: 22.11.2019 Onlineveröffentlichung: 10.01.2020 Autorenhinweis Die vorliegenden zwei Studien entstanden im Rahmen eines experimentalpsychologischen Praktikums im Studiengang Psychologie (B.Sc) an der Universität Mannheim.
Prof. Dr. Oliver Dickhäuser Universität Mannheim Fakultät für Sozialwissenschaften Fachbereich Psychologie D-68131 Mannheim oliver.dickhaeuser@uni-mannheim.de
Anzeige
Passende JOBs. Neue Talente. PsychJOB Ihr Online-Stellenmarkt im Bereich Psychologie
www.psychjob.eu
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 51–60
© 2020 Hogrefe
Buchbesprechung Nuss, B. (2018). Base-1 method: A structural-functional approach to word, sentence and discourse readability. Münster: Waxmann. 256 Seiten, 39.90 €, ISBN 978-3-8309-3871-2 Textverständlichkeit ist ein starker Prädiktor für Textver stehen und intrinsische Motivation beim Lesen. Daher sind Studien zur Messung und Verbesserung der Textver ständlichkeit höchst wünschenswert. Mit diesem Buch legt Bernd Nuss seine Dissertation vor. Ziel der Arbeit ist die Entwicklung eines Konzepts und eines Instruments zur Messung der Verständlichkeit (Lesbarkeit) von Texten. Das Instrument zielt vor allem auf Texte für Leseanfänger innen und -anfänger ab. Die entwickelte Methode nennt Nuss base-1 method. Nuss unterscheidet zunächst zwischen Textverständ lichkeit (readability) und Textkomplexität (text complexity). Textverständlichkeit wird dabei als Merkmal der Inter aktion von Text und Leser bzw. Leserin aufgefasst. Diese Vorstellung der Textverständlichkeit wird durch alltäg liche Erfahrungen gestützt: Ein Text kann für eine Studen tin im ersten Semester unverständlich, am Ende des Stu diums aber verständlich sein. Der Text hat sich nicht verändert, die Verständlichkeit hat sich aber verändert, weil das Wissen zum Thema und zur Sprache des Textes gestiegen ist. Dementsprechend nehmen sowohl Merk male des Textes als auch Merkmale der Leserinnen und Leser Einfluss darauf, wie leicht ein Text in einer bestimm ten Situation verstanden werden kann. Zentrale Merkmale sind dabei vor allem Wortschatz, thematisches Vorwissen, Motivation, Aufmerksamkeit, Lesekompetenz und Größe des Arbeitsgedächtnisses. Die Textkomplexität auf der an deren Seite behandelt ausschließlich die Merkmale von Texten, welche die Verständlichkeit beeinflussen. In der Regel werden hier die Wortlänge, die Geläufigkeit der Wörter, die Satzlänge, die Komplexität der Syntax der Sätze und die Kohäsion des Textes untersucht. Um im Sinne von Wygotskis Zone des proximalen Wachstums Lernmaterial anbieten zu können, das Schüler innen und Schüler herausfordert, ohne sie zu überfordern, ist es zentral, die Textverständlichkeit bzw. die Komplexi tät der Texte zu ermitteln. Spätestens seit den 1920er Jah ren werden daher systematisch Konzepte und Instrumente zur Messung der Textverständlichkeit entwickelt und er probt. Die Forschung zur Textverständlichkeit findet noch immer vor allem im angloamerikanischen Sprachraum statt und bezieht sich dementsprechend vor allem auf eng © 2020 Hogrefe
lischsprachige Texte. Trotz der Bedeutung der Textver ständlichkeit für die Gestaltung von Lernmaterialien und Unterricht spielt das Thema in Deutschland im Vergleich zu den Vereinigten Staaten eine eher untergeordnete Rolle. Das Werk legt überzeugend dar, dass die Konzepte und Instrumente zur Messung der Textkomplexität aus dem englischen Sprachraum allerdings nicht ohne Weiteres auf das Deutsche übertragen werden können; zudem sind die bestehenden Konzepte und Instrumente zur Textkomple xität jeweils nur für begrenzte Personengruppen (Alter, Gesellschaftsschicht, …), Textarten und Kriterien geprüft. Wie Nuss erläutert, erfordern darüber hinaus auch unter schiedliche Konzepte der Lesedidaktik unterschiedliche Texte, die dementsprechend nach verschiedenen Kriterien ausgesucht und bewertet werden müssen. Im Englischen ist z. B. die Sightword-Methode weit verbreitet, bei der zu nächst vermittelt wird, besonders häufig vorkommende Wörter zu lesen. Im Deutschen verändern sich Wörter durch Konjugation und Deklination jedoch viel stärker als im Englischen (S. 60 – 66). Während die 100 geläufigsten Wörter im Englischen etwa die Hälfte aller Texte ausma chen und dabei ihre Form oft nicht oder kaum verändern, tauchen die geläufigsten Wörter im Deutschen oft in ge beugter Form auf (S. 61 – 62). Dem Englischen Wort the stehen im Deutschen beispielsweise die entsprechenden Wörter der, die, das, des, dem und den gegenüber (S. 62). Nuss zufolge sei die Sightword-Methode in der deutschen Lesedidaktik daher weniger sinnvoll und weniger gebräuch lich. Dementsprechend seien Instrumente, die die Text komplexität aufgrund der Worthäufigkeit bewerten, für das Deutsche auch weniger geeignet als für das Englische. Aufgrund der enormen Bedeutung der Entwicklung der Lesekompetenz und der Wissensvermittlung mit Hilfe verbaler Informationen sind Instrumente zur Messung der Textkomplexität aber auch für das Deutsche höchst wün schenswert, insbesondere zur Bewertung von Texten für Leseanfängerinnen und -anfänger. Um Texte mit passender Komplexität zuordnen zu können, ist es erforderlich, die Entwicklung der Lesekompetenz genauer zu betrachten und anzugeben, welche Merkmale der Texte zu welchem Zeitpunkt verarbeitet werden können. Dazu schlägt Nuss nachvollziehbar vor, die Komplexität der Wörter auf fol Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 61–63 https://doi.org/10.1024/1010-0652/a000264
62 Buchbesprechung
gende Weise zu erfassen: Wie viele Morpheme enthalten die Wörter, wie lang sind die Morpheme und wie sind sie miteinander verknüpft? Ähnliches schlägt er für Sätze vor: Wie viele Phrasen enthalten sie, wie lang sind die Phrasen und wie sind diese miteinander verknüpft? Der Fokus der Arbeit liegt auf der theoretischen Herlei tung der Base-1-Methode, gefolgt von ihrer kurzen exem plarischen Überprüfung. Dazu werden zunächst die Rele vanz der Arbeit und grundlegende Begriffe geklärt. Im Anschluss werden auf etwa 60 Seiten die Entwicklung der Lesekompetenz und Prädiktoren der Lesekompetenz be handelt. Dazu werden u. a. folgende Themen abgehandelt: der soziokulturelle Kontext, die Lesemotivation, die pho nologische Bewusstheit, der Wortschatz, das Weltwissen, Buchstabenlesen und Leseflüssigkeit. Anschließend wer den auf etwa 30 Seiten weit verbreitete Konzepte zur Text verständlichkeit und Textkomplexität vorgestellt, u. a. Fleschs Reading-Ease-Formel (1948) und die Software Coh-Metrix (McNamara, Graesser, McCarthy & Cai, 2014). Darauf aufbauend wird auf etwa 80 Seiten die Base-1- Methode erarbeitet. Auf etwa 20 Seiten wird die an schließend exemplarisch erprobt (s. u.) und auf weiteren 5 Seiten diskutiert. Der Theorieteil legt überzeugend dar, dass Textverstehen vor allem darin besteht, den Wörtern eines Textes Bedeutung zuzuordnen, die Syntax der Sätze zu dekodieren und eine angemessene, kohärente Reprä sentation des Inhalts aufzubauen; wobei diese Prozesse sowohl von Personen- als auch von Textmerkmalen ab hängen. Im Anschluss werden neue und innovative Me thoden vorgeschlagen, um die Komplexität der Wörter und der Syntax der Sätze sowie der Kohäsion eines Textes zu bewerten. Die Base-1-Methode zur Bewertung der Komplexität von Wörtern funktioniert wie folgt: Die Wörter werden zu erst in Morpheme zerlegt. Das Wort unerlässliche wird z. B. zerlegt in die Morpheme un, er, lass, lich, e und das Allo morph ä (S. 143). Den Morphemen werden dann aufgrund ihrer Länge in Buchstaben in 0.1er-Schritten Gewichte zu geordnet (die Morpheme un und er erhalten also z. B. je weils ein Gewicht von 0.2; das Morphem lass erhält den Wert 0.4, das Allomorph ä 0.1 usw.; S. 143). Um sicherzu stellen, dass für die weiteren Berechnungen Werte über 1 zur Verfügung stehen, wird diesen Gewichten der Basis wert 1 hinzuaddiert (daher „Base-1-Methode”). Diese Ge wichte werden dann miteinander multipliziert, bevor der Basiswert 1 anschließend wieder von der resultierenden Summe abgezogen wird. Das Wort unerlässliche erhält so den Base-1-Wert 1.2 ∙ 1.2 ∙ 1.4 ∙ 1.1 ∙ 1.4 ∙ 1.1 – 1 = 2.4 (S. 143). Auf diese Weise wird jedem Wort eines Textes ein Wert zugewiesen, dessen Höhe repräsentieren soll, wie schwie rig es ist, das Wort zu dekodieren. Nuss diskutiert die Mög lichkeit, die Morpheme jeweils noch zusätzlich zu gewich ten, beispielsweise nach ihrer Häufigkeit oder der Art der Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 61–63
Morpheme (so dass Präfixe und Suffixe u. U. verschiedene Gewichte erhielten). Die Base-1-Methode zur Bewertung der Komplexität der Syntax von Sätzen funktioniert ähnlich: Der Satz wird dazu zunächst in Phrasen zerlegt. Den Phrasen werden dann aufgrund ihrer Länge in Wörtern in 0.1er-Schritten Gewichte zugeordnet. Der Phrase my family wird also z. B. der Wert 0.2, der Phrase had wird der Wert 0.1 zugeordnet (S. 189). Diesen Gewichten wird wiederum der Basiswert 1 hinzuaddiert. Je nachdem, wie die Phrasen miteinander verknüpft sind, werden ihre Gewichte jeweils aufaddiert oder miteinander multipliziert. Anschließend wird der Basiswert 1 wieder von der resultierenden Summe abge zogen. Der Satz My family had a reunion wird z. B. n die Phrasen my family, had und a reunion zerlegt. Der Base1-Wert dieses Satzes ist dann 1.2 ∙ 1.1 ∙ 1.2 – 1 = 0.58 (S. 189). Auf diese Weise wird jedem Satz eines Textes ein Wert zu gewiesen, der repräsentieren soll, wie schwierig die Deko dierung der Syntax ist. Nuss diskutiert die Möglichkeiten, die Satzteile nach der Art der Phrase (z. B. Verbalphrase oder Nominalphrase) zu gewichten, oder die Base-1-Werte für die Wörter in die Bewertung der Sätze zu integrieren. Im Anschluss wird Kohäsion definiert und ihre Bedeu tung für das Verstehen herausgestellt, bevor verschiedene Arten der Kohäsion unterschieden und gängige Methoden zur Messung der Kohäsion angesprochen werden, vor allem latente semantische Analysen (Kintsch, 1998) und die Software Coh-Metrix (McNamara et al., 2014). Die an schließenden Ausführungen zur Base-1-Methode zur Be wertung der Kohäsion von Texten sind schwer nachvoll ziehbar. Hier wären Beispiele wünschenswert gewesen. Zur Bewertung der Kohäsion sollen in jedem Haupt- und Nebensatz die Wörter identifiziert werden, die sich auf frühere Ausführungen beziehen. Dann soll ausgezählt werden, wie viele Haupt- und Nebensätze zwischen den beiden Teilen liegen. Diese Werte sollen in eine Formel eingefügt werden, die einen Wert liefert, der wiedergeben soll, wie stark der formale Zusammenhang des Textes ist. Es bleibt allerdings unklar, was nach dieser Methode je weils als Referenz und Referent gewertet werden soll. Nuss liefert an dieser Stelle leider auch keine Rechtferti gung für das gewählte mathematische Modell. Die neu vorgeschlagene Methode zur Bewertung der Kohäsion ist den Methoden zur Bewertung der Wort- und der Satzkom plexität ähnlich. Darüber hinaus bleibt allerdings offen, welchen Vorteil das neu vorgeschlagene Verfahren gegen über etablierten und erprobten Verfahren haben soll. Die Stärken der Arbeit liegen in ihrem Theorieteil. Der Theorieteil trägt meines Wissens erstmals zentrale Er kenntnisse zusammen aus den sehr verschiedenen Fach gebieten zur Entwicklung der Lesekompetenz, zur Text verständlichkeit und der Sprachwissenschaft, um diese Erkenntnisse zu einem Gesamtkonzept zusammenzuführen © 2020 Hogrefe
Buchbesprechung 63
und kritisch zu diskutieren. Wie Nuss betont, kann die Methode auf verschiedene Sprachen angewendet werden. Der empirische Teil weist dagegen Schwächen auf. Für die empirische Erprobung des Verfahrens wurden neun unterschiedlich lange Geschichten zu jeweils verschie denen Themen geschrieben. Zu jeder Geschichte wurden anschließend sechs Behaltens- und Verstehensfragen konstruiert. Mit Hilfe der Base-1-Methode wurde die durchschnittliche Komplexität der Syntax der Sätze dieser Geschichten bewertet. Alle Texte und Fragen wurden je weils N = 306 Schülerinnen und Schülern der Klassenstu fen 1 bis 8 vorgelegt. Infolge mehrerer methodisch nicht nachvollziehbarer Schritte wurde die Stichprobengröße dann auf n = 105 bzw. n = 52 Versuchspersonen reduziert. In den statistischen Analysen wurden die durchschnitt lichen Base-1-Werte der Sätze der Texte mit der Lösungs häufigkeit der sechs Fragen zu dem jeweiligen Text korre liert. Die Base-1-Werte sind also jeweils mit der Textlänge, den Themen der Texte sowie den Behaltens- und Verste henstests konfundiert. Es fehlen Angaben zur Objektivität und Reliabilität der Base-1-Methode sowie empirische Be lege zur Objektivität, Reliabilität und Validität der anderen eingesetzten Instrumente. Die Verfahren zur Bewertung der Komplexität der Wörter und der Kohäsion der Texte wurden nicht erprobt. Insgesamt gibt die durchgeführte Untersuchung daher nur wenige Hinweise auf den Nutzen der Base-1-Methode. Darüber hinaus wären Angaben zur Ökonomie der Me thode interessant. Im Buch wird beschrieben, wie man die Komplexität von Texten mit Hilfe der Base-1-Methode be wertet. Das Verfahren erfordert allerdings einige Exper tise bei der Analyse der Morphologie der Wörter, der Syn tax der Sätze und der Kohäsion. Das Buch enthält keine Angaben dazu, wie lange es dauert, diese Expertise zu
© 2020 Hogrefe
rwerben und wie lange Expertinnen und Experten brau e chen, um Texte nach den entsprechenden Base-1-Methoden zu analysieren. Nuss spricht die Möglichkeit an, eine Soft ware zu entwickeln, die das Verfahren ausführt, es bleibt aber offen, inwieweit die Base-1-Methode mit Hilfe beste hender Tools bereits umgesetzt werden kann oder welche Schritte dafür noch erforderlich sind. Das Werk weist schließlich noch eine Reihe von Lek torierungsfehlern auf. So fehlen z. B. immer wieder Quellen aus dem Text im Literaturverzeichnis. Von den Schwächen der empirischen Untersuchung abgesehen, fand ich den Theorieteil – soweit ich es beurteilen kann – sehr lesens wert und interessant. Wer sich dafür interessiert, wie ver schiedene Fachgebiete auf Lesen und Verständlichkeit blicken, findet hier eine interessante und kompakte Dar stellung der verschiedenen Herangehensweisen.
Literatur Flesch, R. (1948). A new readability yardstick. Journal of Applied Psychology, 32, 221 – 233. doi: 10.1037/h0057532 Kintsch, W. (1998). Comprehension – A paradigm for cognition. New York, NY: Cambridge University Press. McNamara, D. S., Graesser, A. C., McCarthy, P. M., & Cai, Z. (2014). Automated evaluation of text and discourse with Coh-Metrix. New York, NY: Cambridge University Press.
Dr. Marcus C. G. Friedrich Technische Universität Braunschweig Institut für Pädagogische Psychologie Bienroder Weg 82 38106 Braunschweig m.friedrich@tu-braunschweig.de
Zeitschrift für Pädagogische Psychologie (2020), 34 (1), 61–63
Hinweise für Autorinnen und Autoren Die «Zeitschrift für Pädagogische Psychologie» hebt die traditionel len Grenzen zwischen der Pädagogischen Psychologie und den an deren psychologischen Teilbereichen auf und nutzt deren Erkennt nisse für ein erweitertes Verständnis von Pädagogischer Psychologie. Dabei versteht sie sich als integrierende Klammer für all diejenigen Bemühungen, die zu einer besseren Beschreibung und Vorhersage sowie zu einem tieferen Verständnis und zur Optimierung der Ent wicklungs, Erziehungs und Unterrichtsprozesse von Individuen und Gruppen beitragen. So wird die «Zeitschrift für Pädagogische Psychologie» der zunehmen den Bedeutung der Pädagogischen Psychologie als anwendungs orientierte Disziplin für die Sozialisation und Lebensbewältigung von Lernenden aller Altersstufen in einer immer komplexer werdenden Umwelt gerecht. Veröffentlicht werden in der Zeitschrift für Pädagogische Psy chologie die Rubriken: Originalarbeiten, Übersichtsartikel und Kurzbeiträge. Einsendung von Manuskripten. Alle Manuskripte sind in elektroni scher Form auf https://www.editorialmanager.com/zfpp einzureichen. Detaillierte Hinweise für Autorinnen und Autoren finden Sie unter https://www.hogrefe.com/j/zpp Detailed instructions to authors are provided at https://www.hogrefe.com/j/zpp Urheber und Nutzungsrechte. Manuskripte, die zur Veröffentlichung in dieser Zeitschrift eingereicht werden, dürfen nicht gleichzeitig an anderer Stelle eingereicht oder veröffentlicht sein bzw. werden. Die Autorin bzw. der Autor bestätigt und garantiert, dass sie bzw. er uneingeschränkt über sämtliche Urheberrechte an ihrem bzw. seinem Beitrag einschließlich eventueller Bildvorlagen, Zeichnungen, Pläne, Karten, Skizzen und Tabellen verfügt, und dass der Beitrag keine Rech te Dritter verletzt. Die Autorin bzw. der Autor räumt – und zwar auch zur Verwertung ihres bzw. seines Beitrages außerhalb der ihn ent haltenen Zeitschrift und unabhängig von deren Veröffentlichung –
dem Verlag räumlich und mengenmäßig unbeschränkt für die Dauer des gesetzlichen Urheberrechts das ausschließliche Recht der Ver vielfältigung und Verbreitung bzw. der unkörperlichen Wiedergabe des Beitrages ein. Die Autorin bzw. der Autor räumt dem Verlag ferner die folgenden ausschließlichen Nutzungsrechte am Beitrag ein: a) Das Recht zum ganzen oder teilweisen Vorabdruck oder Nach druck – auch in Form eines Sonderdrucks, zur Übersetzung in an dere Sprachen, zu sonstiger Bearbeitung und zur Erstellung von Zusammenfassungen (Abstracts); b) das Recht zur Veröffentlichung einer Mikrokopie, Mikrofiche und Mikroformausgabe, zur Nutzung im Weg von Bildschirmtext, Videotext und ähnlichen Verfahren, zur Aufzeichnung auf Bild und /oder Tonträger und zu deren öffentlicher Wiedergabe – auch multimedial – sowie zur öffentlichen Wiedergabe durch Radio und Fernsehsendungen; c) das Recht zur maschinenlesbaren Erfassung und elektroni schen Speicherung auf einem Datenträger (z. B. Diskette, CDRom, Magnetband) und in einer eigenen oder fremden OnlineDaten bank, zum Download in einem eigenen oder fremden Rechner, zur Wiedergabe am Bildschirm – sei es unmittelbar oder im Wege der Datenfernübertragung – sowie zur Bereithaltung in einer eigenen oder fremden OnlineDatenbank zur Nutzung durch Dritte; d) das Recht zu sonstiger Vervielfältigung, insbesondere durch foto mechanische und ähnliche Verfahren (z.B. Fotokopie, Fernkopie) und zur Nutzung im Rahmen eines sogenannten Kopienversands auf Bestellung; e) das Recht zur Vergabe der vorgenannten Nutzungsrechte an Dritte in In und Ausland sowie die von der Verwertungsgesellschaft WORT wahrgenommenen Rechte einschließlich der entsprechenden Ver gütungsansprüche. Nutzungsrichtlinien für HogrefeZeitschriften artikel. Hinweise für Autorinnen und Autoren zur OnlineArchivie rung einer elektronischen Version Ihres Manuskriptes finden Sie auf unserer Homepage unter www.hgf.io/nutzungsrichtlinien. Januar 2020
Anzeige
Motivationsförderung im Schulalltag
Rheinberg / Krug
Falko Rheinberg / Siegbert Krug
Motivationsförderung im Schulalltag Falko Rheinberg Siegbert Krug
Motivationsförderung im Schulalltag Psychologische Grundlagen und praktische Durchführung 4., aktualisierte Auflage
www.hogrefe.com
Psychologische Grundlagen und praktische Durchführung 4., aktualisierte Auflage 2017, 252 Seiten, € 34,95 / CHF 45.50 ISBN 978-3-8017-1950-0
Das Buch schildert die Entwicklung und Erprobung von Techniken, die zur Motivationsförderung im Schulalltag eingesetzt werden können. Dabei werden sowohl Maßnahmen für Schüler als auch für Lehrkräfte berücksichtigt. Für die 4. Auflage wurden einzelne Abschnitte ergänzt sowie die Literatur aktualisiert.
32nd International Congress of Psychology
July 19 - 24, 2020 Prague, Czech Republic 5-day Scientific Programme Over 25 State-of-the-Art Lectures Over 100 Keynote Addresses Over 190 Invited Symposia Over 5 Controversial Debates and much more …
Represent your country and join us at the ICP 2020! Follow us on Facebook, Twitter, Instagram!
Die umfassende Einführung fürs Lehramtsstudium
Markus Roos / Bruno Leutwyler
Wissenschaftliches Arbeiten im Lehramtsstudium Recherchieren, schreiben, forschen 2., überarb. Aufl. 2017. 328 S., 18 Abb., 36 Tab., Kt € 19,95 / CHF 26.90 ISBN 978-3-456-85817-3 Auch als eBook erhältlich
Dieses kompakte Lehrbuch führt Studierende des Lehramtes zielgenau in das gesamte Spektrum der wissenschaftlichen Arbeitsmethoden ein: von der ersten Recherche bis hin zur pädagogisch orientierten Bachelor- oder Masterarbeit.
06.06.17 14:24
www.hogrefe.com
Hier erfahren Sie alles Wichtige über wissenschaftliches Lesen, Interpretieren, Exzerpieren und Zitieren. Zusätzlich begleitet Sie das Buch bei den ersten Schritten in der Forschung und vermittelt Ihnen die entscheidenden Basics zu Forschungsdesign, Beobachtung, Interviews, Fragebogenerhebung sowie qualitativer und quantitativer Datenauswertung.
Die 2. Auflage wurde aktualisiert und überarbeitet – so wird nun beispielsweise die Suche nach Themen besser unterstützt, und das Kapitel zum Zitieren ist übersichtlicher gestaltet und ausgeweitet worden.