Über Statistik und Forschung

In den Reflexionen über Lernen und Gedächtnis 2 habe ich die Untersuchung von Kornell und Bjork (2008) zur Selbstregulation beim Vokabellernen vorgestellt. Dabei hat sich gezeigt, dass die Bedingung «Selbstregulation», bei der die Teilnehmenden entscheiden konnten, ob sie ein Vokabelpaar für weitere Lerndurchgänge beibehalten wollten oder nicht, zu weniger guten Lernleistungen geführt hat als die Bedingung ohne Selbstregulation. Vermutlich deshalb, weil die Selbstregulation dazu verführte, Vokabeln verfrüht als gelernt einzustufen und von weiteren Lerndurchgängen auszuscheiden. In Folgenden möchte ich den Untersuchungsplan und die Ergebnisse dieser Studie noch etwas detaillierter darlegen.

Wenn in der experimentellen Forschung zwei Bedingungen – in unserem Fall, zwei Lernbedingungen – miteinander verglichen werden, so gibt es prinzipiell zwei mögliche Vorgehensweisen: (1) Die Teilnehmenden werden nach dem Zufallsprinzip auf zwei Gruppen verteilt, welche dann die Untersuchung gemäss der einen oder der anderen Bedingung durchführen. Oder (2) alle Teilnehmenden der Untersuchung absolvieren sowohl die eine als auch die andere Bedingung. Bei der ersten Vorgehensweise spricht man in der experimentellen Forschung von einer Variation zwischen den Versuchsteilnehmenden und bei der zweiten Vorgehensweise von einer Variation innerhalb der Versuchsteilnehmenden. Der Vorteil der zweiten Vorgehensweise ist der, dass in der Regel weniger Teilnehmende benötigt werden, weil allfällige individuelle Unterschiede der rekrutierten Teilnehmenden bezüglich des interessierenden Masses (hier: bezüglich der Fähigkeit zu Lernen), sich gleichermassen auf die Leistungen in beiden Bedingungen auswirken. Allerdings müssen nun mögliche sogenannte «Störvariablen» bei der Versuchsdurchführung berücksichtigt werden. Zum Beispiel, die Ermüdung: Im Laufe der Untersuchung könnten die Teilnehmenden ermüden, sodass ihre generelle Lernfähigkeit im zweiten Teil der Untersuchung abnimmt. Oder, eine Trainingseffekt: Da die Teilnehmenden womöglich schon längere Zeit keine Vokabeln lernen mussten, könnten sie im Laufe der Untersuchung beim Vokabellernen effizienter werden. Um die Wirkung solcher «Störvariablen» auszugleichen, wird die Abfolge der Bedingungen variiert: jeweils die Hälfte der Teilnehmenden beginnt mit der Bedingung A (gefolgt von B) oder mit der Bedingung B (gefolgt von A). 

Auf diese Weise sind auch Kornell und Bjork (2008) bei ihrer Untersuchung vorgegangen. Als Lernmaterial verwendeten sie 40 Englisch-Suaheli-Wortpaare, unterteilt in zwei Listen à 20 Wortpaare, nämlich je eine Liste für die beiden Lernbedingungen. Als Untersuchungsteilnehmende wurden 60 Studierende rekrutiert (Studierende der Psychologie sind verpflichtet, im Rahmen ihrer Ausbildung eine bestimmte Anzahl Stunden an wissenschaftlichen Studien teilzunehmen). Es gab zwei Lernblöcke à 10 Minuten mit je 20 Wortpaaren. Die Wortpaare wurden auf einem PC-Bildschirm wie folgt dargeboten: Zuerst das englische Wort für 1.5 Sekunden, gefolgt vom Suaheli-Wort während 3 Sekunden. Um mit dem nächsten Wortpaar fortzufahren, musste nun ein «Entscheidungsknopf» gewählt werden, nämlich «Study again later» oder «Remove from stack». Allerdings gab es diese Alternativen nur in der Bedingung mit Selbstregulation; in der Vergleichsbedingung ohne Selbstregulation wurde nur der Knopf «Study again later» präsentiert. Auf diese Weise wurden alle Wortpaare mehrmals dargeboten, bis die 10 Minuten pro Lernblock vorbei waren. Wie bereits gesagt, wurde die Abfolge der beiden Lernbedingungen und die Zuteilung der beiden Lernlisten auf die beiden Lernbedingungen so variiert, dass eine allfällige Auswirkung dieser Störvariablen auf die Testleitung ausgeglichen wurde.

Beim nachfolgenden Vokabeltest wurden dann Wörter beider Bedingungen resp. Listen in zufälliger Abfolge präsentiert. Dabei wurden die englischen Wörter gezeigt und die Teilnehmenden gebeten, das entsprechende Suaheli-Wort einzutippen. Dazu hatten sie für jede Vokabel 12 Sekunden Zeit.

Nun gab es bezüglich Testzeitpunkt eine weitere Variation: Entweder wurde der Test gleich anschliessend an die Lernphasen, oder erst nach einer Woche durchgeführt. Da diese Variation nicht innerhalb der Teilnehmenden variiert werden konnte (denn der erste Test hätte ja eine zusätzliche Konsolidierung des Lernens für den zweiten Test bewirkt) haben 31 Teilnehmende den Test sogleich absolviert, und die andern 29 Teilnehmende wurden nach einer Woche getestet.

Kurz zusammengefasst: Die Untersuchung beinhaltete einen 2 x 2 Versuchsplan mit zwei sog. unabhängigen Variablen, nämlich (1) die Lernbedingung (Selbstregulation versus keine Selbstregulation; Variation innerhalb der Teilnehmenden), und (2) der Testzeitzeitpunkt (unmittelbar versus nach einer Woche; Variation zwischen den Teilnehmenden). Dies ergibt die insgesamt vier Bedingungen, die in der Grafik der Ergebnisse enthalten sind, welche wir nun betrachten:

Beginnen wir mit dem Trivialen: Die Teilnehmenden, die den Vokabeltest unmittelbar nach den Lernphasen absolvierten, konnten durchschnittlich bedeutend mehr Vokabeln korrekt wiedergeben (2 Balken links), als jene, die erst nach einer Woche getestet wurden (2 Balken rechts).

Von zentralem Interesse ist nun aber die Frage, wie sich die Variable Lernbedingung auf die Erinnerungsleistung auswirkte. Es ist ersichtlich, dass bei beiden Testzeitpunkten mehr Suaheli-Vokabeln korrekt wiedergegeben wurden, wenn die Teilnehmenden NICHT selber entscheiden konnten, Vokabel-Paare beizubehalten oder auszuscheiden. Sind aber diese Unterschiede (zwischen den weissen und den schwarzen Balken) nicht relativ klein? Hierzu gilt es Folgendes zu bedenken: Intuitiv würde man ja eher annehmen, dass die Möglichkeit, Vokabeln beiseitezulegen (wenn sie beherrscht werden), die Lernzeit für jene Vokabeln erhöht, die eben noch nicht beherrscht werden, was doch insgesamt zu bessern Leistungen führen sollte. Wenn nun der Unterschied in die entgegengesetzte Richtung geht, so ist das doch umso eindrucksvoller.

Noch eine Anmerkung zu den Ergebnissen beim Test nach einer Woche. Hier ist ja die Differenz zwischen den beiden Bedingungen absolut betrachtet noch etwas geringer als beim unmittelbaren Test. Aber – im Verhältnis betrachtet – wurden in der «No-drop»-Bedingung fast doppelt so viele Vokabeln korrekt wiedergegeben als in der «Drop»-Bedingung. Das Beibehalten von Vokabel-Paaren in der «No-Drop»-Bedingung hatte zur Folge, dass diese Vokabeln während der Lernphase weiterhin mehrmals erfolgreich reproduziert wurden; und dieses Reproduzieren ist insbesondere für das langfristige Behalten von Vorteil. In der Gedächtnispsychologie sind zwei Theorieansätze oder Lernmechanismen bekannt, um diese Wirkung zu erklären: Der Generierungseffekt und der Testing-Effekt. Ich werde darauf in einer kommenden «Reflexion über Lernen und Gedächtnis» eingehen.