Prof. Dr. Hartmut Esser zu Gast bei der WIPOG und dem VDL Hessen – die Inhalte HIER zum Nachlesen

Falsch abgebogen!

Wie PISA und die Bildungsforschung die Bildungspolitik in die Irre geführt haben.

Tief saß der PISA-Schock von 2000: Deutschland weit unten in den Leistungen und die soziale Ungleichheit in der Bildung so hoch „wie kaum in einem anderen Land“. Für viele war sofort klar, woran das gelegen haben müsse: An der frühen und in Deutschland besonders strikten Trennung der Bildungswege, einprägsam illustriert über Bilder wie das vom Bildungstrichter, wonach von 100 Akademikerkindern fast 80% studieren, aber nur knapp 30% von aus Nicht-Akademikerfamilien. Seitdem gilt der Übergang in ein integratives System nach dem Vorbild der skandinavischen Länder, wie Schweden und besonders Finnland, als der Königsweg für die Lösung der Probleme. Erst kürzlich noch forderte der Erziehungswissenschaftler Georg Breidenstein in der ZEIT: „Wir dürfen Schüler nicht aussortieren!“, ganz auf einer Linie mit dem Protestaufruf „BILDUNGSWENDE.jetzt“ im September 2023 – noch vor dem zweiten PISA-Schock. Offenbar wurden, so könnte man meinen, länger schon als zwanzig Jahre die mehr als überfälligen Reformen verschlafen oder gar gewollt verschleppt. Und das obwohl die nach PISA 2000 stark ausgebaute empirische Bildungsforschung die Befunde zur Abschaffung der Differenzierung doch immer wieder neu zu bestätigen schien.

Hat sie das wirklich? Man kann, nein: man muss es bezweifeln, und das ist eine doch längere und recht wendungsreiche Geschichte. Gleich bei PISA 2000 schon fanden sich nämlich Hinweise, dass es (ganz) anders sein könnte. Für Deutschland etwa gab es eine Sonderauswertung für einen Vergleich der Bundesländer. Und was für eine Überraschung! Bayern und Baden-Württemberg lagen über dem OECD-Durchschnitt, und zwar recht deutlich, und Sachsen nur wenig darunter. Die soziale Durchlässigkeit war besser als die der anderen Bundesländer, nicht weit weg von Schweden sogar. Diese drei Bundesländer hatten dabei die stringentesten institutionellen Regelungen: die Verbindlichkeit der Empfehlungen und eine stärkere organisatorische Kontrolle der Schulen, etwa über die Standardisierung des Stoffs, Zentralexamina, regelmäßige Tests und die „Accountability“ der Schulen und des Lehrpersonals (vgl. die Übersicht bei Helbig und Nikolai 2015, Abbildung 28). Die schlechtesten Leistungen und die stärkste soziale Ungleichheit zeigten sich dagegen in Bremen, Berlin, Hessen und Nordrhein-Westfalen. Das aber waren ausgerechnet jene Bundesländer mit der größten Öffnung und der stärksten Lockerung, keine Verbindlichkeit und eine nur geringe Kontrolle, also Regelungen, die schon sehr in die Richtung der Integration gehen.

Diese beiden Regelungen sind darauf gerichtet, dass die Einteilung auf die unterschiedlichen Bildungswege auch tatsächlich nach den Fähigkeiten der Kinder erfolgt und die damit verbundenen institutionellen Änderungen, die Anpassung der Curricula und des Unterrichts an die Unterschiede, auch wirklich implementiert werden – so wie das in den frühen Begründungen der Differenzierung auch immer vorausgesetzt worden war. Ohne diese Regelungen kann man nicht viel erwarten, es ist vielleicht die schlechteste der Lösungen: Sortierung nach Belieben und dann natürlich mit Ungerechtigkeiten aller Art, von Verlusten in der möglichen Effizienz ganz abgesehen. Und genau das zeigte sich dann ja auch in dem Muster der Bundesländer mit und ohne die beiden Zusatzregelungen zur Differenzierung. Es war damit also auch geradezu umgekehrt zu dem im einfachen Vergleich der Nationalstaaten bei PISA 2000 entstandenen Eindruck, dass mit der Öffnung die Leistungen besser und die Bildungsungleichheit geringer würden. In der Zusammenfassung der Mittelwerte im PISA-Vergleich für das ganze Land war das alles überdeckt worden. Man konnte es in den jeweiligen Berichten gut nachlesen, damals schon. Aber kaum jemand hat es bemerkt, geschweige denn darauf hingewiesen.

Die Geschichte ging nur wenig später mit einem auch wieder etwas überraschenden Dreh weiter. Es gab 2003 einen Bericht über die Verhältnisse in den Grundschulen, auch im internationalen Vergleich, IGLU 2003. Darin zeigte sich, dass man in Deutschland recht gut mithalten konnte, aber auch, dass es danach in der Sekundarstufe im Vergleich deutlich schlechter würde. Daraus wurde in dem Bericht geschlossen: Die Grundschulen, in denen ja noch nicht getrennt wird, machen ihren Job in Deutschland ganz gut, aber sobald in der Sekundarstufe die Differenzierung greift, geht es wieder los mit Leistungsrückstand und Ungleichheit. Und wieder lag der Schluss auf der Hand: Abschaffung der Differenzierung.

Aber auch hier gab es wieder eine gesonderte Betrachtung der Bundesländer. Und da zeigte sich etwas ganz Ähnliches wie zuvor beim Vergleich der Leistungen in der Sekundarstufe: Baden-Württemberg und Bayern mit ihren besonders stringenten Regelungen lagen auch bei den Grundschulen weit über dem Durchschnitt und kamen fast an Schweden heran, Nordrhein-Westfalen und Bremen mit ihren Öffnungen blieben jedoch deutlich darunter. Die anderen Bundesländer hatten nicht teilgenommen oder lagen auch im unteren Bereich, spätestens in der Sekundarstufe, Hessen etwa. Im Vergleich bei IGLU 2003 zeigte sich dann wieder das Muster von PISA 2000 für die Bundesländer für die Sekundarstufe: In den stringenten Bundesländern waren die Leistungen nicht nur in der Grundschule höher als im Durchschnitt, sondern dieser Unterschied nach oben verstärkte sich in der Sekundarstufe gegenüber den offenen Systemen noch einmal. Die stringente Differenzierung half also schon immer offenbar doppelt nach oben: bereits vor dem Übergang und dann noch einmal zusätzlich danach in der Sekundarstufe. Das allerdings nur bei in den Bundesländern mit den stringenten Regelungen einer Kombination von Verbindlichkeit und Kontrolle.

So ging es mit den PISA-Berichten für 2003 und 2006 eine Weile weiter. Im internationalen Vergleich gab es für Deutschland insgesamt dann aber auch erste Anzeichen der Besserung in Niveau und sozialer Durchlässigkeit – und von Verschlechterungen in Schweden wie auch in Finnland. Das verstärkte sich 2009, dann noch einmal für 2012 und besonders schließlich für 2015, so dass sich die Länder im internationalen Vergleich mit und ohne Differenzierung damals kaum noch unterschieden. Mehr noch: Im Vergleich der deutschen Bundesländer waren Sachsen und Bayern 2018, also vor Corona und damit in der Zeit mit einem regulären Unterricht, in den Leistungen wieder die besten in Deutschland – und international besser als Schweden und sogar Finnland. In der sozialen Durchlässigkeit unterschieden sich die Länder ohnehin alle nicht mehr, auch vorher schon nicht. In Abbildung 1 ist das für das Jahr 2018 zusammenfassend graphisch dargestellt.

Abbildung 1: Differenzierung und Integration im internationalen Vergleich und im Vergleich der deutschen Bundesländer mit stringenter und offener Differenzierung (nach PISA 2018 und IQB 2018).

Gleichwohl verstummten die Stimmen nicht, in Deutschland mit seiner frühen und rigiden Trennung der Kinder nach der Grundschule seien die Probleme besonders groß und, so mindestens der Subtext, nur durch den Übergang zur vollen Integration, beziehungsweise zu einem „längeren gemeinsamen Lernen“ über die ganze Pflichtschulzeit hinweg zu lösen. Es war (und ist) nach PISA 2000 ein breiter Konsens, und man könnte schon von einer nicht weiter bezweifelten Standardposition zu der Frage nach den Effekten von Differenzierung und Integration sprechen, etwa bei Wößmann et al. 2009, van de Werfhorst und Mijs 2010 oder Allmendinger 2012 unter vielen anderen bis in die letzte Zeit. Auch Richard David Precht hat nicht gefehlt. Für 2018 noch wiederholte sich das in der OECD-Ländernotiz zu PISA. Und daran anschließend konnte man es auch in der ZEIT wieder lesen (online am 3. Dezember 2019) – obwohl es so schon noch nie gestimmt hatte.

Auf dem Gipfelpunkt dieser Verbesserungen und Konvergenzen gab es nun, als solches wohl ungewollt, ein wissenschaftlich interessantes, wenngleich politisch auch umstrittenes Feldexperiment. In Baden-Württemberg war 2011/12 mit dem politischen Wechsel zu Rot-Grün die Verbindlichkeit der Grundschulempfehlungen abgeschafft worden. Das könnte negative Folgen, so hatte zum Beispiel Dollmann (2011) früh genug gewarnt, der den damals wohl den einzigen Datensatz zur Verfügung hatte, der einigermaßen brauchbar war, um die Frage nach den Effekten der Verbindlichkeit wirklich anzugehen. Und das war auch nur naheliegend: Ohne die Verbindlichkeit und mit der Freigabe der Schulwahl entscheidet nicht mehr die Leistung der Kinder allein, sondern der Ehrgeiz der Eltern, insbesondere der aus den oberen sozialen Schichten, oder aber die Furcht vor dem unbekannten Schritt bei den eher bildungsferneren Eltern der unteren sozialen Schichten. Das aber führe dazu, so konnte man vermuten, dass mehr Kinder aus den sozial privilegierten Schichten auf dem Gymnasium landeten, die die Leistungsanforderungen nicht erfüllen könnten, aber auch dass gerade die talentierten Kinder aus den unteren Schichten ihre Chancen nach oben nicht wahrnehmen könnten. Hinzu kommt, dass es mit der Verbindlichkeit einen besonderen Anreiz gibt, sich schon vor dem Übergang besonders anzustrengen, der, so könnte man denken, bei der freien Wahl kleiner wird oder ganz entfällt, weil es bei der freien Wahl auf die Leistungen beim Übergang auf das Gymnasium ja nicht so unbedingt mehr ankommt.

Und so kam es auch. Baden-Württemberg war 2015 und 2018 bei den stringent gebliebenen Bundesländern Bayern und Sachsen nicht mehr dabei. Die waren ungerührt mit ihrer Stringenz auf dem eingeschlagenen Erfolgspfad geblieben und einfach weiter nach oben davongezogen. Baden-Württemberg sackte zwar nicht unbedingt ab, sondern blieb einfach gegenüber anderen stecken und lag bald nur noch wenig vor Hessen und Nordrhein-Westfalen im unteren Bereich. Und sozial durchlässiger war es auch nicht geworden.  Das Experiment mit der Abschaffung der Verbindlichkeit der Übergangsempfehlungen war also offensichtlich gescheitert. Das war in den Berichten des IQB sogar schon für 2015 nachzulesen gewesen, wo eigentlich noch nichts mit Blick auf die Sekundarstufe hätte passieren dürfen: Die Kinder hatten nach der Umstellung offenbar noch in der Grundschule und vor dem Übergang die Griffel fallen gelassen als klar wurde, dass man es sich ohnehin ja immer noch aussuchen könnte. Inzwischen haben mehrere Studien diese Effekte bestätigt, allgemein wie für den Fall der Reform in Baden-Württemberg speziell, etwa die bei Bach und Fischer (2020), Osikominu et al. (2020) und Grewenig (2020).

Bis 2012 ungefähr sah also alles noch ganz passabel aus, jedenfalls war man in Deutschland und seiner so schlimmen Differenzierung nicht mehr so ungebrochen der Prügelknabe der PISA-Berichte und der öffentlichen Debatten wie bis dahin. Woran der Aufschwung zwischen 2000 und 2012 aber letztlich lag, ist nicht geklärt. Wahrscheinlich lag er an den besonderen Anstrengungen damals um die Kinder in den unteren Leistungsbereichen, dem Ausbau des Vorschulbesuchs und einer doch deutlich erhöhten öffentlichen Aufmerksamkeit und Anstrengung nach dem PISA-Schock von 2000. Und so hätte es eigentlich weiter gehen können: schrittweise Verbesserungen an kritischen Stellen und regelmäßige Kontrollen, ob und wobei es voran geht oder aber auch nicht.

Es geschah jedoch etwas anderes: Nach 2012 gingen nach einer Aufstellung des ifo-Instituts für die PISA- und IQB-Berichte über die Jahre von 2000 bis 2018 die Leistungen in Deutschland zurück, zuerst allmählich und dann immer deutlicher, in der ZEIT auch mit dem Bild traurigen Smiley illustriert. Es war, nahezu unbemerkt damals, auch eine „Zeitenwende“, auch in die falsche Richtung, nach unten nämlich.

Warum es ab 2012 zur Umkehr des positiven Trends kam, kann man wieder definitiv nicht sagen, aber es liegt die Vermutung schon nahe, dass außer der Abschaffung der Verbindlichkeit in Baden-Württemberg die vielen mehr oder weniger sichtbaren Öffnungen und Lockerungen in den anderen Bundesländern ihren Anteil hatten: bei den Noten, beim Unterricht, bei der Anzahl der Klassenarbeiten, alles auch schon vor den großen Krisen. Vielleicht hat auch die schleichend zunehmende Zusammenlegung der unteren Bildungswege eine Rolle gespielt. Dazu könnte auch die Schaffung von „Gesamtschulen“ oder „Stadtteilschulen“, parallel zu den differenzierten Schultypen, beigetragen haben, die den eher bildungsfern-vorsichtigen Familien leichter erscheinende Perspektiven anbieten, aber womöglich dazu führen, dass gerade den talentierten Kinder aus den unteren Schichten die Chancen auf die besseren Leistungen in einer differenzierenden Schule vorenthalten bleiben und sie so über die offenen Angebote in eine Art von Mobilitätsfalle tappen (vgl. dazu die Analysen von van de Werfhorst 2022 zu den „mixed schools“ in den Niederlanden). Und  wo gleichzeitig den oberen Schichten mit ihren Mittelmaß-Maltes ein vergleichsweise bequemes refugium peccatorum geboten wird, wo der Schein gewahrt und sich mit dem Wohlgefühl eines Gleichgewichts von Klassenkampf und pädagogischer Avangarde verbinden lässt. Eine Mobilitätsfalle ist nicht zu befürchten, denn man ist ja schon oben. Womöglich hat aber auch nicht zuletzt die Lockerheit und Abfälligkeit eine Rolle gespielt, mit der inzwischen im öffentlichen und politischen Diskurs über die Orientierung an Leistungskriterien gesprochen wurde, speziell da, wo es ganz offensichtlich nicht so gut lief mit Öffnung und Lockerung wie erwartet. Man weiß es nicht. Jedenfalls gab es auch nun weiter die bereits vorher erkennbaren Unterschiede: Die beiden (verbliebenen) stringenten Länder, Bayern und Sachsen, waren kaum von dem allgemeinen Rückgang betroffen, dafür die offenen Systeme umso mehr. Und in Baden-Württemberg, dem Lackmus-Test für die Folgen der Öffnung und Lockerung wurde der generelle Einbruch stärker und der Abstand zur Spitzengruppe größer.

In Abbildung 2 sind die Entwicklungen über einen Zeitraum von zehn Jahren von 2013 über 2018 zu 2023 dargestellt. Die Werte entstammen entsprechenden Tabellen des „Bildungsmonitors“, mit dem das Institut der deutschen Wirtschaft jährlich die Bildungsaktivitäten, die Ausstattung und den Output der Bundesländer vergleicht. Hier geht es zunächst um die Entwicklungen für das Leistungsniveau und die Erreichung bestimmter Mindeststandards von 2013 auf 2018, nach dem Gipfelpunkt von 2012 also und im letzten „regulären“ Jahr vor den Krisen, also als die Schulen noch nicht geschlossen hatten (grüne Säulen).

Abbildung 2: Leistungen und Mindeststandards in den deutschen Bundesländern mit stringenter und offener Differenzierung im Zeitvergleich 2013 bis 2023 (nach dem Bildungsmonitor 2023).

Wieder gibt es das das bekannte Muster: Die Bundesländer mit der größten Stringenz erreichen 2013 und 2018 nicht nur die besten Durchschnittsleitungen, sondern bei ihnen schaffen auch die meisten Kinder die Mindeststandards. Sichtbar wird auch hier wie Baden-Württemberg nach 2012 im allgemeinen Abschwung den Anschluss nach oben verliert und mit den schwachen Flächenländern, Hessen und Nordrhein-Westfalen, schon recht nahe auf Tuchfühlung gekommen ist. Über Berlin und Bremen müssen wir auch hier ohnehin nicht mehr reden: auch nun nur die Katastrophe. Für 2023 zeigt sich dann der Verfall vollends. Kein Wunder, einerseits: Die Schulen waren wegen Corona länger geschlossen und es gab eine Reihe weiterer Turbulenzen. Aber wieder halten sich die stringenten Länder auf hohem Niveau – erheblich – besser, Baden-Württemberg verliert ein weiters Stück und bei den schwachen Bundesländern rutschen manche deutlich in den negativen Bereich im Vergleich zu 2013.

Eine gewisse Ausnahme von alledem scheint Hamburg gewesen zu sein (in der Abbildung nicht eigens aufgeführt). Da gab es 2022 Spitzenplätze und, wie es aussah, ein deutliches Aufholen, mindestens im Vergleich zu den bis dahin mittelmäßigen Bundesländern oder gar den beiden anderen Stadtstaaten, Berlin und Bremen. Aber was waren dann die highlights in Hamburg? Es war das Hörverstehen in Englisch, auch in Deutsch, also gerade das, was man am ehesten auch ohne die Schule noch mitbekommt, wohl aber mit dem eifrigen Streamen von Videos und Musik, wenn es die Zeit dafür gibt. Beim Lesen allgemein sah es schon wieder anders aus. Mathematik und Sachkunde waren 2022 nicht erhoben worden. Da, nämlich 2018, war es in Hamburg noch ganz schlecht gewesen. Und der Bildungssenator Rabe, der eigentlich schon viel getan hatte, sinnvolles wie weniger geeignetes, um Hamburg aus dem unteren Mittelfeld zu hieven, hat dafür dann auch Besserung versprochen. 2023.

Ganz ähnlich waren die Entwicklungen für die Grundschulen. Noch 2022 gab es eine neue IGLU-Untersuchung des internationalen Vergleichs für die Grundschulen. Und da zeigte sich, dass es in Deutschland einen deutlichen Rückgang in den Leseleistungen gab und dabei unter den Wert von 2016 wie den von 2001 gesunken, dabei auch nur einen Platz im Mittelfeld, hinter Finnland und Schweden, eingenommen hatte. Aber wieder gab es auch Unterschiede für die deutschen Bundesländer. Abbildung 3 beschreibt sie für den Vergleich von 2011 über 2016 zu 2022 nach den Angaben der jeweiligen IQB-Berichte.

Abbildung 3: Leistungen in Lesen und Mathematik für die Grundschulen in den deutschen Bundesländern mit stringenter und offener Differenzierung im Zeitvergleich 2011, 2016 und 2022 (nach den jeweiligen IQB-Berichten).

Überall sind auch hier über die Zeit nach 2011 die Rückgänge zu erkennen, aber wieder halten sich die stringenten Bundesländer vergleichsweise gut, im Lesen eher noch als in Mathematik: zwischen 2011 und 2016 – und das also auch noch vor dem Übergang in der Grundschule, wo es die Trennung ja noch nicht gibt. Und ähnlich ist es auch noch für 2022, wo der Ausfall der Schulen eigentlich gerade da besonders gravierend hätte wirken sollen, wo sie besonders effizient gewesen sind, auch in den Grundschulen.

Soweit die Sachlage. Sie ist alles andere als das, was man bis dahin und von Anfang an normalerweise zu lesen bekommen hat (vgl. ausführlicher zu den theoretischen Hintergründen und Befunden: Esser 2021, 2023). Aber warum dann jetzt auf einmal diese ganz andere „Wirklichkeit“? Gab es die deskriptiven Berichte denn nicht schon, bei PISA wie bei IQB, die wenigstens die „totalen“ Unterschiede der empirisch sichtbaren Verhältnisse beschreiben? Und was ist denn aus den vielen, mehr oder weniger komplexeren statistischen Analysen geworden, die dann alles Mögliche einbezogen haben, was die deskriptiven Unterschiede ggf. hätte auch (kausal) erklären können, weitere Eigenschaften der Länder, der Schulen und Schulklassen, der Familien und der Kinder? Natürlich gab es die, aber nahezu immer gab es im Grunde den gleichen Befund: Eher geringere Leistungen bei Differenzierung, besonders bei den Kindern aus den schwierigeren Verhältnissen und, insbesondere, eine Verstärkung des Effektes der sozialen Herkunft.

Es gibt zwei Antworten. Die eine kennen wir schon: In den PISA-Vergleichen finden sich nur die nationalen Unterschiede, evtl. Variationen aber, etwa nach Regionen oder einzelnen Schulen dann womöglich auch, wurden überdeckt oder nicht auf unterschiedliche und ggf. zusätzliche Regelungen bezogen. Die andere ist besonders überraschend und gravierend: In den meisten Untersuchungen wurden zentral wichtige Einflussgrößen auf die Leistungen nicht berücksichtigt, insbesondere weil es sie in den Daten der PISA-Studien und vergleichbarer anderer Untersuchungen, wie TIMMS, PIRLS oder PIACC nicht gab oder aber nicht in die Analysen aufgenommen worden waren.

Und das kann besonders fatal werden. Fragt man nämlich nach den Regelungen der Bildungssysteme als Ursachen für die Effekte der Differenzierung, dann müssen in den betreffenden Untersuchungen die jeweils bedeutsamen weiterenBedingungen möglichst vollständig erfasst und in ihrer jeweils eigenen Wirksamkeit bestimmt, also statistisch voneinander getrennt werden. Für das Lernen und die Leistungen wären das, neben anderem, der Einfluss der sozialen Herkunft und – vor allem! – jener der kognitiven Fähigkeiten, also: der Intelligenz, der Kinder. Es ist der, auch in anderen Kontexten, mit Abstand stärkste Faktor für das Lernen und die Leistungen. Aber ausgerechnet die kognitiven Fähigkeiten sind in den PISA-Daten nicht enthalten, und in den IQB-Berichten, in denen es sie gab, sind sie nicht analysiert worden. Es wird immer nur die soziale Herkunft ausgewiesen – neben einigen weiteren Faktoren wie Geschlecht, Migrationshintergrund oder der Vorschulbesuch, die auch beteiligt sind, aber alle, wie die soziale Herkunft, deutlich weniger wichtig als die kognitiven Fähigkeiten. Wenn aber der dazu noch mit Abstand bedeutsamste Faktor in den Analysen nicht berücksichtigt wird, kann das nur zu, auch gravierenden, Verzerrungen und Fehlurteilen führen. Das gilt analog für die Vernachlässigung der in den Begründungen der Differenzierung so wichtigen Schuleffekte, die der sozialen und besonders auch der kognitiven Zusammensetzung der Schulklassen.

Die Folgen der Versäumnisse sind fatal. Es sind zwei: Die Herkunftseffekte werden generell schon überschätzt. Aber nicht nur das: Wenn es ggf. positive Effekte der Differenzierung gibt, dann werden die nicht als Folge einer der kognitiven Fähigkeiten bzw. der kognitiven Zusammensetzung der Schulklassen identifiziert, wenn sie schon statistisch nicht kontrolliert werden, sei es, dass sie in den Daten fehlen, sei, dass man die entsprechenden Analysen nicht berücksichtigt werden. Und so ist es wohl gekommen, was auch derzeit immer noch als Standardansatz und als Standardposition gilt: Analysen ohne die kognitiven Fähigkeiten und eine Verstärkung der Herkunftseffekte – allgemein wie insbesondere als Systemeffekt der Differenzierung. Kaum glaubliche Anfängerfehler also. Und das in einem so aufwendigen und wichtigen Projekt wie es die internationalen Vergleichsstudien sind. Gary Marks, ein international bekannter PISA-Forscher von der Universität Melbourne, hat dazu 2014 ein aufschlussreiches und in den zuständigen Fachkreisen anerkanntes Buch geschrieben. Aus der Bildungsforschung hat das wohl nicht alle erreicht. Von Anfang an. Das konnte nicht gut gehen.

Damit aber stellt sich eine andere Frage: Warum hat das denn kaum jemand vorher gemerkt oder gar ausgesprochen? Es ist eine schwierige und äußerst heikle Angelegenheit, und man kann letztlich nur spekulieren. Vielleicht ist es eine Art von institutionalisierter Blindheit in Kombination mit gut verankerten politisch-ideologischen Einstellungen gewesen: Der PISA-Schock schien im Jahr 2000 mit einem Schlag die ewige Kontroverse um die Differenzierung zugunsten der Integration erledigt zu haben. Und dann kamen die vielen Programme und Institutionen der Bildungsforschung mit ihren Festlegungen, in Ansatz und Untersuchungsanlage, die kaum eine andere Perspektive erlaubten. Man hätte sich sehr in die Brennnesseln setzen können, wenn man an etwas anderes auch nur gedacht hätte.

Aber es gab, damit sicher zusammenhängend, einen anderen, viel einfacheren Grund: Erst ab seit etwa 2006 gab es – endlich! – ein Projekt, die „National Educational Panel Study“, abgekürzt NEPS, das die nötigen Daten auch im Zeitverlauf und für die unterschiedlichen Stadien des Bildungsverlaufs erfasst hatte, allerdings nur für die deutschen Bundesländer, nicht international. Das dauerte natürlich – die Erhebung und Aufbereitung der Daten, vor allem aber das Warten auf den Bildungsverlauf der Kinder, hier von der Grundschule über den Übergang bis einige Zeit in die Sekundarstufe hinein. Und so kam es, dass die eigentlich immer schon erforderlichen Analysen erst vor kurzem überhaupt erst möglich wurden. Und da zeigte sich, so etwa ab 2018, plötzlich das ganz andere Bild von den Effekten des Ability-Tracking und der Regelungen, die man dafür braucht, dass es auch ein Ability-Tracking wirklich ist: Verbindlichkeit und Kontrolle.

Vielleicht hätte man noch etwas machen können, um den, schon länger erkennbaren, Abwärtstrend noch aufzuhalten, so ab 2015 etwa. Aber da war es schon zu spät. Nur wenig später hatte man mit der Bildung ganz andere Sorgen, „Corona“ vor allem und die damit bedingten Schulschließungen, dann der Lehrermangel und die versäumte Digitalisierung. An die „Systemfrage“ hat niemand mehr gedacht, schon länger nicht. Vielleicht war man klammheimlich auch ganz froh. Es wären politisch und auch wissenschaftlich höchst riskante Fragen gewesen, an das Bildungsministerium und die KMK zuerst, dann aber auch an die so breit ausgebaute Bildungsforschung, die den kommenden Absturz angesichts der Öffnungen wohl nicht für möglich hat halten können. Es braucht eben zehn Jahre hatte der Ministerpräsident von Baden-Württemberg verlauten lassen, bis Reformen greifen. Es brauchte mit der Abschaffung der Verbindlichkeit 2011/12 weniger, aber in die andere Richtung als gedacht. Und so kam in Deutschland auch niemand darauf, dass es für das Ausbleiben der versprochenen Effekte der Lockerungen noch andere Gründe gegeben haben mag als Mangel an Geld und multiprofessionellen Teams und man, seit 2012 etwa, den falschen Befunden und Ratschlägen der Bildungsforschung mit der ganzen Autorität der großen Vergleichsstudien im Rücken gefolgt war, lange, und eigentlich bis heute, zentral wichtige Dinge übersehen hat, sich weithin gar nichts anderes mehr vorstellen konnte als immer weitere Öffnungen und Lockerungen oder, wie in Hamburg, mit einer Mixtur aus sinnvollen Maßnahmen der gezielten Unterstützung, wo es besonders klemmt, und wohl klingenden Konzepten wie die Einrichtung von „Stadtteilschulen“ herumexperimentiert, die das wieder neutralisieren, was es an Verbesserungen in anderen Bereichen geben mag.

Nach der PISA-Studie für 2022 nun, die Ende 2023 veröffentlicht wurde und schon im Vorfeld nichts gutes erwarten ließ, gab es die Forderung der Umstellung auf die Integration auch wieder, wie kurz zuvor im Aufruf zur „Bildungswende.jetzt“. Es war der alte Reflex, auch wieder mit der bekannten Formel, in keinem anderen Land der Welt sei der Zusammenhang von Bildungserfolg und sozialer Herkunft so stark wie in Deutschland.  Nicht einmal die aktuellen Tabellen hatte man sich auch dabei einmal genauer angesehen: Deutschland liegt trotz des Rückgangs der PISA-Leistungen über dem OECD-Durchschnitt, ist kaum schlechter als Finnland und Schweden und die beiden Bundesländer mit der höchsten Stringenz, Sachsen und Bayern, wieder besser als Schweden und auch Finnland.

Allerdings war in Deutschland die soziale Durchlässigkeit, in der Tat wieder recht stark angestiegen, und zwar besonders in den stringenten Ländern. Das könnte, wie immer bei diesen einfachen Aufgliederungen, auch an den nach 2015 noch einmal besonders gestiegenen Anteilen von Flüchtlingskindern gelegen haben, wäre also ein Sondereffekt, der, wenn man die besonderen Bedingungen der Migrationssituation berücksichtigt, vor allem die Sprachkenntnisse, verschwindet. Aber selbst, wenn es daran nicht gelegen haben sollte: Spräche der Abfall nun auch in den stringenten Bundesländern denn nun aber wenigstens für die Öffnung und Lockerung der Schulen? Keineswegs. Denn es gäbe eine einfache Erklärung gerade im Sinne der Wirkungen der Stringenz: Solange die Schule ihren Einfluss behält, lässt sich manches von den Folgen der Krisen auffangen, aber nicht mehr, wenn wie bei Corona die Schulen geschlossen sind und die Familie als einziger Ort des Lernens verbleibt. Das hat offensichtlich so gewirkt wie die bekannten Ferieneffekte: An der Unterbrechung des Unterrichts leiden insbesondere die Kinder aus den schwierigen Verhältnissen in der Familie, und das besonders, wenn Eltern und Kinder Migranten der ersten Generation sind. Und das besonders da Auswirkungen, wo die Schule vorher besonders effizient gewesen ist und mehr als anderswo an sozialen Nachteilen ausgeglichen haben.

Mit dem neuen Schock ist aber nun erst recht so gut wie niemand mehr auf den Gedanken gekommen, dass man in der Bildungspolitik so um das Jahr 2012 ohne Not, unter Berufung auf PISA und die Ergebnisse der Bildungsforschung, aber auch gegen viele Evidenzen damals schon, falsch abgebogen war. Man hätte es kommen sehen können, auch in dieser Deutlichkeit, und das keineswegs nur in komplizierten statistischen Analysen, die keiner so richtig durchschaut, der nicht täglich damit zu tun hat. Und so ist das Thema inzwischen von vielen anderen, unbestreitbar gravierenden, aber eben auch “nur“ allgemeinen Problemen überlagert worden, die alle in allen Systemen betreffen können, auch die mit der vollen Integration, manche davon schon lange bekannt und gut vorhersehbar, andere über die Krisen verschärft: Miserable bauliche Zustände, Lehrkräftemangel, Probleme bei der Digitalisierung, immer mehr Unruhe in der Gesellschaft, Flüchtlingskinder in einem vorher und anderswo kaum bekannten Maß.

Das hat die aktuelle Diskussion inzwischen fast ganz bestimmt, und es sind ja auch alles überaus gewichtige Aspekte, die in der Tat eine große Aufmerksamkeit verdienen. An die Folgen der immer weiter getriebenen Öffnung und Lockerung denkt offenbar niemand mehr. Derzeit scheint die Stimmung allerdings etwa so auszusehen: Alles nicht so tragisch, wahrscheinlich ohnehin nicht zu klären, Reformen brauchten halt eben ihre Zeit und der aktuelle Schulfriede reicht uns schon. Im Moment brennt uns sowieso ganz was anderes auf den Nägeln, wie die Lehrerschelte von Alexander Schleicher als seine Erklärung für den Verfall – nachdem er mit vielen anderen vorher kaum etwas anderes kannte als die Forderung nach einer Aufgabe der Leistungsdifferenzierung und der Schaffung von interierten Einheitsschulen. Und dann kommt auch leicht die Frage auf: Braucht´s dieses ganze PISA- und Assessment-Getue eigentlich überhaupt, wenn es die Verwirrungen nur immer weiter vergrößert?

So kann man es sich gewiss auch zurechtlegen, und aus der Sicht von Politik und Praxis ist das auch ganz gut nachvollziehbar: Es gibt nun ganz andere Sorgen, in der Tat, und die eignen sich ganz gut, von den alten Sünden abzulenken. Aber dürfte die seinerzeit gerade für die Klärung der Frage nach den Systemeffekten von Differenzierung und Integration so ausgebaute und erblühte Bildungsforschung es denn einfach so hinnehmen, dass ihre Bedeutung derart abgewiegelt und eines ihrer wichtigsten, interessantesten, herausforderndsten und alles andere als gelösten Probleme still unter den Teppich gekehrt wird? Womöglich würde man sie ja schon bald gut brauchen können – wenn es etwa darum geht, die Vergleichsstudien, wie PISA insbesondere, endlich so auf den Stand der Dinge zu bringen, dass sie das auch leisten können, wozu sie einmal gedacht waren. Und dann auch unentbehrlich wären. Es ist ungefähr so wie mit der Leistungsdifferenzierung auch: Man muss es schon konsequent und stringent machen und immer wieder auch nachsehen, wie es denn läuft und wo es Verbesserungen geben könnte. Der schlechteste Fall aber wäre, sich – wie derzeit – von den Ereignissen hilflos und – mit der Abschaffung der lästigen Vergleiche und der in der Tat schwierigen Suche nach den Ursachen – auch noch gänzlich blind überrollen zu lassen.

Hartmut Esser

Prof. Dr. (em) für Soziologie und Wissenschaftslehre;

Universität Mannheim; Fakultät für Sozialwissenschaften

Email: hartmut.esser@uni-mannheim.de

 

Quellen:

Allmendinger, J. 2012. Schulaufgaben. Wie wir das Bildungssystem verändern müssen, um un- seren Kindern gerecht zu werden. München: Pantheon.

Bach, M. und M. Fischer. 2020. Understanding the Response to High Stakes Incentives in Pri- mary Education. In: IZA-Discussion Paper Nr. 13845. Bonn: Forschungsinstitut Zukunft der Arbeit. Institute for the Study of Labor.

INSM-Bildungsmonitor 2023. Institut der deutschen Wirtschaft. Köln.

Dollmann, J. 2011. Verbindliche und unverbindliche Grundschulempfehlungen und soziale Un- gleichheiten am ersten Bildungsübergang. In: Kölner Zeitschrift für Soziologie und Sozial- psychologie, 63: 595–621.

Esser, H. 2021. „Wie kaum in einem anderen Land?“ Die Differenzierung der Bildungswege und ihre Wirkung auf Bildungserfolg, -ungleichheit und -gerechtigkeit. Band 1: Theoretische Grundlagen. Frankfurt/M. und New York: Campus.

Esser, H. 2023. „Wie kaum in einem anderen Land?“ Die Differenzierung der Bildungswege und ihre Wirkung auf Bildungserfolg, -ungleichheit und -gerechtigkeit. Band 2: Empirische Befunde. Frankfurt/M. und New York: Campus.

Grewenig, E. 2021. School Track Decisions and Teacher Recommendations. In: E. Grewenig. Human Capital and Education Policy: Evidence from Survey Data. Ifo-Beiträge zur Wirt- schaftsforschung, 96, Kapitel 4: 113–161.

Helbig, M. und R. Nikolai. 2015. Die Unvergleichbaren. Der Wandel der Schulsysteme in den deutschen Bundesländern seit 1949. Bad Heilbrunn: Klinkhardt.

IGLU. 2003. Einige Länder der Bundesrepublik Deutschland im nationalen und internationalen Vergleich. Zusammenfassung ausgewählter Ergebnisse. In: W. Bos, E.M. Lankes, M. Prenzel, K. Schwippert, R. Valtin und G. Walther, (Hrsg.). (2004). Münster: Waxmann.

IGLU 2023. Lesekompetenz von Grundschulkindern im internationalen Vergleich und im Trend über 20 Jahre. N. Mc Elvany et al., Hrsg., Münster und New York: Waxmann.

IQB-Berichte 2009 bis 2022. Münster, New York, München, Berlin: Waxmann.

Marks, G. N. 2014. Education, social background and cognitive ability. The decline of the social. London: Routledge.

Osikominu, A., G. Pfeifer und K. Strohmaier. 2020. The Effects of Free Secondary Track School Choice: A Disaggregated Synthetic Control Approach. In: IZA-Discussion Paper Nr. 14133. Bonn: Forschungsinstitut Zukunft der Arbeit. Institute for the Study of Labor.

PISA. PISA database 2000, 2003, 2006, 2009, 2012, 2015, 2018, 2022; http://www.oecd.org/pisa/ data/.

van de Werfhorst, H. G. 2022. Sorting or mixing? Multi-track and single-track schools and social inequalities in a differentiated educational system. In: British Educational Research Jour- nal. https://doi.org/10.1002/berj.3722.

van de Werfhorst, H. G. und J. J. B. Mijs. 2010. Achievement inequality and the institutional structure of educational systems: A comparative perspective. In: Annual Review of Sociology, 36: 407–428.

Wößmann, L., E. Lüdemann, G. Schütz, und M.R. West. 2009. School Accountability, Autonomy and Choice around the World. Celtenham: Edward Elgar Publishing.

Diese Website verwendet technisch erforderliche Cookies, um eine bestmögliche Funktionalität zu gewährleisten. Mehr lesen

Ok