Bemerkungen zu Ziffernnoten

Im Rahmen meiner ersten Staatsexamensarbeit habe ich mich mit Portfolios im Sachunterricht beschäftigt. Innerhalb dieser Arbeit gibt es auch einen Abschnitt, der sich mit Ziffernnoten auseinandersetzt, und der m. E. gut in die gerade laufende Diskussion passt, z. B. bei Herrn Rau und Frau Lucius. Da die Examensarbeit derzeit nicht mehr im Netz steht, möchte ich hier den entsprechenden Abschnitt, leicht überarbeitet, vorstellen.
Leider sind mehrere der Internetquellen nicht mehr auffindbar, die historischen Quellen findet man zum Nachlesen am einfachsten bei Scripta Paedagogica Online.

Das, was ich im Rahmen der Arbeit gelesen und kennengelernt und parallel dazu als Elternteil erlebt habe, hat meine Haltung zu Ziffernnoten entscheidend geprägt.
Besonders Eilige sollten gleicht zu Punkt 5 und 7 vorscrollen.

Leistungsbewertung in der Schule

Unsere heutige Gesellschaft wird häufig als „Leistungsgesellschaft“ bezeichnet, in der gesellschaftliche Positionen und damit Geldmittel, Privilegien, Lebenschancen nach dem Leistungsprinzip zugeteilt werden. Bei genauerem Hinsehen zeigt sich jedoch, dass Leistung nur eines von mehreren Verteilungsprinzipien ist, daneben existieren auch die Prinzipien der Anciennität, Bekanntheit- und Beliebtheit, ideologische Prinzipien, das Sozialprinzip und immer noch das Vorrecht der Geburt (vgl. Sacher, 2001, S.5). Schule beruft sich jedoch bei der Verteilung ihrer Schüler auf die verschiedenen Bildungsgänge (und damit auf Berufslaufbahnen und Lebensläufe) allein auf das Leistungsprinzip. Leistung muss also in allen Bereichen von Schule, und damit auch im Sachunterricht, festgestellt, bewertet und vergleichbar gemacht werden; Schüler sollen unter dem Einfluss der Schule zu leistungsbereiten und leistungsfähigen Menschen heranwachsen. Es stellt sich hierbei die Frage, welche Arten von Leistung gemessen und verglichen werden sollen und wer berechtigt ist, diese Arten festzulegen. Rauschenberger vertritt die Ansicht, dass Leistung im Zusammenhang mit den Erwartungen zu sehen ist, die Lehrer und Eltern, allgemeiner gesehen: Staat und Gesellschaft, an die Schüler haben und diese seien in Curricula, Stoffplänen und Abschlussprofilen der einzelnen Schularten relativ klar definiert (vgl. Rauschenberger, 2002, S.39). Damit ist aber (zumindest bisher) nur der Inhalt der zu erbringenden Leistungen festgelegt, nicht das zu erreichende Niveau, das zu Berechtigungen irgendeiner Art führen könnte. Brügelmann weist darauf hin, dass zumindest im Grundschulbereich keine empirisch belegten Leistungsniveaus existieren, die einen Erfolg beim Besuch einer höheren Schule oder der Bewältigung des Alltags verheißen könnten (vgl. Brügelmann, 2004, S.15), auf anderen Ebenen schulischer und universitärer Bildung wird die Forschungslage ähnlich sein.

Für den Sachunterricht ergibt sich hierbei eine besondere Problematik: Er ist das einzige Fach, das an den weiterführenden Schulformen nicht in seiner Gesamtheit wieder aufgegriffen wird, sondern in seine Bezugsfächer zerfällt. Welche Bedeutung Leistungen im Sachunterricht für das weitere schulische Fortkommen haben, lässt sich daher nur schwer und höchstens für Teilbereiche verfolgen.Wenn die zu erbringenden Leistungen von den gesellschaftlichen Erwartungen abhängig sind, müssen sich die Leistungsanforderungen in Inhalt und Anspruchsniveau zugleich mit der Gesellschaft verändern – ein Vorgang, der historisch tatsächlich beobachtbar ist (s. 2) und anscheinend derzeit wieder abläuft. Wie, häufig auch wie oft, schulische Leistung heute bewertet wird, nämlich weitestgehend über schriftliche, gelegentlich auch mündliche Prüfungen, Beobachtungen und einige praktische Leistungsnachweise, ist genauestens festgelegt, ebenso die Art der Beurteilung (überwiegend Ziffernnoten) und die daraus folgenden Berechtigungen. Offen bleibt bisher jedoch, was als Leistung zählt, warum eben dieses als Leistung gilt, welches Niveau welcher Beurteilung zugeordnet werden soll und wie der Einfluss äußerer Bedingungen, die nachgewiesenermaßen sowohl auf die Entstehung als auch auf die Beurteilung von Leistungen wirken, verringert werden kann.

1. Leistungsbewertung und Leistungsbeurteilung – Begriffsklärung

Leistungsbewertung und Leistungsbeurteilung werden in der schulpädagogischen Literatur immer wieder thematisiert und stehen auch im Zentrum einiger neuerer Veröffentlichungen zur Methodik des Sachunterrichts. Zwischen beiden Begriffen wird teilweise sehr genau differenziert, sie können aber, je nach Autor, durchaus Verschiedenes bedeuten. Winter verwendet die beiden Begriffe, um die derzeitige Veränderung in der Leistungsbewertung zu kennzeichnen, er differenziert folgendermaßen:

  • Leistungsbeurteilung: bezeichnet den traditionellen Umgang mit Schülerleistungen
  • Leistungsbewertung: bei Verwendung reformierter Konzepte („neue Formen der Leistungsbewertung“)(vgl. Winter, 2004a, S.1, Fußnote 1)

Vierlinger spricht häufiger von Leistungsfeststellung, definiert aber keinen Unterschied zwischen Leistungsbewertung und Leistungsbeurteilung. Leistungsbeurteilung steht in seinen Veröffentlichungen jedoch stets im Gegensatz zur „Direkten Leistungsvorlage“, woraus sich schließen lässt, dass er darunter vermutlich die herkömmliche Form des Zensierens versteht. Bohl übernimmt die Bedeutungsinhalte von Salderns, der die Begriffe folgendermaßen unterscheidet:

  • Leistungsbewertung: konkrete, detaillierte Einordnung einer beschriebenen Leistung in einen bestimmten Maßstab
  • Leistungsbeurteilung: bezieht sich auf einen längeren Zeitrauman juristische Vorgaben gebunden, einklagbar

(vgl. Bohl, 2004, S.60f)

Bohl grenzt davon noch die Leistungsmessung ab, die höheren messtheoretischen Ansprüchen genügen muss (u.a. Testgütekriterien). Andere Autoren präzisieren die Begrifflichkeiten nicht so stark oder verwenden die Begriffe synonym.

2. Historischer Rückblick

Schriftlich festgehaltene Bewertungen von Leistung tauchen im Zusammenhang mit Schule bereits im 16. Jahrhundert auf. Diese Benefizien- oder Stipendiatenzeugnisse enthielten weitgehend formlose Aussagen über Fleiß, Benehmen und charakterliche Eignung, wohl auch über die Frömmigkeit der Schüler und dienten einer Bewerbung bedürftiger oder besonders begabter Schüler um einen Freiplatz oder ein Stipendium an einer Schule bzw. Universität (vgl. Maier, 2001, S.51). In diesen Zeugnissen wurden zwar Leistungen bewertet, die Bewertungen wurden jedoch aus Beobachtungen gewonnen, nicht aus punktuellen Prüfungen und waren durchaus sehr subjektiv und darauf gerichtet, den Schützling in ein gutes Licht zu rücken1.Eine Berechtigungsfunktion erhielten Zeugnisse erst, als Stipendienvergabe und Zulassung zur Hochschule nach Leistungsgesichtspunkten erfolgte. So galt in Preußen zwischen 1784 bis 1834 ein Abiturientenexamen zuerst als Voraussetzung für ein Studienstipendium des Landesherren, dann als Grundlage zur Anerkennung des Studiums als Ausbildung zum Beamten und letztlich als Zulassungsvoraussetzung zu einem Studium generell (vgl. Huber, 2002, S.14). Hierbei wurde die Examensleistung jedoch nur in zwei (bestanden / nicht bestanden), später in drei Stufen (unbedingte Tüchtigkeit, bedingte Tüchtigkeit, Untüchtigkeit) eingeteilt (vgl. u.a. Merz, 2002; N.N., 1825), die ausführliche verbale Bewertung war aufgrund der zunehmenden Zahl von Zeugnissen und der Bedingung, dass die Zeugnisse einfach zu übersehen und schnell vergleichbar sein mussten, einer Codierung gewichen.Die Verbindung von Zeugnis und Berechtigungen bedingte nun eine Nachprüfbarkeit des Anspruch auf diese Privilegien, was im Laufe der Zeit zu einer starken Formalisierung und Verrechtlichung dieser Reifeprüfung führte (vgl. Huber, 2002, S.15). So waren die inhaltlichen und leistungsmäßigen Anforderungen an die Abiturprüfungen in Preußen detailliert festgelegt, ebenso wie die daraus zu erfolgende Einstufung. Alle Prüfungsergebnisse mussten an ein zentrales „Oberkollegium“ übersandt werden, so dass neben der Erfassung geeigneter Kandidaten für die Beamtenlaufbahn auch eine externe Kontrolle der Prüfungen stattfinden konnte (vgl. N.N., 1825). In Hessen genügte für „Inländer“ der Nachweis eines ausreichend langen Schulbesuchs in der obersten Gymnasialstufe bestimmter Gymnasien für die Berechtigung zum Hochschulzugang, aber auch hier waren die verlangten Kenntnisse der angehenden Studienanfänger, z.T. in Abhängigkeit vom angestrebten Studienfach, genau festgelegt, mussten jedoch im Verlauf des Gymnasiums nachgewiesen werden, nicht in einer Abschlussprüfung. Eine „Maturitätsprüfung“ wurde nur bei vorzeitigem Übergang an die Universität oder „ausländischen“ Studenten vorgenommen (vgl. v. Grolmann, 1824). Um die entsprechenden Kenntnisse der Schüler sicherzustellen, mussten nun in jedem Semester Prüfungen „von der untersten bis zu der obersten Klasse der Gymnasien mit der größten Sorgfalt und Strenge vorgenommen“ (ebd., S.299) werden, von denen der Aufstieg in die nächsthöhere Klasse abhing. Der Hinweis, dass man bei mangelnder Leistung auch Schüler, die „die gesetzliche Zeit auf ihrer Ordnung ausgehalten hätten“ (ebd.) nicht aufsteigen lassen dürfe, lässt vermuten, dass diese rein zeitabhängige Versetzung, die an der Volksschule üblich war, zuvor auch am Gymnasium praktiziert wurde. Von dieser kontinuierlichen Leistungsüberprüfung erhoffte man sich einerseits „neue und nicht unkräftige Beweggründe zur gewissenhaften Benutzung des Schulunterrichts“ (N.N., 1825), also ein eifrigeres Lernen der Kinder, andererseits sollte sie aber auch ein „mittelbar erhaltener Wink“ (ebd.) an die Eltern sein und diese „auf die glaubwürdigste Art auf die Mängel in der Ausbildung ihrer Söhne aufmerksam“ (ebd.) machen, die allerdings nur auf Schülerseite gesehen wurden. Hier sind also zwei weitere Funktionen der Leistungsbeurteilung erstmals erkennbar, die in Portfolios eine wichtige Rolle spielen, nämlich eine Lernstandsrückmeldung an die Schüler und die Berichtsfunktion an die Eltern. Das Prinzip der Leistungsüberprüfung und -beurteilung setzte sich also im gymnasialen Bereich sozusagen von oben nach unten durch und weitete sich später auch auf die anderen Schulformen aus.
Grundsätzlich war die Verteilung von Berechtigungen nach Leistung ein Fortschritt, waren bis zur französischen Revolution doch gesellschaftliche Positionen und damit größtenteils auch die Lebenschancen allein davon abhängig, in welchen Stand man hineingeboren wurde, wenn man denn nicht Gönner und Mäzene unter den Mächtigen und Reichen finden konnte (vgl. Sacher, 2001, S.3; Huber, 2002, S.14). Von der Einführung des Leistungsprinzips profitierte vor allem das Bürgertum: erst, indem es über Leistung Zugang zu vorher nicht erreichbaren Positionen erhielt, dann im Laufe der späteren Entwicklung, indem es diese Positionen durch Leistungsanforderungen (und Schulgeldforderungen) absicherte, die für andere Schichten nicht oder nur sehr schwer zu erreichen waren (vgl. Sacher, 2001, S.3). Nach Leistung vergebene Freiplätze (Schulgeldfreistellen) existierten zwar bis in das erste Drittel des 20. Jahrhunderts für höhere Schulen, nicht jedoch für die darauf vorbereitenden Vorschulen. Das Anrecht auf einen solchen Freiplatz musste zudem ständig durch ein hohes Leistungsniveau und gutes Betragen aufrecht erhalten werden (vgl. Friebe, 1927, S.38ff). Die Leistungsüberprüfung selbst konnte ebenfalls kostenpflichtig sein, so existierten in Preußen Gebühren für die Reifeprüfung und Versetzungen (ebd., S.59. Anm.2). Die Lage in den Volksschulen stellte sich hingegen anders dar. Das Abschlusszeugnis („Entlaßschein“) war nach Einführung der Schulpflicht als Nachweis der abgeleisteten Schulzeit zwar notwendig, da damit aber keine leistungsabhängigen Berechtigungen verbunden waren, spielte eine individuelle und differenzierte Beurteilung der Schüler durch Zensuren lange Zeit kaum eine Rolle. Dies war erst der Fall, als die Grundschule nach der Reichsschulkonferenz 1920 für alle Kinder Pflichtschule wurde und nach der vierten Klasse eine Aufteilung auf die weiterführenden Schulen erfolgen musste (vgl. Maier, 2001, S.52). Doch schon lange vorher fanden in den Volksschulen auf dem Lande regelmäßig Prüfungen, zum Teil vierteljährlich, meist halbjährlich statt. Diese Prüfungen waren in Gesetzbüchern und Kirchenordnungen festgeschrieben (z. B. Kirchen-Ordnung für das Herzogtum Magdeburg, 1739) (vgl. Zerrenner, 1825, S.128) und fanden öffentlich, zum Teil sogar in der Kirche, statt. Zwar wurden die Kinder geprüft, möglichst über alle „in der Schule behandelten Lehrgegenstände“ (ebd., S.125), soweit sie der Würde des Prüfungsortes entsprachen, die Zeugnisse wurden aber direkt nach der Prüfung ausgegeben, müssen also bereits vorher festgestanden haben und somit von der „Prüfung“ unabhängig gewesen sein.(vgl. N.N., 1802, S.435). Als Prüfling muss bei diesen „öffentlichen Schulprüfungen“ vielmehr der Lehrer gelten, der vor der versammelten Gemeinde, den Honoratioren und seinen Vorgesetzten zeigen musste, was (zum Teil auch wie) die Schüler unter seiner Leitung gelernt hatten. Der ursprüngliche Zweck dieser Prüfungen war also eine Rechtfertigung des Lehrers vor seinen Geldgebern, gleichzeitig war es aber auch eine Qualitätskontrolle des Unterrichts in Methode und Inhalt durch Eltern und Verwaltung. Da der erreichte Kenntnisstand der Schüler der Prüfungskommission bereits vorher schriftlich angegeben werden musste, wurde auch die Beurteilung der Schüler durch den Lehrer weitgehend nachprüfbar, die Vor- und Prüfungsberichte wurden zudem an zentraler staatlicher Stelle gesammelt (vgl. Zerrenner, 1825, S.129). Eine ähnlich starke Kontrolle des Lehrerhandelns, wie sie damals ausgeübt werden konnte, ermöglicht erst jetzt wieder die Methode des Portfoliogesprächs bzw. der Kommentierten Leistungsvorlage, in der die Eltern direkt Einblick in die Unterrichtsinhalte und -verfahren nehmen können. Mit den öffentlichen Prüfungen verband man aber noch mehr Hoffnungen. Durch eine zeitliche Absprache der Prüfungen in benachbarten Gemeinden sollten auch Lehrer anderer Schulen daran teilnehmen können, damit sie „zu neuem Fleiße in ihrem Amte und in der eigenen Fortbildung angeregt werden, und von ihren Amtsgenossen Manches lernen, wenigstens auf manches Fehlerhafte aufmerksam gemacht werden“ (ebd., S.136) und derart das Schulniveau des gesamten Landes gehoben werde. Die öffentliche Schulprüfung war auch eine Gelegenheit, neue Lehrmethoden (hier insbesondere die Lautiermethode) vorzustellen und durch die sichtbaren Erfolge für ihre Anerkennung und Verbreitung zu sorgen (vgl. ebd., S.133). Eine „schöne“ und feierliche Schulprüfung, umrahmt von Musik und Reden, sorgte außerdem durch Spenden der Gemeindemitglieder für zusätzliche Mittel in der Schulkasse (vgl. N.N., 1802, S.435).Aber auch die Leistungen der Kinder wurden gewürdigt. Ganz im Sinne von Comenius, der empfiehlt: „Die Obrigkeit aber und die Aufseher der Schulen können den Eifer der Lernbegierigen entflammen, wenn sie den öffentlichen Schulfesten (seien es nun Übungen, Vorträge und Disputationen oder Prüfungen und Versetzungen) selbst beiwohnen und den Fleißigeren Lobsprüche und kleine Geschenke (ohne Ansehen der Person) austeilen.“ (Luthmer, 1911, S.51), wurden die die Besten mit leistungsmäßig gestaffelten Geschenken bedacht (z.B. Kleidung, Büchern, Geld) (vgl. Becker, 1815, S.655f2 )). Hierbei wurde aber die Leistung (Arbeitshaltung, Wissen, Frömmigkeit) des gesamten Zeitraumes berücksichtigt, nicht die eigentliche Prüfungsleistung. Die Prüfungen waren ursprünglich auch dazu gedacht, die Verbindung zwischen Schule und Elternhaus zu stärken, den Eltern vorzustellen, was in der Schule vor sich geht und einen realistischen Eindruck vom Leistungsstand der eigenen Kinder zu vermitteln und sie durch öffentlichen Druck auch auf ihre Pflichten (z. B. den Kindern einen regelmäßigen Schulbesuch zu ermöglichen und den „häuslichen Fleiß“ zu überwachen) aufmerksam zu machen (vgl. Zerrenner, 1825, S.131f). Im Laufe der Zeit trat aber einerseits der „Unterhaltungswert“ dieser Prüfungen für die Eltern immer mehr in den Vordergrund, andererseits scheinen sie mit wachsender Bedeutung der erteilten Zensuren einen erhöhten Rechtfertigungsdruck auf die Lehrer ausgeübt zu haben (vgl. N.N., 1854, S.178). Etliche Lehrer scheinen versucht zu haben, sich diesem Druck zu entziehen, indem sie versuchten, die Prüfungen nur schulintern abzuhalten (ebd., S.130) oder durch intensive Vorbereitung (besondere Vorbereitung der Prüfungsinhalte bis hin zum Auswendiglernen des geplanten Prüfungsgesprächs) das Prüfungsergebnis zu ihren Gunsten zu beeinflussen (ebd., S.177; vgl. N.N., 1829). Die Tendenz, den Prüfungscharakter zu vernachlässigen und aus der öffentlichen Schulprüfung eine Veranstaltung zu machen, die der Unterhaltung (gelegentlich auch Bildung) des Publikums diente (ebd.; vgl. N.N., 1840), sowie nachlassendes Interesse der Öffentlichkeit, ganz zu schweigen von der Frage, ob es (nach allgemeiner Einführung der Prüfungen in den Städten) sittlich vertretbar sei, das Wissen höherer Töchter (und sie selbst) öffentlich zur Schau zu stellen (vgl. u.a. N.N., 1838), führte gegen Ende des 19. Jahrhunderts zur offiziellen Abschaffung dieser Art von Prüfungen (vgl. N.N., 1894). Damit zog sich die Volksschule, von reformpädagogischen Ausnahmen abgesehen, für lange Zeit weitgehend aus der öffentlichen Kontrolle ihrer Leistungen und Leistungsbewertungen zurück, obwohl mit Einführung der Jahrgangsklassen, Versetzungen und Übergangsregelungen an weiterführende Schulen Zeugnisse als Auswahlkriterium eine entscheidende Bedeutung erhielten. Auch der Kommentierten Leistungsvorlage und gemeinsamen Eltern-Schülergesprächen in der Bewertung mit Portfolios liegt der Gedanke zugrunde, Eltern wieder mehr in die schulische Arbeit einzubeziehen (vgl. Benson, Barnett, 2005, S.2f). Die Gefahr, dass der Unterhaltungswert einer solchen Veranstaltung den Prüfungsgedanken verdrängt, besteht meiner Meinung auch bei diesen Verfahren, sie kann jedoch vielleicht durch einen entsprechend formellen, äußeren Rahmen verringert werden.

Insgesamt hat sich Schule in den letzten 150 Jahren von einem Ort, der Lernen überhaupt erst ermöglichen soll, zu einem Ort der Bewertung von Leistung, mit der Berechtigungen und Statusoptionen verbunden sind, gewandelt. Ziel schulischen Lernens ist nicht mehr optimales Lernen (sowohl im Sinne von Prozess als auch von Ergebnis), sondern das Erlangen einer optimalen Leistungsbewertung (vgl. Sacher, 2002, S.26).

3. Funktionen von Leistungsbewertung und Leistungsbeurteilung

Leistungsbewertung und Leistungsbeurteilung sollen heute vielfältige Funktionen erfüllen, die eng mit den gesellschaftlichen Funktionen von Schule (Qualifikation, Selektion, Integration) verknüpft sind. Sie werden zur Lehr- und Lerndiagnose, Kontrolle, Prognose zukünftiger Leistungen, Legitimation und Berechtigung, Sozialisation und Disziplinierung in allen Bereichen von Schule  herangezogen, zusätzlich besitzen sie auch noch eine Berichts- und Informationsfunktion. Diese Funktionen sollen sie nicht nur auf Schülerebene leisten, über schulische Leistungsbewertung kann auch eine Kontrolle der Lehrer und Lehrpläne stattfinden, sowie von Schulen oder Schulsystemen (vgl. Sacher, 2002, S.22ff). Die Funktionen und die jeweilige Bedeutung, die Leistungsbewertung darin besitzt, ist im Anhang in einer Tabelle zusammengestellt. Wo Wettbewerb zwischen Bildungsstätten herrscht, wird die erbrachte Leistung der Schule (gemessen durch Schülerleistungen) auch als Begründung für die Zuteilung von Ressourcen verwendet (vgl. Huber, 2002, S.18). Hier zeigt sich bereits ein erstes Problem: Im Allgemeinen bestimmen Lehrer und Lehrerinnen, was und wie geprüft wird, denn sie gestalten die Prüfung oder Klausur, fertigen also das Instrument, mit dem gemessen werden soll, selbst an, gestalten die äußeren Bedingungen (Zeit, Raum, Hilfsmittel) und sind für die Voraussetzungen, die die gewünschte Leistung überhaupt erst möglich machen, entscheidend mit ihrem Unterricht verantwortlich. Sie lesen die Messergebnisse ab (was ist richtig, was falsch, was lässt man durchgehen, welche Wichtung erhält welcher Fehler?) und unterliegen dabei persönlichen Bewertungsfehlern. Die entstandenen Ergebnisse werden anschließend bewertet – der Maßstab hierzu liegt häufig ebenfalls in der Hand der Lehrperson (vgl. Sacher, 2001, S.40). Der gesamte Vorgang der Leistungserhebung und Bewertung wird also von vielen, in den wenigsten Fällen kontrollierten, Variablen beeinflusst, die sich in der Lehrerpersönlichkeit konzentrieren. Entscheidungen irgendwelcher Art, betreffen sie nun Schüler, Schulen oder Schulsysteme, mit derart gewonnenen Leistungswerten zu begründen, scheint doch recht fragwürdig.

Eine andere Problematik wird ersichtlich, wenn man die Funktionender Leistungsbewertung in zwei übergeordnete Gruppen zusammenfasst. Bartnitzky z. B. unterscheidet zwei Hauptfunktionen: die Steuerungsfunktion (gesellschaftspolitisch begründet) und die Entwicklungsfunktion (bildungspolitisch und pädagogisch begründet). Hierbei umfasst die Steuerungsfunktion alle Auslesefunktionen, die Entwicklungsfunktion neben der Lehr- und Lerndiagnose auch pädagogische Funktionen wie Ermutigung, Würdigung von Ergebnissen und Kompetenzerweiterung (vgl. Bartnitzky, 2004a, S.30f); Sacher fasst gesellschaftliche, politische und schulorganisatorische Funktionen (Selektion, Sozialisation, Legitimierung, Kontrolle) zusammen und stellt dieser Gruppe unterrichtliche und erzieherische Funktionen (Information, alle Funktionen, die sich auf individuelle Entwicklungsprozesse beziehen) gegenüber (vgl. Sacher, 2001, S.19f). Die Anforderungen, die diese Funktionsgruppen jeweils an das Instrument Leistungsbewertung stellen, lassen sich jedoch nur schwer miteinander vereinbaren. Während steuernde und selektierende Funktionen einfach zu vergleichende Messwerte (z.B. Zensuren, Größen, Prozente) aus der Leistungsbewertung benötigen und sich daher bevorzugt auf kognitive Leistungen und Endprodukte stützen, benötigen die pädagogischen Funktionen differenzierte und höchst individuelle Ergebnisse, um ihre Aufgabe erfüllen zu können (ebd.). Aussagekräftige Ergebnisse dieser Art lassen sich besser aus der Bewertung von Lernprozessen gewinnen und verbal beschreiben.Schulische Leistungsbewertung und -beurteilung muss, um alle von ihr erwarteten Funktionen zu erfüllen, dennoch versuchen, diesen Anforderungen gleichzeitig gerecht zu werden, bei Schwerpunktsetzung auf eine Funktion den Gegenpart also jeweils mitbedenken (vgl. Huber, 2002, S.16). Bei Interessenkonflikten zwischen den Funktionsgruppen tritt allerdings im Schulalltag derzeit die Entwicklungsfunktion deutlich hinter der Steuerungsfunktion zurück (vgl. Bartnitzky, 2004a, S.32).
Diese konkurrierenden Interessen sind mit eine wichtige Ursache für die „Pendelbewegung“ schulischer Leistungsbewertung zwischen den Polen „Abtesten“ und „Beobachten“, die sehr deutlich in der Entwicklung der Leistungsbeurteilung im Sachunterricht bzw. seinen Vorläufern von den 50er Jahren bis heute festzustellen ist.

4. Bezugsnormen

Jede Messung und Bewertung, ob im außer- oder innerschulischen Bereich, in Mathematik, Deutsch oder im Sachunterricht, benötigt einen Vergleichsmaßstab. Hierbei scheint die Bestimmung dieses Maßstabes in einigen Fächern leichter, in anderen, mit sehr unterschied-lichen möglichen Formen von Leistung wie dem Sachunterricht, schwerer zu fallen. Im schulischen Kontext können hierbei grundsätzlich drei unterschiedliche Maßstäbe verwendet werden:

  • der Vergleich der erreichten Leistung mit der erreichten Leistung einer Bezugsgruppe (soziale Bezugsnorm, interindividueller Maßstab)
  • der Vergleich der erreichten Leistung mit bereits zuvor erzielten Leistungen derselben Person (individuelle Bezugsnorm, intraindividueller Maßstab)
  • der Vergleich der erreichten Leistung mit einem zuvor festgelegtem Anspruchsniveau (kriteriale Bezugsnorm, lehrzielorientierter Maßstab)

(vgl. Nauck, 2001, S.273ff)

Bei Verwendung der sozialen Bezugsnorm wird die individuelle Leistung durch den tatsächlich erreichten Leistungsstand der Bezugsgruppe bestimmt, Leistungsunterschiede innerhalb der Bezugsgruppe werden deutlich, nicht jedoch die individuelle Leistungssteigerung oder der Leistungsstand in Bezug auf konkrete Lernziele. Mit der individuellen Bezugsnorm lässt sich der Lernzuwachs der einzelnen Schüler und Schülerinnen aufzeigen. Hierzu muss jeweils eine „Ausgangsleistung“ bekannt sein. Dieser Maßstab „entspricht dem pädagogischen Auftrag, die individuelle Entwicklung zu beschreiben und zu fördern am besten“ (ebd., S. 275), lässt aber ebenfalls keinen Schluss darauf zu, wie weit die unterrichteten Sachinhalte tatsächlich beherrscht werden. Außerdem muss der Unterricht bei der Verwendung dieser Bezugsnorm so gestaltet sein, dass jeder Schüler tatsächlich einen Lernzuwachs erzielen kann und „Deckeneffekte“3 ausgeschlossen werden. Die kriteriale Bezugsnorm, die das Grundkonzept der Portfoliomethode im amerikanischen Sinne prägt, stellt eine Beziehung zwischen der erzielten Leistung und dem beabsichtigten Lehrziel her (ebd., S.277). Ihre Problematik besteht in der Festlegung des Anspruchsniveaus. Bei schulexterner Festlegung muss der vorausgegangene Unterricht es ermöglichen, das geforderte Niveau überhaupt erreichen zu können; Niveaufestlegungen, die sich aus dem Unterrichtsprozess ergeben, erfordern von der Lehrperson eine kritische und realistische Einschätzung des eigenen Unterrichtserfolgs.

Die Wahl der Bezugsnorm beeinflusst also die Gestaltung des Unterrichts, die Prüfung und die Beurteilung einer erbrachten Leistung, wie sich am Beispiel Portfolio eindrucksvoll belegen lässt. Welche Leistungshöhe überhaupt erreicht werden kann, ist ebenfalls zu einem großen Teil von Inhalt und Organisation von Unterricht und Prüfung abhängig (vgl. Sacher, 2001, S.52). Dieselbe Leistung kann nun, je nachdem welche Bezugsnorm verwendet wird, völlig verschieden bewertet werden, was sich letztlich in höchst unterschiedlichen Urteilen (und Zensuren) ausdrückt, aus denen die verwendete Norm aber nicht mehr hervorgeht. Die Leistungsbewertung verliert dadurch in vielen Bereichen ihre Funktionalität, denn gleiche Urteile können auf unterschiedlichen Leistungen beruhen und sind in ihrer Entstehung nicht nachvollziehbar. Daher schlagen verschiedene Autoren eine kombinierte Bewertung vor, die alle drei Bezugsnormen gleichzeitig berücksichtigt und sowohl Ziffern als auch verbale Anteile enthält (vgl. u.a. Sacher, 2001, S.52; Richter, 1999, S.135f; Easley, Mitchell, 2004, S.17). Einen vollkommen anderen Ansatz verfolgt Vierlinger mit seiner Direkten Leistungsvorlage, in der die Beurteilung anhand von völlig subjektiven und persönlichen Bezugsnormen dessen erfolgt, der die Leistungen betrachtet, weil er die enthaltenen Informationen benötigt, die Beurteilung gilt dann jedoch auch nur innerhalb dieses engen Bezugsrahmens.

5. Ziffernnoten

Im Rahmen einer Betrachtung von Leistungsbewertung im Sachunterricht wird man nicht umhinkommen, auch die Zensurenfrage als eine äußere Form von Bewertung zu untersuchen. In diesem Abschnitt soll belegt und begründet werden, warum Ziffernnoten für die meisten Leistungsarten keine angemessene Beurteilungsform darstellen und insbesondere für eine Beurteilung im Sachunterricht ungeeignet sind.

5.1 Entwicklung des sechsstufigen Notensystems

Zwar ist bereits seit dem Jahr 1599 eine sechstufige Bewertungsskala belegt4, in den Volksschulen wurde eine solche Skala aber erst im 19. Jahrhundert eingeführt, als auch die Volksschulzeugnisse mit Berechtigungen verbunden wurden. Ihr Vorläufer dort war der Rangplatz innerhalb der Klasse, der ebenfalls als „Zahlwert“ beschrieben wurde, dessen Geltungsbereich und Bezugsrahmen jedoch klar eingeschränkt waren (vgl. Huber, 2002, S.16). Ausgehend von einfachen zweistufigen Skalen der Abiturprüfung wurde die Beurteilung erbrachter Leistungen immer weiter differenziert und formalisiert, aber stets verbal mitgeteilt. Mitte des 19. Jahrhunderts finden wir z.B. die Bewertungsstufen „hinlänglich“, „gut“, „sehr gut“, „vorzüglich“ (Entlassschein der Sonntagsschule für Barbara Heckel, 1842) sowie „lobenswert“ und die Abstufung „ziemlich gut“ (Entlassungs-Zeugnis für Friedrich Gleich, 1919), Leistungen wurden aber auch mit Ziffernnoten, die teilweise noch durch Zwischennoten differenziert wurden (1 ½ ), beurteilt (Zeugnis-Büchlein von Auguste Schilling, 1896-1903). Die Bereiche „Betragen“, „Fleiß“ und „Leistungen“ besaßen teilweise eigene „Notenstufen“. Die Bewertungsskalen entwickelten sich regional unterschiedlich und wurden erst 1938 für die Schulen des Deutschen Reichsgebietes zu der uns vertrauten sechsstufigen Skala vereinheitlicht, reformpädagogisch orientierte Schulen versuchten, die Notenstufen durch Berichte zu ergänzen oder ganz auf Zeugnisse zu verzichten (vgl. Karsen, 1924, S.195; Bohl, 2004, S.52ff). 1954 wurde die sechsstufige Skala auch für die Bundesrepublik eingeführt, die einzelnen Stufen „sehr gut“, „gut“, „befriedigend“, „ausreichend“, „mangelhaft“ und „ungenügend“ konnten noch verbal notiert werden und wurden über den Begriff des „Durchschnitts“ definiert, wobei nicht verbindlich geklärt war, worauf sich eine solche Durchschnittsleistung bezog (vgl. Maier, 2001, S.52, Zeugnisheft 1.-4. Klasse, 1969). Mit dem Schuljahr 1969/1970 wurden in Niedersachsen gemäß den Vereinbarungen des Hamburger Abkommens der Kultusminister von 1964 die verbalen Begriffe durch Ziffern ersetzt, Grundlage der Notenstufen wurden nun die „Anforderungen“, denen in unterschiedlichem Maße entsprochen oder nicht entsprochen wird (vgl. Zeugnisheft 1.-4. Klasse, 1969, Beilage). Um welche Anforderungen es sich handelt, wird auch heute im Erlass des Kultusministeriums noch nicht präzisiert, aus den Bestimmungen für Förderschulen lässt sich jedoch schließen, dass Anforderungen aus den Rahmenrichtlinien gemeint sind (vgl. Niedersächsisches Kultusministerium, 2004) und damit eine kriteriale Bezugsnorm bei der Bewertung beabsichtigt zu sein scheint (vgl. Sacher, 2001, S.47). Werden in den Rahmenrichtlinien entsprechend Kriterienkataloge oder Kompetenzgrade als „Anforderung“ definiert, ließe sich hiermit die auch Portfoliomethode als Grundlage von Zeugnisnoten legitimieren.

Neben den reinen Ziffernzeugnissen dürfen in einigen Schulformen und Jahrgängen derzeit auch Berichtszeugnisse ausgestellt werden (vgl. Niedersächsisches Kultusministerium, 2004), ihre Verbreitung wurde jedoch im Grundschulbereich wieder erheblich eingeschränkt, so dass Prüfungsformen wie Portfoliogepräche oder die Kommentierte Leistungsvorlage rechtlich derzeit nicht zulässig sind, Schulversuche vielleicht ausgenommen.

Noten besitzen im Gegensatz zu verbalen Beurteilungen den Vorteil, dass sie mathematisch weiterverarbeitet werden können: Sie sind vergleichbar und verrechenbar, können Durchschnitts- und Mittelwerte liefern. Entscheidungen auf der Basis von Zahlenmaterial wirken sachlich überzeugend und sind einfach zu treffen. Die Rechenvorgänge sind nachvollziehbar und justitiabel, bei der Berechnung von „Gesamtzensuren“ für ein Schuljahr aus Einzelnoten eines Faches ebenso wie bei der Ermittlung einer Durchschnittsnote des Abschlusszeugnisses, die über die Zulassung zu bestimmten Bildungsgängen entscheidet. Daher werden die Ziffernzeugnisse gerne für bürokratische Vorgänge und als Selektionskriterium verwendet (vgl. Huber, 2002, S.17). Dennoch bestehen erhebliche Bedenken gegen die Verwendung von Ziffern zur Beurteilung einer Einzel- oder Gesamtleistung. Insbesondere im Sachunterricht ist eine „Gesamtzensur“ sehr fragwürdig, da sie sich aus unterschiedlichsten Leistungsformen und Inhalten zusammensetzt und besondere Stärken und Schwächen des einzelnen Schülers in Teilbereichen nicht mehr sichtbar werden, sondern im Nebel eines irgenwie gearteten mathematischen Mittels verschwinden lässt.

5.2 Einwände gegen Ziffernnoten

Mathematische Einwände:

Die mathematischen Bedenken stellen einige der Gründe dar, warum bei der Arbeit mit Portfolios auf die Verwendung von Ziffernnoten verzichtet wird, obwohl dies sehr wohl möglich wäre. Das Ergebnis von schriftlichen Leistungsmessungen liegt meist in der Form vor, dass die erreichten richtigen Lösungen und Lösungsprozesse mit Punkten bewertet werden (Rohpunkte). Diese unterschiedlichen Punktzahlen müssen zur Bewertung mit Ziffernnoten in sechs Klassen (Notenstufen 1 bis 6) eingeteilt werden. Nach welchen Kriterien (Bewertungsnormen) diese Zuteilung erfolgt, bleibt der Lehrperson überlassen. Eine statistische Weiterverarbeitung der so gewonnenen Zahlen zu arithmetischen Mittelwerten ist aber nur zulässig, wenn die Klassenbreiten gleich sind, in der Praxis der Leistungsabstand oder zumindest der Punkteabstand z.B. von der „1“ zur „2“ genauso groß ist wie von der „4“ zur „5“, die Notenstufen also gleichmäßig5 über die erreichbaren Punkte verteilt sind. Dies ist in der Praxis normalerweise nicht üblich (vgl. Nauck, 2001, S.273). Noch komplizierter wird es bei den sogenannten „mündlichen Noten“, die in der Praxis im Sachunterricht die entscheidende Rolle in der Zensurengebung spielen, hier ist der Leistungsabstand kaum definierbar. Eine mögliche Lösung des Problems wäre eine unterschiedliche Wichtung der einzelnen Notenstufen nach Klassenbreite, günstiger wäre jedoch eine Umsetzung von graduell gleichmäßig abgestuften beobachtbaren Merkmalen, wie sie innerhalb der Portfoliomethode nach amerikanischen Zuschnitt verwendet werden, in Zensuren.

Die Mittelwerte werden z.B. zur Ermittlung der Gesamtzensur in einem Fach, zur Beurteilung, ob eine Klassenarbeit wiederholt werden muss oder bei Bildungsabschlüssen benötigt. Hier stellt sich neben der oben geschilderten Problematik der Notenabstände zusätzlich die Frage, ob das arithmetische Mittel als Entscheidungskriterium geeignet ist, oder ob andere Mittelbildungen wie Modalwert oder Median nicht eine angemessenere Entscheidungsgrundlage liefern können6.

Pädagogische Einwände

Die Ziffernnote konstatiert den „Wert“ einer Leistung, liefert aber keine Rückmeldung, warum die Leistung eben so bewertet wurde oder welchen Weg der Schüler einschlagen muss, um eine bessere Note zu erhalten (vgl. Winter, 2004c, S.46). In der Regel wird auch nur der Endstand eines Lernprozesses bewertet, nicht seine Qualität, wie Anstrengungsbereitschaft der Schüler, Misserfolgsbewältigung oder ihr überlegtes Vorgehen (vgl. Sacher, 2002, S.22). Persönliche Lernfortschritte, die anhand eines Entwicklungsportfolios deutlich gemacht werden können, auch wenn sie noch so gering sind, bleiben unsichtbar, wenn sie nicht größer sind als der Lernfortschritt der Gesamtklasse und gleichzeitig die nächste Notenschwelle überschritten wird. Dadurch werden schwächere Schüler immer wieder entmutigt (vgl. Winter, 2002a). Die „Scheinobjektivität und Pseudowissenschaftlichkeit“ (Sacher, 2002, S.24) der Zahlen tragen dann ganz wesentlich dazu bei, dass diese Schüler sich als unfähig erleben, dies akzeptieren und in ihr Selbstbild übernehmen (ebd.). Noten wirken im pädagogischen Kontext als Belohnung und Bestrafung, sie werden zum primären Ziel, so dass es zu einem Lernen um der Noten willen kommen kann (vgl. Winter, 2004b, S.3), statt zum Aufbau einer intrinsischen Lernmotivation. Der Bestrafungscharakter von Ziffernnoten führt dann auch zur Zensur als einfach anzuwendende Disziplinierungsmaßnahme (ebd.; vgl. Huber, 2002, S.17)

und was sonst noch dagegen spricht…

Unter schulischen Alltagsbedingungen, in denen z.B. mündliche Noten und Arbeitsverhalten bestimmt werden, gelingt es nur, zwei bis drei Leistungsstufen sicher voneinander zu trennen, die Notenarithmetik bis auf mehrere Nachkommastellen täuscht eine Genauigkeit vor, die sie inhaltlich gar nicht leisten kann (vgl. Sacher, 2002, S.21). Die Entstehung einer Note ist meistens nicht nachvollziehbar. Weder die Bezugsnorm noch das erbrachte Leistungsniveau lässt sich aus ihr ersehen, zusätzlich ist sie mit Bewertungsfehlern vielerlei Art behaftet – gleiche Noten bedeuten also keinesfalls gleiche Leistung, wie es in Selektionsprozessen unterstellt wird und identische Leistungen werden von unterschiedlichen Lehrern sehr unterschiedlich beurteilt (ebd.), wie empirische Untersuchungen bestätigten, z.B. Studien von Ulshöfer 1949, Weiss 1965 und eine Replikationsstudie von Birkel und Birkel, 2002. Weiss konnte auch Einflüsse des Geschlechts und weiterer Vorinformationen über den Prüfling auf die erteilte Zensur nachweisen. Er meint auch, dass die tatsächliche Bedeutung einer Zensur vom Unterrichtsfach und der Schulstufe, in der sie erteilt wird, abhängt. So existierten in den einzelnen Fächern unterschiedliche Zensurenmaßstäbe, in seiner Untersuchung wurde in den „Nebenfächern“ (Sport, Religion, Musik…) milder geurteilt als in den Hauptfächern (Mathematik, Deutsch, Fremdsprachen), ein Effekt, der sich auch im Sachunterricht nachweisen lässt, in dem Lehrer das untere Spektrum der Notenskala außer zu disziplinarischen Zwecken so gut wie nie verwenden. Mit zunehmender Schulstufe wurden die Schüler außerdem immer strenger beurteilt. Die von außen gegebenen Definitionen, welche Leistung für eine bestimmte Note zu erbringen sind, schafften es also zur Zeit dieser Untersuchungen nicht, bei den Lehrkräften einheitliche Vorstellungen dieser Leistung zu vermitteln (vgl. Thiel, 2003). Die Portfoliomethode versucht dieses Problem durch Schulung der Lehrkräfte und Bewertungskonferenzen, bei denen kleine Gruppen von Lehrern gemeinsam die Portfolios ihrer Schüler bewerten, zu beheben und zu einheitlichen Leistungs- und Bewertungsvorstellungen zu gelangen.

Ein weiteres Problem sind die Chiffrier- und Dechiffriervorgänge beim Umgang mit Noten. Der Lehrer vergleicht die erbrachten Leistungen mit seinen Vorstellungen und übersetzt sie in eine Note. Nach welchen Regeln (Kombination von Bezugsnormen, Fachspezifika, Wichtung von Teilbereichen…) diese Transformation vorgenommen wird, bleibt weitgehend ihm überlassen und wird Dritten gegenüber nicht offengelegt. Der „Abnehmer“ des Zeugnisses, weiter-führende Schule oder Arbeitgeber, erhält als Information lediglich die Note. Er konstruiert aufgrund seiner persönlichen Erfahrungen eine Vorstellung von der erbrachten Leistung, die aber selten deckungsgleich mit der Ausgangsleistung ist und trifft auf dieser von Subjektivismen geprägten Grundlage seine Entscheidungen (vgl. Vierlinger, 2002, S.33). Vierlinger weist weiter daraufhin, dass Noten Rivalität und Konkurrenzdenken unter den Schülern fördern und somit einen negativen Einfluss auf das soziale Klima der Klasse ausüben (ebd. S.87ff), auf das insbesondere der Sachunterricht mit seinem hohen Anteil an gruppenunterrichtlichen Verfahren und offenem Unterricht angewiesen ist. Wege zur positiven Gestaltung gemeinschaftlichen Zusammenlebens und -arbeitens sind zudem ein Lernziel des Sachunterrichts, er steht damit in der Gefahr, mit dem Einsatz von Ziffernnoten seine eigenen Aufgaben zu konterkarieren. Bei einem Vergleich zwischen den Funktionen, die Leistungsbeurteilung zugeschrieben werden und dem, was Ziffernnoten dazu beitragen können, wird deutlich, dass eine Beurteilung allein durch Noten viele dieser Funktionen nicht erfüllen kann. Sie geben sich zwar als Ergebnis exakter Messvorgänge, stellen aber in Wirklichkeit nur ein Werturteil dar, das lediglich dann Aussagekraft hat, wenn der normative Standpunkt des Wertenden bekannt ist, und nur dann Gültigkeit für den Interpretierenden besitzt, wenn er diesen Standpunkt teilt (vgl. Sacher, 2001, S.41).

6. Verbale Beurteilungen

Im Sachunterricht erbringen Schüler viele Leistungen, die aus den oben genannten Gründen mit einer „Note“ nicht angemessen beurteilt werden können, da sie ausgesprochen komplex sind oder aus (zum Teil auch qualitativ) sehr unterschiedlichen Anteilen bestehen, denen man mit der Erteilung einer Gesamtnote nicht gerecht werden kann. Als Alternative zu Ziffernnoten werden deshalb vielfach verbale Beurteilungen verwendet, deren Tradition, wie bereits gezeigt, älter ist als die Ziffernnote, auch wenn sie derzeit als „moderneres“ und „neuartiges“ Beurteilungsmodell verstanden wird. Die verbale Beurteilung bietet die Möglichkeit, differenzierte und individuelle Aussagen über jeden Schüler in Bezug auf seine Leistung und seine Lernfortschritte zu machen, sowie seine Eigenarten zu erfassen. Die Gründe für eine geringe Leistung können beschrieben und Hilfemöglichkeiten dargestellt werden.Es besteht die Möglichkeit, mit entsprechenden Aussagen Kinder zu ermutigen und Anerkennung auszudrücken. Individuelle verbale Beurteilungen sind nicht untereinander vergleichbar, dies verringert Konkurrenzdenken und Rivalität innerhalb der Gruppen. Sie erfordern von Lehrer und Lehrerin eine genaue Beobachtung und Auseinandersetzung mit jedem einzelnen Schüler und fördern die Beziehung zwischen Eltern, Lehrkräften und Schülern. Selbst standardisierte verbale Beurteilungen werden für aussagekräftiger gehalten als Ziffernnoten (vgl. Thiel, 2003).
Ausführliche verbale Beurteilungen sind jedoch sehr zeitaufwendig. So besteht die Gefahr, sich auf Standardformulierungen zurückzuziehen, die letztlich einer Zensur entsprechen oder der Individualität des Beurteilten nicht gerecht werden. Dies wird durch inzwischen erhältliche kommerzielle Produkte unterstützt, mit denen Verbalzeugnisse quasi im Baukastensystem zusammengesetzt werden können. Leicht kann aus einer verbalen Beurteilung auch ein „pseudo-psychologisches Gutachten“ (ebd.) werden, dessen Zuschreibungen von Eltern und Schüler kritiklos übernommen werden; diese Gefahr besteht besonders im Fach Sachunterricht, das als Lernziel auch den Erwerb von personalen und sozialen Kompetenzen ausweist. Hier muss darauf geachtet werden, dass ein geringer Grad an Kompetenz in einem Bereich, z.B. Konfliktfähigkeit, nicht als persönliche Eigenschaft oder Charakterzug interpretiert, sondern als erlernbare und verbesserbare Handlungsoption betrachtet wird. Die Objektivität der Beurteilungen ist durch subjektive Formulierungen und willkürlicher Wahl und Wichtung einzelner Beurteilungsbereiche gefährdet (ebd.). Die Beurteilung entspricht dem verbalen Stil des Lehrers. In Untersuchungen konnte gezeigt werden, dass zumindest die Beschreibung des Lernstandes ohne weitere Kenntnisse von den Eltern kaum verstanden wurde, da ihnen der Bezugsrahmen des erwarteten Leistungsniveaus, wie er z.B. bei der Portfoliomethode in den Standards formuliert wird, fehlte. Nahezu alle Eltern waren mit den Wortzeugnissen ihrer Kinder zufrieden, die negativen Aspekte wurden also nicht „herausgelesen“. Eltern schwächerer Schüler, die wenig Kontakt zur Schule hatten, überschätzten jedoch die enthaltenen positiven Aussagen (Sacher, 2001, S.145). Hier entwickelt sich die mangelnde Vergleichbarkeit zum Nachteil, solange nicht, wie in der Portfoliomethode vorgesehen, über die erwartete Leistung als Vergleichsmaßstab ebenfalls informiert wird.

7. Bewertungsfehler

Studien zu Bewertungsfehlern sind schon vielfach mit zum Teil erstaunliche Ergebnissen durchgeführt worden, das Fach Sachunterricht ist meines Wissens jedoch unter dieser Fragestellung noch nicht untersucht worden, obwohl hier aufgrund des hohen Anteils sprachlicher Komponenten, der zu mangelnder Validität der Leistungsfeststellung führt, und der hohen Relevanz von mündlichen Anteilen und „Beteiligung“ ein starker Einfluss von Bewertungsfehlern auf die Beurteilung anzunehmen ist.
Bevor eine Leistung beurteilt oder bewertet wird, muss sie festgestellt, gemessen werden. Will eine Messung aber als brauchbar und sinnvoll gelten, sollte sie drei Qualitätskriterien genügen: Sie muss objektiv sein, reliabel und valide.

Objektivität erfordert, dass subjektive Einflüsse der Untersucher möglichst ausgeschaltet werden. In einem objektiven Verfahren würden also verschiedene Lehrer dieselbe Schülerleistung gleich beurteilen. Die Objektivität der Messung ist Voraussetzung für Reliabilität und Validität jeder Messung.
Reliabilität bedeutet die Zuverlässigkeit der Messung, den Grad der Sicherheit oder Genauigkeit, mit dem ein bestimmtes Merkmal gemessen werden kann; ein Lehrerurteil wäre dann reliabel, wenn bei einer zweiten Beurteilung derselben Leistung zu anderen Zeitpunkten derselbe Lehrer stets dieselbe Bewertung vergeben würde.
Die Validität oder Gültigkeit eines Verfahrens bezieht sich darauf, ob man wirklich das misst, was beabsichtigt ist oder ob die Wirkung anderer Einflüsse das Messergebnis beeinflusst. Will man z.B. mit der Leistungsmessung prüfen, ob Unterrichtsziele erreicht wurden, müssen auch genau diese Ziele geprüft werden; bei schriftlichen Anweisungen im Sachunterricht, wie beispielsweise bei der Stationsarbeit, aber auch schon bei schlichten Arbeitsblättern, kann es vorkommen, dass Schüler von der sprachlichen Komponente überfordert sind und die Aufgabe deshalb nicht lösen können. Die so gemessene Leistung spiegelt dann eine mangelnde sprachliche Kompetenz wider, über die geforderte sachunterrichtliche Leistung sagt die Messung nichts aus (vgl. Thiel, 2003).

Während bei schul- und landesübergreifenden Tests im schulischen Bereich (z.B. PISA, regionale Vergleichsarbeiten, erweiterte IGLU-Studie für den naturwissenschaftlichen Bereich des Sachunterrichts) durch genaue Bewertungs- und Beurteilungsvorgaben zumindest Objektivität und Reliabilität gesichert sind, haben empirische Untersuchungen gezeigt, dass Leistungsmessung im schul- und klasseninternen Bereich keines dieser drei Kriterien erfüllt.Eine valide Leistungsüberprüfung selbst zu konzipieren ist für eine einzelne Lehrkraft, von reinen Wissens-Abfrage-Situationen einmal abgesehen, kaum möglich; die Validität müsste zudem an Kontrollgruppen überprüft werden. Zur Leistungsmessung mit der Funktion einer Lernberatung bietet sich hier für die Bereiche Lesen, Schreiben und Rechnen die Verwendung von Schultests an (z.B. Hamburger Lese- bzw. Schreibprobe, Diagnostischer Rechentest für 3. Klassen), die überwiegend zu Diagnosezwecken entwickelt wurden, Leistungen oberhalb des Erwartungshorizontes werden allerdings meist nicht erfasst. Für den Sachunterricht gibt es derzeit solche Tests nicht, obwohl sich aus dem Fragenkatalog und den Ergebnissen der TIMSS – Studie, an der Deutschland im Primarbereich nicht teilnahm, vielleicht eine derartige Diagnostik ableiten ließe; als Ursache für das Fehlen von diagnostischen Tests zum Sachunterricht können einerseits die vielfältigen Anforderungen dieses Fachs gesehen werden, andererseits aber auch die bisher sehr uneinheitlichen Vorstellungen über den Bildungsinhalt dieses Faches in den einzelnen Bundesländern, die eine Erstellung und Vermarktung eines „Diagnose-Tests zum natur- resp. geisteswissenschaftlichen Verständnis“ erschweren.

Objektivität und Reliabilität der Leistungsbeurteilung können durch zahlreiche Arten von Fehlern beeinträchtigt werden.Bei der Vergabe der Zensur kann es zu konstanten, schülerunabhängigen Fehlern kommen: Die Lehrperson beurteilt konstant zu gut („Milde-Fehler“) oder zu schlecht („Strenge-Fehler“), beim „Mitte-Fehler“ („Central Tendency“) werden Extreme vermieden, alle Zensuren gruppieren sich um das Mitttelfeld. Die Gründe dafür können z.B. in einer nicht angemessenen Anwendung der Leistungsdefinitionen liegen, darin, dass die Leistungsunterschiede innerhalb der Gruppe nicht differenziert genug gesehen werden (vgl. Koliadis, 2003) oder in einer zu feinen Einteilung der Bewertungsskala, die das Unterscheidungsvermögen der Lehrperson überfordert, Portfoliobewertungen werden aus diesem Grund häufig nur in drei oder vier unterschiedliche Leistungsstufen differenziert.Reihungs- und Kontrasteffekte treten bei der Beurteilungen mehrerer Leistungen hintereinander auf. Aufgrund von Erfahrungen weiß die Lehrkraft, dass sich die Leistungen der Schüler unterscheiden müssen; bei einer zeitlichen Reihung von nur mäßigen Leistungen wird eine geringe Verbesserung oder Verschlechterung einer folgenden Arbeit stärker gewertet (Reihungseffekt). Nach einer Reihe besonders guten Leistungen wird eine mittlere Leistung schlechter gewertet, nach besonders schlechten besser, als es ihr eigentlich entsprechen würde (Kontrasteffekt)(ebd.). Durch eine Mehrfachkorrektur in veränderter Reihenfolge oder kurze Korrektursequenzen könnten diese Effekte, die bei schriftlichen Leistungen und damit auch bei der Leistungsbewertung von Portfolios als Sammlung überwiegend schriftlicher Einlagen auftreten, vermindert werden.Die meisten Fehler beruhen jedoch auf impliziten Persönlichkeitstheorien und dadurch beeinflusster subjektiver Wahrnehmung. So zeigt sich eine Tendenz zu konsistenter Bewertung bei der Betrachtung einer sozialen Dimension (Verlässlichkeit, Ehrlichkeit…) und der intellektuellen Dimension (vermutete Intelligenz, Fleiß, Beharrlichkeit…). Obwohl beide Dimensionen unabhängig voneinander existieren, wird bei Beurteilung einer Dimension die Bewertung unbewusst auch auf die andere übertragen (ebd.)(Bsp.: „faule“ Schüler werden eher für unzuverlässig gehalten als fleißige…). Einen ähnlichen Vorgang, nämlich den Fehlschluss von einem Merkmal auf ein anderes, allerdings in derselben Dimension, bezeichnet Thiel als „Logischen Fehler“, der ebenfalls eine Bewertung verfälschen kann (vgl. Thiel, 2003) (Bsp.: Wer gut in Mathematik ist, muss auch gut in Physik sein…). Dieser Fehler beruht häufig auf Stereotypen, die durch entsprechende Erfahrungen verstärkt werden. Der Einfluss eines allgemeinen Gesamteindrucks, des „Rufs“ der einem Schüler vorauseilt oder von erzielten Leistungen auf die Beurteilung in einem anderen, davon unabhängigen Leistungs-bereich, wird als „Halo-Effekt“ bezeichnet (ebd.). Sachunterricht als Konglomerat unterschiedlichster Bezugsfächer und Kompetenzbereiche ist für diese Art von Fehlern, bei denen die Einschätzung aus einem Bereich auf weitere, davon unabhängige Dimensionen übertragen wird, besonders anfällig. Auch der Primacy-Effekt (Perseverationstendenz, „Nähe-Fehler“) beeinflusst die Beurteilung einer Leistung: Die erste Bewertung eines Kindes in einem Fach wirkt sich häufig auf die weitere Beurteilung aus, eine Abweichung findet meistens nur um eine Notenstufe statt (vgl. Koliadis, 2003). Dieser Haltung wird in den Zeugnisregelungen Niedersachsens Vorschub geleistet, da hier Veränderungen in den Zeugnissen über einen Zensurenschritt hinaus in der Klassenkonferenz erörtert und schriftlich festgehalten werden müssen7.

Viele Beurteiler führen eine erzielte Leistung hauptsächlich auf die zwei Faktoren Können und Bemühen (bzw. Fähigkeit und Anstrengung) zurück (Kausalattribuierungstheorie). Eine negative Bewertung wird eher erteilt, wenn vom Beurteiler ein „Nicht-Wollen“ als Ursache für eine geringe Leistung vermutet wird, als bei einem „Nicht-Können“ (ebd.), die Beurteilung wird demnach hier durch Interpretation gewonnen, und nicht durch Beobachtung festgelegter Merkmale wie in der Portfoliobewertung. Einen weiteren Einfluss auf die Bewertung stellen Sympathie und Ablehnung dar. In einer Untersuchung 1928 wurde festgestellt, dass bei gleicher Leistung die „beliebteren Schüler“ bessere Beurteilungen erhielten. Dieser Einfluss kehrt sich jedoch ins Gegenteil um, wenn die Lehrperson sich dieser Sympathie bewusst ist, wie in einer späteren Studie aufgezeigt wurde; die sympathischen Schüler wurden hier strenger beurteilt, da die Lehrer dem Vorwurf der Bevorzugung entgehen wollten (ebd.).„Projektion“ findet statt, wenn der Beurteiler eigene Unzulänglichkeiten im Schüler wiedererkennt und sie bei der Beurteilung unangemessen stark berücksichtigt (ebd.).Insgesamt wird nur ein kleiner Teil aller abgegebenen Reize, die im Sachunterricht aus sehr vielen unterschiedlichen Lernbereichen stammen, und für eine Beurteilung alle von gleicher Relevanz sein können, in einer Bewertungssituation beachtet und verarbeitet. Die Wahrnehmung wird von den Annahmen beeinflusst, die im jeweiligen Sozialgefüge gelten, der Lehrer nimmt nur das wahr, was er aufgrund sozialer Normen und Regeln von diesem Schüler erwartet (vgl. Thiel, 2003), im Sinne der „Theorie der kognitiven Dissonanz“8 wird die Aufnahme von Informationen vermieden, die den eigenen, in der Regel schwer veränderbaren Erwartungen widersprechen (vgl. Koliadis, 2003). Dies kann, um ein Beispiel zu geben, dazu führen, dass Mädchen im Sachunterricht bei Arbeiten mit technischen oder physikalischen Anteilen schlechter beurteilt werden als Jungen, da aufgrund von Vorerwartungen ihre technische Kompetenz einfach nicht registriert wird. Die Informationen werden zusätzlich kulturspezifisch interpretiert. Gerade das Verhalten gegenüber Respektspersonen ist kulturell geprägt. Da im Bereich mündlicher Prüfungen äußere Faktoren wie Sprechtempo, Aussehen und Blickkontakte einen starken Einfluss auf die Bewertung der Leistung haben (vgl. Jäger, 2004, S.151f; Vierlinger, 1999, S.49f; Koliadis, 2003 ), schlagen sich kulturell bedingte Missverständnisse in der Beurteilung nieder.

Fast alle der beschriebenen Bewertungsfehler treten sowohl bei schriftlichen als auch bei mündlichen Leistungsüberprüfungen auf und lassen sich bei einer Bewertung durch Ziffernnoten ebenso wie bei verbalen Beurteilungen finden. Viele von ihnen können dadurch abgemildert oder gar vermieden werden, dass die Beurteilung von mehreren Personen vorgenommen und dann ein gemeinsames Urteil gefunden wird. Die Portfoliomethode versucht deshalb, den Einfluss von Bewertungsfehler durch kriterienorientierte Verfahren und den Einsatz mehrerer Prüfer sowohl bei der Portfolioprüfung (interne und externe Begutachter) als auch im Portfoliogespräch (Eltern, Lehrer) und bei der Beurteilung eingereichter Portfolios (Kollegium, Bewertungskonferenz) zu verringern.

Auf Schülerseite kann die Leistungsbewertung durch Faktoren verfälscht werden, die es verhindern, dass der Schüler zum Prüfungszeitpunkt sein Leistungspotential voll abrufen kann. Hier sind zum einen Prüfungsängste und Stressfaktoren zu nennen, aber auch familiäre Problemlagen und mangelndes Selbstvertrauen können die Leistungsfähigkeit mindern (vgl. Bohl, 2004, S.73). Die punktuelle Messung der Leistung ist dann zwar für den Messzeitpunkt korrekt, gibt aber nicht die Leistungsfähigkeit des Schülers oder der Schülerin in Normalsituationen wieder. Bei schulübergreifenden Tests hängt die Leistung, die ein Kind erreichen kann, wesentlich von der Qualität des vorher erteilten Unterrichts ab. Ein schlechtes Abschneiden in einem solchen Test kann allein darauf beruhen, dass das entsprechende Wissen oder die erforderlichen Kompetenzen noch nicht vermittelt wurden, die extern festgelegten Bewertungskriterien darauf aber keine Rücksicht nehmen. Hier wird der Unterricht des Lehrers bewertet, nicht das Lernen der Kinder, denen das Versagen aber letztlich zugeschrieben wird. Eine Möglichkeit, eine derartige fehlerhafte Beurteilung zu vermeiden, wäre eine schulintern flexible Handhabung der Bewertungskriterien (nicht jedoch im schulübergreifenden Bereich) oder die Nichtberücksichtigung der betreffenden Leistungsmessung in einer zusammenfassenden Beurteilung.

1 Interessanterweise erlebt diese Idee derzeit wieder eine Renaissance in den Zulassungsbedigungen zu einzelnen Master-Studiengängen an der Universität Hannover, bei denen zwei positive Empfehlungsschreiben des Lehrpersonals als Voraussetzung zur Einschreibung gefordert werden, die allein auf einer persönlichen Einschätzung der Dozenten beruhen.

2 Der Text scheint gleichlautend bereits 1798 von Becker veröffentlicht worden zu sein, diese Quelle liegt mir aber nicht vollständig vor.

3 Deckeneffekt: Schüler beherrschen das Lehrziel bereits vor dem Unterricht, es findet also kein Lernzuwachs mehr statt (Nauck, 2001, S.262)

4 Beschrieben in der „Ratio studiorum“, der Studienordnung der Jesuitenschulen (Vierlinger, 2002, S.37), hierbei handelt es sich um die Stufen optimus (bester), bonus (gut), mediocris (mittelmäßig), dubius (zweifelhaft), retinendus (auszusiebende) und reiciendus (abzuweisende) (http://www.arge.schule-hamburg.de/Inhalt/Noten.html [Stand 30.9.05])

5 oder in einem logarithmischen Verhältnis, dann müssen auch die weiteren Berechnungsmethode verändert werden

6 eine Beispielrechnung zur Auswirkung der Verwendung der verschiedenen Werte befindet sich im Anhang (im Blog nicht enthalten)

7 vgl. Niedersächsisches Kultusministerium, 2004, 3.6

8 Die Theorie der kognitiven Dissonanz besagt, dass kognitive Elemente (also Informationen) zueinander konsonant, dissonant oder irrelevant sein können. (…) Konsonante Informationen werden vom Menschen als angenehm empfunden und daher aktiv gesucht. Gleichzeitig wird versucht, dissonante Informationen zu vermeiden. Die Folge des geschilderten Verhaltens ist die selektive Wahrnehmung von Informationen (Url: http://de.wikipedia.org/wiki/Kognitive_Dissonanz [Stand 30.9.05]) Diese Theorie wurde von Leon Festinger (1919-1989), US-amerikanischer Sozialpsychologe, entwickelt.

Quellen:

Bartnitzky, Horst (2004a): „Die pädagogische Leistungskultur – eine Positionsbestimmung“. In: Bartnitzky, Horst; Speck-Hamdan, Angelika: Leistungen der Kinder wahrnehmen – würdigen – fördern. Grundschulverband – Arbeitskreis Grundschule: Frankfurt am Main. S.27-40.

Becker, Rudolf Zacharias (1815): Noth- und Hülfsbüchlein für Bauersleute: welches lehret, wie man vergnügt leben, mit Ehren reich werden und sich und Andern in Nothfällen helfen kann: alles mit glaubhaften Historien bewiesen und mit Bildern gezieret. Band 2. Gotha. S.651ff

Benson, Barbara P.; Barnett, Susan P. (2005): Student-Led Conferencing Using Showcase-Portfolios. 2. erw. Auflage. Corwin Press: Thousand Oaks, Kalifornien, USA.

Bohl, Thorsten (2004): Prüfen und Bewerten im Offenen Unterricht. 2. Auflage. Beltz: Weinheim, Basel.

Brügelmann, Hans (2004): „ ‚Output‘ statt ‚Input‘? Kritische Anmerkungen zur aktuellen Leistungsdebatte“. In: Bartnitzky, Horst; Speck-Hamdan, Angelika: Leistungen der Kinder wahrnehmen – würdigen – fördern. Grundschulverband – Arbeitskreis Grundschule: Frankfurt am Main. S.10-26.

Easley, Shirley-Dale; Mitchell, Kay (2004): Arbeiten mit Portfolios. Schüler fordern, fördern und fair beurteilen. Verlag an der Ruhr: Mühlheim a.d. Ruhr.

Friebe, Günther (1927): Schulgeld. Die geltenden Bestimmungen über das Schulgeld an den öffentlichen höheren Schulen. Weidemannsche Buchhandlung: Berlin.

Jäger, Reinhold S. (2004): Von der Beobachtung zur Notengebung. Ein Lehrbuch. 5. überarbeitete und ergänzte Aufl. Verlag empirische Pädagogik: Landau.

Huber, Ludwig (2002): „ Leistung in der Schule. Rückblicke in die Geschichte – Fragen an die Gegenwart.“ In: Winter, Felix; von der Groeben, Annemarie; Lenzen, Klaus-Dieter (Hg.): Leistung sehen, fördern, bewerten. Neue Wege für die Schule. Klinkhardt: Bad Heilbrunn. S.11-19.

Karsen, Fritz (1924): „Die Aufbauschule in Neukölln“. In: Karsen, Fritz (Hg.) (1924): Die neuen Schulen in Deutschland. Verlag Julius Beltz: Langensalza. S.181-200.

Koliadis, Emmanuel et.al. (2003): Psychologische Aspekte der Leistungsbeurteilung – Verfälschungsmechanismen, diverse Effekte; die Verhaltenskomponente… In: Seebauer, Renate (Hg.):Studienmaterial zur Lehreraus- und -fortbildung „Qualität durch Qualifikation“. Europahaus Burgenland. URL:http://www.europahausburgenland.net/Projekte/Q-B9a.htm [Stand 29.9.05]
dieser Artikel ist im Internet leider nicht mehr auffindbar. Stand. 13.10.2013

Luthmer, H. (Hg.) (1911): Comenius. Eine Auswahl aus seinen pädagogischen Schriften für den Gebrauch an Seminarien. Dritte Auflage. Velhagen & Klasing: Bielefeld und Leipzig.

Maier, Markus (2001): Das Verbalzeugnis in der Grundschule – Anspruch und Wirklichkeit.
Verlag Empirische Pädagogik: Landau.

Merz, German (2002): Die Entwicklung des Gymnasiums aus systemtheoretischer Sicht. Selbstverlag: Ingolstadt. Kapitel 2.2.3.1.2.1 Das Humanistische Gymnasium um 1800
URL: http://www.gymnasium-2002.de/online_lesen/onl_teilb1_030403p23.html

N.N. (1802): „Feyerliche Prüfung der Schuljugend in Burgörner“: In: Bibliothek der pädagogischen Literatur: verbunden mit ein Correspondenzblatte, welches pädagogische Abhandlungen, Aufsätze, Anfragen, Nachrichten, Wünsche, Zweifel, Vorschläge & c. enthält, und einen Anzeiger. Band 1 Heft 4. Perthes: Gotha. S.432-438.

N.N. (1825): „Prüfung der zur Universität abgehenden Jünglinge in Preußen“. In: Allgemeine Schulzeitung: ein Archiv für die neueste Geschichte des gesammten Schul-, Erziehungs- und Unterrichtswesens der Universitäten, Gymnasien, Volksschulen und aller höheren und niederen Lehranstalten. 2. Jahrgang. Heft 77. o.A: Darmstadt. S.609-613.

N.N. (1829): „Prüfungsgespräch: Über den Frühling als Bild unserer Jugend“. In: Rossel‘s Wochenblatt für Elementarlehrer. 2. Jahrgang, Heft 18. o.A: Aachen. S.282-286.

N.N. (1838): „Sollen auch in Mädchenschulen öffentliche Schulprüfungen gehalten werden?“. In: Allgemeine Schulzeitung : ein Archiv für die neueste Geschichte des gesammten Schul-, Erziehungs- und Unterrichtswesens der Universitäten, Gymnasien, Volksschulen und aller höheren und niederen Lehranstalten 15. Jahrgang, Heft 11. o.A: Darmstadt. S.90-93.

N.N. (1840): „Einladung zur öffentlichen Prüfung in der Volkstöchterschule zu Clausthal, am 19.März 1839“. In: Allgemeine Schulzeitung : ein Archiv für die neueste Geschichte des gesammten Schul-, Erziehungs- und Unterrichtswesens der Universitäten, Gymnasien, Volksschulen und aller höheren und niederen Lehranstalten. 17. Jahrgang, Heft 83. o.A: Darmstadt. S.673-677.

N.N. (1854): „Oeffentliche halbjährige Prüfung an einer Hauptschule in Böhmen“. In: Berthelt, A.(Hg): Allgemeine deutsche Lehrerzeitung : zugleich Organ der allgemeinen deutschen Lehrerversammlungen und des Deutschen Lehrer- Pensionsverbandes. 6. Jahrgang, Heft 23. o.A: Leipzig. S.177-180.

N.N. (1894): „Aufhebung der öffenlichen Prüfungen am Schlusse des Schuljahres bei den höheren Schulen.“ In: Pädagogisches Archiv: Monatsschrift für Erziehung, Unterricht und Wissenschaft.
36. Jahrgang, Heft 1. Quelle & Meyer: Leipzig. S. 43-44.

Nauck, Joachim (2001): „Kontrolle und Bewertung des Lernerfolgs“. In: Hoof, Dieter (Hg.): Didaktisches Denken und Handeln. Eine Einführung in die Theorie des Unterrichts. 5. Auflage. Institut für Schulpädagoik und Allgemeine Didaktik der Technischen Universität Braunschweig: Braunschweig. S.259-281.

Niedersächsisches Kultusministerium (Hg.)(2004): „Zeugnisse in den allgemeinbildenden Schulen. RdErl. d. MK v. 24.5.2004 -303-83203“ In: Schulverwaltungsblatt Heft 11/2004 Verlag Hahnsche Buchhandlung: Hannover. S.505.
URL: http://www.schure.de/22410/303/83203.htm#p21 [Stand 26.9.05]

Rauschenberger, Hans (2002): „Leistungserziehung als Leistungsdialog.“ In: Winter, Felix; von der Groeben, Annemarie; Lenzen, Klaus-Dieter (Hg.): Leistung sehen, fördern, bewerten. Neue Wege für die Schule. Klinkhardt: Bad Heilbrunn. S.39-47.

Richter, Ingo (1999): Die sieben Todsünden der Bildungspolitik. Carl Hanser Verlag: München, Wien.

Sacher, Werner (2001): Leistungen entwickeln, überprüfen und beurteilen: Grundlagen, Hilfen und Denkanstöße für alle Schularten. 3. erw. und überarb. Auflage. Klinkhardt: Bad Heilbrunn.

Sacher, Werner (2002): „ Die Notengebung ist unzureichend“. In: Winter, Felix; von der Groeben, Annemarie; Lenzen, Klaus-Dieter (Hg.): Leistung sehen, fördern, bewerten. Neue Wege für die Schule. Klinkhardt: Bad Heilbrunn. S.20-27.

Von Grolmann (1824): „Maturitätsprüfung der Gymnasiasten zum Behuf des akademischen Studiums im Großherzogtum Hessen“. In: Allgemeine Schulzeitung: ein Archiv für die neueste Geschichte des gesammten Schul-, Erziehungs- und Unterrichtswesens der Universitäten, Gymnasien, Volksschulen und aller höheren und niederen Lehranstalten. 2. Jahrgang 1825, Heft 38. o.A: Darmstadt. S.298-301. (1)

Thiel, Bernhard (2003): „Funktionen der Leistungsmessung, historische Aspekte und aktuelle Erscheinungsformen, (Ziffernnote und verbale Beurteilung).“ In: Seebauer, Renate (Hg.):Studienmaterial zur Lehreraus- und -fortbildung „Qualität durch Qualifikation“. Europahaus Burgenland. URL: http://www.europahausburgenland.net/Projekte/Q-B6a.htm [Stand 29.9.05]

Vierlinger, Rupert (1999): Leistung spricht für sich selbst. „Direkte Leistungsvorlage“ (Portfolios) statt Ziffernzensuren und Notenfetischismus. Dieck-Verlag: Heinsberg.

Vierlinger, Rupert (2002): „Das Konzept der Direkten Leistungsvorlage“. In: Winter, Felix; von der Groeben, Annemarie; Lenzen, Klaus-Dieter (Hg.): Leistung sehen, fördern, bewerten. Neue Wege für die Schule. Klinkhardt: Bad Heilbrunn. S.28-38.

Winter, Felix (2002a): „Portfolio und Leistungsbewertung“.In: ide – Informationen zur Deutschdidaktik 26. Heft 1. Studienverlag: Innsbruck, Wien, Bozen. S.91-98.
URL: http://portfolio-schule.de/index.cfm?uuid=496D352DCC4E4076AF63B8D9AACA8C56&o_lang_id=1
[Stand 25.8.05]

Winter Felix (2004a): Leistungsbewertung. Eine neue Lernkultur braucht einen anderen Umgang mit den Schülerleistungen. Schneider Verlag Hohengehren: Baltmannsweiler.

Winter, Felix (2004b): Wir brauchen eine geklärte Vielfalt. Rede zur 2. Portfoliotagung in Obermarchtal. URL: http://portfolio-schule.de/index.cfm?uuid=8A4586EAAFAF44E8B50415CAE749158B&o_lang_id=1 [Stand: 18.8.05]

Winter, Felix (2004c): „Neue Lernkultur – aber Leistungsbewertung von gestern?“. In: Bartnitzky, Horst; Speck-Hamdan, Angelika: Leistungen der Kinder wahrnehmen – würdigen – fördern. Grundschulverband – Arbeitskreis Grundschule: Frankfurt am Main. S.41-53.

Zerrenner, Carl Christoph Gottlieb (1825): „Über öffentliche Prüfungen der Volksschulen“. In: Zerrenner, Carl (Hg): Jahrbuch für das Volksschulwesen: als Fortsetzung des neuesten deutschen Schulfreundes. 1. Jahrgang, Heft 2. Heinrichshofen: Magdeburg. S. 124-156.

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: