Margreid – „Lächerlich“ seien die Ergebnisse, sie „könnten nicht ernst genommen werden“. Mit diesen Worten reagierte die französische Presse auf das wohl prägendste Ereignis in der Geschichte der Weinverkostung. Am 24. Mai 1976 waren im Pariser Intercontinental Hotel bei den Weiß- wie auch bei den Rotweinen die Sieger dieses Frankreich-USA-Vergleichs jeweils kalifornische Produkte. Die scheinbar in Stein gemeißelte Wahrheit, dass Frankreich für alle Zeiten die besten Weine der Welt habe, schien ernsthaft in Frage gestellt. Hinter der Idee des amerikanisch-französischen Verkostungs-Vergleichs stand der Brite Spurrier. Anfangs wurde Steven Spurrier von der französischen Weinwirtschaft wegen dieses Fauxpas eine gewisse Zeit zu keiner Veranstaltung mehr eingeladen. Inzwischen berichten aber auch Medien der Grand Nation viticole neutral über diese Kost. Tatsache ist, dass der Höhenflug der kalifornischen Weine ab diesem Zeitpunkt so richtig begann. Und auch Frankreich, so wurde immer wieder betont, hat dieses Waterloo eigentlich gutgetan. Nach Jahren des Ausruhens auf den Lorbeeren mussten die Produzenten sich um eine signifikante Qualitätssteigerung bemühen. Doch wer hat sich eigentlich genauer die Umstände dieser so ereignisschweren Verkostung angesehen?
Mich fasziniert diese Geschichte, weil sie der prominente Beweis dafür ist, wie entmystifizierend Blindverkostungen sein können. Das zeigen auch Auswertungen von Datenmaterial, das Parallelen zu den Ergebnissen von Weinverkostungen herstellt, welche von mir in den letzten Jahren durchgeführt wurden. Wenn man am Ende eines Weinkostwettbewerbes die Jurymitglieder fragt, was sie vom Siegerwein halten, dann werden die wenigsten sich mit diesem vollends identifizieren. Diese Erfahrung habe ich fast immer nach den von mir organisierten Verkostungen gemacht. Anfänglich bin ich darüber sehr erschrocken und habe vorsichtshalber die Auswertung wiederholt, Fehler konnte ich zum Glück aber keine finden. Der Grund dieser Unzufriedenheit liegt aber woanders: Fragt man nämlich die Koster, welchen Wein sie favorisieren, dann bekommt man oft fast so viele Antworten, wie es Kommissionsmitglieder gibt.
Das zeigt, dass das Koster-Verhalten heute stark individualisiert ist. Das allgemein hohe technische Niveau der Weine lässt die Rolle der Charakteristik und der Stilistik stark hervortreten. Und die Bewertung dieser Parameter, besonders des letzteren, ist stark subjektiv geprägt. Nur ein Beispiel: Bei einer von mir organisierten Verkostung gab nur ein einziger Koster von 14 dem Siegerwein die Höchstnote. Alle anderen gaben ihm hingegen gute bis sehr gute Urteile – der Wein war Sieger nach Punkten. Ein gutes, aber nicht unbedingt exzellentes Abschneiden bei allen Kostern und kein Absturz in der Gunst ist die typische Voraussetzung für Siegerweine.
Auch die Erstplatzierten beim historischen USA-Frankreich-Vergleich hatten eine ähnliche Charakteristik. Unabhängig von diesen Beispielen an Zuordnungen kann man davon ausgehen, dass die Punktvergaben an sich nach bestem Wissen und Gewissen durchgeführt wurden. Doch wie erfahrene Koster und vor allem die Auswerter von Verkostungen wissen, können das beste Wissen und die gereiftesten Erfahrungen von einer schlechten Tagesform zunichte gemacht werden. Diese kann physiologische (zum Beispiel eine Erkältung) oder psychologische Gründe (Stress oder Zerstreutheit) haben. Um mit diesen Mängeln behaftete Kosturteile zu identifizieren und eventuell auszuscheiden, bietet sich eine Art der Koster-Prüfung an, welche die Abweichungen zwischen mehrfach gereichten gleichen Weinen und der Auspunktungsbereitschaft in Bezug setzt. Zur Interpretation der angeführten vier Koster-Ergebnisse eines Sortenbewerbs genügt es zu wissen, dass je höher der F-Wert ist, desto genauer wurden die Weine vom jeweiligen Prüfer bewertet.
In Fachkreisen wird immer wieder angenommen, dass geübte Koster nicht mehr als drei Punkte abweichen, wenn sie den gleichen Wein noch einmal präsentiert bekommen. Meine inzwischen mehrjährigen Erfahrungen sehen in einem konkreten Beispiel (siehe Grafik) anders aus: Koster A, welcher sicherlich keine gute Tagesform hatte — seine Ergebnisse wurden für die Gesamtauswertung auch nicht berücksichtigt — , bewertet die gleichen Weine mit bis zu zehn Punkten Unterschied, während er zwischen den verschiedenen Weinen weit weniger stark differenziert. Zudem nutzt er die Skala wenig aus. Die Koster B und C weisen mittlere F-Werte auf, und ihr Verhalten ist repräsentativ für viele erfahrene Koster: Ersterer nutzt die angebotene Skala gut aus, weicht fünf und mehr Punkte ab, wobei ihm auch ein sensorischer Ausrutscher von 15 Punkten unterlaufen ist. C reproduziert besser, unterscheidet aber auch weniger zwischen den verschiedenen Proben. Der beste Koster der Veranstaltung, D, unterscheidet gut und wiederholt gut. Aber auch er bewertet gleiche Weine mit neun Hundertstel Differenz. Was ich damit sagen will: Wenn (wirkliche oder angenommene) Weinexperten sich oft wegen zwei Punkten streiten oder einen Wein mit 90 Punkten als deutlich besser einstufen als einen mit 87, dann sollte man sich als Leser an die Abweichungen zwischen gleichen Proben erinnern. Das hilft deutlich der Entspannung.
In diesem Zusammenhang sei an ein Zitat von Roger Downey erinnert: „Ein Vergleich der Ränge von 18 Weinen von gut zu schlecht zeigt ungefähr so viel Konsistenz wie eine Kolonne von Zufallszahlen“. Tatsächlich unterscheiden sich auch Experten aus ähnlichen (Wein-) Kulturkreisen in ihren Präferenzen. Die allermeisten geben gerne auch recht verschiedene Urteile, wenn sie den gleichen Wein am selben Tag bekommen. Noch mehr Unterschiede gibt es, wenn sie ihn an verschiedenen Tagen bekommen. Die Kosturteile sagen mehr über die Koster als über die Weine aus. Setzt man die Kostkommission nur ein bisschen anders zusammen, wird man ziemlich andere Ergebnisse in Bezug auf die Reihenfolge haben. Das alles musste ich selbst zur Kenntnis nehmen; die in den bisherigen Folgen dieser Serie dargelegten Beispiele aus erster Hand sprechen eine klare Sprache.
Ist somit jedes Expertenurteil total umsonst und regiert der totale Zufall? Meiner Meinung nach nicht, die Ansprüche an die Ergebnisse müssen aber gehörig herabgestuft werden. Ich vergleiche inzwischen das Endergebnis — wesentlich entspannter als noch vor Jahren — mit einem Gruppenfoto. Wir lächeln alle in die Kamera, die Unterschiede unserer Attraktivität sind klein, wir unterscheiden uns nicht so stark wie im unbeobachteten täglichen Leben. Aber keine Aufnahme wird genauso so sein wie die vorige oder die nächste: Einmal hat jeder die Augen gerade geschlossen oder den Blick nach unten gerichtet. Der verantwortungsvolle Fotograf wird im Sinne der oben genannten Chancengleichheit darauf achten, dass die Kleineren unter uns nicht immer von den Größeren zugedeckt werden und dass nicht immer die Gleichen am undankbaren Rand stehen. Aber mehr Konstanz in die Bilderfolge wird auch er nicht bringen.
Und vielleicht ist es am Ende doch so, wie mir der altersbedingt ausgeschiedene Präsident einer Önologen-Vereinigung auf meine Thesen geantwortet hat: „Das ist ja alles ganz nett, was Sie da herausgefunden haben und wie Sie für mehr Gerechtigkeit sorgen wollen. Aber es interessiert nicht wirklich, wie seriös ein Wettbewerb abgelaufen ist. Wichtig ist, dass es einen Sieger gibt und in der Folge wieder über Wein gesprochen wird.“ Amen.
Der Autor: Armin Kobler ist Weinbauer in Margreid und leitete bis 2008 die Sektion Kellerwirtschaft im Versuchszentrum Laimburg.