Gestern abend war ich auf einem Vortrag, den ich nur mäßig interessant fand: es ging um die Regressionsanalyse, d.h. um die (statistische) Errechnung von Kurvenverläufen und den darauf folgenden Vorhersagen.
Neben der Rauschreduktion ist dabei vor allem auch die Fragestellung wichtig, für was eine solche Analyse benötigt wird. Um ein Beispiel zu geben: trotz der Klimaerwärmung schwankt das Wetter zum Teil sehr stark. Um die Klimaerwärmung zeigen zu können, müssen die Wetterschwankungen als Rauschen herausgerechnet werden. Trotzdem gab es in den letzten zehn Jahren eine Stagnation (zum Glück!), die von den neuesten Daten allerdings aufgehoben wird. Trotzdem macht es Sinn, die Wetterdaten nicht nur langfristig zu betrachten, sondern auch in kleineren Abschnitten, um Thesen aufstellen zu können, warum die Klimaerwärmung der letzten zehn Jahre schwächer war.
Auf die Frage hin, nach welchen Regeln man eine günstige Berechnung durchführen kann (denn es gibt sehr viele Arten, Daten zusammenzufassen), wusste der Vortragende keine wirkliche Antwort. Bzw. war sie unbefriedigend. Ich denke, man muss hier in zwei Schritten vorgehen. Zuerst gebraucht man all die Regressionsanalysen, deren Ergebnis eine Aussage zulässt. Dann vergleicht man die Aussagen entlang ihrer semantischen Homogenität. Das heißt, man führt ein zweites statistisches Kriterium für die Ergebnisse ein, welches die Häufigkeit ähnlicher Aussagen als "Qualitätskriterium" verwendet.
Keine Kommentare :
Kommentar veröffentlichen