Stochastik kompakt für Dummies

Schummelseite

Über den Autor

Christoph Maas hat Mathematik und Informatik studiert und in Mathematik das Diplom erworben, promoviert und sich habilitiert. Nach Stationen an der University of Kentucky und der Fachhochschule Darmstadt ist er jetzt schon seit etlichen Jahren Mathematikprofessor an der Hochschule für Angewandte Wissenschaften in Hamburg.

Danksagungen

Ohne die Ermutigung von Marcel Ferner, meinem Lektor bei VCH Wiley hätte ich ein solches Buch wohl gar nicht angefangen. Manchmal braucht man einfach im Leben zur richtigen Zeit einen Schubs. Boris Tolg ist es zu verdanken, dass das Buch jetzt deutlich weniger Fehler enthält als in der vorangegangenen Version. (Was jetzt noch übrig ist, geht natürlich auf mein Konto!) Schließlich hat mich auch noch Lutz Witte mit der Nase auf die Sache mit der Krebsfrüherkennung in Kapitel 10 gestoßen. Ihnen und Euch herzlichen Dank dafür!

Die Computerberechnungen sowie das Erstellen der meisten Abbildungen wurden mit dem Computeralgebrasystem MAPLE® durchgeführt. Ich danke der Firma Maplesoft Inc., die mir die entsprechende Lizenz zur Verfügung gestellt hat.

Einführung

»Sind Sie sicher?«

Nicht immer können Sie und ich diese Frage vorbehaltlos bejahen. Öfter, als mir lieb ist, befinde ich mich in einer Situation, in der Manches noch im Unklaren liegt. Und doch muss dann eine Entscheidung getroffen werden. – Ich denke, Sie wissen, wovon ich rede.

Also fange ich an zu vermuten: Dies könnte vielleicht so sein, jenes wird wahrscheinlich so weitergehen, und falls gleichzeitig noch das passiert, wäre es am besten, wenn ich …

Der Begriff Stochastik ist von dem altgriechischen Wort für »vermuten« abgeleitet. In der Mathematik dient er als Oberbegriff für die Fachgebiete Statistik und Wahrscheinlichkeitsrechnung

Die Stochastik ist zudem nützlich, wenn es darum geht, unklare Situationen einzuschätzen. Sie verwendet mathematische Verfahren und kommt dann auch schon einmal zu Aussagen, die Ihrer Intuition widersprechen. Jetzt gilt es zu entscheiden: Gibt es ausreichend Anhaltspunkte dafür, dass hier tatsächlich ein überraschender Zusammenhang besteht, oder müssen Sie sich davor hüten, einem Trugschluss zum Opfer zu fallen? Mit dem bloßen Ausrechnen von Formeln ist es dann jedenfalls nicht getan. An verschiedenen Stellen dieses Buches werde ich auf diesen Punkt noch einmal zurückkommen.

Über dieses Buch – oder: »… für Dummies« verpflichtet!

Dieses Buch ermöglicht Ihnen auf leicht verständliche Weise den Einstieg in die Anfangsgründe der Statistik und der Wahrscheinlichkeitsrechnung.

Die Formeln und Rechenverfahren, die Sie dazu beherrschen müssen, werden so vorgestellt, dass Sie sie sofort einsetzen können. Gleichzeitig bekommen Sie aber auch stets die Anknüpfungspunkte für die dahinter stehende Theorie mitgeliefert.

Die Beispiele stammen aus unterschiedlichen Gebieten. So sehen Sie auch für Ihr Fach, wie die Gedankengänge dort eingesetzt werden können.

Das Buch will Sie nicht an allen Ecken und Enden spüren lassen, was Sie alles noch nicht wissen. Stattdessen möchte es Sie zu einer Entdeckungsreise in ein spannendes und buntes Teilgebiet der Mathematik einladen. Schließlich ist es ein »… für Dummies«-Buch. Das verpflichtet!

Wie man dieses Buch benutzt

Sie können mit diesem Buch alleine arbeiten. In einer kleinen Lerngruppe zu zweit oder zu dritt macht es aber vielleicht mehr Spaß, und Sie können sich gegenseitig inspirieren, wenn jemand von Ihnen gerade nicht weiter weiß.

In den Abschnitten finden Sie drei Zwischenüberschriften:

Ich habe mir große Mühe gegeben, in den »So geht‘s«-Passagen möglichst wenige Vorkenntnisse vorauszusetzen. Da ich trotzdem auf irgendetwas aufbauen musste, wäre es wohl ganz gut, wenn Sie zumindest eine Formelsammlung in Reichweite hätten. Manche Dinge sind ja auch gar nicht unbedingt schwierig (ich denke da an die Bruchrechnung und an binomische Formeln und all so etwas), liegen aber einfach schon sooo lange zurück.

Die Beispiele können Sie zunächst einmal mit einem normalen Taschenrechner durchrechnen. Wenn Sie dem Thema treu bleiben, sollten Sie sich aber auch bald damit vertraut machen, wie Sie diese Berechnungen mit einem Computeralgebrasystem, einer Tabellenkalkulation oder mit entsprechender Statistik-Software durchführen.

Törichte Annahmen über die Leser

Am wahrscheinlichsten erscheint mir, dass Sie dieses Buch in die Hand nehmen, weil Sie im Laufe Ihres Studiums einen Kurs über Stochastik absolvieren. Vielleicht müssen Sie sich aber auch beruflich mit Stochastik beschäftigen, oder sind ganz einfach nur am Thema interessiert. Sie wollen dabei zunächst einmal grundlegende Aufgabenstellungen und Rechenweisen kennenlernen, ohne sich dabei mit komplizierter Mathematik beschäftigen zu müssen.

Zugleich sehen Sie aber, dass im Laufe der Zeit auch ein paar fortgeschrittene Themen für Sie auf dem Programm stehen werden. Und Sie ahnen möglicherweise, dass Sie sich irgendwann auch mit den mathematischen Gedanken, die hinter den Formeln stehen, zumindest ein klein wenig beschäftigten sollten, damit Sie die Rechenverfahren im Rahmen von Studienprojekten oder vielleicht auch der Abschlussarbeit hinreichend kompetent einsetzen können.

Wenn das – so in der groben Richtung – auf Sie zutrifft, haben Sie das richtige Buch in der Hand.

Wie dieses Buch aufgebaut ist

Das Buch ist nach bestimmten Oberthemen in vier Teile gegliedert, in denen der Stoff kapitelweise Schritt für Schritt besprochen wird.

Die Teile I bis III stellen das Grundwissen der Statistik und der der Wahrscheinlichkeitsrechnung dar. Sie bauen in weiten Teilen aufeinander auf. Im Top-Ten-Teil finden Sie Beispiele für weiterführende Themen. Mit jedem dieser Themen können Sie sich weitgehend unabhängig von den anderen beschäftigen.

Die Kapitel 1 bis 10 enden jeweils mit einer Aufgabe. Hier können Sie einen Punkt aus dem vorangegangenen Stoff noch einmal üben. Die zugehörigen Lösungen stehen in Anhang D.

Teil I: Beschreibende Statistik

Ich finde es immer wieder erstaunlich, wie viel sich über die Welt um uns herum schon mit einfachen Mitteln herausfinden lässt – ganz ohne geheimnisvolle Formeln und komplizierte Mathematik. Es kommt »nur« darauf an

  • Fragen richtig zu stellen,
  • ein paar einfache Kennzahlen, allen voran Häufigkeiten, Mittelwerte und Standardabweichungen zu berechnen und grafisch übersichtlich zu präsentieren,
  • und vor allem: eine ganze Bande naheliegender Trugschlüsse auf Abstand zu halten.

Etwas von meinem Erstaunen möchte ich Sie in diesem Teil spüren lassen. Blättern Sie ruhig ein wenig darin herum. Sie werden bald merken, was ich meine.

Teil II: Wahrscheinlichkeitsrechnung

Wahrscheinlichkeit ist ein recht künstlicher Begriff, der zunächst einmal nur in der Welt des Glücksspiels funktioniert. Deshalb werden Sie hier auch zunächst erfahren, wie in dieser Umgebung Wahrscheinlichkeiten ausgerechnet werden. Durch die Einführung der Begriffe Zufallsvariable und Verteilung lässt sich das Konzept dann aber so weiterentwickeln, dass es auch für Vorgänge im richtigen Leben nutzbar wird.

Sie werden einige häufig vorkommende Verteilungen kennenlernen. Die Kennzahlen dieser Verteilungen können Sie zur Not erst einmal auswendig lernen. Bei einigen von ihnen ist es nämlich ziemlich anspruchsvoll, nachzurechnen, warum es sich mit ihnen gerade so und nicht anders verhält. Wichtiger ist, dass Sie sich mit den Beschreibungen der Situationen vertraut machen, die typischerweise dafür verantwortlich sind, dass Sie es jetzt gerade mit dieser Verteilung zu tun haben.

Dieser Teil ist eher knapp gehalten. Je nachdem wie tiefgehend Sie sich mit dem Thema beschäftigen möchten, sollten Sie eventuell zusätzliche Quellen zu Rate ziehen.

Teil III: Beurteilende Statistik

Die Anwendung der Wahrscheinlichkeitsrechnung auf statistische Daten bringt Einsichten in die Verlässlichkeit der berechneten Kennzahlen. Sie können dadurch Fragen beantworten wie

  • Ich habe die Füllmenge von 1% unserer Tagesproduktion an Getränkepackungen nachgemessen. Wie genau kann ich daraus den Durchschnitt und die Schwankungsbreite der Füllmenge aller heute produzierten Packungen schätzen?
  • Im letzten Jahr lag der durchschnittliche Sturmschaden bei unseren Gebäudeversicherungen 15% höher als kalkuliert. Müssen wir die Kalkulation anpassen oder können wir dies noch als normale statistische Schwankung ansehen?

Die Rechenverfahren hierzu sind recht einfach durchzuführen und nutzen Werte aus Tabellen oder aus Funktionsaufrufen entsprechender Softwarepakete. Verblüffend werden Sie es wahrscheinlich finden, wie viele Versuche nötig sind, bis Häufigkeits-, Durchschnitts- oder Streuungswerte einigermaßen stabil werden.

Wenn Sie das nächste Mal beim »Mensch ärgere dich nicht« sechsmal hintereinander würfeln, ohne eine Sechs zu bekommen, werden Sie vielleicht auch weiterhin der Versuchung nicht widerstehen können, sich über den bösartigen Würfel zu beklagen – aber irgendwo tief drinnen werden Sie es dann besser wissen.

Teil IV: Der Top-Ten-Teil

Hier habe ich zehn Dinge aus dem (mehr oder minder) alltäglichen Leben herausgegriffen, die den Stoff des Buches ergänzen und die ich für jemanden, der sich mit Stochastik beschäftigt, für wissenswert halte.

Ihnen begegnen dort einige typisch menschliche Denkfehler, aber auch Situationen aus verschiedenen Fachgebieten, in denen stochastische Begriffe und Vorgehensweisen tiefere Einsichten in bestimmte Fragestellungen ermöglichen.

Die wesentliche Aussage jedes Abschnitts habe ich so formuliert, dass sie auch ohne Vorkenntnisse aus den anderen Teilen des Buchs verständlich ist. Wenn zur weitergehenden Erläuterung des Sachverhalts zusätzliche Informationen nötig sind, finden Sie Hinweise auf die entsprechenden Kapitel.

Falls Sie Lust haben, dort einfach einmal zu blättern und zu stöbern – nur zu!

Anhang

Hier habe ich Tabellen mit Werten von zwei Verteilungen, die beim Schätzen und Testen oft vorkommen, zusammengestellt, sowie eine Übersicht über Rechenregeln für den Erwartungswert und die Varianz von Zufallsvariablen, die ich an verschiedenen Stellen des Buches verwende.

Die Werte der Verteilungen können Sie heutzutage in vielen Softwarepaketen und auch bei manchen Taschenrechnern abrufen. Die Tabellen habe ich trotzdem aufgenommen – natürlich zum einen, weil ich nicht weiß, ob Ihnen diese Hilfsmittel gerade zur Verfügung stehen. Zum anderen bin ich aber auch überzeugt davon, dass es für Sie hilfreich ist, wenn Sie einmal einen Überblick darüber bekommen, wie sich die Werte in Abhängigkeit von ihren Parametern entwickeln. Das gibt Ihnen noch etwas mehr Verständnis für die Gesamtsituation als ein Taschenrechner, der Ihnen nur die einzelne Zahl liefert, nach der Sie ihn gerade konkret gefragt haben.

Der letzte Anhang enthält die Lösungen zu den Übungsaufgaben, die am Ende jedes Kapitels stehen.

Die Symbole in diesem Buch

Die Glühbirne zeigt Ihnen hilfreiche Tipps für den Umgang mit den Rechenverfahren an.

Wenn Sie etwas vermeiden sollten, sehen Sie dieses Symbol.

Gelegentlich konnte ich mir die eine oder andere Anekdote nicht verkneifen – kleine Erlebnisse oder Geschichten, die mir zu dem Thema gerade so in den Sinn kamen.

Wie es weitergeht

Natürlich finde ich es gut, wenn Sie das Buch von vorn bis hinten durcharbeiten. Wenn ich etwas für nicht wissenswert hielte, hätte ich es nicht hineingeschrieben. Aber ich kann mir auch gute Gründe vorstellen, sich (zunächst?) auf Teile des Buches zu konzentrieren.

Falls Sie das Buch parallel zu einem Kurs lesen, in dem die beschreibende Statistik keine Rolle spielt, sollten Sie sich in Teil I zumindest mit den Begriffen arithmetisches Mittel, Varianz und Standardabweichung vertraut machen. Sie sind in Kapitel 3 zu finden.

In Teil II sind die zentralen Begriffe Wahrscheinlichkeit, Zufallsvariable und Verteilung beschrieben. Die Rechenwege mit Variationen und Kombinationen in Kapitel 5 können Sie auch erst einmal überschlagen, falls Sie nicht ausdrücklich Aufgaben dieser Art lösen müssen. Mit den typischen Eigenschaften der einzelnen Verteilungen, die ich in diesem Teil vorstelle, sollten Sie sich aber auf jeden Fall beschäftigen. Sie tauchen an allen Ecken und Enden auf – allen voran die Normalverteilung.

Egal, wie Ihr Stochastik-Kurs im Einzelnen aufgebaut ist, die Themen aus Teil III werden mit Sicherheit darin vorkommen. So brauche ich hier keine Werbung für die Wichtigkeit einzelner Punkte zu betreiben. Möglicherweise beschleicht Sie an manchen Stellen aber das Gefühl, dass die Formeln überhand nehmen und der Zusammenhang nicht recht erkennbar wird. Mein Tipp: Versuchen Sie einmal jemandem, der keine Ahnung von Statistik hat, zu erklären, was Sinn und Zweck eines Konfidenzintervalls ist. Wenn Ihnen das gelingt, haben Sie garantiert alles verstanden, worauf es ankommt. Und wenn Sie beim Erklären ins Stolpern kommen sollten, haben Sie dadurch eine prima Frage gefunden, mit der Sie nochmal an den Text herangehen können.

Viel Erfolg!

Teil I

Beschreibende Statistik