Bibliografische Information der Deutschen Nationalbibliothek
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
All rights reserved including the right of reproduction in whole or in part in any form.
Alle Rechte vorbehalten inklusive des Rechtes auf Reproduktion im Ganzen oder in Teilen und in jeglicher Form.
Wiley, the Wiley logo, Für Dummies, the Dummies Man logo, and related trademarks and trade dress are trademarks or registered trademarks of John Wiley & Sons, Inc. and/or its affiliates, in the United States and other countries. Used by permission.
Wiley, die Bezeichnung »Für Dummies«, das Dummies-Mann-Logo und darauf bezogene Gestaltungen sind Marken oder eingetragene Marken von John Wiley & Sons, Inc., USA, Deutschland und in anderen Ländern.
Das vorliegende Werk wurde sorgfältig erarbeitet. Dennoch übernehmen Autoren und Verlag für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie eventuelle Druckfehler keine Haftung.
Christoph Maas hat Mathematik und Informatik studiert und in Mathematik das Diplom erworben, promoviert und sich habilitiert. Nach Stationen an der University of Kentucky und der Fachhochschule Darmstadt ist er jetzt schon seit etlichen Jahren Mathematikprofessor an der Hochschule für Angewandte Wissenschaften in Hamburg.
Danksagungen
Ohne die Ermutigung von Marcel Ferner, meinem Lektor bei VCH Wiley hätte ich ein solches Buch wohl gar nicht angefangen. Manchmal braucht man einfach im Leben zur richtigen Zeit einen Schubs. Boris Tolg ist es zu verdanken, dass das Buch jetzt deutlich weniger Fehler enthält als in der vorangegangenen Version. (Was jetzt noch übrig ist, geht natürlich auf mein Konto!) Schließlich hat mich auch noch Lutz Witte mit der Nase auf die Sache mit der Krebsfrüherkennung in Kapitel 10 gestoßen. Ihnen und Euch herzlichen Dank dafür!
Die Computerberechnungen sowie das Erstellen der meisten Abbildungen wurden mit dem Computeralgebrasystem MAPLE® durchgeführt. Ich danke der Firma Maplesoft Inc., die mir die entsprechende Lizenz zur Verfügung gestellt hat.
Einführung
»Sind Sie sicher?«
Nicht immer können Sie und ich diese Frage vorbehaltlos bejahen. Öfter, als mir lieb ist, befinde ich mich in einer Situation, in der Manches noch im Unklaren liegt. Und doch muss dann eine Entscheidung getroffen werden. – Ich denke, Sie wissen, wovon ich rede.
Also fange ich an zu vermuten: Dies könnte vielleicht so sein, jenes wird wahrscheinlich so weitergehen, und falls gleichzeitig noch das passiert, wäre es am besten, wenn ich …
Der Begriff Stochastik ist von dem altgriechischen Wort für »vermuten« abgeleitet. In der Mathematik dient er als Oberbegriff für die Fachgebiete Statistik und Wahrscheinlichkeitsrechnung
Die Statistik befasst sich mit der Auswertung von Beobachtungsdaten aus der realen Welt. Ob Sie Menschen interviewen, an einem technischen Versuchsaufbau Messungen vornehmen oder sich durch Krankenakten, Steuerlisten oder Fußballergebnisse wühlen – sobald Sie unter einer konkreten Fragestellung Daten sammeln, sind sie schon dabei, Statistik zu betreiben. Manche Schlussfolgerungen können Sie auch ohne großen Rechenaufwand erreichen. Aber die Wahrscheinlichkeitsrechnung hilft Ihnen dabei, die Verlässlichkeit Ihrer Ergebnisse zu beurteilen und zusätzliche Schlüsse zu ziehen.
Die Wahrscheinlichkeitsrechnung ist eine Erfindung von Theoretikern, um in der künstlichen Welt des Glücksspiels möglichst gut abzuschneiden. Durch zwei außerordentlich geschickte Erweiterungen der Theorie können die Überlegungen aber auch auf statistische Daten aus dem »richtigen Leben« angewendet werden und erlauben dort weitergehende Auswertungen.
Die Stochastik ist zudem nützlich, wenn es darum geht, unklare Situationen einzuschätzen. Sie verwendet mathematische Verfahren und kommt dann auch schon einmal zu Aussagen, die Ihrer Intuition widersprechen. Jetzt gilt es zu entscheiden: Gibt es ausreichend Anhaltspunkte dafür, dass hier tatsächlich ein überraschender Zusammenhang besteht, oder müssen Sie sich davor hüten, einem Trugschluss zum Opfer zu fallen? Mit dem bloßen Ausrechnen von Formeln ist es dann jedenfalls nicht getan. An verschiedenen Stellen dieses Buches werde ich auf diesen Punkt noch einmal zurückkommen.
Über dieses Buch – oder: »… für Dummies« verpflichtet!
Dieses Buch ermöglicht Ihnen auf leicht verständliche Weise den Einstieg in die Anfangsgründe der Statistik und der Wahrscheinlichkeitsrechnung.
Die Formeln und Rechenverfahren, die Sie dazu beherrschen müssen, werden so vorgestellt, dass Sie sie sofort einsetzen können. Gleichzeitig bekommen Sie aber auch stets die Anknüpfungspunkte für die dahinter stehende Theorie mitgeliefert.
Die Beispiele stammen aus unterschiedlichen Gebieten. So sehen Sie auch für Ihr Fach, wie die Gedankengänge dort eingesetzt werden können.
Das Buch will Sie nicht an allen Ecken und Enden spüren lassen, was Sie alles noch nicht wissen. Stattdessen möchte es Sie zu einer Entdeckungsreise in ein spannendes und buntes Teilgebiet der Mathematik einladen. Schließlich ist es ein »… für Dummies«-Buch. Das verpflichtet!
Wie man dieses Buch benutzt
Sie können mit diesem Buch alleine arbeiten. In einer kleinen Lerngruppe zu zweit oder zu dritt macht es aber vielleicht mehr Spaß, und Sie können sich gegenseitig inspirieren, wenn jemand von Ihnen gerade nicht weiter weiß.
In den Abschnitten finden Sie drei Zwischenüberschriften:
So geht's: Dies ist die Schritt-für Schritt-Anleitung, mit der Sie eine Aufgabenstellung abarbeiten können. Dazu gibt es auch immer ein durchgerechnetes Beispiel.
Das steckt dahinter: Hier steht die mathematische Begründung dafür, warum dieser Rechenweg gerade das liefert, wonach gefragt ist. Wenn dies momentan nicht Ihre größte Sorge ist, können Sie diese Passagen auch ruhig erst einmal überschlagen.
Darauf kommt's an: Nun folgen noch ein paar Tipps, die Ihnen dabei helfen, das Rechenverfahren souveräner einzusetzen.
Ich habe mir große Mühe gegeben, in den »So geht‘s«-Passagen möglichst wenige Vorkenntnisse vorauszusetzen. Da ich trotzdem auf irgendetwas aufbauen musste, wäre es wohl ganz gut, wenn Sie zumindest eine Formelsammlung in Reichweite hätten. Manche Dinge sind ja auch gar nicht unbedingt schwierig (ich denke da an die Bruchrechnung und an binomische Formeln und all so etwas), liegen aber einfach schon sooo lange zurück.
Die Beispiele können Sie zunächst einmal mit einem normalen Taschenrechner durchrechnen. Wenn Sie dem Thema treu bleiben, sollten Sie sich aber auch bald damit vertraut machen, wie Sie diese Berechnungen mit einem Computeralgebrasystem, einer Tabellenkalkulation oder mit entsprechender Statistik-Software durchführen.
Törichte Annahmen über die Leser
Am wahrscheinlichsten erscheint mir, dass Sie dieses Buch in die Hand nehmen, weil Sie im Laufe Ihres Studiums einen Kurs über Stochastik absolvieren. Vielleicht müssen Sie sich aber auch beruflich mit Stochastik beschäftigen, oder sind ganz einfach nur am Thema interessiert. Sie wollen dabei zunächst einmal grundlegende Aufgabenstellungen und Rechenweisen kennenlernen, ohne sich dabei mit komplizierter Mathematik beschäftigen zu müssen.
Zugleich sehen Sie aber, dass im Laufe der Zeit auch ein paar fortgeschrittene Themen für Sie auf dem Programm stehen werden. Und Sie ahnen möglicherweise, dass Sie sich irgendwann auch mit den mathematischen Gedanken, die hinter den Formeln stehen, zumindest ein klein wenig beschäftigten sollten, damit Sie die Rechenverfahren im Rahmen von Studienprojekten oder vielleicht auch der Abschlussarbeit hinreichend kompetent einsetzen können.
Wenn das – so in der groben Richtung – auf Sie zutrifft, haben Sie das richtige Buch in der Hand.
Wie dieses Buch aufgebaut ist
Das Buch ist nach bestimmten Oberthemen in vier Teile gegliedert, in denen der Stoff kapitelweise Schritt für Schritt besprochen wird.
Die Teile I bis III stellen das Grundwissen der Statistik und der der Wahrscheinlichkeitsrechnung dar. Sie bauen in weiten Teilen aufeinander auf. Im Top-Ten-Teil finden Sie Beispiele für weiterführende Themen. Mit jedem dieser Themen können Sie sich weitgehend unabhängig von den anderen beschäftigen.
Die Kapitel 1 bis 10 enden jeweils mit einer Aufgabe. Hier können Sie einen Punkt aus dem vorangegangenen Stoff noch einmal üben. Die zugehörigen Lösungen stehen in Anhang D.
Teil I: Beschreibende Statistik
Ich finde es immer wieder erstaunlich, wie viel sich über die Welt um uns herum schon mit einfachen Mitteln herausfinden lässt – ganz ohne geheimnisvolle Formeln und komplizierte Mathematik. Es kommt »nur« darauf an
Fragen richtig zu stellen,
ein paar einfache Kennzahlen, allen voran Häufigkeiten, Mittelwerte und Standardabweichungen zu berechnen und grafisch übersichtlich zu präsentieren,
und vor allem: eine ganze Bande naheliegender Trugschlüsse auf Abstand zu halten.
Etwas von meinem Erstaunen möchte ich Sie in diesem Teil spüren lassen. Blättern Sie ruhig ein wenig darin herum. Sie werden bald merken, was ich meine.
Teil II: Wahrscheinlichkeitsrechnung
Wahrscheinlichkeit ist ein recht künstlicher Begriff, der zunächst einmal nur in der Welt des Glücksspiels funktioniert. Deshalb werden Sie hier auch zunächst erfahren, wie in dieser Umgebung Wahrscheinlichkeiten ausgerechnet werden. Durch die Einführung der Begriffe Zufallsvariable und Verteilung lässt sich das Konzept dann aber so weiterentwickeln, dass es auch für Vorgänge im richtigen Leben nutzbar wird.
Sie werden einige häufig vorkommende Verteilungen kennenlernen. Die Kennzahlen dieser Verteilungen können Sie zur Not erst einmal auswendig lernen. Bei einigen von ihnen ist es nämlich ziemlich anspruchsvoll, nachzurechnen, warum es sich mit ihnen gerade so und nicht anders verhält. Wichtiger ist, dass Sie sich mit den Beschreibungen der Situationen vertraut machen, die typischerweise dafür verantwortlich sind, dass Sie es jetzt gerade mit dieser Verteilung zu tun haben.
Dieser Teil ist eher knapp gehalten. Je nachdem wie tiefgehend Sie sich mit dem Thema beschäftigen möchten, sollten Sie eventuell zusätzliche Quellen zu Rate ziehen.
Teil III: Beurteilende Statistik
Die Anwendung der Wahrscheinlichkeitsrechnung auf statistische Daten bringt Einsichten in die Verlässlichkeit der berechneten Kennzahlen. Sie können dadurch Fragen beantworten wie
Ich habe die Füllmenge von 1% unserer Tagesproduktion an Getränkepackungen nachgemessen. Wie genau kann ich daraus den Durchschnitt und die Schwankungsbreite der Füllmenge aller heute produzierten Packungen schätzen?
Im letzten Jahr lag der durchschnittliche Sturmschaden bei unseren Gebäudeversicherungen 15% höher als kalkuliert. Müssen wir die Kalkulation anpassen oder können wir dies noch als normale statistische Schwankung ansehen?
Die Rechenverfahren hierzu sind recht einfach durchzuführen und nutzen Werte aus Tabellen oder aus Funktionsaufrufen entsprechender Softwarepakete. Verblüffend werden Sie es wahrscheinlich finden, wie viele Versuche nötig sind, bis Häufigkeits-, Durchschnitts- oder Streuungswerte einigermaßen stabil werden.
Wenn Sie das nächste Mal beim »Mensch ärgere dich nicht« sechsmal hintereinander würfeln, ohne eine Sechs zu bekommen, werden Sie vielleicht auch weiterhin der Versuchung nicht widerstehen können, sich über den bösartigen Würfel zu beklagen – aber irgendwo tief drinnen werden Sie es dann besser wissen.
Teil IV: Der Top-Ten-Teil
Hier habe ich zehn Dinge aus dem (mehr oder minder) alltäglichen Leben herausgegriffen, die den Stoff des Buches ergänzen und die ich für jemanden, der sich mit Stochastik beschäftigt, für wissenswert halte.
Ihnen begegnen dort einige typisch menschliche Denkfehler, aber auch Situationen aus verschiedenen Fachgebieten, in denen stochastische Begriffe und Vorgehensweisen tiefere Einsichten in bestimmte Fragestellungen ermöglichen.
Die wesentliche Aussage jedes Abschnitts habe ich so formuliert, dass sie auch ohne Vorkenntnisse aus den anderen Teilen des Buchs verständlich ist. Wenn zur weitergehenden Erläuterung des Sachverhalts zusätzliche Informationen nötig sind, finden Sie Hinweise auf die entsprechenden Kapitel.
Falls Sie Lust haben, dort einfach einmal zu blättern und zu stöbern – nur zu!
Anhang
Hier habe ich Tabellen mit Werten von zwei Verteilungen, die beim Schätzen und Testen oft vorkommen, zusammengestellt, sowie eine Übersicht über Rechenregeln für den Erwartungswert und die Varianz von Zufallsvariablen, die ich an verschiedenen Stellen des Buches verwende.
Die Werte der Verteilungen können Sie heutzutage in vielen Softwarepaketen und auch bei manchen Taschenrechnern abrufen. Die Tabellen habe ich trotzdem aufgenommen – natürlich zum einen, weil ich nicht weiß, ob Ihnen diese Hilfsmittel gerade zur Verfügung stehen. Zum anderen bin ich aber auch überzeugt davon, dass es für Sie hilfreich ist, wenn Sie einmal einen Überblick darüber bekommen, wie sich die Werte in Abhängigkeit von ihren Parametern entwickeln. Das gibt Ihnen noch etwas mehr Verständnis für die Gesamtsituation als ein Taschenrechner, der Ihnen nur die einzelne Zahl liefert, nach der Sie ihn gerade konkret gefragt haben.
Der letzte Anhang enthält die Lösungen zu den Übungsaufgaben, die am Ende jedes Kapitels stehen.
Die Symbole in diesem Buch
Die Glühbirne zeigt Ihnen hilfreiche Tipps für den Umgang mit den Rechenverfahren an.
Wenn Sie etwas vermeiden sollten, sehen Sie dieses Symbol.
Gelegentlich konnte ich mir die eine oder andere Anekdote nicht verkneifen – kleine Erlebnisse oder Geschichten, die mir zu dem Thema gerade so in den Sinn kamen.
Wie es weitergeht
Natürlich finde ich es gut, wenn Sie das Buch von vorn bis hinten durcharbeiten. Wenn ich etwas für nicht wissenswert hielte, hätte ich es nicht hineingeschrieben. Aber ich kann mir auch gute Gründe vorstellen, sich (zunächst?) auf Teile des Buches zu konzentrieren.
Falls Sie das Buch parallel zu einem Kurs lesen, in dem die beschreibende Statistik keine Rolle spielt, sollten Sie sich in Teil I zumindest mit den Begriffen arithmetisches Mittel, Varianz und Standardabweichung vertraut machen. Sie sind in Kapitel 3 zu finden.
In Teil II sind die zentralen Begriffe Wahrscheinlichkeit, Zufallsvariable und Verteilung beschrieben. Die Rechenwege mit Variationen und Kombinationen in Kapitel 5 können Sie auch erst einmal überschlagen, falls Sie nicht ausdrücklich Aufgaben dieser Art lösen müssen. Mit den typischen Eigenschaften der einzelnen Verteilungen, die ich in diesem Teil vorstelle, sollten Sie sich aber auf jeden Fall beschäftigen. Sie tauchen an allen Ecken und Enden auf – allen voran die Normalverteilung.
Egal, wie Ihr Stochastik-Kurs im Einzelnen aufgebaut ist, die Themen aus Teil III werden mit Sicherheit darin vorkommen. So brauche ich hier keine Werbung für die Wichtigkeit einzelner Punkte zu betreiben. Möglicherweise beschleicht Sie an manchen Stellen aber das Gefühl, dass die Formeln überhand nehmen und der Zusammenhang nicht recht erkennbar wird. Mein Tipp: Versuchen Sie einmal jemandem, der keine Ahnung von Statistik hat, zu erklären, was Sinn und Zweck eines Konfidenzintervalls ist. Wenn Ihnen das gelingt, haben Sie garantiert alles verstanden, worauf es ankommt. Und wenn Sie beim Erklären ins Stolpern kommen sollten, haben Sie dadurch eine prima Frage gefunden, mit der Sie nochmal an den Text herangehen können.
Viel Erfolg!
Teil I
Beschreibende Statistik
IN DIESEM TEIL …
Statistik betreiben Sie, um aus Daten Schlussfolgerungen zu ziehen. Einige vorbereitende Überlegungen helfen Ihnen dabei, zu aussagefähigen Daten zu kommen. Anschließend stelle ich Ihnen gängige Techniken zur Auswertung von Daten vor.
Schon durch einige einfache Verfahren zur grafischen Darstellung gewinnen Sie einen Überblick über den Informationsgehalt Ihrer Daten.
Der Durchschnitt fasst Ihre Daten in einer einzigen Angabe zusammen. Allerdings müssen Sie sich je nach Zusammenhang etwas Unterschiedliches unter diesem Begriff vorstellen.
Auch nach Verbindungen zwischen zwei Eigenschaften können Sie schon mit einfachen Berechnungen suchen.
Allerdings besteht bei allen diesen Methoden die Gefahr von Fehldeutungen und Trugschlüssen. Auch darüber wird in den Kapiteln dieses Teils zu reden sein.