Bibliografische Information der Deutschen Nationalbibliothek
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d‐nb.de abrufbar.
1. Auflage 2014
© 2014 WILEY‐VCH Verlag GmbH & Co. KGaA, Weinheim
All rights reserved including the right of reproduction in whole or in part in any form.
Alle Rechte vorbehalten inklusive des Rechtes auf Reproduktion im Ganzen oder in Teilen und in jeglicher Form.
Wiley, the Wiley logo, Für Dummies, the Dummies Man logo, and related trademarks and trade dress are trademarks or registered trademarks of John Wiley & Sons, Inc. and/or its affiliates, in the United States and other countries. Used by permission.
Wiley, die Bezeichnung »Für Dummies«, das Dummies‐Mann‐Logo und darauf bezogene Gestaltungen sind Marken oder eingetragene Marken von John Wiley & Sons, Inc., USA, Deutschland und in anderen Ländern.
Das vorliegende Werk wurde sorgfältig erarbeitet. Dennoch übernehmen Autoren und Verlag für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie eventuelle Druckfehler keine Haftung.
Coverfoto: © Fotolia. de/erspek
Korrektur: Petra Heubach-Erdmann und Jürgen Erdmann, Düsseldorf
E‐Book: Beltz Bad Langensalza GmbH, Bad Langensalza
Print ISBN: 978-3-527-71014-0
ePub ISBN: 978-3-527-69057-2
mobi ISBN: 978-3-527-69058-9
Ich möchte mich ausdrücklich bei meinem Kollegen Peter Plappert bedanken! Viele Ideen der didaktischen Aufbereitung des Themas stammen von ihm.
Außerdem danke ich meinem Kollegen Joachim Gaukel sehr herzlich fürs aufwendige Nachrechnen, Nachvollziehen und Korrekturlesen!
Timm Sigg studierte an der Universität Stuttgart Mathematik und Physik und promovierte anschließend in theoretischer Physik. Erfahrung in angewandter Statistik konnte er in seiner Tätigkeit als Statistiker und Risikomanager bei der EnBW Vertriebsgesellschaft mbH sammeln. Seit 2004 ist er Professor für Mathematik an der Hochschule Esslingen, wo er begeistert Kurs‐ und Statistikvorlesungen hält. Darüber hinaus hat er einige Arbeiten zu den Themen stochastische Physik und zur Quantenkosmologie veröffentlicht. Sein Buch Grundlagen der Differenzialgleichungen für Dummies ist seit Oktober 2010 auf dem Markt.
Prof. Dr. Christoph Maas lehrt Mathematik in Ingenieurstudiengängen an der Hochschule für Angewandte Wissenschaften Hamburg und ist Autor von Stochastik für Dummies. Prof. Dr. Joachim Gaukel lehrt an der Hochschule Esslingen seit 2009 die Fächer Mathematik, Statistik und Numerik.
Was fällt Ihnen zu dem Begriff Statistik ein?
Ist es
oder ist es etwas ganz anderes? Die Statistik taucht an so vielen verschiedenen Stellen im Leben und in so vielfältiger Form auf, dass man diese Liste fast beliebig fortsetzen könnte. Welcher Aspekt davon auch immer für Sie von Bedeutung sein mag, die Statistik‐Formeln für Dummies sollen Sie dabei in doppelter Hinsicht unterstützen.
Zum einen ist das Buch so angelegt, dass Sie alle zentralen statistischen Begriffe leicht nachschlagen können und auch griffige Kurzerklärungen dazu finden.
Zum anderen sind alle wichtigen statistischen Formeln ausführlich erklärt und mit Beispielen versehen. Sie werden feststellen, dass Sie die Formeln viel leichter verinnerlichen, wenn Sie sie an einem Beispiel nachrechnen.
Dieses Buch ist als Nachschlagewerk konzipiert. Wann immer Ihnen also ein Begriff, eine Fragestellung oder eine spezielle Übungsaufgabe aus der Statistik begegnet, können Sie hier nachschlagen. Die Statistik‐Formeln für Dummies bieten Ihnen darüber hinaus zu jedem Begriff, jeder Formel und jedem mathematischen Zusammenhang Erläuterungen und Beispiele. Darin unterscheidet sich das Buch von einer reinen Formelsammlung oder einem Lexikon.
Formeln und Begriffsdefinitionen findet man im Internet heutzutage in Hülle und Fülle. Mir war es aber wichtig, die Formeln und Begriffe mit Leben zu füllen, sie verständlich zu erläutern und mit Beispielen zu versehen. Dieses Buch soll also neben seinem Charakter als Nachschlagewerk durchaus auch zur Lektüre anregen.
Alle statistischen und sonstigen mathematischen Begriffe und Symbole werden an Ort und Stelle erklärt. Typischerweise sind sie kursiv gesetzt, wenn sie eine zentrale Bedeutung haben. Sie finden diese auch im Index am Ende des Buches.
Dezimalzahlen schreibe ich mit einem Punkt und nicht mit Komma, also beispielsweise .
Alle Abschnitte sind in diesem Buch in sich abgeschlossen und somit für sich alleine genommen verständlich. Daher schlage ich vor, Sie lesen stets genau das, was für Sie aktuell von Bedeutung ist.
Abgesehen davon gibt es viele Querverweise innerhalb des Buches, die insgesamt zu einem besseren Verständnis beitragen. Und schließlich habe ich das Buch so geschrieben, dass man es auch komplett von vorne bis hinten durchlesen kann, ohne ständig das Gefühl zu haben, mit etwas völlig Neuem konfrontiert zu werden, wie beispielsweise bei einem Lexikon oder einer reinen Formelsammlung.
Zugegeben, ich kenne Sie nicht. Aber dennoch habe ich eine vage Vorstellung von Ihnen. Ich stelle Sie mir so vor:
Aus welcher Motivation heraus Sie sich auch immer mit Statistik beschäftigen, um die Formeln zu verstehen und nachvollziehen zu können, benötigen Sie etwas Mathematik, allerdings keine allzu anspruchsvolle. Dazu gehören zunächst Funktionen und Summen. Vermutlich sind Ihnen diese schon an den unterschiedlichsten Stellen im Leben begegnet. Und zu weiten Teilen kommt das Buch auch ohne Ableitungen und Integrale aus; sie lassen sich aber nicht ganz vermeiden, insbesondere wenn es um die Begriffe Dichtefunktion und Verteilungsfunktion geht. Hier ist nämlich die eine Funktion die Ableitung der anderen. Wenn Sie sich im Ableiten und Integrieren noch unsicher fühlen, es aber unbedingt können wollen, so kann ich Ihnen das Buch Analysis für Dummies ans Herz legen.
Dieses Buch besteht aus vier Teilen und einem Anhang. Die ersten drei Teile behandeln die beschreibende Statistik, die Wahrscheinlichkeitsrechnung und zu guter Letzt die schließende Statistik. Der vierte Teil des Buches ist der Top‐Ten‐Teil. Danach folgt noch der Anhang mit vier Tabellen. Und jetzt das Ganze nochmals etwas ausführlicher:
Dieser Teil widmet sich der Datenerhebung, der Klassifizierung von Merkmalen und den Darstellungsmöglichkeiten von größeren Datenmengen, vor allem aber den Formeln der beschreibenden Statistik (man sagt auch deskriptive Statistik).
Wenn Sie also wissen wollen, wie man das Durchschnittsalter einer Fußballmannschaft berechnet, wie groß die Streuung des Gewichts Ihrer Schokoladentafelsammlung ist, was es bedeutet, wenn das Gewicht Ihres Kindes auf dem 3%‐Perzentil liegt, oder ob die Größe eines Menschen mit der Zahl seiner Sommersprossen korreliert, dann sind Sie hier richtig.
Streng genommen müsste man die Wahrscheinlichkeitsrechnung nicht zur Statistik zählen, sie ist aber einerseits eng mit ihr verbunden und wird andererseits vor allem für die schließende Statistik (Teil III) benötigt. Daher sind die Formeln zur Wahrscheinlichkeitsrechnung unumgänglich, wenn man Statistik betreiben möchte.
Mit diesen Formeln sind Sie in der Lage, auszurechnen, wie groß die Wahrscheinlichkeit ist, einen Sechserpasch zu würfeln, Sie erfahren, was man unter bedingter Wahrscheinlichkeit versteht, was unter unabhängigen Ereignissen, wofür man eine Zufallsvariable braucht, welche Verteilungsfunktionen es gibt und was das überhaupt ist.
Die sogenannte schließende Statistik (man sagt auch induktive Statistik) ist die Krönung der Statistik. Die Formeln werden etwas länger, die Verfahren aufwendiger und die Interpretationen umfassender. Sie lernen hier unter anderem statistische Tests und Konfidenzintervalle kennen.
Mit den Formeln der schließenden Statistik lassen sich richtig tolle Sachen machen. Ist ein Würfel, den Sie 30‐mal werfen und der kein einziges Mal eine 6 zeigt, gezinkt? Ja oder nein? Und wenn Ja, mit welcher Wahrscheinlichkeit stimmt dieses Ja?
Der Dummies‐Buch‐typische Top‐Ten‐Teil schließt das Buch ab. Er enthält zehn typische Fehlerquellen, in die man in der Statistik und der Wahrscheinlichkeitstheorie gerne tappt.
Im Anhang finden Sie vier Tabellen A.1 bis A.4, um die Werte, die Sie für einige statistische Methoden benötigen, nachzuschlagen.
Die folgenden Symbole werden Sie durch das ganze Buch begleiten:
Ich sehe nun zwei Möglichkeiten, wie es weitergehen kann:
In allen Fällen wünsche ich Ihnen viel Spaß mit dem Buch!
Teil I
In diesem Teil …
geht es um die beschreibende Statistik. Sie steht nicht nur in diesem Buch ganz vorne. Sie steht auch immer zeitlich am Anfang, wenn Sie Statistik betreiben. Und darum habe ich diesen Teil auch so aufgebaut, wie man in der Realität typischerweise vorgeht: Er beginnt mit der Datengewinnung. Und selbst wenn Sie nicht für die Erhebung an sich zuständig sind, ist es von Vorteil, wenn Sie sich hier etwas auskennen; insbesondere wenn es darum geht, welche Möglichkeiten Sie haben, die Daten einzuteilen. Weiter geht es mit den zahlreichen Möglichkeiten der grafischen Darstellung dieser Daten. Und schließlich lernen Sie die wesentlichen Formeln der beschreibenden Statistik kennen.
Kapitel 1
In diesem Kapitel
Das Arbeitsgebiet der beschreibenden Statistik lässt sich so zusammenfassen:Mit der beschreibenden Statistik lassen sich Daten übersichtlich darstellen. Dazu werden nicht nur Tabellen oder grafische Methoden verwendet, sondern darüber hinaus Kennzahlen definiert und berechnet, die dieser Übersichtlichkeit dienen.
Das Wichtigste gleich vorweg: Eine statistische Auswertung ist nur sinnvoll, wenn genügend Daten vorliegen und wenn Sie den Daten trauen können. Taugen die Daten nichts oder sind es (viel) zu wenige, so ist jede weitere Rechnung für die Mülltonne. So toll Ihr Statistikprogramm auch sein mag, es kann von sich aus nicht beurteilen, ob die Daten etwas taugen.
Als Mathematiker wird man häufig gefragt, ob man bei dieser oder jener statistischen Auswertung nicht helfen könne. Ich mache das immer gerne und habe dabei festgestellt, dass es meistens nicht die statistischen Verfahren sind, die Probleme machen, sondern die Daten und dabei vor allem die folgenden Tücken:
Grundsätzlich lassen sich Merkmale in quantitative und qualitative Merkmale aufteilen. Die quantitativen Merkmale haben in der Statistik die bei Weitem größere Bedeutung.
Die Ausprägungen quantitativer Merkmale sind Zahlen aus Messungen oder aus Zählungen. Man unterscheidet dabei
Diese Unterscheidung zwischen stetig und diskret zieht sich wie ein roter Faden durch die Statistik und somit auch durch dieses Buch.
Qualitative Merkmale sind beschreibende Eigenschaften.
Man unterscheidet
Zum Abschluss des Kapitels noch zu jeder Kategorie ein Beispiel:
Das ist nicht so schwierig, nicht wahr? Dann kommt jetzt was fürs Auge, und zwar die verschiedenen Darstellungsmöglichkeiten dieser Merkmale.