Einführung

Die Statistik und statistische Formeln spielen in nahezu allen privaten und beruflichen Lebensbereichen, aber auch in nahezu sämtlichen Wissenschaften, wie beispielsweise in den Naturwissenschaften aber ebenso in den Wirtschafts‐ und Sozialwissenschaften eine Rolle.

Auch wenn Sie sich dieses Buch zugelegt haben, um Ihren Statistikschein an der Uni zu erwerben, eine Prüfung in der Berufsausbildung oder in der Schule zu bestehen oder einfach nur um ein gutes Verständnis für die Grundlagen der Statistik zu gewinnen, werden Sie sicher auch in ganz anderen Situationen davon profitieren.

Über dieses Buch

Statistik kompakt für Dummies richtet sich an all diejenigen, die sich für Statistik interessieren oder interessieren müssen und dafür eine kompakte, immer griffbereite und dennoch anschauliche Einführung in die wichtigsten und grundlegendsten Begriffe und Methoden der Statistik benötigen.

Das thematische Grundgerüst von Statistik kompakt für Dummies entstammt dabei dem Buch Statistik für Wirtschafts‐ und Sozialwissenschaftler für Dummies. Ganz wie Sie es von einem Kompaktband erwarten würden, wurde die Darstellung der Themen jedoch so überarbeitet, dass Sie eine komprimiertere, direktere und präzisere aber dennoch prägnante Einführung in die Themen bietet, die sich an alle Interessierten der Statistik richtet. Trotz der Verschlankung ist es dabei gelungen zusätzliche Beispiele und Erklärungen hinzuzufügen, um das Verständnis der statistischen Sachverhalte zu wecken. Auch in Statistik kompakt für Dummies bleibt damit der Anspruch bestehen, dem Leser eine verständliche, verdauliche und somit nützliche Einführung in die wichtigsten Themen der Statistik zu bieten. Dabei werden Sie auch bei abstrakteren und schwierigeren Konzepten und Methoden der Statistik nicht im Regen stehengelassen. Stattdessen erhalten Sie mit Hilfe von Abbildungen und motivierenden Beispielen Einblicke über deren Sinn und Zweck. Statistik kompakt für Dummies ist durch seine kompakte und dennoch unkomplizierte Präsentation das richtige Nachschlagewerk für den statistischen »Newcomer«.

Da Statistik ein Teilgebiet der Mathematik ist, kommen Sie trotz alledem aber auch in diesem Buch nicht um bestimmte Formeln und Gleichungen herum. Aber keine Angst, eine anwendungsorientierte Erklärung der Formeln steht dabei im Vordergrund. Zu nahezu jeder statistischen Formel, die in diesem Buch besprochen wird, finden Sie so:

Informationen über den Sinn und Zweck ihrer Berechnung
Ausführliche Beschreibungen zu den in der Formel auftretenden Größen und Symbolen
Ein Kochrezept, dass ganz allgemein die Berechnung der Formel illustriert
Ein Anwendungsbeispiel, an dem die Berechnung der Formel Schritt für Schritt anhand eines konkreten Zahlenbeispiels erklärt wird
Eine Interpretation der Ergebnisse

Sie sehen es schon, es ist das Anliegen von Statistik kompakt für Dummies, Ihnen die Statistiken und ihre Formeln nicht nur sozusagen vor die Füße zu kippen, sondern Ihnen auch nötiges Hintergrund‐ und Zusammenhangswissen zu vermitteln. Insbesondere durch die detaillierte Beschreibung der einzelnen Arbeitsschritte, die Sie bei der Anwendung der Formeln durchlaufen müssen, und durch die Beispiele mit ihren vollständigen Lösungswegen und Ergebnisinterpretationen wird die Voraussetzung dafür geschaffen, dass Sie lernen die Statistiken und Formeln garantiert auch in der privaten und beruflichen Praxis erfolgreich anwenden zu können.

Natürlich ist es bei dem Umfang dieses Kompaktbandes nicht möglich (und das werden Sie sicherlich auch nicht erwartet haben), jedes kleinste Detail zu behandeln. Auch werden einige Themen wie zum Beispiel Zeitreihenanalyse oder die Maximum Likelihood Methode komplett ausgelassen. Auch für eine Behandlung der kompliziertesten Statistiken und Formeln ist hier leider nicht der Platz. Dazu sind schließlich die vielen anderen dicken Statistikwälzer da.

Törichte Annahmen über den Leser

Lassen Sie mich ein paar Vermutungen über Sie als Leser meines Buches anstellen:

Vielleicht bereiten Sie sich gerade auf eine Statistikprüfung in der Schule, in der Ausbildung oder in der Uni in den Naturwissenschaften oder zum Beispiel für das Fach Wirtschaftswissenschaften oder Sozialwissenschaften vor. Es kann auch sein, dass Sie statistische Informationen für Entscheidungen in Ihrer beruflichen Praxis benötigen oder Sie möchten einfach endlich mal die Formeln hinter den Statistiken, die Ihnen tagtäglich in Zeitungen, im Fernsehen und im Internet begegnen, kennenlernen und verstehen.

Die Aussage »Statistiken und statistische Formeln sind wirklich nur für Mathegenies oder in Zahlen verliebte Sonderlinge interessant« wäre eine durchaus törichte Annahme, wenn man sie auf den Leser von Statistik kompakt für Dummies beziehen würde.

Wenn Sie ein wenig Kenntnisse in der grundlegenden Schulmathematik mitbringen und ansonsten gerade begonnen haben, sich mit Statistik in Ihrem Fach, an der Hochschule oder in Ihrer beruflichen Praxis zu beschäftigen, dann ist Statistik kompakt für Dummies genau das richtige Buch für Sie. Aber auch wenn Sie bereits als Statistikprofi in der Lehre und Ausbildung auf Gebieten wie beispielsweise der Wirtschafts‐ und Sozialwissenschaften tätig sind, können Sie dieses Buch zur Einführung einsetzen. Sie sehen, selbst für richtige Profis hat es etwas anzubieten.

Wie dieses Buch aufgebaut ist

Wie die Statistik selbst besteht auch Statistik kompakt für Dummies – nach einem einführenden Teil – aus zwei großen Hauptteilen. In diesen Teilen spiegeln sich die beiden wesentlichen Gebiete oder auch das »Ying« und »Yang« der Statistik wieder: die beschreibende und die schließende Statistik. Und Sie finden in diesem Buch wie in allen Büchern der … für Dummies‐Reihe natürlich auch einen Top‐Ten‐Teil.

Teil I: Ein paar statistische Grundlagen

Damit Sie nicht gleich ins eiskalte Wasser der statistischen Formelwelt gestoßen werden, erhalten Sie im ersten Teil erst einmal einen allgemeinen systematischen Einstieg in das Fachgebiet der Statistik. Hier werden der Zweck und die wesentlichen Aufgaben sowie der grundlegende Aufbau der Statistik vorgestellt. Damit Sie gleich kompetent informiert sind, erfahren Sie hier außerdem mehr über die Herkunft und Messung der Daten, mit denen Sie später Statistiken berechnen und die Ergebnisse interpretieren können.

Teil II: Die beschreibende Statistik

Teil II ist dem ersten großen Teilgebiet der Statistik gewidmet: der beschreibenden Statistik. Nach einer kurzen Erläuterung der Ziele und Aufgaben der beschreibenden Statistik stellen wir Ihnen die Darstellung von statistischen Daten in Tabellen und Diagrammen vor. Dann folgt die Behandlung der wichtigsten Statistiken. Dabei handelt es sich um zentrale Lagemaße, um Streuungsmaße und Zusammenhangsmaße. Natürlich dürfen dabei bedeutsame statistische Kennzahlen und auch die Grundlagen der Regressionsanalyse nicht fehlen.

Teil III: Die schließende Statistik

Um das zweite große Teilgebiet der Statistik, die schließende Statistik, geht es in Teil III. Sie lernen hier die Grundbegriffe der Wahrscheinlichkeit und damit Wahrscheinlichkeiten verstehen und zu bestimmen, Wahrscheinlichkeitsverteilungen zu erkennen, zu unterscheiden und zur Berechnung von Wahrscheinlichkeiten anzuwenden. Darauf aufbauend erfahren Sie, wie Sie statistische Parameter schätzen sowie Vertrauensintervalle berechnen und sinnvoll nutzen können. Selbstverständlich erfahren Sie auch, wie Sie Hypothesen an der Realität überprüfen und testen können. So lernen Sie gleichsam alles Wichtige, was Sie unbedingt für die »Königsklasse« der Statistik wissen müssen.

Teil IV: Der Top‐Ten‐Teil

Im Top‐Ten‐Teil, der in keinem … für Dummies‐Buch fehlen darf, stellen wir den Prozess von der Datengewinnung bis zur Analyse in zehn Meilensteinen als erfrischende Abwechslung zu den vorherigen Kapiteln dar.

Symbole, die in diesem Buch verwendet werden

Dieses Symbol kennzeichnet hilfreiche Hinweise und Tipps, die Ihnen die Arbeit mit den Formeln und der statistischen Analyse erleichtern sollen.

Dieses Symbol kennzeichnet Passagen, in denen wichtige Konzepte und Begriffe dargestellt und genauer erklärt werden. Das gibt Ihnen ein sicheres Verständnis der wichtigsten statistischen Konzepte.

Fehler sind dazu da, dass man aus ihnen lernen kann. Es erspart Ihnen aber viel Arbeit und Mühe, wenn Sie bestimmte Fehler erst gar nicht machen. Damit Sie nicht in das eine oder andere Fettnäpfchen treten, haben wir an den entsprechenden Stellen diese Warnschilder aufgestellt.

Wie es weitergeht

Als Newcomer fangen Sie am besten einfach am Anfang an und lesen das Buch von vorn bis hinten durch. So werden Sie systematisch in die Statistik eingeführt.

Jedes Kapitel ist aber auch für sich genommen verständlich, also springen Sie einfach in das Thema hinein, das Sie gerade beschäftigt, ganz wie Sie mögen. Viel Erfolg und Spaß dabei!

Kapitel 1

Was Statistik ist und warum sie benötigt wird

In diesem Kapitel

Statistik und ihre Bedeutung heute
Ziele und Aufgaben der Statistik
Aufbau und wesentliche Bestandteile der Statistik

Statistik wird schon so lange betrieben, wie es Mathematik gibt. Erste Volkszählungen gab es zum Beispiel bereits bei den alten Ägyptern vor mehr als 2000 Jahren. Heute ist die Statistik selbst aus unserem Privatleben nicht mehr wegzudenken und allgegenwärtig. Viele Menschen führen beispielsweise Statistik über ihr Gewicht oder ihre sportlichen Leistungen. Jedes Mal, wenn Sie eine Zeitung aufschlagen, werden Sie darin Tabellen, Diagramme und statistische Kennzahlen zu den verschiedensten gesellschaftlichen, wirtschaftlichen und technischen Bereichen finden. Es gibt keinen gesellschaftlichen, kulturellen, naturwissenschaftlichen, volkswirtschaftlichen und auch keinen betrieblichen Bereich in Unternehmen, für den nicht Statistiken erstellt werden. Ganz offenbar benötigt man heute in allen Bereichen menschlichen Handelns statistische Kenntnisse, wenn man informiert sein möchte oder mitreden will. Warum ist das so?

Warum Statistik?

Eine Antwort auf diese Frage können Sie finden, wenn Sie sich anschauen, um was es bei der Statistik geht. Statistik leitet sich aus dem lateinischen Wort »status« ab, was so viel wie Zustand, Verfassung oder Stand der Dinge bedeutet.

Bei der Statistik geht es um das zahlenmäßige Erfassen, Klassifizieren, Auswerten, Analysieren und Präsentieren von Daten über Massen, Gesamtheiten oder Populationen.

Die Statistik benötigen Sie vor allem, um informierte und das heißt richtige oder bessere Entscheidungen für Probleme treffen zu können, die sich nicht auf Einzelfälle, sondern auf Gesamtheiten oder Massenerscheinungen beziehen oder von denen ganze Bevölkerungen beziehungsweise Populationen betroffen sind. Beispielsweise müssen Politiker über Gesetze entscheiden, die das Wohl von Millionen von Bürgern beeinflussen; denken Sie nur mal an die Steuergesetzgebung.

Einsatzgebiete der Statistik

Die Anwendung der Methoden und Instrumente der Statistik finden Sie nicht nur in der Politik, Sie finden sie in allen gesellschaftlichen Bereichen. Die folgende Liste zeigt Beispiele für Einsatzgebiete für Statistik innerhalb von Unternehmen:

Marktforschung: Konsumentenstrukturen und Präferenzen
Produktplanung: Wirtschaftstrends, detaillierte Verkaufsbudgets
Finanzanalysen: Jahresberichte, Kosten‐ und Einnahmedaten
Vorhersagen: Absatz‐, Umsatz‐, Beschäftigungs‐ und Produktivitätsentwicklung
Prozess‐ und Qualitätskontrollen
Arbeitnehmerstatistik: Krankenstand oder Personalfluktuation

Bereiche der Statistik

Innerhalb der Statistik unterscheidet man zwei große Aufgabengebiete, auf deren Details wir im Folgenden näher eingehen:

die deskriptive Statistik
die schließende Statistik

Die deskriptive und die schließende Statistik bilden die beiden wichtigsten Gebiete in der Statistik. Gemäß dieser Unterscheidung ist auch Statistik kompakt für Dummies entsprechend aufgebaut. Ehe es ans Eingemachte geht, liefert Abbildung 1.1 einen ersten Überblick über die statistischen Teilgebiete, wie sie auch in den Formeln und Kapiteln dieses Buches thematisiert werden.

Abbildung 1.1: Übersicht über die Teilgebiete der Statistik

Die deskriptive oder beschreibende Statistik

Wie schon im Namen zum Ausdruck kommt, dient Ihnen die deskriptive Statistik, die manchmal auch beschreibende Statistik genannt wird, der genauen Beschreibung von bereits erhobenen Daten aus statistischen Gesamtheiten. Die Beschreibung erfolgt dabei anhand von statistischen Tabellen, Diagrammen oder zusammenfassenden Zahlen.

Die deskriptive Statistik dient dazu, Fakten und Daten für die Analyse aufzubereiten, sie auszuwerten, zu beschreiben, zu interpretieren sowie sie systematisch, geordnet und informativ darzustellen.

Das zugrunde liegende Datenmaterial wird dabei aus einer sogenannten Grundgesamtheit erhoben. Die Grundgesamtheit wird auch als Population oder statistische Masse bezeichnet. Sie ist die Menge aller Objekte oder Personen (sogenannter »statistischen Einheiten«, »Merkmalsträger« oder »Untersuchungsobjekte«), über die Informationen über bestimmte Eigenschaften gewonnen werden sollen. Diese Eigenschaften bezeichnet man als statistische Merkmale oder Variablen.

Lassen Sie mich diese Begriffe an einem Beispiel erörtern. Stellen Sie sich vor, Sie wären an der Verteilung des Einkommens von Männern und Frauen in einer bestimmten beruflichen Position interessiert. Die Grundgesamtheit besteht in diesem Fall einfach aus allen Erwerbstätigen in dieser beruflichen Position. Jeder einzelne dieser Erwerbstätigen ist dabei eine statistische Einheit. Es werden zwei statistische Merkmale an diesen Einheiten erhoben: das Einkommen (in Euro) und das Geschlecht. Da die gemessenen Merkmale, wie zum Beispiel das Einkommen, für unterschiedliche Personen unterschiedlich ausfallen können, ist auch der Begriff »Variable« statt »Merkmal« sinnvoll. Ihre erhobenen Daten bestehen letztendlich aus den an den statistischen Einheiten gemessenen Werten des Merkmals, den Merkmalswerten. Von der ersten befragten Person stellen Sie so vielleicht fest, dass sie weiblich ist und über ein Einkommen von 2500 Euro verfügt – der Merkmalswert des Merkmals »Geschlecht« beziehungsweise »Einkommen« dieser statistischen Einheit ist also »weiblich« beziehungsweise »2500 Euro«. Bei der zweiten befragten Person könnte es sich hingegen um einen Mann mit einem Einkommen von 2400 Euro handeln und so weiter.

Anstelle von Merkmalswert spricht man häufig auch von Merkmalsausprägung. Insbesondere dann, wenn man von Werten eines Merkmals spricht, die es grundsätzlich zwar annehmen könnte, die es in der Erhebung aber nicht unbedingt annehmen muss. Für das Merkmal Geschlecht wären die (möglichen) Merkmalsausprägungen männlich oder weiblich, für das Merkmal Einkommen hingegen positive Zahlen wie 450,90 oder 2400.

Sie können sich leicht vorstellen, dass man bei einer solchen Erhebung schnell den Überblick verliert. Nachdem Sie die Daten gesammelt haben, geht es daher im nächsten Schritt darum, sie mithilfe der deskriptiven Statistik möglichst gut darzustellen und zu beschreiben. Die Möglichkeiten, Instrumente oder Formen der Beschreibung reichen von eindimensionalen Tabellen und Diagrammen über einfache statistische Kennzahlen bis hin zu komplexen mehrdimensionalen statistischen Analysetools.

Streng genommen wird das Datenmaterial im Rahmen der deskriptiven Statistik nur beschrieben und zusammengefasst. Das gezielte Auffinden von Strukturen und Zusammenhängen innerhalb des Datenmaterials bezeichnet der Statistiker hingegen als explorative Statistik.

Instrumente der Statistik

Zu den wichtigsten Instrumenten der deskriptiven Statistik zählen:

Datentabellen: Tabellen, in denen die Daten zu den betrachteten statistischen Merkmalen systematisch zusammengefasst präsentiert werden (mehr erfahren Sie darüber in Kapitel 3)
Diagramme: Daten der statistischen Merkmale in Form von Bildern anschaulich und informativ präsentieren (siehe auch Kapitel 3)
Zentrale Lagemaße: Statistiken, die in einer Zahl die Werte eines statistischen Merkmals beschreiben (zum Beispiel das arithmetische Mittel, beim Merkmal »Einkommen« also das Durchschnittseinkommen; mehr hierzu in Kapitel 4)
Streuungsmaße: Statistiken, die in einer Zahl mitteilen, wie weit die einzelnen Werte eines Merkmals vom Durchschnitt entfernt liegen (wie stark zum Beispiel die einzelnen Einkommen vom Durchschnittseinkommen entfernt sind; mehr hierzu in Kapitel 5)
Mess‐/Indexzahlen: Zahlen, die die Werte anderer statistischer Kennzahlen zusammenfassen (zum Beispiel der Preisindex für Lebenshaltungskosten, der die Information über die Preisentwicklung vieler verschiedener Güter in einer Zahl komprimiert; mehr hierzu in Kapitel 6)
Zusammenhangsmaße: statistische Maßzahlen, die auch als Koeffizienten bezeichnet werden, die die Stärke der Beziehung zwischen verschiedenen statistischen Merkmalen beschreiben (zum Beispiel inwiefern die Höhe des Einkommens von der Berufserfahrung abhängt; mehr hierzu in Kapitel 7)

Diese zentralen Instrumente der deskriptiven Statistik werden Sie im Detail in Teil II kennenlernen.

Datenmessung mit Niveau

Die so beschriebenen und analysierten Merkmale können auf verschiedene Weise gemessen werden (zu den Messniveaus erfahren Sie mehr in Kapitel 2):

nominal, das heißt, die möglichen Werte eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich nur unterscheiden
ordinal, das heißt, die möglichen Werte eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich zudem in eine Rangordnung bringen
metrisch, das heißt, die Unterschiede in den möglichen Werten eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich zusätzlich mithilfe genormter Messeinheiten quantifizieren, also zahlenmäßig in ihrer Größenordnung ausdrücken

Die deskriptiven Statistiken und ihre Zuordnung zu den jeweiligen Messniveaus sehen Sie im Überblick in Tabelle 1.1. Außerdem können Sie der Tabelle entnehmen, in welchen Kapiteln die erwähnten Themen behandelt werden.

Statistiken	Skalenniveaus Nominal	Ordinal	Metrisch
Maße der Tendenz beziehungsweise Lagemaße	Modus (siehe Kapitel 4)	Median Quartile Perzentile (siehe Kapitel 4)	arithmetisches Mittel gewichtetes Mittel geometrisches Mittel (siehe Kapitel 4)
Maße der Variabilität	nicht sinnvoll, da Zahlen nicht von Bedeutung sind und nur zur Unterscheidung der Kategorien der Merkmale dienen	Abstand Interquartiler Abstand (siehe Kapitel 5)	mittlere Abweichung Varianz Standardabweichung Variationskoeffizient (siehe Kapitel 5)
Beziehungsmaße	Chi‐Quadrat Pearsons Kontingenz (siehe Kapitel 7)	Spearmans Rangkorrelation (siehe Kapitel 7)	Bravais‐Pearson‐ Korrelation Kovarianz (siehe Kapitel 7) Regressionskoeffizient Determinationskoeffizient (siehe Kapitel 8)

Statistiken

Skalenniveaus
Nominal

Ordinal

Metrisch

Maße der
Tendenz
beziehungsweise
Lagemaße

Modus

(siehe Kapitel 4)

Median
Quartile
Perzentile

(siehe Kapitel 4)

arithmetisches Mittel
gewichtetes Mittel
geometrisches Mittel

(siehe Kapitel 4)

Maße der
Variabilität

nicht sinnvoll, da Zahlen nicht von
Bedeutung sind
und nur zur
Unterscheidung
der Kategorien
der Merkmale
dienen

Abstand
Interquartiler
Abstand

(siehe Kapitel 5)

mittlere
Abweichung
Varianz
Standardabweichung
Variationskoeffizient

(siehe Kapitel 5)

Beziehungsmaße

Chi‐Quadrat
Pearsons
Kontingenz

(siehe Kapitel 7)

Spearmans
Rangkorrelation

(siehe Kapitel 7)

Bravais‐Pearson‐
Korrelation
Kovarianz

(siehe Kapitel 7)

Regressionskoeffizient
Determinationskoeffizient

(siehe Kapitel 8)

Tabelle 1.1: Der Zusammenhang zwischen Statistiken und Messniveaus

Die Statistiken der deskriptiven Statistik sind nur für die in der Untersuchung erfassten Untersuchungseinheiten aussagekräftig und für die in die Berechnung einbezogenen Daten, das heißt, Sie können die daraus resultierenden Ergebnisse auch nur auf die analysierten Fälle und Daten beziehen und nicht auf andere Fälle (insbesondere nicht auf eine umfassendere Grundgesamtheit) übertragen. Stellen Sie sich vor, dass eine Sonntagsfrage unter 1000 Wahlberechtigten in Deutschland durchgeführt wurde. Mit den Instrumenten der deskriptiven Statistik könnten Sie dann zwar feststellen, dass zum Beispiel 43 Prozent der 1000 Befragten für Partei A stimmen würde. Sie könnten dieses Ergebnis allerdings nicht auf alle Wahlberechtigten in Deutschland verallgemeinern. Wenn Sie das tun wollen, müssen Sie über die deskriptive Statistik hinaus auf das Instrumentarium der schließenden Statistik zurückgreifen.

Die schließende Statistik oder Inferenzstatistik

Die schließende Statistik (auch Inferenzstatistik oder induktive Statistik genannt) ist neben der deskriptiven Statistik die zweite wesentliche Säule der Statistik. Sie benötigen sie immer dann, wenn Sie nicht alle für eine Analyse interessanten Fälle (statistische Einheiten) in Ihre Datenerhebung einbeziehen können. Ihnen steht somit nur ein Teil der Daten aus der Gesamtheit der Untersuchungseinheiten für die Analyse zur Verfügung. Sie möchten aber dennoch etwas über die Verhältnisse in der Gesamtheit aussagen.

Wählen Sie nur einen Teil der statistischen Einheiten aus der Grundgesamtheit für die statistischen Analysen aus, so handelt es sich um eine Teilerhebung beziehungsweise Stichprobe. Anhand der Ergebnisse der statistischen Analysen mit der Stichprobe wollen Sie auf die entsprechenden Werte in der betreffenden Grundgesamtheit schließen. Aus dieser Aufgabe ergibt sich auch der Name für die schließende Statistik, die auch oft als Inferenzstatistik bezeichnet wird, was aber nichts anderes bedeutet. Die Grundlage dafür, dass Sie aus den Ergebnissen einer Stichprobe einen repräsentativen Schluss auf die Verhältnisse in der Grundgesamtheit ziehen können, ist die Wahrscheinlichkeitsrechnung. Darauf bauen die statistischen Schätzverfahren und die Methoden zum Testen von Hypothesen auf.

Eine Hypothese ist eine noch nicht anhand von Daten systematisch überprüfte und analysierte oder bestätigte Behauptung, Aussage oder Vermutung.

Instrumente der schließenden Statistik

Besonders wichtige Konzepte, Verfahren und Instrumente, die Sie in der schließenden Statistik antreffen, sind:

Zufallsexperiment: ein Experiment, dessen mögliche Ereignisse zufällig mit einer bestimmten Wahrscheinlichkeit auftreten und daher nicht eindeutig vorhergesagt werden können (mehr hierzu in Kapitel 10)
Zufallsvariablen: die bei dem Experiment betrachteten Merkmale, deren Werte zufällig auftreten (siehe Kapitel 10)
Wahrscheinlichkeitsverteilung: die den möglichen Werten der Zufallsvariablen zugeordneten Wahrscheinlichkeiten (mehr hierzu in Kapitel 11 und Kapitel 12)
Stichprobe: ein Teil einer statistischen Gesamtheit; anhand der Stichprobe gewinnen Sie statistische Informationen über diese Gesamtheit (siehe dazu Kapitel 13)
Schätzverfahren: ein Verfahren, mit dem Sie von den Daten beziehungsweise Ergebnissen aus einer Stichprobe auf die Verhältnisse in der statistischen Gesamtheit schließen (mehr hierzu in Kapitel 14)
Parameter‐ und Hypothesentest: ein Test, mit dem Sie anhand der Ergebnisse aus einer Stichprobe überprüfen können, ob bestimmte Annahmen oder Hypothesen, die Sie über die Verhältnisse in der Grundgesamtheit haben, zutreffen (siehe Kapitel 15)

Aufgaben der schließenden Statistik

Zwei Aufgabentypen der schließenden Statistik sind besonders wichtig:

Schätzung der Werte nicht bekannter Grundgesamtheitsparameter wie den Durchschnittswert (beziehungsweise zu erwartenden Wert) einer Variablen in einer Population

Zum Beispiel können Sie die durchschnittlichen Einkommen der Männer und Frauen einer Stichprobe berechnen und mithilfe der Verfahren der schließenden Statistik auf die Durchschnittseinkommen von Männern und Frauen in der gesamten Population, aus der Sie die Stichprobe gezogen haben, schließen.
Hypothesentest über die Werte von Populationsparametern (zum Beispiel darüber, dass das arithmetische Mittel einen bestimmten Wert hat)

Ausgehend von einer Hypothese über die Durchschnittseinkommen von Männern und Frauen in der gesamten Population erheben Sie eine Stichprobe aus der Gesamtpopulation und überprüfen anhand der Daten aus der Stichprobe und mithilfe der Verfahren der schließenden Statistik, ob die Hypothese zutrifft oder nicht. Wenn Sie in unserem Beispiel die Annahme haben, dass Frauen und Männer in gleichen beruflichen Positionen das gleiche Einkommen erzielen, können Sie diese Annahme auf diese Weise »empirisch«, das heißt erfahrungsgestützt, überprüfen.

Um zuverlässig schließen zu können, benötigen Sie eine repräsentative Stichprobe. Repräsentativ ist eine Stichprobe dann, wenn sie sozusagen ein Abbild der Grundgesamtheit ist. Repräsentativität kann erreicht werden, wenn die Untersuchungsobjekte (oder »Fälle«), an denen die Daten erhoben wurden, zufällig aus der Grundgesamtheit ausgewählt wurden.

Gründe für Stichproben und schließende Statistik

Die Beschränkung auf eine Stichprobe und damit der Rückgriff auf die schließende Statistik bietet sich vor allem dann an, wenn Sie

zu hohe Kosten für die Datenerhebung vermeiden wollen,
den zeitlichen Aufwand für die Datenerhebung verringern müssen beziehungsweise wollen und/oder
aus sachlogischen, praktischen Gründen auf eine Voll‐ beziehungsweise Gesamterhebung zugunsten einer Stichprobe verzichten müssen.

Beispielhaft für den Verzicht auf eine Befragung der gesamten Grundgesamtheit aus sachlogischen Gründen ist die Qualitätskontrolle im Bereich der Herstellung von Produkten. Stellen Sie sich hierzu einen Lebensmittelhersteller vor, der das Haltbarkeitsdatum eines seiner Produkte bestimmen will. Wenn er von jedem einzelnen Produkt festhalten würde, wie lange das Produkt genießbar ist, so hat er am Ende keine Ware mehr zu verkaufen. Natürlich kostet es auch mehr Geld und Zeit, wenn Sie statt einer repräsentativen Stichprobe alle Produkte testen wollten.

Über die Autoren

Einführung

Über dieses Buch

Törichte Annahmen über den Leser

Wie dieses Buch aufgebaut ist

Teil I: Ein paar statistische Grundlagen

Teil II: Die beschreibende Statistik

Teil III: Die schließende Statistik

Teil IV: Der Top‐Ten‐Teil

Symbole, die in diesem Buch verwendet werden

Wie es weitergeht

Ein paar statistische Grundlagen

Was Statistik ist und warum sie benötigt wird

Warum Statistik?

Einsatzgebiete der Statistik

Bereiche der Statistik

Die deskriptive oder beschreibende Statistik

Instrumente der Statistik

Datenmessung mit Niveau

Die schließende Statistik oder Inferenzstatistik

Instrumente der schließenden Statistik

Aufgaben der schließenden Statistik

Gründe für Stichproben und schließende Statistik