diff --git a/chapters/Problematiken/Big Data.tex b/chapters/Problematiken/Big Data.tex new file mode 100644 index 0000000..870ce9e --- /dev/null +++ b/chapters/Problematiken/Big Data.tex @@ -0,0 +1,21 @@ +\chapter{Big Data} +\label{big data} + Mithilfe von riesigen Datenmengen ist es \textbf{scheinbar} möglich Beziehungen zu erkennen, die zuvor nicht erkennbar waren. + Viele Leute setzen sich sogar nach dem Prinzip \say{with enough data the numbers speak for themselves} dafür ein, + die erkannten Beziehungen als bewiesen zu akzeptieren ohne die zugrundeliegende Logik zu hinterfragen. + Diese als \say{Big Data Philosphie} bezeichnete Ansicht beruht allerdings auf einem Trugschluss. + \Huge + {\color{red}$$\text{Correlation}\ne\text{Causation}$$} + \normalsize + Dieser Fehlschluss wird auch als \say{cum hoc, ergo propter hoc} (zusammen hiermit, daher hiervon verursacht) bezeichnet. + Allgemein gibt es 5 mögliche Erklärungen für die Korrelation von Daten:\\ + \includegraphics[width = \textwidth]{correlation_reasons.png}\\ + Im 5. Fall spricht man von einer \textbf{Scheinkorrelation}. + Diese müssen schon rein aus statistischen Gründen in ausreichend großen Datenmengen auftauchen. + + \section{Korrelationsarten} + \label{big data: types of correlation} + Meist werden bei der Untersuchung von Korrelationen nur die linearen Korrelation betrachtet. + Dies greift allerdings zu kurz, da Eigenschaften auch auf ganz andere Art und Weise miteinander korrelieren können:\\ + \includegraphics[width = \textwidth]{types of correlation.png} + diff --git a/images/correlation_reasons.png b/images/correlation_reasons.png new file mode 100644 index 0000000..66cca31 Binary files /dev/null and b/images/correlation_reasons.png differ diff --git a/images/types of correlation.png b/images/types of correlation.png new file mode 100644 index 0000000..a2c1b78 Binary files /dev/null and b/images/types of correlation.png differ diff --git a/parts/Problematiken.tex b/parts/Problematiken.tex index 59c85f0..a7c142e 100644 --- a/parts/Problematiken.tex +++ b/parts/Problematiken.tex @@ -3,4 +3,5 @@ \input{chapters/Problematiken/Zuverlässigkeit und Vertrauen.tex} \input{chapters/Problematiken/Erklärbarkeit.tex} -\input{chapters/Problematiken/Bias.tex} \ No newline at end of file +\input{chapters/Problematiken/Bias.tex} +\input{chapters/Problematiken/Big Data.tex} \ No newline at end of file