diff --git a/Acronyms.tex b/Acronyms.tex index 467da36..485ec3d 100644 --- a/Acronyms.tex +++ b/Acronyms.tex @@ -29,4 +29,6 @@ \acro{ID3}{Iterative Dichotomizer 3} \acro{KNN}{Künstliches Neuronales Netz} \acrodefplural{KNN}{Künstliche Neuronale Netze} + \acro{CRISP}{Cross-Industry Standard Process} + \acro{CRISP-DM}{\acs{CRISP} for Data Mining} \end{acronym} \ No newline at end of file diff --git a/Readme.md b/Readme.md index 840c80f..84f65b2 100644 --- a/Readme.md +++ b/Readme.md @@ -4,7 +4,7 @@ Dieses Repo beinhaltet die $\LaTeX$ Informationen für die Zusammenfassung im Fa ## Änderungen für die Zusammenfassung - [ ] Lineare Programmierung hinzufügen - [x] Automated Machine Learning -- [ ] CRISP-DM (Übung 7) +- [x] CRISP-DM (Übung 7) - [x] Informationsbasiertes Lernen - [x] Entscheidungsbaum - [x] Entropie diff --git a/chapters/Maschinelles Lernen/Einführung.tex b/chapters/Maschinelles Lernen/Einführung.tex index c22a99f..97bf3ab 100644 --- a/chapters/Maschinelles Lernen/Einführung.tex +++ b/chapters/Maschinelles Lernen/Einführung.tex @@ -119,6 +119,59 @@ Ein typisches Beispiel für einen Hyperparameter ist die Anzahl der zu erreichenden Cluster. Dieser Hyperparameter muss vielen Clustering-Algorithmen übergeben werden. + \section{\acf{CRISP-DM}} + \label{ml: crisp-dm} + Ein mögliches Prozessmodell für den Entwurf von \ac{ML}-Anwendungen ist \ac{CRISP-DM}. + \begin{center} + \includegraphics[width = .6\textwidth]{CRISP-DM_Process_Diagram.png} + \end{center} + + \paragraph{Geschäftsverständnis} + \begin{itemize} + \item Welcher Geschätsprozess muss/kann optimiert werden? + \item Kann die Analyse von Daten helfen? + \item Nutzung von Domänenwissen und Experten + \end{itemize} + + \paragraph{Datenverständnis} + \begin{itemize} + \item Welche Daten stehen wo und wie zur Verfügung? + \item Wie können benötigte Daten erfasst werden? + \item Wie können Daten aus unterschiedlichen Quellen zusammengeführt werden? + \item Visualisierung der Daten + \item Überprüfung der Daten mit Domänenwissen + \end{itemize} + + \paragraph{Vorerarbeitung} + \begin{itemize} + \item Sind die Daten vollständig? + \item Gibt es Fehler in meinen Daten oder fehlende Daten? + \item Müssen oder können die Daten aufbereitet und bereinigt werden? (evtl. Domänenwissen hilfreich) + \item Wie müssen Die Daten für meinen Algorithmus vorverarbeitet werden? + \end{itemize} + + \paragraph{Modellbildung} + \begin{itemize} + \item Welche Algorithmen können für die Daten zum Einsatz kommen? + \item Welche Algorithmen sind vielversprechend? + \item Modelle entwerfen und vergleichen + \end{itemize} + + \paragraph{Evaluatoin} + \begin{itemize} + \item Löst das Modell mein Problem zufriedenstellend? + \item Wird der Geschäftsprozess verbessert? + \item Sind die Ergebnisse nachvollziehbar? + \item Ist der Einsatz meines Modells zuverlässig? + \end{itemize} + + \paragraph{Modell bereitstellen} + \begin{itemize} + \item Wie kann die Anwendung skaliert werden? + \item Wie kann die Leistung des Modells kontinuierlich überwacht werden? + \item Wie wird reagiert, wenn die Leistung des Modells abnimmt? (z.B. durch Concept Drift) + \end{itemize} + \section{Auswahl des \ac{ML}-Algorithmus} \label{ml: algorithmus-auswahl} \includegraphics[width = \textwidth]{machine-learning-cheet-sheet.png} \ No newline at end of file diff --git a/images/CRISP-DM_Process_Diagram.png b/images/CRISP-DM_Process_Diagram.png new file mode 100644 index 0000000..779f2db Binary files /dev/null and b/images/CRISP-DM_Process_Diagram.png differ