added crisp-dm

This commit is contained in:
paul-loedige 2021-02-08 21:20:40 +01:00
parent 0733f0be49
commit 45f341ad06
4 changed files with 56 additions and 1 deletions

View File

@ -29,4 +29,6 @@
\acro{ID3}{Iterative Dichotomizer 3}
\acro{KNN}{Künstliches Neuronales Netz}
\acrodefplural{KNN}{Künstliche Neuronale Netze}
\acro{CRISP}{Cross-Industry Standard Process}
\acro{CRISP-DM}{\acs{CRISP} for Data Mining}
\end{acronym}

View File

@ -4,7 +4,7 @@ Dieses Repo beinhaltet die $\LaTeX$ Informationen für die Zusammenfassung im Fa
## Änderungen für die Zusammenfassung
- [ ] Lineare Programmierung hinzufügen
- [x] Automated Machine Learning
- [ ] CRISP-DM (Übung 7)
- [x] CRISP-DM (Übung 7)
- [x] Informationsbasiertes Lernen
- [x] Entscheidungsbaum
- [x] Entropie

View File

@ -119,6 +119,59 @@
Ein typisches Beispiel für einen Hyperparameter ist die Anzahl der zu erreichenden Cluster.
Dieser Hyperparameter muss vielen Clustering-Algorithmen übergeben werden.
\section{\acf{CRISP-DM}}
\label{ml: crisp-dm}
Ein mögliches Prozessmodell für den Entwurf von \ac{ML}-Anwendungen ist \ac{CRISP-DM}.
\begin{center}
\includegraphics[width = .6\textwidth]{CRISP-DM_Process_Diagram.png}
\end{center}
\paragraph{Geschäftsverständnis}
\begin{itemize}
\item Welcher Geschätsprozess muss/kann optimiert werden?
\item Kann die Analyse von Daten helfen?
\item Nutzung von Domänenwissen und Experten
\end{itemize}
\paragraph{Datenverständnis}
\begin{itemize}
\item Welche Daten stehen wo und wie zur Verfügung?
\item Wie können benötigte Daten erfasst werden?
\item Wie können Daten aus unterschiedlichen Quellen zusammengeführt werden?
\item Visualisierung der Daten
\item Überprüfung der Daten mit Domänenwissen
\end{itemize}
\paragraph{Vorerarbeitung}
\begin{itemize}
\item Sind die Daten vollständig?
\item Gibt es Fehler in meinen Daten oder fehlende Daten?
\item Müssen oder können die Daten aufbereitet und bereinigt werden? (evtl. Domänenwissen hilfreich)
\item Wie müssen Die Daten für meinen Algorithmus vorverarbeitet werden?
\end{itemize}
\paragraph{Modellbildung}
\begin{itemize}
\item Welche Algorithmen können für die Daten zum Einsatz kommen?
\item Welche Algorithmen sind vielversprechend?
\item Modelle entwerfen und vergleichen
\end{itemize}
\paragraph{Evaluatoin}
\begin{itemize}
\item Löst das Modell mein Problem zufriedenstellend?
\item Wird der Geschäftsprozess verbessert?
\item Sind die Ergebnisse nachvollziehbar?
\item Ist der Einsatz meines Modells zuverlässig?
\end{itemize}
\paragraph{Modell bereitstellen}
\begin{itemize}
\item Wie kann die Anwendung skaliert werden?
\item Wie kann die Leistung des Modells kontinuierlich überwacht werden?
\item Wie wird reagiert, wenn die Leistung des Modells abnimmt? (z.B. durch Concept Drift)
\end{itemize}
\section{Auswahl des \ac{ML}-Algorithmus}
\label{ml: algorithmus-auswahl}
\includegraphics[width = \textwidth]{machine-learning-cheet-sheet.png}

Binary file not shown.

After

Width:  |  Height:  |  Size: 608 KiB