\chapter{Information and Pattern Recognition} \label{information and pattern regocgnition} Falls zu viele Daten vorliegen um diese manuell auszuwerten kann es möglich sein den Vorgang zu automatisieren. Hierbei werden die Daten mithilfe eines Musters klassifiziert (Pattern assignment $\rightarrow$ classification). Das Verfahren zur Auswahl der jeweiligen Klassenzuordnung wird als \say{Pattern Recognition} bezeichnet. Man spricht von \say{Automatc Pattern Recognition}, falls das System dazu in der Lage ist neue Pattern in bestehende Klassen einzuordnen. \paragraph{Muster (pattern)} Das Wort \say{Pattern} beschreibt dabei eine Menge von Objekten mit vorherbestimmten beschreibenden Eigenschaften. Ein ein-dimensionales Pattern ist durch einen Vektor (discrete signals) definiert, wohingegen ein zwei-dimensionales Pattern durch eine Matrix beschrieben wird. \paragraph{Klassen (classes)} Pattern, die von einem \say{Pattern Recognition System} in die gleiche Klasse gesteckt werden sind äquivalent. Die Klassen stellen dadurch Äquivalenzklassen (equivalent classes) dar. \paragraph{Klassifikation (classification)} Die Klassifikation beschreibt das Verfahren, mit dem einzelne Pattern in Klassen unterteilt werden. \paragraph{Features} Ein \say{Feature} bezeichnet die \say{Signatur} eines Pattern. Das Feature errechnet sich aus den Eigenschaften des jeweiligen Pattern. \paragraph{Feature space}\label{feature space} Der \say{Feature space} ist ein mehrdimensionaler mathematisch definierter Raum. Die Dimension dieses Raums wird durch die Anzahl der Features definiert. Mithilfe des Raumes lassen sich die einzelnen Pattern zueinander in Relation setzen. \paragraph{Cluster} Bei gut gewählten Features liegen die Pattern einer Klasse im Feature Space nah beieinander (low intra-class distance).\\ \includegraphics[width=\textwidth]{good_vs_bad_features.png} Falls die einzelnen Klassen zudem einen großen Abstand zueinander im Feature Space haben (large inter-class distance) spricht man von einem \say{Cluster}. Bei schlecht gewählten Features lassen sich keine Cluster bilden, da die Klassen einander im Feature Space überlappen.\\ \includegraphics[width=\textwidth]{cluster.png} \section{Humans as Pattern Recognition Systems} Wie sich herausstellen wird sind die Menschen sehr gut darin Muster in Dingen zu erkennen. Sie können mit nur wenigen Informationen sehr gezielte Klassifizierungen vornehmen. \section{Human vs. Machine Pattern Recognition} \begin{center} \includegraphics[width=.8\textwidth]{human_vs_machine 1.png}\\ \includegraphics[width=.8\textwidth]{human_vs_machine 2.png} \end{center} \section{Class allocation (Klassen-Einteilung)} Grob zusammengefasst gibt es zwei Möglichkeiten für die Erstellung verschiedener Klassen: \paragraph{Semantical classes} \say{Semantical classes} werden aufgrund der inhaltlichen Äquivalenz der Pattern gebildet. Hierbei werden die Klassen selber meist durch einen menschlichen Experten definiert. Die Aufgabe ist dann ein System zu erstellen, welche die Pattern in die vordefinierten Klassen einordnet. Man spricht hierbei vom \textbf{Supervised Learning} (\ref{supervised learning}). \paragraph{Natural classes} \say{Natural classes} werden auf Basis mathematischer Formalismen gebildet. Hierfür wird z.B. der mathematische Abstand eines bestimmten Patterns zu einem anderen für die Klassifikation verwendet. Diese Art Klassen wird vor allem im Bereich der \say{numerical classification} verwendet, welche ein Beispiel für ein \textbf{Unsupervised Learning} (\ref{unsupervised learning}) Verfahren ist.