ML_P3_2/ML_U3_2.ipynb

{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Maschinelles Lernen (ML) - Übung 3\n",
    "# Perzeptronen und mehrschichtige Perzeptronen\n",
    "# 3.2 Loss Function, Backpropagation und Gradient Descent\n",
    "\n",
    "In dieser Aufgabe wird die Aktualisierungsfunktion (Lernalgorithmus) aus der Vorlesung durch das Verfahren der Fehlerrückführung (engl. backpropagation) und des Gradientenverfahrens (engl. gradient descent) ersetzt.\n",
    "\n",
    "In dieser Übung sollen Sie das bereits ausgearbeitete Perzeptron anpassen."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 49,
   "metadata": {},
   "outputs": [],
   "source": [
    "# matplotlib: Modul zum Plotten von Daten\n",
    "from matplotlib import pyplot as plt \n",
    "\n",
    "# numpy: Mathematikbibliothek\n",
    "import numpy as np \n",
    "import pandas as pd\n",
    "import time"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "**Aufgabe 1:** Ersetzen Sie die bisherige Aktivierung in der Methode *predict* durch die Sigmoidfunktion.\n",
    " "
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "**Aufgabe 2:** Implementieren Sie das beschriebene Gradientenlernverfahren mit Backpropagation in die Methode *fit*."
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "**Aufgabe 3:** Schauen Sie sich die Ausgabe des Perzeptrons (perceptron.predict(.)) auf einem der bisher verwendeten Datensätze (z.B. *AND*, Iris) an. Was fällt gegenüber einem Perzeptron mit der Signum-Funktion als Aktivierung auf? Was bedeutet das für den Einsatz als binärer Klassifikator?"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 50,
   "metadata": {},
   "outputs": [],
   "source": [
    "class Perceptron(object):\n",
    "    def __init__(self, number_of_inputs, epochs, eta):\n",
    "        \"\"\"\n",
    "        Beispielaufruf des Konstruktors:\n",
    "        >>> Perceptron(2, 100, 0.1)\n",
    "        \"\"\"\n",
    "        ### Dein Code kommt hierhin:\n",
    "        self.weights = np.zeros(number_of_inputs+1)\n",
    "        self.epochs = epochs\n",
    "        self.eta = eta\n",
    "        self.bias = 0\n",
    "        ##########################\n",
    "        pass\n",
    "           \n",
    "    def predict(self, inputs):\n",
    "        \"\"\"\n",
    "        Beispiel des Funktionsaufrufes:\n",
    "        >>> inputs = np.array([0, 1])\n",
    "        >>> h = perceptron.predict(inputs) \n",
    "        \"\"\"\n",
    "        # Dein Code kommt hierhin:    \n",
    "        z = self.bias * self.weights[0]\n",
    "        z += np.dot(inputs, self.weights[1:])\n",
    "        return 1/(1 + np.exp(-z))\n",
    "        ##########################\n",
    "        pass\n",
    "\n",
    "    def fit(self, training_inputs, labels):\n",
    "        \"\"\"\n",
    "        Beispiel des Funktionsaufrufs:\n",
    "        >>> perceptron.fit(train_input, labels)\n",
    "        \"\"\"\n",
    "        # Dein Code kommt hierhin:\n",
    "        for e in range(self.epochs):\n",
    "            L_old=0\n",
    "            h_old=0\n",
    "            z_old=-1\n",
    "            weights_old=-np.ones(len(self.weights))\n",
    "            for xi, target in zip(training_inputs, labels):\n",
    "                h = self.predict(xi)\n",
    "                h_diff = h - h_old\n",
    "                L = (target - h) ** 2\n",
    "                L_diff = L - L_old\n",
    "                z = self.bias * self.weights[0] + np.dot(xi, self.weights[1:])\n",
    "                z_diff = z - z_old\n",
    "                weights_diff = self.weights - weights_old\n",
    "                #Ableitung\n",
    "                deriv_z = np.where(weights_diff!=0, z_diff/weights_diff, 0)\n",
    "                deriv_h = h_diff/z_diff if z_diff!=0 else 0\n",
    "                deriv_L = L_diff/h_diff if h_diff!=0 else 0\n",
    "                deriv = deriv_L * deriv_h * deriv_z\n",
    "                delta_weights = self.eta * deriv\n",
    "                weights_old = self.weights\n",
    "                L_old = L\n",
    "                h_old = h\n",
    "                z_old = z\n",
    "                self.weights -= delta_weights\n",
    "        ##########################\n",
    "        pass\n",
    "            \n",
    "    def status(self):\n",
    "        \"\"\"\n",
    "        Die Methode status(...) gibt die aktuellen Gewichte aus.\n",
    "\n",
    "        Beispiel des Funktionsaufrufes und der Ausgabe:\n",
    "        >>> perceptron.status()\n",
    "        Perceptron weights:  [0. 1. 1.]\n",
    "        \"\"\"\n",
    "        print(\"Perceptron weights: \", self.weights)\n",
    "        \n",
    "    def getWeights(self):\n",
    "        return self.weights"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 51,
   "metadata": {},
   "outputs": [
    {
     "output_type": "stream",
     "name": "stdout",
     "text": [
      "[3.0643397 3.0643397 3.0643397]\n"
     ]
    },
    {
     "output_type": "error",
     "ename": "NameError",
     "evalue": "name 'train_input_AND' is not defined",
     "traceback": [
      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
      "\u001b[0;31mNameError\u001b[0m                                 Traceback (most recent call last)",
      "\u001b[0;32m<ipython-input-51-fc9213e067f7>\u001b[0m in \u001b[0;36m<module>\u001b[0;34m\u001b[0m\n\u001b[1;32m     22\u001b[0m \u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m     23\u001b[0m \u001b[0mfig\u001b[0m\u001b[0;34m,\u001b[0m \u001b[0max\u001b[0m \u001b[0;34m=\u001b[0m \u001b[0mplt\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0msubplots\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0;32m---> 24\u001b[0;31m \u001b[0max\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mscatter\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mtrain_input_AND\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mlabels_AND\u001b[0m\u001b[0;34m==\u001b[0m\u001b[0;34m-\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m,\u001b[0m\u001b[0;36m0\u001b[0m\u001b[0;34m]\u001b[0m \u001b[0;34m,\u001b[0m \u001b[0mtrain_input_AND\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mlabels_AND\u001b[0m\u001b[0;34m==\u001b[0m\u001b[0;34m-\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m,\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[0m\u001b[1;32m     25\u001b[0m \u001b[0max\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mscatter\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mtrain_input_AND\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mlabels_AND\u001b[0m\u001b[0;34m==\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m,\u001b[0m\u001b[0;36m0\u001b[0m\u001b[0;34m]\u001b[0m \u001b[0;34m,\u001b[0m \u001b[0mtrain_input_AND\u001b[0m\u001b[0;34m[\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mlabels_AND\u001b[0m\u001b[0;34m==\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m,\u001b[0m\u001b[0;36m1\u001b[0m\u001b[0;34m]\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n\u001b[1;32m     26\u001b[0m \u001b[0mplt\u001b[0m\u001b[0;34m.\u001b[0m\u001b[0mplot\u001b[0m\u001b[0;34m(\u001b[0m\u001b[0mx_AND\u001b[0m\u001b[0;34m,\u001b[0m\u001b[0my_AND\u001b[0m\u001b[0;34m)\u001b[0m\u001b[0;34m\u001b[0m\u001b[0;34m\u001b[0m\u001b[0m\n",
      "\u001b[0;31mNameError\u001b[0m: name 'train_input_AND' is not defined"
     ]
    }
   ],
   "source": [
    "# AND-Datensatz\n",
    "train_input = np.array([\n",
    "                        [0, 0],\n",
    "                        [0, 1],\n",
    "                        [1, 0],\n",
    "                        [1, 1]\n",
    "                        ])\n",
    "\n",
    "labels_AND = np.array([0, 0, 0, 1])\n",
    "\n",
    "perceptron_AND = Perceptron(2,100,0.1)\n",
    "perceptron_AND.fit(train_input,labels_AND)\n",
    "\n",
    "# Geradengleichung berechnen und plotten\n",
    "weights = perceptron_AND.getWeights()\n",
    "print(weights)\n",
    "\n",
    "slope = -weights[1]/weights[2]\n",
    "offset = -weights[0]/weights[2]\n",
    "x_AND = np.linspace(0,1)\n",
    "y_AND = slope * x_AND + offset\n",
    "\n",
    "fig, ax = plt.subplots()\n",
    "ax.scatter(train_input_AND[(labels_AND==-1),0] , train_input_AND[(labels_AND==-1),1])\n",
    "ax.scatter(train_input_AND[(labels_AND==1),0] , train_input_AND[(labels_AND==1),1])\n",
    "plt.plot(x_AND,y_AND)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Beispiel mit OR\n",
    "labels_OR = np.array([0, 1, 1, 1])\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Hier wird der Iris-Datensatz geladen und vorbereitet (siehe Übung 2)\n",
    "\n",
    "# Datensatz laden\n",
    "names = [\"sepal-length\", \"sepal-width\", \"petal-length\", \"petal-width\", \"class\"]\n",
    "iris_data = pd.read_csv(\"iris.csv\", names = names)\n",
    "\n",
    "# Klassen auswählen (Bei Bedarf ändern)\n",
    "iris_data = iris_data.loc[lambda x: x['class'] != 'Iris-setosa']\n",
    "\n",
    "# Merkmale auswählen (Bei Bedarf ändern)\n",
    "iris_features = ['petal-length', 'petal-width']\n",
    "X = iris_data[iris_features]\n",
    "# Pandas-Datenformat in reine Liste umwandeln\n",
    "X = X.values\n",
    "\n",
    "# Label vorbereiten\n",
    "from sklearn.preprocessing import LabelEncoder\n",
    "lb_make = LabelEncoder()\n",
    "iris_data[\"class_code\"] = lb_make.fit_transform(iris_data[\"class\"])\n",
    "y = iris_data.class_code\n",
    "y = y.values\n",
    "        \n",
    "# Trainings- und Testdatensplit\n",
    "from sklearn.model_selection import train_test_split\n",
    "X_train, X_test, y_train, y_test = (\n",
    "    train_test_split(X, y, test_size=.2, random_state=np.random.seed(42)))"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.7.6-final"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}