| Inhalt | 5 |
---|
| Vorwort | 17 |
---|
| Teil I: Die Grundlagen des Machine Learning | 29 |
---|
| Kapitel 1: Die Machine-Learning-Umgebung | 31 |
| Was ist Machine Learning? | 32 |
| Warum wird Machine Learning verwendet? | 32 |
| Anwendungsbeispiel | 35 |
| Unterschiedliche Machine-Learning-Systeme | 37 |
| Überwachtes/unüberwachtes Lernen | 37 |
| Batch- und Online-Learning | 44 |
| Instanzbasiertes versus modellbasiertes Lernen | 46 |
| Die wichtigsten Herausforderungen beim Machine Learning | 52 |
| Unzureichende Menge an Trainingsdaten | 52 |
| Nicht repräsentative Trainingsdaten | 54 |
| Minderwertige Daten | 55 |
| Irrelevante Merkmale | 56 |
| Overfitting der Trainingsdaten | 56 |
| Underfitting der Trainingsdaten | 58 |
| Zusammenfassung | 59 |
| Testen und Validieren | 59 |
| Hyperparameter anpassen und Modellauswahl | 60 |
| Datendiskrepanz | 61 |
| Übungen | 62 |
| Kapitel 2: Ein Machine-Learning-Projekt von A bis Z | 65 |
| Der Umgang mit realen Daten | 65 |
| Betrachte das Gesamtbild | 67 |
| Die Aufgabe abstecken | 67 |
| Wähle ein Qualitätsmaß aus | 69 |
| Überprüfe die Annahmen | 72 |
| Beschaffe die Daten | 72 |
| Erstelle eine Arbeitsumgebung | 72 |
| Die Daten herunterladen | 76 |
| Wirf einen kurzen Blick auf die Datenstruktur | 77 |
| Erstelle einen Testdatensatz | 81 |
| Erkunde und visualisiere die Daten, um Erkenntnisse zu gewinnen | 85 |
| Visualisieren geografischer Daten | 86 |
| Suche nach Korrelationen | 88 |
| Experimentieren mit Kombinationen von Merkmalen | 91 |
| Bereite die Daten für Machine-Learning- Algorithmen vor | 92 |
| Aufbereiten der Daten | 92 |
| Bearbeiten von Text und kategorischen Merkmalen | 95 |
| Eigene Transformer | 98 |
| Skalieren von Merkmalen | 99 |
| Pipelines zur Transformation | 100 |
| Wähle ein Modell aus und trainiere es | 102 |
| Trainieren und Auswerten auf dem Trainingsdatensatz | 102 |
| Bessere Auswertung mittels Kreuzvalidierung | 104 |
| Optimiere das Modell | 106 |
| Gittersuche | 106 |
| Zufällige Suche | 108 |
| Ensemble-Methoden | 109 |
| Analysiere die besten Modelle und ihre Fehler | 109 |
| Evaluiere das System auf dem Testdatensatz | 110 |
| Nimm das System in Betrieb, überwache und warte es | 111 |
| Probieren Sie es aus! | 114 |
| Übungen | 115 |
| Kapitel 3: Klassifikation | 117 |
| MNIST | 117 |
| Trainieren eines binären Klassifikators | 119 |
| Qualitätsmaße | 120 |
| Messen der Genauigkeit über Kreuzvalidierung | 120 |
| Konfusionsmatrix | 122 |
| Relevanz und Sensitivität | 124 |
| Die Wechselbeziehung zwischen Relevanz und Sensitivität | 125 |
| Die ROC-Kurve | 128 |
| Klassifikatoren mit mehreren Kategorien | 131 |
| Fehleranalyse | 134 |
| Klassifikation mit mehreren Labels | 137 |
| Klassifikation mit mehreren Ausgaben | 138 |
| Übungen | 140 |
| Kapitel 4: Trainieren von Modellen | 143 |
| Lineare Regression | 144 |
| Die Normalengleichung | 146 |
| Komplexität der Berechnung | 148 |
| Das Gradientenverfahren | 149 |
| Batch-Gradientenverfahren | 152 |
| Stochastisches Gradientenverfahren | 155 |
| Mini-Batch-Gradientenverfahren | 158 |
| Polynomielle Regression | 159 |
| Lernkurven | 161 |
| Regularisierte lineare Modelle | 165 |
| Ridge-Regression | 165 |
| Lasso-Regression | 167 |
| Elastic Net | 170 |
| Early Stopping | 171 |
| Logistische Regression | 172 |
| Abschätzen von Wahrscheinlichkeiten | 173 |
| Trainieren und Kostenfunktion | 174 |
| Entscheidungsgrenzen | 175 |
| Softmax-Regression | 177 |
| Übungen | 181 |
| Kapitel 5: Support Vector Machines | 183 |
| Lineare Klassifikation mit SVMs | 183 |
| Soft-Margin-Klassifikation | 184 |
| Nichtlineare SVM-Klassifikation | 187 |
| Polynomieller Kernel | 188 |
| Ähnlichkeitsbasierte Merkmale | 189 |
| Der gaußsche RBF-Kernel | 190 |
| Komplexität der Berechnung | 191 |
| SVM-Regression | 192 |
| Hinter den Kulissen | 194 |
| Entscheidungsfunktion und Vorhersagen | 194 |
| Zielfunktionen beim Trainieren | 195 |
| Quadratische Programme | 197 |
| Das duale Problem | 198 |
| Kernel-SVM | 199 |
| Online-SVMs | 201 |
| Übungen | 203 |
| Kapitel 6: Entscheidungsbäume | 205 |
| Trainieren und Visualisieren eines Entscheidungsbaums | 205 |
| Vorhersagen treffen | 206 |
| Schätzen von Wahrscheinlichkeiten für Kategorien | 209 |
| Der CART-Trainingsalgorithmus | 209 |
| Komplexität der Berechnung | 210 |
|