: Oliver Zeigermann, Chi Nhan Nguyen
: Machine Learning - kurz& gut Eine Einführung mit Python, Scikit-Learn und TensorFlow
: O'Reilly Verlag
: 9783960108573
: & gut
: 3
: CHF 8.80
:
: Programmiersprachen
: German
: 278
: Wasserzeichen
: PC/MAC/eReader/Tablet
: ePUB
Der kompakte Schnelleinstieg in Machine Learning und Deep Learning - Die 3. Auflage des Bestsellers wurde ergänzt durch Kapitel zu Large Language Models wie ChatGPT und zu MLOps - Anhand konkreter Datensätze lernst du einen typischen Workflow kennen: vom Datenimport über Datenbereinigung, Datenanalyse bis hin zur Datenvisualisierung - Nicht nur für zukünftige Data Scientists und ML-Profis geeignet, sondern durch seine durchdachte Didaktik auch für Interessierte, die nur am Rande mit ML zu tun haben, wie z.B. Softwareentwickler*innen Machine Learning beeinflusst heute beinahe alle Bereiche der Technik und der Gesellschaft. Dieses Buch bietet Interessierten, die einen technischen Hintergrund haben, die schnellstmögliche Einführung in das umfangreiche Themengebiet des maschinellen Lernens und der statistischen Datenanalyse. Dabei werden folgende Themen behandelt und mit praktischen Beispielen veranschaulicht: - Datenvorbereitung, Feature-Auswahl, Modellvalidierung - Supervised und Unsupervised Learning - Neuronale Netze und Deep Learning - Reinforcement Learning - LLMs - moderne Sprachmodelle - MLOps - Machine Learning für die Praxis Anhand von Beispieldatensätzen lernst du einen typischen Workflow kennen: vom Datenimport über Datenbereinigung, Datenanalyse bis hin zur Datenvisualisierung. Mit den Codebeispielen kannst du in Jupyter Notebooks experimentieren. Sie basieren auf Python und den Bibliotheken Scikit-Learn, Pandas, NumPy, TensorFlow und Keras. Nach der Lektüre dieses Buchs hast du einen Überblick über das gesamte Thema und kannst Ansätze einordnen und bewerten. Das Buch vermittelt dir eine solide Grundlage, um erste eigene Machine-Learning-Modelle zu trainieren und vertiefende Literatur zu verstehen.

Oliver Zeigermann ist Entwickler, Architekt, Berater und Coach aus Hamburg. Über die letzten Jahrzehnte hat er Software in vielen unterschiedlichen Sprachen und Technologien entwickelt. In den letzten Jahren ist er tiefer in die Analyse und Verarbeitung von Daten eingestiegen. Chi Nhan Nguyen arbeitet als Senior Data Scientist bei der softgarden e-recruiting GmbH. Seine Stationen im akademischen Ausland waren u.a. das Fermilab, die Texas A&M University, der Teilchenbeschleuniger LHC am CERN und die Columbia University.

KAPITEL 1


Einführung


Im Machine Learning wird ein Modell anhand von Daten trainiert und für ähnliche Daten genutzt oder darauf angewandt. Dafür stehen unterschiedliche Ansätze von einfachen linearen Modellen bis hin zu großen Sprachmodellen zur Verfügung. Da das erlernte Modell häufig nicht mehr komplett von uns Menschen verstanden werden kann, sind zudem Methoden notwendig, ein Modell als Blackbox zu validieren.

Was man mit Machine Learning machen kann und wie ein solches Training und die Validierung im Detail funktionieren, ist Gegenstand dieses Buchs.

Dies ist ein praxisorientiertes Buch mit lauffähigem Code. Alle Codebeispiele werden in Python 3 angegeben – Python-Kenntnisse sind jedoch nicht zwingend erforderlich, denn wir werden die notwendigen Grundlagen Stück für Stück in entsprechend gekennzeichneten Kästen vermitteln. Diese kannst du überspringen, falls du Python bereits beherrschst. Wenn du dir nur einen generellen Überblick verschaffen willst, ist es auch möglich, die Programmierbeispiele komplett zu überspringen, einen tieferen Einblick bekommst du aber nur mit ihrer Hilfe.

Wie du dieses Buch lesen kannst


Dieses Buch ist kein Nachschlagewerk. Du kannst es gut von vorn bis hinten durchlesen. Dann dient es dir als Einführung in das Thema Machine Learning. Du kannst aber auch bestimmte Kapitel auslassen, wenn du dich nicht so sehr für das darin behandelte Thema interessierst. In jedem Fall solltest du den Schnelldurchlauf inKapitel 2,Quick-Start, undKapitel 4,Supervised Learning, komplett lesen. Diese Kapitel enthalten die Kernthemen dieses Buchs.

Das Buch ist in zwei Teile aufgeteilt. DieKapitel 1 bisKapitel 6 des ersten Teils liefern einen strukturierten Aufbau der Grundlagen. Im zweiten Teil, bestehend ausKapitel 7 bisKapitel 11, lernst du anhand von Anwendungsbeispielen fortgeschrittene Techniken kennen, wie neuronale Netze, Autoencoder, Deep Reinforcement Learning, MLOps und große Sprachmodelle.

InKapitel 2,Quick-Start, findest du einen Schnelldurchlauf durch alle Stationen dieses Buchs. InKapitel 4 werden wir uns durch die einzelnen klassischen Strategien des Supervised Learning hindurcharbeiten und dabei deren Unterschiede, Stärken und Schwächen kennenlernen.

DieKapitel 5,Feature-Auswahl undKapitel 6,Modellvalidierung, gehen etwas mehr in die Tiefe und beantworten Fragen, die eventuell inKapitel 4 offengeblieben sind. Sie enthalten Formeln und erfordern ein wenig mathematisches Interesse und Verständnis.

Kapitel 3,Datenimport und -vorbereitung, liegt uns persönlich besonders am Herzen. Gute Daten sind die Voraussetzung für einen erfolgreichen Machine-Learning-Prozess. In diesem Kapitel schaffen wir zudem die technischen Grundlagen für den Umgang mit Python und seinen Bibliotheken.

Kapitel 7 handelt von Deep Learning mit neuronalen Netzen. Dies ist ebenfalls eine Strategie des Supervised Learning, ist aber in vielen Punkten anders als die zuvor inKapitel 4 behandelten Strategien. Wir wenden alles bisher Gelernte in einer praktischen Anwendung an, indem wir versuchen, Geschwindigkeitsbeschränkungen auf Verkehrsschildern zu erkennen.

InKapitel 8,Unsupervised