: Bharath Ramsundar, Peter Eastman, Patrick Walters, Vijay Pande
: Deep Learning für die Biowissenschaften Einsatz von Deep Learning in Genomik, Biophysik, Mikroskopie und medizinischer Analyse
: O'Reilly Verlag
: 9783960103516
: 1
: CHF 33.30
:
: Informatik
: German
: 236
: Wasserzeichen
: PC/MAC/eReader/Tablet
: ePUB
Deep Learning hat bereits in vielen Bereichen bemerkenswerte Ergebnisse erzielt. Jetzt hält es Einzug in die Wissenschaften, insbesondere in die Biowissenschaften. Dieses praxisorientierte Buch bietet Programmierern und Wissenschaftlern einen Überblick darüber, wie Deep Learning in Genomik, Chemie, Biophysik, Mikroskopie, medizinischer Analyse und der Arzneimittelforschung eingesetzt wird. Das Buch vermittelt Deep-Learning-Grundlagen und führt in die Arbeit mit der Python-Bibliothek DeepChem ein. Sie erfahren, wie Deep Learning z.B. zur Analyse von Mikroskopaufnahmen, für molekulare Daten und bei medizinischen Scans genutzt wird. Abschließend zeigen Bharath Ramsundar und seine Co-Autoren anhand einer Fallstudie Techniken für die Entwicklung neuer Therapeutika, eine der größten interdisziplinären Herausforderungen der Wissenschaft. - Lernen Sie, wie Machine Learning auf molekulare Daten angewendet werden kann - Erfahren Sie, warum Deep Learning ein mächtiges Werkzeug für Genetik und Genomik ist - Setzen Sie Deep Learning ein, um biophysikalische Systeme zu verstehen - Erhalten Sie eine kurze Einführung in Machine Learning mit DeepChem - Nutzen Sie Deep Learning zur Auswertung von Mikroskopaufnahmen - Analysieren Sie medizinische Scans mithilfe von Deep-Learning-Techniken - Erfahren Sie mehr über Variational Autoencoder (VAE) und Generative Adversarial Networks (GANs) - Interpretieren Sie, was Ihr Modell tut und wie es funktioniert 'Ein wertvoller Beitrag für die wissenschaftliche Community.' - Prabhat Teamleader Data and Analytics Services, NERSC, Lawrence Berkeley National Laboratory 'Ein hervorragender High-Level-Überblick, dersowohl Einstiegspunkte in bestimmte Techniken bietet als auch die Erörterung der zugrundeliegenden Wissenschaft.' - C. Titus Brown Associate Professor, University of California, Davis

Bharath Ramsundar ist Mitbegründer und CTO von Computable. Peter Eastman entwickelt Software für rechnergestützte Chemie und Biologie an der Universität Stanford. Pat Walters leitet die Computation& Informatics Group bei Relay Therapeutics. Vijay Pande ist aktiver Teilhaber bei Andreessen Horowitz.

KAPITEL 2


Einführung in Deep Learning


Dieses Kapitel führt Sie in die Grundprinzipien von Deep Learning ein. Sollten Sie bereits über einiges an Erfahrung mit Deep Learning verfügen, können Sie dieses Kapitel auch nur überfliegen und dann zum nächsten gehen. Falls Sie weniger Erfahrung haben, sollten Sie dieses Kapitel sorgfältig lesen, da das darin enthaltene Wissen für das weitere Verständnis des Buchs unentbehrlich ist.

Bei den meisten Aufgabenstellungen, die wir behandeln werden, besteht unsere Arbeit darin, eine mathematische Formel zu erstellen:

y =f(x)

Beachten Sie bitte, dassx undy fett geschrieben sind. Das bedeutet, hierbei handelt es sich um Vektoren. Eine Funktion kann viele Eingabewerte haben, möglicherweise Tausende oder gar Millionen, und viele Ausgabewerte erzeugen. Hier einige Funktionsbeispiele:

  • x enthält die Farben aller Pixel eines Bilds.f(x) ergibt 1, wenn auf dem Bild eine Katze abgebildet ist, und 0, wenn das nicht der Fall ist.
  • Das Gleiche wie oben, außer dassf(x) ein Vektor von Zahlen ist. Das erste Element zeigt an, ob das Bild eine Katze enthält, das zweite, ob es sich um einen Hund handelt, das dritte, ob ein Flugzeug zu sehen ist, und so weiter für Tausende von Objekten.
  • x beinhaltet die DNA-Sequenz eines Chromosoms.y ist ein Vektor, dessen Länge der Anzahl der Basen im Chromosom entspricht. Jedes Element ergibt 1, wenn diese Base Teil einer Region ist, die für ein Protein codiert, und 0, falls nicht.
  • x beschreibt die Struktur eines Moleküls. (Wir besprechen die verschiedenen Darstellungsmöglichkeiten von Molekülen in späteren Kapiteln.)y stellt einen Vektor dar, in dem jedes Element eine physikalische Eigenschaft des Moleküls beschreibt: wie einfach es sich in Wasser auflöst, wie stark es an andere Moleküle bindet usw.

Wie Sie sehen können, kann es sich beif(x) um eine sehr komplizierte Funktion handeln! In der Regel wird ein langer Vektor als Eingabe verwendet, aus dem versucht wird, Informationen zu extrahieren, die nur anhand der eingegebenen Zahlen nicht ersichtlich sind.

Der übliche Ansatz zur Lösung dieser Aufgabenstellung besteht darin, eine Funktion von Hand zu entwerfen. Sie würden damit beginnen, die Aufgabe zu zerlegen. Welche Pixelmuster deuten auf die Anwesenheit einer Katze hin? Welche DNA-Muster neigen dazu, codierende von nicht codierenden Regionen zu unterscheiden? Sie würden Computercode schreiben, um bestimmte Arten von Merkmalen zu erkennen, und dann versuchen, Kombinationen von Merkmalen zu identifizieren, die zuverlässig das beabsichtigte Ergebnis erzeugen. Dieser Ablauf ist langsam und arbeitsaufwendig und hängt stark von den Fachkenntnissen des Auszuführenden ab.

Machine Learning geht ganz anders vor. Anstatt eine Funktion von Hand zu entwerfen, ermöglichen Sie dem Computer, seine eigene Funktion anhand von Daten zu erlernen.