Bis 30.9.2024 gibt es mit dem Code EBOOK20 20% Rabatt auf alle Stämpfli E-Books. Einfach den Rabattcode an der Kasse im entsprechenden Feld eingeben.
Fokusthemen
Publikationen
Services
Autorinnen/Autoren
Verlag
Shop
LEXIA
Zeitschriften
SachbuchLOKISemaphor

Data Science Training - Supervised Learning

Ein praktischer Einstieg ins überwachte maschinelle Lernen

Inhalt

Dieses Lehrbuch erklärt auf narrative und direkte Weise die wichtigen Zusammenhänge zwischen Data Science, Künstlicher Intelligenz und anderen Disziplinen und Domänen wie Datenschutz und Ethik, mit Fokus auf überwachtes Lernen (Supervised Learning).
Wir begleiten Anna und Karl während ihrer Traineephase in einer internationalen Versicherung. Schritt für Schritt reifen sie zu Data Scientists, indem sie sich intensiv mit der Titanic-Katastrophe auseinandersetzen. Anna kann Python programmieren, während Karl ein grafisches Werkzeug (KNIME Analytics Platform) benutzt. Bei ihren Untersuchungen stoßen sie auf interessante Fakten und Mythen. Mit Unterstützung von Max und Sophia verarbeiten sie historische Daten, um Vorhersagen zu erstellen (Predictive Analytics). Dabei benutzen sie Methoden und Algorithmen des maschinellen Lernens.
Begleitende Zusatzmaterialien (KNIME Workflows, Jupyter Notebooks, Erklärvideos) stehen den Lernenden online zur Verfügung. Und wenn in diesem Buch Anna und Karl sich auf Themen des überwachten Lernens konzentrieren, werden wir künftig mit ihnen noch weitere Gebiete der Data Science entdecken.

Der Inhalt
  • Einführung, Datenschutz vs. Datensicherheit, Datenethik, Datenformate, Skalenniveaus, Datenqualität, Explorative Datenanalyse, CRISP-DM
  • Klassifikation, k-Nearest Neighbor, Partitionierung & Sampling, Kreuzvalidierung, Feature Engineering, Overfitting, Gütemaße, Konfusionsmatrix, ROC, AURC
  • Naïve Bayes, Entscheidungsbäume, Pruning, Neuronale Netze, Multilayer Perzeptron, Support Vector Machine, Kernel-Trick, Logistische Regression, Regularisierung, Bias Variance Tradeoff, Ensemble Learning, Random Forest, Gradient Boosted Trees
  • Regression vs. Korrelation, Methode der kleinsten Quadrate, Bestimmtheitsmaß, Fehlermaße, Lineare und polynomiale Regression, T-Test, Ridge, LASSO, Elastic-Net
  • Mehrklassen-Klassifikation, Mikro- und Makro-Mittelwertbildung, Kreuzentropie, ungleiche Verteilungen, Equal Size Sampling, Bootstrapping, SMOTE
  • Feature Selection, Genetische Algorithmen, Hyperparameteroptimierung

Der Autor
Stefan Selle ist seit 2007 Professor für Wirtschaftsinformatik an der Hochschule für Technik und Wirtschaft des Saarlandes und lehrt dort Daten- und Geschäftsprozessmanagement, Digitale Transformation, Software Engineering, Data Science und Künstliche Intelligenz.

Bibliografische Angaben

November 2024, ca. 597 Seiten, Deutsch
Vieweg + Teubner
978-3-662-67959-3

Inhaltsverzeichnis

Schlagworte

Weitere Titel zum Thema