Machine Learning – Die Referenz

Das praktische Nachschlagewerk zum Machine Learning mit strukturierten Daten

Detalles Bibliográficos
Otros Autores:	Harrison, Matt, author (author), Lotze, Thomas (-)
Formato:	Libro electrónico
Idioma:	Inglés
Publicado:	dpunkt 2020.
Edición:	1st edition
Materias:	Künstliche Intelligenz Algorithmen KI Neural Networks Artificial Intelligence NumPy Data Science Maschinelles Lernen überwachtes Lernen Pandas scikit-learn AI Statistische Datenanalyse Supervised Learning
Ver en Biblioteca Universitat Ramon Llull:	https://discovery.url.edu/permalink/34CSUC_URL/1im36ta/alma991009630802006719

Tabla de Contenidos:

Intro
Inhalt
Vorwort
Kapitel 1: Einleitung
Verwendete Bibliotheken
Installation mit pip
Installation mit conda
Kapitel 2: Der Vorgang des maschinellen Lernens: Überblick
Kapitel 3: Klassifikation Schritt für Schritt: der Titanic-Datensatz
Vorschlag für das Projektlayout
Importe
Eine Frage stellen
Begriffe und Bezeichnungen für die Daten
Daten sammeln
Daten säubern
Merkmale gewinnen
Stichproben von Daten nehmen
Daten auffüllen
Daten normalisieren
Refaktorieren
Vergleichsmodell
Verschiedene Algorithmenfamilien
Stacking
Ein Modell erstellen
Das Modell auswerten
Das Modell optimieren
Wahrheitsmatrix
Grenzwertoptimierungskurve (ROC-Kurve)
Trainingskurve
Das Modell einsetzen
Kapitel 4: Fehlende Daten
Fehlende Daten untersuchen
Fehlende Daten entfernen
Daten auffüllen
Indikatorspalten hinzufügen
Kapitel 5: Daten säubern
Spaltennamen
Fehlende Werte ersetzen
Kapitel 6: Erkunden
Datenmenge
Zusammenfassende Statistiken
Histogramm
Streudiagramm
Kombidiagramm
Paarmatrix
Kasten- und Violinendiagramme
Vergleich zweier Ordinalwerte
Korrelation
RadViz
Parallele Koordinaten
Kapitel 7: Daten vorverarbeiten
Standardisieren
Den Wertebereich skalieren
Dummy-Variablen
Markierungen codieren
Häufigkeitscodierung
Kategorien aus Text gewinnen
Weitere kategoriale Codierungen
Datumsmerkmale konstruieren
Ein Merkmal col_na hinzufügen
Manuelle Merkmalskonstruktion
Kapitel 8: Merkmalsauswahl
Kollineare Spalten
Lasso-Regression
Rekursiver Ausschluss von Merkmalen
Wechselseitige Aussagekraft
Hauptkomponentenverfahren
Merkmalsgewichtung
Kapitel 9: Unausgeglichene Klassen
Eine andere Metrik anwenden
Baumalgorithmen und Ensembles
Modelle mit Strafpunkten.
Minderheiten erweitern
Minderheitsdaten erzeugen
Mehrheiten verkleinern
Erweitern und danach verkleinern
Kapitel 10: Klassifikation
Logistische Regression
Naiver Bayes-Klassifikator
Supportvektormaschine
K-nächste Nachbarn
Entscheidungsbaum
Random-Forest
XGBoost
Gradientenverstärkung mit LightGBM
TPOT
Kapitel 11: Modellauswahl
Validierungskurve
Lernkurve
Kapitel 12: Metriken und Beurteilung der Klassifikation
Wahrheitsmatrix
Metriken
Vertrauenswahrscheinlichkeit
Trefferquote
Genauigkeit
F1 (F-Maß)
Klassifikationstafel
ROC-Kurve (Grenzwertoptimierungskurve)
Kurve der Genauigkeit über der Trefferquote
Kumulatives Gain-Diagramm
Lift-Kurve
Ausgeglichenheit der Klassen
Klassenvorhersagefehler
Ansprechschwelle
Kapitel 13: Interpretation von Modellen
Regressionskoeffizienten
Merkmalsgewichtung
LIME
Interpretation von Bäumen
Partielle Abhängigkeitsdiagramme
Stellvertretermodelle
Shapley
Kapitel 14: Regression
Vergleichsmodell
Lineare Regression
Supportvektormaschinen (SVM)
K-nächste Nachbarn
Entscheidungsbaum
Random-Forest
XGBoost-Regression
Regression mit LightGBM
Kapitel 15: Metriken und Bewertung der Regression
Metriken
Residuendiagramm
Varianzheterogenität
Normalverteilte Residuen
Diagramm des Vorhersagefehlers
Kapitel 16: Interpretation von Regressionsmodellen
Shapley
Kapitel 17: Dimensionsreduktion
Hauptkomponentenverfahren (PCA)
UMAP
t-SNE
PHATE
Kapitel 18: Clustern
K-Means-Algorithmus
Agglomeratives (hierarchisches) Clustern
Cluster verstehen
Kapitel 19: Pipelines
Klassifikationspipeline
Regressionspipeline
Pipeline für das Hauptkomponentenverfahren
Index.

Machine Learning – Die Referenz

Ejemplares similares