Seminar: Seminar.EIM: Data Mining: Grundlagen, Algorithmen und Datenstrukturen - Details

Seminar: Seminar.EIM: Data Mining: Grundlagen, Algorithmen und Datenstrukturen - Details

Sie sind nicht in Stud.IP angemeldet.

Allgemeine Informationen

Veranstaltungsname Seminar: Seminar.EIM: Data Mining: Grundlagen, Algorithmen und Datenstrukturen
Semester WiSe 18/19
Aktuelle Anzahl der Teilnehmenden 13
maximale Teilnehmendenanzahl 12
Wartelisteneinträge 1
Heimat-Einrichtung Elektrotechnik, Informatik und Mathematik
beteiligte Einrichtungen E-13 Eingebettete Systeme
Veranstaltungstyp Seminar in der Kategorie Lehre
Vorbesprechung Donnerstag, 25.10.2018 09:00 - 10:00
Erster Termin Donnerstag, 25.10.2018 09:00 - 10:00, Ort: (E3.032)

Themen

Übung: Daten visualisieren, Statistische Grundlagen, Überwachte Verfahren, Unüberwachte Verfahren, Datenbanken

Räume und Zeiten

(E3.032)
Donnerstag, 25.10.2018 09:00 - 10:00
Donnerstag, 08.11.2018, Donnerstag, 22.11.2018, Donnerstag, 13.12.2018, Donnerstag, 10.01.2019, Donnerstag, 17.01.2019 09:45 - 11:15

Kommentar/Beschreibung

Der Trend geht seit Jahren in Richtung "Big Data" - das Analysieren und Generieren von Wissen aus großen Datensätzen. Data Science ist eine eigenständige Disziplin und nutzt ähnliche Grundlagen, wie sie auch im Bereich Machine Learning benötigt werden. Im Seminar sollen numerische Algorithmen zur Erzeugung von Daten und zur Optimierung, sowie  statistische Methoden zur Datenanalyse zur Verarbeitung großer Datenmengen diskutiert werden. Die Teilnehmer erlangen einen ersten Überblick über die Datenwissenschaft und grundlegende Algorithmen. Zu jedem Seminarthema wird Literatur ausgegeben, anhand deren ein 20-minütiger Vortrag und eine schriftliche Ausarbeitung erstellt wird. Jedes Seminarthema hat neben der theoretischen Aufbereitung auch eine praktische Demonstration zum Gegenstand, die Möglichkeiten und Grenzen der jeweiligen Verfahren verdeutlicht. Max. Teilnehmer: 12 Sprache: deutsch, wahlweise englisch Termine: 4 Termine á 1,5 Std. (jeweils 3 Vorträge 20 min + Diskussion 10 min) Themen: 0. F. Bahnsen - Daten visualisieren mit Python (Übung für Interessierte 1.5 Stunden) 1. Zufall beschreiben, erzeugen und prüfen [1,5 jeweils Kap. 4] ◦ Definitionen ◦ Spektraltest ◦ Zufallszahlen generieren ◦ Cholesky-Zerlegung 2. Daten und Relationen [2 Kap. 2] (18 Seiten) ◦ Maßskalen ◦ Relationen ◦ Ähnlich und Unähnlichkeit ◦ Sequenzen und Abtastung 3. Datenvorverarbeitung & Korrelation [2 Kap. 3 & 5] (21 Seiten) ◦ Fehler ◦ Rauschen & Filter ◦ Transformation & Integration ◦ Korrelatoren (nicht in der Quelle) 4. Datenvisualisierung [2 Kap. 4] (22 Seiten) ◦ Hauptkomponenten Analyse (PCA) ◦ Spektralanalyse ◦ Projektionen 5. Regression & Prognose [2 Kap. 6-7] (21 Seiten) ◦ Neuronale Netze ◦ Kreuzvalidierung ◦ Endliche Zustandsautomaten ◦ Autoregressive Modelle 6. Klassifikation [2 Kap. 8] (19 Seiten) ◦ Klassifikationskriterien ◦ Diskriminanzanalyse ◦ knn-Algorithmus ◦ Entscheidungsbäume 7. Random Forest [3,4] ◦ Algorithmus ◦ Anwendung ◦ Beispiel 8. Clustering [2 Kap. 9] (22 Seiten) ◦ Selbstorganisierende Karten ◦ Partitionen ◦ verschiedene Clustering-Methoden 9. Optimierung I [1 Kap. 10.1-10.8, 5 Kap. 8] ◦ Nebenbendingungen ◦ Hesse-Matrix ◦ Simplex ◦ Numerische Genauigkeigt 10. Optimierung II [1 Kap. 10.9-10.18, 5 Kap. 8, 6] ◦ Lernrate ◦ Marquardt-Algorithmus ◦ Backpropagation 11. Entfaltung [5 Kap. 11] (14 Seiten) ◦ Problemdarstellung ◦ Regularisierung ◦ Entfaltung periodischer Verteilungen 12. Datenbanken [Ref fehlt noch] ◦ Relationale Datenbanken ◦ SQL ◦ Indizierung ◦ Suchalgorithmen Referenzen: [1] S. Brandt, Datenanalyse für Naturwissenschaftler und Ingenieure, Springer, 2005. (https://www.springer.com/de/book/9783642376634) [2] T. A. Runkler, Data Mining - Methoden und Algorithmen intelligenter Datenanalyse, Springer, 2015. (https://link.springer.com/book/10.1007%2F978-3-8348-2171-3) [3] T. K. Ho, Random Decision Forests, Proceedings of the 3rd International Conference on Document Analysis and Recognition, Montreal, 1995. (https://web.archive.org/web/20160417030218/http://ect.bell-labs.com/who/tkh/publications/papers/odt.pdf) [4] N Donges, The Random Forest Algorithm, Towards Data Science, 2018. (https://towardsdatascience.com/the-random-forest-algorithm-d457d499ffcd) [5] V. Blobel und E. Lohrmann, Statistische und numerische Methoden der Datenanalyse, Teubner, 1998. (http://www.desy.de/~blobel/eBuch.pdf) [6] G. Goh und U. C. Davis, Why Momentum Really Works, Distill, 2017. (https://distill.pub/2017/momentum/)

Anmelderegeln

Diese Veranstaltung gehört zum Anmeldeset "Seminare.EIM-WiSe-18/19".
Für fachbezogene Fragen wenden Sie sich bitte an den jeweiligen Dozenten des Seminars, nicht aber an Frau Deicke oder Frau Herder. Für Informationen zu den einzelnen Seminaren, gehen Sie bitte auf die Veranstaltung "Seminare.EIM-Übersicht-18/19" unter: https://e-learning.tu-harburg.de/studip/dispatch.php/course/details/?send_from_search=1&send_from_search_page=%2Fstudip%2Fdispatch.php%2Fsearch%2Fcourses%3Fkeep_result_set%3D1&sem_id=48721a878fac507622b2f56a9d7af727
Folgende Regeln gelten für die Anmeldung:
  • Die Anmeldung ist möglich von 07.10.2018, 00:00 bis 14.10.2018, 23:59.
  • Es wird eine festgelegte Anzahl von Plätzen in den Veranstaltungen verteilt.
    Die Plätze werden in der Reihenfolge der Anmeldung vergeben.
  • Diese Regel gilt von 07.10.2018 00:00 bis 14.10.2018 00:00.
    Die Anmeldung zu maximal 3 Veranstaltungen des Anmeldesets ist erlaubt.
Veranstaltungszuordnung:

Anmeldemodus

Die Anmeldung ist verbindlich, Teilnehmende können sich nicht selbst austragen.