Data Engineering und Big Data
- Fakult?t
Wirtschafts- und Sozialwissenschaften
- Version
Version 10.0 vom 08.02.2019
- Modulkennung
22M0989
- Modulname (englisch)
Data Engineering and Big Data
- Studieng?nge mit diesem Modul
Wirtschaftsinformatik (Master) (M.Sc.)
- Niveaustufe
4
- Kurzbeschreibung
Das Modul vermittelt den Umgang mit strukturierten, semi-strukturierten, polystrukturierten und unstrukturierten Daten durch eine nachhaltige Datenbewirtung sowohl für klassische Anwendungsgebiete als auch für Big Data-Anwendungen, bei denen Volume, Variety und Velocity besondere Relevanz haben.
- Lehrinhalte
- Notwendigkeit und Herausforderungen klassischer Datenbewirtschaftung und Big DataDatenhaltung (Objektrelational und NoSQL)Datenhaltungsarchitekturen (einschl. Replica, Sharding, Scale-out , Scale-up Konzepte)
- Cluster-Datenbanken
- F?derierte Datenbanken
- Parallele und verteilte DatenbankenDatenbewirtschaftungsarchitekturen
- Data Warehousing (einschl. ETL-Prozesse)
- Data Lakes (einschl. ELT-Prozesse)
- Datenbewirtschaftung und Internet of Things / Industrie 4.0
- Datenbewirtschaftung für WearablesDatenintegrationsans?tzeAusgew?hlte Aspekte der Big Data LandscapeAktuelle, etablierte Big Data FrameworksDatenstrommanagementsystemeDatenvorverarbeitung in Datenanalyseprozessen
- Lernergebnisse / Kompetenzziele
Wissensverbreiterung
Studierende, die dieses Modul erfolgreich studiert haben, kennen grundlegende Konzepte und Verfahren zur Datenhaltung, -bewirtschaftung, -integration und -vorverarbeitung, auch unter Berücksichtigung von Big Data. Sie sind in der Lage, Datenbewirtschaftungsarchitekturkonzepte hinsichtlich ihrer Eignung zu bewerten und ausgew?hlte Aufgabenstellungen zu bearbeiten.
Wissensvertiefung
Die Studierenden, die dieses Modul erfolgreich studiert haben, verfügen über detailliertes Wissen zu Aufgaben und M?glichkeiten moderner Datenbewirtschaftungsans?tze. Darüber hinaus verfügen Sie über Spezialwissen hinsichtlich der Verarbeitung von Daten aus verschiedenen Quellen.
K?nnen - instrumentale Kompetenz
Die Studierenden k?nnen die Einführung und den Betrieb (datengetriebener), zeitgem??er und nachhaltiger Datenhaltung begleiten. Sie sind in der Lage, Daten aus vielf?ltigen Quellen zu integrieren und die Daten nachgelagerten Systemen, z.B. der Datenanalyse, integriert, transformiert und ggf. aufgabengerecht bereitzustellen.
K?nnen - kommunikative Kompetenz
Die Studierenden sind in der Lage, gemeinsam mit Dom?nenexperten L?sungsans?tze zu diskutieren. Ihre sozio-kommunikative Kompetenz bef?higt sie, ihre Standpunkte und Erkenntnisse sprachad?quat gegenüber Fach- und Dom?nenexperten zu vertreten und zu begründen.
K?nnen - systemische Kompetenz
Die Studierenden sind in bef?higt, Datenhaltung, -integration und -bereitstellung ganzheitlich zu betrachten, um eine konsistente, effiziente Datenbewirtschaftung zu erm?glichen. Sie sind in der Lage, sich in neue Datenverarbeitungsframeworks selbst?ndig einzuarbeiten, diese auf der Basis der vermittelten Konzepte zu bewerten und ggf. in eine Datenhaltungslandschaft zu integrieren
- Lehr-/Lernmethoden
In seminaristischen Vorlesungen werden die theoretischen Grundlagen vermittelt und in zunehmend komplexeren ?bungen anhand von Fallbeispielen behandelt.
- Empfohlene Vorkenntnisse
(relationale) Datenbanken, Programmierkenntnisse sind von Vorteil
- Modulpromotor
Tapken, Heiko
- Lehrende
Tapken, Heiko
- Leistungspunkte
5
- Lehr-/Lernkonzept
Workload Dozentengebunden Std. Workload Lehrtyp 24 Vorlesungen 7 Teletutorien Workload Dozentenungebunden Std. Workload Lehrtyp 50 Veranstaltungsvor-/-nachbereitung 69 ?bungen
- Literatur
Big Data in der Praxis: L?sungen mit Hadoop, Spark, HBase und Hive. Daten speichern, aufbereiten, visualisieren, Jonas Freiknecht, 2018
NoSQL: Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken, Stefan Edlich und Achim Friedland, 2011
Data Mining: Concepts and Techniques, 3rd Edition, Jiawei Han, Micheline Kamber, Jian Pei, 2011
Big Data: Entwicklung und Programmierung von Systemen für gro?e Datenmengen und Einsatz der Lambda-Architektur, Nathan Marz und James Warren, 2016
Verteiltes und Paralleles Datenmanagement: Von verteilten Datenbanken zu Big Data und Cloud, Erhard Rahm und Gunter Saake, 2015
- Prüfungsleistung
- Hausarbeit
- Portfolio Prüfung
- Projektbericht, schriftlich
- Bemerkung zur Prüfungsform
Die Portfolio Prüfung umfasst insgesamt 100 Punkte. Sie setzt sich zusammen aus einem Referat (40 Punkte) und einer Hausarbeit (60 Punkte).
- Dauer
1 Semester
- Angebotsfrequenz
Nur Sommersemester
- Lehrsprache
Deutsch