(English version see below)
In den modernen Lebenswissenschaften werden in den letzten Jahren immer
groesser werdende Datensammlungen erzeugt. Die Probleme verschieben sich
dabei von der Datenerzeugung zur Datenanalyse: waren frueher die
biologischen Experimente oder medizinischen Datenerhebungen die langwierigsten Schritte,
sind es heute die Laufzeiten der benutzten Analysealgorithmen.
In diesem Kurs werden wir uns sowohl mit den theoretischen Grundlagen
als auch der praktische Anwendung von aktuellen Techniken zur Modellierung und Analyse
von solchen großen Datensammlungen auseinandersetzen.
In Zusammenarbeit mit dem Forschungscampus MODAL wird es dabei um die
Bearbeitung eines fiktiven, aber realitaetsnahen Projektes gehen, in dem
viele Aspekte einer modernen Analysepipeline betrachtet und praktisch
erarbeitet werden.
Nach Besuch dieses Kurses sollen die Studenten in der Lage sein:
Masterstudenten der Mathematik, Bioinformatik und verwandter Disziplinen
Grundlegende Erfahrungen in Statistik und gute Kenntnisse in mindestens einer Programmier- bzw. Skriptsprache (z.B. Java, C, Python, Matlab, R).
-----------
During this course, students engage in the entire process of solving a real-world data science project: from collecting and processing actual data, to applying a suitable and appropriate analytic method to the problem. Both the problem statements for the project assignments and the datasets orginate from the life-science domain, similar to those that students might typically encounter within industry or academic research.
Big Data requires the storage, organization, and processing of data at a scale and efficiency that go well beyond the capabilities of conventional information technologies. In this course, we will study the state of the art in big data management: we will learn about algorithms, techniques and tools needed to support big data processing.
The projects we will be dealing with will require large data analysis and how it can be implemented on Big Data platforms. There will be programming assignments that will provide students with hands-on experience on building data-intensive applications using existing Big Data platforms.