- Für alle Projekte sind grundsätzlich alle Data Science-Phasen vorgesehen:
- Datenaufbereitung und Explorative Datenanalyse, speziell Visualisierung [20%]
- Modellierung (Klassifikation oder Regression) mit zumindest 3 Methoden, inkl. Parameter Tuning und Benchmarking [30%]
- Deployment des besten Modells mittels Webservice (und Webservice Test) [10%]
- Kurzpräsentation des Projekts/der Ergebnisse mittels Dashboards [10%]
- Zwei Extra-Features - zB neue Methoden, interaktive Visualisierungen [20%]
- Dokumentation und Einhaltung der Projekt-Richtlinien [10%]
- Erstellen Sie ein neues Projekt in R-Studio für Ihre Ausarbeitung:
- Verwenden als Projektnamen: Thema_NachnameA_NachnahmeB
- Erstellen Sie im Projekt sinnvolle Subfolder, z.B. /data, /dashboard, /webservice, etc.
- Ihr R-Projekt sollte „self-contained“ sein. Wenn Ihr Projekt in R-Studio geöffnet wird, sollten alle Funktionalitäten verfügbar sein, verwenden Sie daher nur relative Bezüge zu Ihren Dateien und Modellen.
- Das R-Projekt enthält alle Teile Ihrer Ausarbeitung.
- Geben Sie in Moodle eine ZIP Datei mit dem Projektordner ab.
- Dokumentation und Projektausarbeitung
- Die Projektausarbeitung und -dokumentation mittels R-MD Datei(en).
- Knitten Sie die Ihre Projektdokumentation (.Rmd Datei) zu einer PDF Datei.
- Interpretieren Sie den Output Ihrer Analysen!
- Achten Sie darauf, dass Ihr R-Code verständlich und ggf. dokumentiert ist.
- Geben Sie alle nötigen Informationen an, beispielsweise, wie Ihr Webservice gestartet wird und wie es von Ihnen getestet wurde.
- Für einen Dritten, der Ihr Projekt öffnet, sollte es möglich sein, Ihre R-MD Dateien zu knitten, ihr Webservice zu starten, ihr flexdashboard neu zu knitten, etc.
Abgabefrist ist per Deadline: 17.1.2022, 9h00, es gibt keine Mindestpunktezahl.