Jupyterhub
Pilotbetrieb
Jupyterhub – wichtigste Fakten
Jupyter Notebooks (jupyter.org) haben sich in vielen wissenschaftlichen Disziplinen etabliert. Einerseits ermöglichen Notebooks einen einfachen Einstieg in die KI-basierte datengetriebene Forschung, andererseits können sie die Reproduzierbarkeit von Forschungsergebnissen erleichtern, indem sie Code, Dokumentation und Ergebnisse in einem ausführbaren Dokument zusammenfassen. Forschungsworkflows werden dadurch transparent, was wiederum zur guten wissenschaftlichen Praxis beiträgt.
Im Rahmen des AI-SKILLS Projektes werden Jupyter Notebooks über einen cloudbasierten sogenannten Jupyterhub serverseitig bereitgestellt. Dieser ermöglicht eine persistente Datenspeicherung und stellt gleichzeitig die notwendige (GPU-)Rechenleistung zur Verfügung. Studierende mit unterschiedlichsten Voraussetzungen und Endgeräten können so ohne zeit- und ressourcenaufwändige lokale Installationen an der Lehre teilnehmen. Die Lehrenden wiederum können sich ganz auf die Vermittlung der verschiedenen Methoden, deren Anwendung und Reflexion konzentrieren. Lern-, Daten- und Rechenressourcen können effizient und flexibel geteilt und genutzt werden.
Anwendungsszenarien
- Die Jupyter Notebooks über den Jupyterhub sind vor allem für didaktische Szenarien ausgelegt.
- Sechs verschiedene Jupyterlab-Umgebungen stehen derzeit zur Auswahl (Python, Spark, R, Tensorflow, eine Umgebung für Natural Language Processing und eine Umgebung mit Cuda-Unterstützung).
- Eigene Docker Images via Gitlab des CMS können prinzipiell eingebunden werden. Bei der Erstellung eines eigenen angepassten Images können Sie sich gern an uns wenden (siehe Service-E-Mail-Adresse unten).
Einschränkungen
- Ein HU-Account wird gegenwärtig vorausgesetzt für die LDAP-Authentifizierung.
- Es sind aktuell nur Übungsszenarien mit bis zu 90 gleichzeitigen Nutzer/innen möglich.
- Für die jeweils gestartete Jupyterlab-Umgebung stehen max. 6 CPUs, 28 GB RAM & 10 GB Speicherplatz zur Verfügung.
- Derzeit stehen nur fünf Server mit GPU-Unterstützung zur Verfügung.
- Die anfallenden Daten werden nach dem Ende des jeweiligen Semesters wieder gelöscht
Software-Konfiguration
Jupyterhub läuft auf einem Kubernetes Cluster innerhalb der HU-Cloud des CMS, auf der Basis von Openstack. Die Anwendung selbst basiert auf dem Zero 2 JupyterHub Project.
Website des Dienstes
Support
jupyterhub-support@hu-berlin.de
E-Mails an die Adresse jupyterhub-support@hu-berlin.de werden mit einem elektronischen Ticketsystem bearbeitet. Bitte beachten Sie den datenschutzrechtlichen Hinweis: https://otrs.hu-berlin.de/hinweis.html