ViRZ-ITSH - Virtualisiertes Datacenter der Hochschulen Schleswig-Holsteins auf zwei Standorten

Beteiligte Universitäten: Christian-Albrechts-Universität zu Kiel, Universität zu Lübeck für die Hochschulen Schleswig-Holsteins im Rahmen der ITSH-edu.

Beschreibung des Vorhabens

Art des Vorhabens

Unter dem Titel „Virtualisiertes Datacenter der Hochschulen Schleswig-Holsteins auf zwei Standorten“ erneuern und erweitern die Rechenzentren der Antragspartner Christian-Albrechts-Universität zu Kiel (CAU) und Universität zu Lübeck (UzL) ihre digitale Infrastruk-tur, um im Rahmen von ITSH-edu ein zukunftsfähiges, sicheres und flexibles Ökosystem zu schaffen, das im Verbund mit den übrigen Hochschulen Schleswig-Holsteins erlaubt, für und gemeinsam mit allen Hochschulen des Landes kollaborative digitale Dienstangebote für For-schung, Lehre und Verwaltung zu schaffen. Neben den Hauptpartnern CAU und UzL sind insofern die Europa-Universität Flensburg, die Fachhochschule Kiel, die Fachhochschule Westküste, die Fachhochschule für Verwaltung und Dienstleistung in Schleswig-Holstein, die Hochschule Flensburg, die Musikhochschule Lübeck, die Muthesius Kunsthochschule und die Technische Hochschule Lübeck assoziierte Partner dieses Antrages.

Beantragt werden IT-Infrastrukturen (Server, Speicher, Netzinfrastruktur, Peripherie, Soft-ware) an den Standorten CAU und UzL für den Aufbau einer virtualisierten Plattform zur Nutzung durch alle o.g. Hochschulen (1) für den Aufbau und Betrieb zentraler Services in kollaborativer Form, (2) als Entwicklungsmöglichkeit redundanzfähiger, lokal individueller Dienste je Hochschule im Sinne einer Plattform-as-a-Service (PaaS), und (3) für die Flexibili-tät in der Service-Skalierung pro Hochschule durch niederschwellige Schaffung von Aus-weichkapazitäten bei Überlastung der lokalen IT-Infrastruktur.

Herleitung aus dem bestehenden Kontext

ITSH-edu, die Arbeitsgemeinschaft der IT-Verantwortlichen der Hochschulen und wissen-schaftlichen Einrichtungen in Schleswig-Holstein, erarbeitet in bereits langjähriger Zusam-menarbeit gemeinsame Strategien und Lösungen für die zielgerichtete Entwicklung der Kommunikations- und Informationsverarbeitung der Hochschulen und wissenschaftlichen Einrichtungen in Schleswig-Holstein (www.itsh-edu.de). Mit Mittelzuweisungen in 03/2019 und 08/2020 hat das Ministerium für Bildung, Wissenschaft und Kultur Schleswig-Holsteins im Rahmen des Projektes „Landesweite IT-Kooperation für Forschung und Lehre“ den Grundstein für den Aufbau einer gemeinsamen, digitalen Infrastruktur für die Hochschulen des Landes gelegt. Zu nennen sind in diesem Kontext die in Umsetzung befindlichen Teilpro-jekte SH Forschungsnetz und SH IdM zur Schaffung der Daten-Transport- und Nutzer-Authentifizierungsschicht, sowie die beiden Konzeptstudien SH Co-Lokation und SH Cloud, die mit Ist- und Bedarfs-Analysen die Planungsgrundlage für gemeinsame zentrale Infra-strukturen und kollaborativ betriebene Cloud-Dienste bilden.

Der vorliegende Antrag stellt die ideale Ergänzung für die Umsetzung der Konzeptstudien SH Co-Lokation und SH Cloud dar. Zwar wird über o.g. Mittelzuweisung des Ministeriums auch eine Anschubfinanzierung für die Umsetzung kollaborativer Dienste geleistet, für ernsthafte Skalierung über alle Landeshochschulen wird als Basis jedoch eine digitale Infrastruktur in Form von hunderten virtueller Server und Speicherkapazitäten im Petabyte-Maßstab benötigt.

Zeitpunkt für die Umsetzung

Im März 2020 mussten die Hochschulen ihren Betrieb pandemiebedingt quasi über Nacht fast vollständig auf Homeoffice und online-Lehre umstellen. Dafür haben alle Hochschul-Rechenzentren unter erheblichem Zeitdruck abseits ihrer eigentlichen Planungen individuelle Dienste ausgebaut und neue Dienste implementiert. Hierbei wurden die Grenzen der vorhan-denen Personal- und IT-Kapazitäten teilweise deutlich überschritten, und es ist nun dringend erforderlich, die fehlenden Ressourcen zu ergänzen und betriebssicher und nachhaltig abzu-sichern.

Die Corona-Pandemie hat die Digitalisierung in Forschung, Lehre und Verwaltung zwar nicht ausgelöst, aber erheblich beschleunigt. Damit wurde die Erkenntnis einer notwendigen Flexi-bilisierung und Zusammenarbeit der Hochschul-Rechenzentren im Sinne einer Beschleuni-gung der Reaktionen auf Anforderungen der Nutzerschaft und Gegebenheiten von außen eindrucksvoll, wenngleich in unangenehmer Zwangssituation bestätigt. Wie bspw. der DFN e.V., ZKI, DINI zeigen, hat die hochschulübergreifende Zusammenarbeit bereits eine langjäh-rige Tradition, sie hat aber gerade in den letzten Jahren durch die explizite Förderung von Projekten für den Aufbau kollaborativer Dienste in diversen Bundesländern eine ganz neue Dynamik erhalten. Auch Schleswig-Holstein ist hierfür durch die langjährige Zusammenarbeit der ITSH-edu organisatorisch hervorragend aufgestellt. Der Zeitpunkt ist ideal, auf der Basis der Konzeptstudien die dringend notwendige digitale Basis-Infrastruktur zu schaffen und so die hochschulübergreifende Kollaboration in der Service-Erbringung zu verstärken und nach-haltig abzusichern.

Gegenstand der Finanzierung

Gegenstand der Finanzierung sind die im Folgenden beschriebenen digitalen Infrastruktur-komponenten für den Aufbau einer virtualisierten Plattform an den Standorten CAU und UzL. Diese beantragten Komponenten sind als Funktionsblöcke in Abbildung 1 farbig markiert. Die jeweiligen Beschaffungen erfolgen unter den Gesichtspunkt der Betriebswirtschaftlichkeit und Nachhaltigkeit als Erweiterung oder Ersatz von IT-Infrastrukturkomponenten der jeweili-gen Einrichtung. Grundsätzlich sollen diese einen flexiblen Einsatz auch bei wechselndem Anforderungen ermöglichen. Alle Komponenten sind individuell und modular nach Bedarf erweiterbar und können an ein sich änderndes Nutzungsverhalten angepasst werden.

Abbildung 1. Architektur des Virtualisierten Datacenter der Hochschulen Schleswig-Holsteins auf zwei Standorten. Antragsgegenstand hier sind die farbig markierten Funktionsblöcke.

Virtualisierungsknoten (Server)

Ein wesentlicher Bestandteil einer flexiblen Virtualisierungsplattform sind die eingesetzten Serverkomponenten. Neben der reinen Prozessorleistung und Hauptspeicher-Kapazität muss bei der Beschaffung auch die notwendige Software-Lizensierung an den Standorten berück-sichtigt werden. Je Standort wird ein Cluster aus mehreren Servern gebildet. Dies ermöglicht die erforderliche Skalierung in der benötigten Leistung sowie eine effiziente Absicherung ge-gen den Ausfall einer einzelnen lokalen Komponente. Auf diesen Servern wird nach den ent-sprechend gültigen Lizenzierungsmodellen eine Virtualisierungssoftware eingesetzt, auf der Virtuelle Maschinen für die ITSH-edu Cloud Services betrieben werden.

Performance-Storage

Um die in einer virtualisierten Umgebung nötige I/O-Performance sicherzustellen, wird für den Betrieb der virtuellen Maschinen (VM) ausschließlich Full-Flash-Storage verwendet (Sto-rage Typ 1 in Abbildung 1). Durch De-Duplizierung und Komprimierung lassen sich trotz der höheren Grundkosten dieser Speichertechnologie VMs wirtschaftlich betreiben. Beschafft werden voll redundante Systeme, die den Ausfall einer einzelnen lokalen Komponente ohne Performance Verluste abfangen können. Je Standort sollen ca. 512 TB nutzbare Kapazität beschafft werden.

File-Storage

Der Betrieb großer Datenmengen mit geringeren I/O-Anforderungen lässt sich auf einem Performance-Storage wirtschaftlich nur schwer abbilden. Auch sind die eingesetzten Daten-sicherungskonzepte eher auf kleine und mittlere VMs zugeschnitten. Für den Betrieb von großen CIFS- und NFS-Fileservern wird daher eine Storage-Architektur verwendet, die die nötige Skalierbarkeit mit der gewünschten Datensicherheit verbindet (Storage Typ 2). Zum Einsatz kommen Filer, die die benötigten Datenmengen in einem einheitlichen Namensraum über unterschiedliche Protokolle den Nutzenden zur Verfügung stellen können. Die nötige Datensicherheit verbunden mit einer sehr schnellen Wiederherstellbarkeit im Falle eines Aus-falles einer Komponenten wird über einen Snapshot- und Replikationsmechanismus reali-siert. Je zwei Filer an unterschiedlichen Standorten sichern ihre Daten an den gegenüberlie-genden Standort.

Die Datenhaltung erfolgt auf NL-SATA-Platten hoher Kapazität. Um die benötigte Perfor-mance zu realisieren, verfügen die Filer über einen entsprechend großen SSD-Cache,  der die Daten für einen schnellen Zugriff zwischenlagert.

Pro Standort wird etwa 1 TB nutzbarer Kapazität für die Bereitstellung der Fileservices und die Sicherung des jeweils anderen Filers beschafft.

Archiv-Storage

Die Bereitstellung und Absicherung sehr großer Datenmengen ist mit den klassischen Tech-nologien nur sehr schwer darstellbar. Die Bereitstellung des Archivbereiches erfolgt daher über einen S3-Speicher, der die Daten redundant auf die beiden Standorte verteilt. (Storage Typ 3). Durch die Verwendung von Erasure-Coding lassen sich die gespeicherten Daten effi-zient über mehrere Standorte sichern. Das S3-Protokoll ermöglicht die flexible Anbindung unterschiedlichster Dienste. Die Daten werden auf NL-SATA-Platten sehr hoher Kapazität gelagert.

Über beide Standorte verteilt sollen ca. 21 PB nutzbare Kapazität bereitgestellt werden.

Rack-Space

Pro Standort sollen je zehn Racks inklusive Stromverteiler- und Netzwerkkomponenten be-schafft werden. Die räumliche Kapazität hierfür ist an beiden Standorten vorhanden. An bei-den Standorten werden Racks mit vollständig ausgestatteten Stromverteilern (PDUs), redun-danten Datennetzverteilern und Monitoring-Systemen sowie mit passiven Rückkühltüren verwendet, die derzeit energetisch als state-of-the-art gelten. Angeschlossen an die jeweils vorhandenen, zentralen Energieversorgungs- und Kühlungsinfrastrukturen nehmen diese die hier beantragten IT-Komponenten auf, auf denen gemäß Abbildung 1 die SH Cloud-Services implementiert werden. Darüber hinaus dient ein Teil dieser Racks für die Aufnahme individu-eller Hardware- und Software-Komponenten einzelner Hochschulen nach dem SH Co-Lokations-Modell für individuell betriebene Hochschul-Services.
 

Ziele des Projektes

Ziel des Projektes ist der Aufbau einer digitalen Infrastruktur an den Standorten CAU und UzL zur Nutzung durch alle Hochschulen Schleswig-Holsteins. Diese erlaubt als Basisinfra-struktur im Anschluss

  1. auf einem 2-Standortekonzept zentrale, betriebssichere Dienste für alle Hochschulen des Landes zu entwickeln und zu betreiben (zentrales Cloud Modell),
  2. einzelnen Hochschulen je nach Bedarf individuelle Dienste durch Einbeziehung eines zweiten, räumlich entfernten Standortes redundanzfähig auszubauen oder zu skalie-ren (Plattform-as-a-Service, PaaS, oder Co-Lokation).

Bezug zu itsh-edu

Dieser Antrag ist ein abgestimmtes Konzept innerhalb der ITSH-edu. Mit diesem Projekt soll die digitale Basisinfrastruktur für die Umsetzung kollaborativer Dienste entlang der ITSH-edu Konzeptstudien SH Co-Lokation und SH Cloud geschaffen werden. Insofern fügt sich die hier beantragte Infrastruktur nahtlos in die bereits bewilligten Teilprojekte für den Aufbau der Kommunikationsnetze unterhalb sowie für die Service-Entwicklung auf dieser Basisinfra-struktur ein.

Zukunftsfähigkeit und Flexibilität der IT-Infrastruktur an Hochschulen

Die gegenwärtig zu beobachtende, erhebliche Beschleunigung der Anforderungen im Rah-men der Digitalisierung von Forschung, Lehre und Verwaltung erfordert zeitgemäße Reakti-onsgeschwindigkeiten seitens der IT. Virtualisierung der IT-Infrastruktur ist unerlässlicher Teil einer adäquaten Antwort auf diese Beschleunigung. Virtuelle Netze, Server und Speichersys-teme auf existierender Hardware erlauben die Schaffung von Betriebsumgebungen für neue und die Skalierung existierender Dienste über zentrales Monitoring und effiziente Ressour-censteuerung auf Knopfdruck (Server & Storage on demand). Hardware kann bei Bedarf ohne Unterbrechung der Dienste erweitert oder ersetzt werden, und Dienste können mit ihrer kompletten virtuellen Umgebung praktisch unterbrechungsfrei von einem Hardware-Standort zu einem anderen verschoben werden. Perspektivisch können sowohl die Dienste als auch die Virtualisierungsinfrastruktur selbst entlang einer Open Source Strategie des Landes wei-terentwickelt werden.

Nachhaltige und effiziente IT-Infrastruktur

Die hier beantragte, digitale Infrastruktur wird in die vorhandenen bzw. ohnehin geplanten RZ-Infrastrukturen an zwei Partnerstandorten integriert. Neubauten oder Erweiterungen für Raum, Strom oder Klimatisierung sind hierfür insofern nicht notwendig. Die CAU hat in 2016 ihr Rechenzentrum auf der Basis einer freien Kühlung saniert und hierfür den dritten Platz des Deutschen Rechenzentrumspreises 2017 in der Kategorie 6, Energieeffizienzsteigerung durch Umbau in einem Bestandsrechenzentrum, erhalten. Die UzL hat bereits ihre vorhan-den Rechenzentrumsräume nach den neusten technischen Möglichkeiten errichtet. Hierbei wurden energieeffiziente Lösungen verwendet, wie z.B. integrierte Rack-Kühlungen statt Raumkühlung sowie der Einsatz von passiven Kühltüren an den Racks, welche an sich keine Verschleißteile mehr aufweisen.

Hierbei wird auch der Tatsache Rechnung getragen, dass die jeweils speziellen, hochschul-spezifischen Anforderungen in den Rechenzentren vor Ort betrieben werden. Durch die Kon-zentration der Redundanzrechenzentren auf zwei zentrale Standorte kann generell ressour-censchonender und energieeffizienter Betrieb gewährleistet werden, welcher dann auch bes-ser skaliert werden kann als eine große Zahl verteilter Anlagen jeweils an den einzelnen Hochschulstandorten. Dies gilt umso mehr für das hier beantragte Virtualisierungskonzept. Gerade aufgrund ihrer Nachhaltigkeit, Flexibilität und Energie- und Betriebseffizienz hat sich die Virtualisierung der IT in den letzten Jahren überall in der Welt durchgesetzt. Statt die Dienste auf vielen einzelnen und nur teilweise ausgelasteten Hardware-Systemen aufzubau-en, kann die gleiche Dienstqualität und -Menge oberhalb einer Software-Schicht auf nur we-nigen, gut ausgelasteten Hardware-Systemen betrieben werden.

Verbesserungen der IT- und Datensicherheit

Wie der kürzliche Brand des OVHcloud-Datenzentrums in Straßbourg gezeigt hat, hat ein derartiges Katastrophenszenario verheerenden Folgen für die Wirtschaft. Viele Firmen haben aus Kostengründen ihre Daten und Dienste nicht mit einem Backup abgesichert und stehen vor einem Totalverlust. Das hier vorgeschlagene Redundanzkonzept auf zwei räumlich ent-fernten Standorten kann per se die Betriebs-, Informations- und Datensicherheit der Hoch-schulen in Schleswig-Holstein erhöhen. Jede Hochschule erhält damit die Möglichkeit, ihr Datenbackup in einem räumlich getrennten Standort zu organisieren, Kiel und Lübeck jeweils gegenseitig. Virtuelle Server können sehr einfach geklont werden, um sie bei größeren loka-len Ausfällen am entfernten Standort schnell wieder in Betrieb zu nehmen. Gerade Backup- und Archiv-Konzepte können gezielt mit bzw. für eingeschränkte Rechtekonzepte und -Zugriffsmöglichkeiten auf einem „Hintergrundstandort“ entwickelt werden, und bieten damit eine höhere Sicherheit der Bestandsdaten. Besonders wertvolle Archivdaten können auf zwei Standorte gespiegelt werden. Darüber hinaus sind in dem Konzept lokaler, selbstbetriebener Datacenter nur Auftragsverarbeitungen innerhalb Schleswig-Holsteins erforderlich. Insofern sind keine komplexen Vertragswerke mit ausländischen Firmen notwendig, und es gibt keine potentiellen Konflikte mit der EU-DSGVO.

Entwicklung innovativer Lehr- und Lernmethoden

Ein virtuelles Datacenter auf zwei Standorten kann zunächst nur einen sekundären Beitrag zu innovativen Lehr- / Lernmethoden liefern. Primäre Beiträge können jedoch durch diejeni-gen Services geleistet werden, die auf dieser digitalen Basisinfrastruktur durch Umsetzung von (weiteren) ITSH-edu- und anderen Hochschul-Projekten ermöglicht werden. Beispiele hierfür wären etwa die zur Umsetzung in ITSH-edu diskutierten SH Cloud-Dienste mit plugins für Chat, Videokonferenzen, gemeinsame Dokumentenbearbeitung etc. als Arbeitsplattform auch für Studierende (Lehr-/Lerngruppen), Cloud-basierte Lernplattformen, gemeinsame Video-Streaming-Services oder kursspezifisch konfigurierbare, virtuelle Arbeits- und Lehr-plätze für Lehrende, Wissenschaftler*innen und Studierende. Darüber hinaus könnte ein vir-tuelles Datacenter perspektivisch zur Speicherung umfangreicher multimedialer Daten von Hochschul-Bibliotheken des Landes als Forschungs- und Lehrmittelbasis sowie für die Öf-fentlichkeit des Landes genutzt werden.

Leistungsfähige Forschungsdateninfrastruktur

Wesentliches Ziel des Forschungsdatenmanagement (FDM) besteht in der Umsetzung des FAIR Prinzips, Forschungsdaten also auffindbar, zugreifbar, interoperabel und für die lang-fristige Nachnutzung verfügbar zu machen. Dazu muss der komplette Forschungsprozess von der Datenentstehung bis zur Veröffentlichung begleitet werden. Die dafür notwendige Infrastruktur muss also einerseits Schutz der neuesten Erkenntnisse und Ideen vor unkontrol-lierbarem Verlust, andererseits aber auch Raum für die Bereitstellung der Forschungsergeb-nisse an Wissenschaft und Öffentlichkeit für Transparenz, Diskurs und Nachnutzung bieten.
Die CAU ist im Bereich des Forschungsdatenmanagements bereits seit mehreren Jahren aktiv. Gemeinsam mit dem Leibnitz-Informationszentrum Wirtschaft, ZBW, setzt sich die CAU für eine Vernetzung auf dem Gebiet des Forschungsdatenmanagements in Schleswig-Holstein sowie überregional in den FDM-Landesinitiativen ein. Lokal hat die CAU ein Kompe-tenzteam aus Personen des Rechenzentrums, der Universitätsbibliothek und des Service-zentrums Forschung, Strategie und integrativer Transfer zusammengestellt, das FDM-Services für die Wissenschafts-Community entwickelt. Insbesondere entsteht hier ein institu-tionelles Forschungsdatenrepositorium für die sogenannten longtail-Daten inklusive An-schlussfähigkeit an Repositorien der Communities in der Nationalen Forschungsdaten Infra-struktur (NFDI). Das institutionelle Forschungsdatenrepositorium benötigt Ressourcen für die Langzeitverfügbarkeit (mind. 10 Jahre) und Absicherung der Forschungsergebnisse und Me-thodendokumentation. Hierfür ist das Virtualisierte Datacenter auf zwei Standorten ein idea-les Zuhause.