Softwaredistributionsserver SWD

Werner Steinmann

Der Software Distribution Server der TU Wien (swd.tuwien.ac.at) hat sich wahrscheinlich eher unbemerkt zu einem sehr wichtigen Knoten in der Campus-Software-Verteilung gemausert. In der Nummer 16 dieser Zeitschrift wurden im Juni 1995 durch Georg Gollmann neue Server der Abt. Institutsunterstützung vorgestellt. In der PIPELINE Nummer 17, Oktober 1995, wurde durch Udo Linauer in einem Artikel genauer auf den neuen Campussoftware-Server eingegangen. Seither hat sich natürlich wieder einiges getan und ich möchte aufbauend auf diese vorangegangenen Mitteilungen diese Neuerungen skizzieren, und zwar mehr aus der Sicht der Administration des Softwareservers als in den bisherigen Beiträgen. Der erste oben erwähnte Beitrag gab einen Überblick der Server an der Abteilung Institutsunterstützung, im zweiten wurden die Zugriffsmöglichkeiten dargestellt.

SWD 1995/96

Die Konfigurationen der beiden Softwareserver (swd. tuwien.ac.at und ftp.tuwien.ac.at) waren vor gut einem Jahr noch sehr ähnlich - und in der PIPELINE 16 sind für diese Wahl auch Argumente zu finden; als Beispiel sei die damalige Ausstattung des Servers swd noch einmal angeführt:

SPARCstation 20/502
64 MB Hauptspeicher
2 SCSI Busse
2 Ethernet Interfaces
1 GB Systemplatte
1 SCSI Gehäuse mit
4 GB Campussoftware & Arbeitsbereich
2 GB Microsoft-Distribution
2 GB Microsoft-Dokumentation
1 CD-ROM Toshiba
1 DAT HP-1533
1 ASCII Boot-Terminal (VT220)

SWD 1996/97

Die aktuelle Zustand hat sich mit den dauernd wachsenden Anforderungen an die Software Distribution entsprechend entwickelt. Auf die größten Änderungen, die Übersiedlung einiger Server der Abteilung Institutsunterstützung im Sommer 1996 von der Gußhausstraße ins Freihaus und die Erweiterung des Softwareservers mit einem RAID möchte ich besonders hinweisen.

SPARCstation 20/502
128 MB Hauptspeicher
3 SCSI Busse
2 Ethernet Interfaces
1 GB im Systemgehäuse für Log-File Backup
1 SCSI Gehäuse mit
8 GB User Home & Workspace
8 GB Scratch
1 RAID DEC StorageWorks 410 mit
4 GB Systemplatte gespiegelt, d.h. RAID Level 1
12*4 GB Datenplatten (RAID Level 5/3)
2*4 GB True Hot Spare (8 von 6*4 Disk Slots sind noch frei)
1 CD-ROM Plextor
1 DAT HP-1533
1 ASCII Boot-Terminal (VT520)
1 USV EMERSON Accupower Select

Zielsetzungen

Jede der Änderungen gegenüber dem Stand von 1995 hat mehr oder weniger gravierende Gründe und Auswirkungen und einige davon sollen hier geschildert werden. (Die entsprechende Entwicklung von ftp.tuwien.ac.at ist einem zukünftigen Artikel vorbehalten.)

Die prinzipielle Zielrichtung beim Betreiben des Software Distribution Servers ist Ausfallssicherheit, Stabilität, leichte Wartbarkeit, Erweiterbarkeit u.ä. Hingegen sind z.B. die Performance-Anforderungen bisher keine besondere Herausforderung gewesen; endlose File System Checks, Backup und vor allem Restore von immer mehr Daten, die wachsende Zahl der Zugriffe machen aber auch in dieser Richtung Anstrengungen notwendig, wobei die Memory-Erweiterung um 64 MB sich bereits positiv bemerkbar machte - die Anzahl der gleichzeitig aktiven Clients war gestiegen und die Last konnte damit wieder abgefangen werden.

Auch das RAID mit 6 internen SCSI Bussen und 32 MB Cache auf dem RAID Controller hat sich bei den Plattenzugriffen mit ca. 30 % Zeitersparnis ausgewirkt. Bei RAID Level 5 dürfte da das Cache Memory ordentlich mithelfen.

CD-ROM und Console Terminal

Zuerst ein paar Kleinigkeiten wie der Wechsel des CD-ROM Laufwerkes: Beim Toshiba Laufwerk gab es Schwierigkeiten beim Bootvorgang und so wurde es innerhalb der Abteilung gegen das Plextor Laufwerk getauscht. Inzwischen haben sich die Probleme zwar geklärt, aber an der swd.tuwien.ac.at wurde der bewährte Zustand beibehalten.

Oder der Tausch des VT220 aus Altbeständen gegen ein neues VT520: Zum einen sind uns nach und nach alte Terminals ausgefallen, zum anderen wurde die Multisession-Fähigkeit des neuen Terminals aus Stellplatzgründen, Vereinheitlichung der Console Terminals für alle Server und zur Ausfallssicherheit notwendig.

Ausfallssicherheit

Viele Erweiterungen, mit denen die Ausfallssicherheit verbessert wird, haben auch andere angenehme Nebenwirkungen, z.B. ist der Plattentausch beim RAID mit ein paar Handgriffen sogar im Betrieb (hot swap) zu erledigen, was als wirklicher Fortschritt gegenüber "Design" des Kistelwerks bei typischen Workstation-Konfigurationen gelten kann. Die USV wird von uns zwar nur zum sicheren Herunterfahren der Maschine verwendet, aber Seiteneffekte wie eine verbesserte Spannungsversorgung sind auch nicht schlecht. Das Überbrücken von längeren Stromausfällen ist kein wesentlicher Gesichtspunkt für unsere Anwendung, hingegen ist das Hochfahren mit zig GB nach einem Crash nichts für schwache Nerven.

Von den zwei Ethernet Interfaces ist eines zur Verbindung der Server untereinander gedacht, um vor allem die Backup Last von dem anderen Netzanschluß für die Zugriffe auf die Campussoftware wegzubekommen bzw. für interne NFS Mounts o.ä.

Eine Backup Lösung ist wieder einmal anstehend: Das DAT Laufwerk wurde von der Entwicklung der Plattenplatzes (bis Ende 1995 eine Verdoppelung auf ca. 20 GB innerhalb eines halben Jahres) überrollt und es wurden in der Zwischenzeit Tape Arrays (ähnlich wie RAID, aber mit Bändern) und DLTs (Digital Linear Tape) getestet. Zwar sollte sich durch das RAID und das Vorliegen vieler Software Pakete auf CD-ROM die Lage entspannen, andererseits sind Snap Shots von gewissen Installationszuständen zum Wiederaufsetzen nach gröberen Ausfällen wünschenswert; zudem ist die Verwaltung der (älteren) Software-Versionen offen. Auch die Verbesserung des Netzanschlusses ist mit der Umschaltung eines Interfaces von 10 auf 100 MBit/s schon vorbereitet.

Von den drei SCSI Bussen ist einer onboard, an einem weiteren ist das RAID fast/wide/differential angeschlossen und das dritte Board enthält neben einem 16-bit SCSI-2 Controller auch noch einen 10/100 MBit/s Ethernetanschluß.

Platten und Systemsoftware

Die interne 1 GB Systemplatte hat sich bei Änderungen immer wieder als sehr unhandlich erwiesen - zu klein und außerdem eine eigenwillige Einbaukonstruktion, sodaß eine gespiegelte Systemplatte im RAID vernünftiger schien. Im RAID verwenden wir zur Zeit nur 4 GB Seagate Barracudas, wobei 1, 2 oder 4 GB Platten möglich sind.

Erste Tests mit 8 GB Fujitsu Disks sind fehlgeschlagen, was nach den Spezifikationen des RAIDs leider zu erwarten war, aber einen Versuch war es uns trotzdem wert. Wir haben auch schon vor der Inbetriebnahme des RAIDs auf einen Plattentyp mit einer Bauform gesetzt, um den Austausch der Platten und die Konfiguration der File Systems zu erleichtern. Die 8 GB Disks für home/user/scratch werden für das parallele Aufbereiten immer noch größerer Programmpakete (GBs) für die Distribution eingesetzt; der ursprüngliche Arbeitsbereich von ca. 2 GB war von Anfang an sehr knapp.

Die System Software wurde gemeinsam mit dem Umstieg auf das RAID auf einen aktuellen Stand gebracht: Solaris 2.5.1 inkl. Patches. Zur Erweiterung der File Systems im Betrieb ist weiter ODS 4.0 (Online Disk Suite) in Verwendung und zur Software-Distribution sind ftp, Samba und PCNFS installiert.

Die Umstellung auf RAID

Die Lieferung durch TCplus war termingerecht und die Vorzeige-Inbetriebnahme des RAIDs innerhalb eines Vormittags an unserer Reserve- und Testmaschine verlief ohne besondere Zwischenfälle. Doch dann wurde der Zeitplan über den Haufen geworfen: Ursprünglich sollte der neue Software Distribution Server im Freihaus mit neuen und Reserveteilen aufgebaut und getestet werden und dann - nach einiger Zeit Parallelbetrieb - die alte Maschine in der Gußhausstraße abgebaut und recycled werden. Wegen Umbauten in der Gußhausstraße mußte aber der alte Server doch noch übersiedelt werden, d. h. Stellplatz in den neuen Racks, Netz- und Stromanschlüsse etc. mußten kurzfristig geändert werden, die Urlaubsplanung neu überdacht werden.

Bei unseren Umstellungen konnten wir von den Erfahrungen der Gruppe Kommunikation profitieren, die ein ähnliches RAID System am Newsserver betreibt, wobei dort jedoch andere Voraussetzungen, z. B. bezüglich Performance herrschen, andere Platten verwendet werden usw. (Genaueres berichtete Johannes Demel in der PIPELINE 20 über den Ausbau des Newsservers). Aber der Übergang von Solaris 2.4 auf 2.5.1 war für uns natürlich leichter, nachdem die Gruppe Kommunikation bei ihrem Server bereits wichtige Details geklärt hatte.

Bei allen unseren Anschaffungen für den Softwareserver wird auf Ausfallssicherheit und Ersatzteile geachtet: Beim DEC StorageWorks RAID 410 sind der Host Adapter Kit (SCSI Controller und Host Software), das Gehäuse, der RAID Controller, EMU (Environmental Monitoring Unit) und Verkabelung nur einfach vorhanden, andere Komponenten wie Disks, Fans, Power Supplies sollten ausreichend redundant sein. Anbote bezüglich Wartung/Austausch von Teilen wurden vor der Bestellung des RAIDs eingeholt; bei Komponenten wie Disks kann aber leicht selber eine gewisse Reserve angelegt werden.

Personelles

Die Ausfallssicherheit ist auch in personeller Hinsicht verbessert worden; seit Oktober 1996 hat Udo Linauer wieder tatkräftig mitgeholfen, die neue Server Konfiguration in Betrieb zu nehmen und gemeinsam mit Gerhard Kircher und mir sollte die System-Administration auch in Urlaubszeiten und bei Krankheitsfällen abgedeckt sein. Beide waren auch schon im Sommer 1995 maßgeblich an der Verwirklichung des Software-Distribution-Konzeptes beteiligt.

Ausblick

Anhand von Statistiken zur Software Distribution kann man versuchen, die weitere Entwicklung des Softwareservers zu extrapolieren. Dazu sei auf entsprechende Auswertungen, die von Udo Linauer für diese Ausgabe der PIPELINE aktualisiert und aus vielen MBytes Log-Files kondensiert wurden, verwiesen. Bisher sind die Ausbauten immer mehr oder weniger inkrementell erfolgt, aber es ist ohne weiteres vorstellbar, daß statt des Übergangs von 4 GB auf 8 GB Platten oder ein weiteres RAID die Installation einer neu zu konzipierenden reinen Server-Maschine sinnvoll wird.

Die momentane Konfiguration ist ja nur eine für unseren Zweck hochgerüstete Workstation mit Limits und Eigenheiten, die natürlich dem geplanten Einsatzgebiet des Gerätes angemessen sind und nicht unbedingt einem Server Betrieb entgegenkommen. Jedenfalls werden auch immer wieder verschiedene Distributions-Mechanismen evaluiert und z.B. die Einsatzmöglichkeiten von CD-ROM Wechslern in Kombination mit Cache File Systemen verfolgt.


Zum Inhaltsverzeichnis, Pipeline 21, Februar 1997