Erfahrungen mit SGI Origin2000

Ernst Haunschmid

Der neue Applikationsserver Freie Programmierung, SGI Origin2000, wurde bereits in der letzten PIPELINE [1] vorgestellt. Die Hardware und die der Origin2000 zugrunde liegende ccNUMA Architektur wurden dort bereits ausführlich beschrieben. Im Mittelpunkt dieses Artikels stehen Software-Aspekte (speziell IRIX-6.5), die Betriebssituation sowie die ersten Erfahrungen mit dem
neuen System.


Das Betriebssystem IRIX-6.5

Zum Zeitpunkt der Lieferung war bereits IRIX-6.5 verfügbar; die neueste Version dieses Betriebssystems bietet neben Y2K compliance einige neue und auf anderen UNIX-Plattformen (derzeit) noch nicht verfügbare Features:

Checkpoints werden üblicherweise vor einer geplanten System-Abschaltung über das Queuing System angelegt, können aber auch vom Benutzer selbst spezifiziert und durchgeführt werden. Problematisch ist Checkpoint/Restart bei Prozessen, die mit anderen Rechnern kommunizieren; hier ist ein Restart im allgemeinen nicht möglich.

Der Miser Scheduler verhält sich dem Benutzer gegenüber wie ein rudimentäres Queuing System; daher wurde der Miser Scheduler mit Craysoft NQE kombiniert. Craysoft NQE entspricht in der Funktionalität Sterling NQS, das auf den SGI Power Challenge Systemen eingesetzt wird.

Durch den Einsatz von Miser kann die Laufzeit serieller Jobs um bis zu 15 %, bei parallelen Jobs um bis zu 30 % verbessert werden (abhängig von der jeweiligen Auslastung des Systems). Generell wird durch den Einsatz von Miser ein wesentlich besseres Verhalten im Hochlastbereich gewährleistet; bei voll ausgelastetem System konnte eine Steigerung der Durchsatzleistung von über 15 % beobachtet werden.

alle Platten der Origin2000 (mit Ausnahme des /tmp-Filesystems) werden von der Plexing Software gespiegelt. Plattendefekte können damit in den meisten Fällen ohne Beeinträchtigung des Benutzerbetriebes behoben werden, zumal alle Platten im laufenden Betrieb getauscht werden können. Bisher kam es im laufenden Betrieb zu keinen Plattendefekten; in umfangreichen Tests mit simulierten Plattendefekten hat sich die Spiegelung der Platten sehr gut bewährt.


Leistungsvergleich mit Power Challenge XL

In beiden Systemen werden MIPS R10000 Prozessoren eingesetzt; in den Power Challenge XL Systemen kommt der IP25 zu Einsatz, in der Origin2000 der IP27.

Aufgrund dieser Eigenschaften kann man eine Leistungssteigerung von zumindest 30 % erwarten, bei guter Ausnutzung des Cache sollte der Leistungsgewinn deutlich höher sein.

Bei seriellen Applikationen konnten bei den bisher durchgeführten Leistungstest Steigerungen um bis zu 80 % festgestellt werden; bei zusätzlicher Last auf den Systemen ist der Leistungsunterschied noch wesentlich höher (siehe Tabelle 1).

aktive Prozesse

 Power Challenge XL

Origin2000

1

1.00

0.56

10

1.47

0.56

20

1.89

0.56

30

 -

0.56

60

 -

0.61

Tabelle 1: Normierte Laufzeiten für eine numerische Applikation

Die Laufzeit einer Applikation auf der Power Challenge XL hängt sehr stark von der Last auf dem System ab. Da die Hauptspeicherzugriffe aller Prozesse über einen gemeinsamen Systembus erfolgen, kann es hier zu gegenseitigen Behinderungen kommen. Ein wesentlicher Teil der Applikationen auf dem Power Challenge XL Cluster hat hohe Anforderungen an die Speicherbandbreite. Laufen mehrere derartige Applikationen gleichzeitig, kommt es zu entsprechenden Leistungseinbußen. Durch die ccNUMA Architektur tritt dieses Problem bei der Origin2000 nicht oder nur in sehr abgeschwächter Form auf.

Bei einem Lastbenchmark, der in etwa die derzeitige Last auf den Power Challenge Systemen widerspiegelt, erreicht die Origin2000 (64 Prozessoren) die zweieinhalbfache Durchsatzleistung des Power Challenge XL Clusters (insgesamt 56 Prozessoren).


Betriebssituation

Der neue Applikationsserver SGI Origin2000 wurde Mitte November geliefert. Aufstellung und Erstinstallation verliefen problemlos, sodass am 4. Dezember 1998 die Abnahme des Systems erfolgen konnte. Nach weiteren Installationsarbeiten und entsprechenden Adaptionen an die Betriebserfordernisse an der TU konnte Mitte Dezember der Testbetrieb aufgenommen werden.

Ende Dezember kam es zu den ersten schwerwiegenden Betriebsproblemen; Softwaredefekte führten mehrmals dazu, dass keine neuen Prozesse gestartet werden konnten; in diesen Fällen war ein Restart des Systems notwendig. Als Ursache wurden Defekte im Miser Scheduler identifiziert, die teilweise durch Workarounds behoben werden konnten. Zusätzlich mussten von einigen Kernel-Komponenten Beta-Versionen installiert werden, um einen Testbetrieb mit dem Miser Scheduler zu gewährleisten.

In den folgenden Wochen traten weitere Hard- und Software-Probleme auf; in den Fällen, in denen eine Fehlerquelle eindeutig identifizierbar war, wurden die entsprechenden Hardware-Komponenten getauscht. Gleichzeitig wurde versucht, das Betriebssystem durch Installation der jeweils neuesten Versionen (teilweise auch Test-Versionen aus den Software-Labors in den USA) ausfallsicherer zu machen.

Für einige der Defekte konnte keine eindeutige Ursache festgestellt werden; obwohl diese Defekte auf unserem System wiederholbar waren, konnten sie auf anderen, vergleichbaren Origin2000 Installationen nicht nachvollzogen werden.

Anfang Mai wurde IRIX-6.5.4 installiert. Obwohl es in den folgenden Tagen zu zwei weiteren Systemabstürzen kam (verursacht durch die Hardeware-Diagnose Tools), besteht berechtigte Hoffnung, dass sich die Betriebssituation verbessert und stabilisiert und somit die vorhandene und durchaus imposante Rechenleistung der Origin2000 in vollem Umfang den Benutzern zur Verfügung gestellt werden kann.


Literatur

[1]    P. Berger: Der neue Applikationsserver Freie Programmierung CRAY Origin2000 Hochleistungsserver.  PIPELINE 26, pp. 14-15, Wien, 1998


Zum Inhaltsverzeichnis, ZIDline 1, Juni 1999