Der neue Applikationsserver Freie Programmierung
CRAY Origin2000 Hochleistungsserver

Peter Berger

Der Mietvertrag für den bestehenden Applikationsserver Freie Programmierung (3x SGI Power Challenge XL) endet am 30. Juni 1999. Im Juni 1998 wurde eine EU-weite Ausschreibung für ein Nachfolgesystem durchgeführt, deren Ziel die Beschaffung eines Systems mit möglichst hoher Durchsatzleistung bei hoher Einzeljob-Performance war.

Als maximaler Finanzrahmen standen öS 15 Mio. (ausgeschrieben war ein Teilzahlungs-Kaufvertrag mit den Zahlungen öS 8,5 Mio. im Jahr 1998, der Rest 1999 und 2000). In diesem Betrag waren die Kosten der Hardware, die Wartung der Systeme und die Softwarelizenzen (für 3 Jahre) zu inkludieren, sodass für das EDV-Zentrum keine weiteren Folgekosten bis Ende 2001 anfallen.

Am 1. Oktober 1998 wurde nach einer intensiven Evaluierungsphase der Zuschlag der Firma Silicon Graphics Computer Systems für folgende Systeme erteilt:

            64 Prozessoren (R 10000, 250MHz, 4MB Cache)
            22 Gbyte Hauptspeicher
            300 GB Plattenspeicher
            CDROM-Laufwerk
            DLT 7000 Bandstation (70 GB)
            Fast Ethernet und FDDI

Die Lieferung des Systems Origin2000 erfolgte am 19. November 1998. Mit der Aufnahme eines Probebetriebes ist bis Mitte Dezember 1998 zu rechnen.

Die Architektur des CRAY Origin2000 Servers

Der Hochleistungsserver CRAY Origin2000 basiert auf einer cache-coherenten, shared-memory, single-system image Architektur (ccNUMA: cache-coherent Non- Uniform Memory Architecture), deren Hauptmerkmale eine hohe Modularität und eine hohe Skalierbarkeit sind (S2MP: Scalable Shared-memory MultiProcessing). Die einzelnen Komponenten (Node-Boards) werden zu Modulen zusammengeschaltet, in denen bis zu 128 Prozessoren über einen „multidimensionalen CrayLink Interconnect“ verbunden sind (Abbildung 1).

Nodes

Node-Board

Node-Boards

Kernstück dieses modularen Systems sind die Node-Boards (Abbildung 2) mit folgenden Komponenten:

        2 Prozessoren (R 10000, 250MHz)
            mit je 4MB Secondary Cache
        Main Memory (max. 4 GB ECC SDRAM),
            4-fach Interleaving, 780MB/s Bandbreite
        Directory Memory (für Hardware Cache Coherency)
        HUB ASIC (4-Port Crossbar Switch)
            mit Anschlüssen für
            Prozessor
            Memory
            I/O-Interface (XIO)
            CrayLink Interconnect Fabric (zum Router Board)

Bis zu 4 Node-Boards können zu einen Modul zusammengeschaltet werden, ein Modul verfügt daher bis zu 8 Prozessoren, 16 GB Memory, 12 XIO-Slots und 2 CrayLink Router Boards.

Interconnect Subsystem

Die einzelnen Node-Boards werden über eine „Interconnection Fabric“ vernetzt. Eine von der Anzahl der Node-Boards abhängige Menge von Switches (Router) bestimmt die Vernetzungsbandbreite, die Router sind als Hypercube vernetzt.

Ein Router-Board enthält vor allem einen 6-fach Crossbar Switch, der auf allen 6 Ports unabhängig und gleichzeitig (full duplex) arbeiten kann. Jedes Port arbeitet bidirektional mit 780 MByte/s, an einen Router-Board sind max. 2 Node-Boards angeschlossen. Abbildung 3 zeigt die Hypercube-Vernetzung einer Origin2000 mit 64 Prozessoren.

Topology

Der Prozessor R10000

Der Microprozessor R10000 von MIPS Technologies verfügt über eine 4-fach Superskalar-Architektur, d. h. es können 4 Instruktionen pro Zyklus dekodiert und abgearbeitet werden. Der Prozessor arbeitet mit einer Taktfrequenz von 250 MHz. Der Instruction Cache und der Primary Data Cache sind 32 KByte groß und 2-fach associativ, der Secondary Data Cache ist 4 MByte groß und über einen internen Bus mit einer Peak-Transferrate von 3,2 GByte/s (128 Bit breit) verbunden.

Drei Instruction Queues, die Integer-, Floating Point- und die Address Queue greifen über 64 Physical Registers auf 2 Integer Arithmetic Logic Units und 3 Floating Point Units zu. Weitere Informationen sind unter http://www.sgi.com/ zu finden.

Systemsoftware

IRIX 6.5
Plexingsoftware zur Filesystem-Spiegelung
NQS oder NQE als Batchsystem
Development (GL, OpenGL, X11R6, Motif 1.2.3)
C und C++
Fortran 77 und 90
Auto Parallelizing Option (für Fortran und C)
NFS 2 und 3

Benutzungsberechtigungen

Das neue System ist vor allem zur Bearbeitung großer Produktionsjobs vorgesehen, die entweder eine hohe Memorybandbreite benötigen oder die einen hohen Parallelisierungsgrad aufweisen. Die Usernummernvergabe wird projektbezogen durchgeführt, Usernummer-Ansuchen sind bei Herrn A. Roza (Kl. 42083) oder im Sekretariat des EDV-Zentrums erhältlich (bitte Projektbeschreibung beilegen). Ich möchte darauf hinweisen, dass eine automatische Verschiebung von Usernummern und Dateien vom bestehenden FP-Server auf das neue System Origin2000 nicht durchgeführt wird.

Für weitere Fragen und Auskünfte stehe ich Ihnen gerne zur Verfügung (Kl. 42070, E-Mail: berger@edvz.tuwien.ac.at).


Zum Inhaltsverzeichnis, Pipeline 26, Dezember 1998