Cray-2 - Cray-2

Cray-2
CRAY-2 IMG 8971.CR2-logo.jpg
CRAY-2 IMG 8915-8913-8912a.jpg
Unidad central Cray-2 (primer plano) y "cascada" de refrigeración Fluorinert (fondo), en exhibición en la EPFL .
Fabricante Investigación de Cray
Escribe Supercomputadora
Fecha de lanzamiento 1985 ( 1985 )
Interrumpido 1990
UPC Procesadores vectoriales personalizados
Predecesor Cray X-MP
Un Cray-2 y su "cascada" de refrigeración Fluorinert , anteriormente número de serie 2101, el único sistema de 8 procesadores jamás fabricado, para NERSC
Un Cray-2 operado por la NASA
Vista frontal de 1985 Supercomputer Cray-2, Musée des Arts et Métiers , París
Vista lateral de la supercomputadora Cray-2 de 1985 , Musée des Arts et Métiers , París
Detalle de la parte superior del Cray-2
Dentro del Cray-2

El Cray-2 es una supercomputadora con cuatro procesadores vectoriales fabricados por Cray Research a partir de 1985. Con un rendimiento máximo de 1.9 GFLOPS , era la máquina más rápida del mundo cuando se lanzó, reemplazando al Cray X-MP en ese lugar. Fue, a su vez, reemplazado en ese lugar por el Cray Y-MP en 1988.

El Cray-2 fue el primero de los diseños de Seymour Cray en utilizar con éxito varias CPU. Esto se había intentado en el CDC 8600 a principios de la década de 1970, pero los transistores de lógica acoplada por emisor (ECL) de la época eran demasiado difíciles de empaquetar en una máquina en funcionamiento. El Cray-2 abordó esto mediante el uso de circuitos integrados ECL , empaquetándolos en un cableado 3D novedoso que aumentó en gran medida la densidad del circuito.

El empaque denso y las cargas de calor resultantes fueron un problema importante para el Cray-2. Esto se resolvió de una manera única al forzar el líquido Fluorinert eléctricamente inerte a través del circuito bajo presión y luego enfriarlo fuera de la caja del procesador. El exclusivo sistema de refrigeración de "cascada" llegó a representar la informática de alto rendimiento a la vista del público y se encontró en muchas películas informativas y como accesorio de película durante algún tiempo.

A diferencia del Cray-1 original, el Cray-2 tenía dificultades para ofrecer el máximo rendimiento. Otras máquinas de la empresa, como la X-MP y la Y-MP, vendieron más que la Cray-2 por un amplio margen. Cuando Cray comenzó a desarrollar el Cray-3 , la empresa optó por desarrollar la serie Cray C90 en su lugar. Esta es la misma secuencia de eventos que ocurrió cuando se estaba desarrollando el 8600 y, como en ese caso, Cray dejó la empresa.

Diseño inicial

Con el exitoso lanzamiento de su famoso Cray-1 , Seymour Cray recurrió al diseño de su sucesor. En 1979 se había cansado de las interrupciones de la gestión en lo que ahora era una gran empresa y, como lo había hecho en el pasado, decidió renunciar a su puesto de dirección y pasar a formar un nuevo laboratorio. Al igual que con su traslado original a Chippewa Falls, Wisconsin desde Control Data HQ en Minneapolis, Minnesota , la dirección de Cray comprendió sus necesidades y apoyó su traslado a un nuevo laboratorio en Boulder, Colorado . Trabajando como consultor independiente en estos nuevos Cray Labs, a partir de 1980 formó un equipo y comenzó con un diseño completamente nuevo. Este laboratorio se cerraría más tarde y una década más tarde se abriría una nueva instalación en Colorado Springs .

Cray había atacado previamente el problema del aumento de la velocidad con tres avances simultáneos: más unidades funcionales para darle al sistema un mayor paralelismo, un empaquetado más ajustado para disminuir los retrasos de la señal y componentes más rápidos para permitir una mayor velocidad de reloj. El ejemplo clásico de este diseño es el CDC 8600 , que empacó cuatro máquinas similares a CDC 7600 basadas en lógica ECL en un cilindro de 1 × 1 metro y las hizo funcionar a una velocidad de ciclo de 8 ns (125 MHz ). Desafortunadamente, la densidad necesaria para lograr este tiempo de ciclo llevó a la caída de la máquina. Las placas de circuito en el interior estaban densamente empaquetadas, y dado que incluso un solo transistor que funcionara mal haría fallar un módulo completo, empaquetar más de ellas en las tarjetas aumentaba en gran medida la posibilidad de falla. El enfriamiento de los componentes individuales empaquetados también representó un gran desafío.

Una solución a este problema, a la que ya se habían trasladado la mayoría de los proveedores de computadoras, era utilizar circuitos integrados (CI) en lugar de componentes individuales. Cada IC incluía una selección de componentes de un módulo precableado en un circuito mediante el proceso de construcción automatizado. Si un CI no funcionaba, se intentaría con otro. En el momento en que se estaba diseñando el 8600, la tecnología simple basada en MOSFET no ofrecía la velocidad que necesitaba Cray. Sin embargo, las implacables mejoras cambiaron las cosas a mediados de la década de 1970, y el Cray-1 había podido utilizar circuitos integrados más nuevos y seguir funcionando a unos respetables 12,5 ns (80 MHz). De hecho, el Cray-1 era en realidad algo más rápido que el 8600 porque empaquetaba considerablemente más lógica en el sistema debido al pequeño tamaño de los circuitos integrados.

Aunque el diseño de los circuitos integrados siguió mejorando, el tamaño físico de los circuitos integrados se vio limitado en gran medida por los límites mecánicos; el componente resultante tenía que ser lo suficientemente grande para soldarse en un sistema. Fueron posibles mejoras dramáticas en la densidad, como estaba demostrando la rápida mejora en el diseño del microprocesador , pero para el tipo de circuitos integrados utilizados por Cray, los que representan una parte muy pequeña de un circuito completo, el diseño se había estancado. Para obtener otro aumento de 10 veces en el rendimiento sobre el Cray-1, el objetivo que pretendía Cray, la máquina tendría que volverse más compleja. Así que, una vez más, recurrió a una solución similar a la del 8600, duplicando la velocidad del reloj a través de una mayor densidad, agregando más de estos procesadores más pequeños al sistema básico y luego tratando de lidiar con el problema de sacar calor de la máquina.

Otro problema de diseño fue la creciente brecha de rendimiento entre el procesador y la memoria principal . En la era del CDC 6600, la memoria funcionaba a la misma velocidad que el procesador, y el principal problema era introducir datos en él. Cray resolvió esto agregando diez computadoras más pequeñas al sistema, permitiéndoles lidiar con el almacenamiento externo más lento (discos y cintas) y "enviar" datos a la memoria cuando el procesador principal estaba ocupado. Esta solución ya no ofrecía ninguna ventaja; la memoria era lo suficientemente grande como para poder leer conjuntos de datos completos, pero los procesadores funcionaban mucho más rápido que la memoria que a menudo pasaban mucho tiempo esperando que llegaran los datos. Agregar cuatro procesadores simplemente empeoró este problema.

Para evitar este problema, el nuevo diseño almacenó memoria y dos conjuntos de registros (los registros B y T) fueron reemplazados por un bloque de 16 KWord de la memoria más rápida posible llamado Memoria Local, no caché, conectando los cuatro procesadores en segundo plano. a él con tubos de alta velocidad separados. Esta memoria local se alimentaba de datos mediante un procesador de primer plano dedicado que, a su vez, estaba conectado a la memoria principal a través de un canal de Gbit / s por CPU; Por el contrario, los X-MP tenían 3, para 2 cargas simultáneas y una tienda, y los Y-MP / C-90 tenían 5 canales para evitar el cuello de botella de von Neumann . La tarea del procesador de primer plano era "ejecutar" la computadora, manejar el almacenamiento y hacer un uso eficiente de los múltiples canales en la memoria principal. Condujo a los procesadores en segundo plano al pasar las instrucciones que deberían ejecutar a través de ocho búferes de 16 palabras , en lugar de atar los conductos de caché existentes a los procesadores en segundo plano. Las CPU modernas también usan una variación de este diseño, aunque el procesador de primer plano ahora se conoce como la unidad de carga / almacenamiento y no es una máquina completa en sí misma.

Los bancos de memoria principales se organizaron en cuadrantes para acceder a ellos al mismo tiempo, lo que permitió a los programadores dispersar sus datos en la memoria para obtener un mayor paralelismo. La desventaja de este enfoque es que el costo de configurar la unidad de dispersión / recopilación en el procesador de primer plano fue bastante alto. Los conflictos de zancadas correspondientes al número de bancos de memoria sufrieron una penalización en el rendimiento (latencia) como sucedía ocasionalmente en los algoritmos basados ​​en FFT de potencia de 2. Como el Cray 2 tenía una memoria mucho más grande que los Cray 1 o X-MP, este problema se solucionó fácilmente agregando un elemento extra no utilizado a una matriz para distribuir el trabajo.

Placas de circuitos empaquetadas y nuevas ideas de diseño

Los primeros modelos de Cray-2 pronto se decidieron por un diseño que utilizaba grandes placas de circuito repletas de circuitos integrados. Esto los hacía extremadamente difíciles de soldar y la densidad aún no era suficiente para alcanzar sus objetivos de rendimiento. Los equipos trabajaron en el diseño durante aproximadamente dos años antes de que incluso el propio Cray "se rindiera" y decidiera que sería mejor si simplemente cancelaban el proyecto y despedían a todos los que trabajaban en él. Les Davis, ex colaborador de diseño de Cray que había permanecido en la sede de Cray, decidió que debería continuar con baja prioridad. Después de algunos movimientos de personal menores, el equipo continuó como antes.

Módulo lógico típico, que muestra el empaque ajustado. Los pines de pogo que conectan las tarjetas son las varillas de color dorado que se ven entre los circuitos integrados.

Seis meses después, Cray tuvo su momento " eureka ". Reunió a los ingenieros principales para una reunión y presentó una nueva solución al problema. En lugar de hacer una placa de circuito más grande, cada "tarjeta" consistiría en una pila tridimensional de ocho, conectadas entre sí en el medio de las placas con clavijas que sobresalen de la superficie (conocidas como "pogos" o "z-pins "). Las cartas estaban empaquetadas una encima de la otra, por lo que la pila resultante tenía solo unas 3 pulgadas de alto.

Con este tipo de densidad, no había forma de que funcionara ningún sistema convencional refrigerado por aire; había muy poco espacio para que el aire fluyera entre los circuitos integrados. En cambio, el sistema se sumergiría en un tanque de un nuevo líquido inerte de 3M , Fluorinert . El líquido refrigerante fue forzado lateralmente a través de los módulos bajo presión, y el caudal fue de aproximadamente una pulgada por segundo. El líquido calentado se enfrió usando intercambiadores de calor de agua enfriada y se devolvió al tanque principal. El trabajo en el nuevo diseño comenzó en serio en 1982, varios años después de la fecha de inicio original.

Mientras esto sucedía, el Cray X-MP se estaba desarrollando bajo la dirección de Steve Chen en la sede de Cray, y parecía que le daría al Cray-2 una carrera seria por su dinero. Para hacer frente a esta amenaza interna, así como a una serie de máquinas japonesas más nuevas similares a Cray-1, el sistema de memoria Cray-2 se mejoró drásticamente, tanto en tamaño como en número de "conductos" hacia los procesadores. Cuando finalmente se entregó la máquina en 1985, los retrasos habían sido tan largos que muchos de sus beneficios de rendimiento se debieron a la memoria más rápida. Comprar la máquina realmente tenía sentido solo para usuarios con grandes conjuntos de datos para procesar.

El primer Cray-2 entregado poseía más memoria física (256 MWord ) que todas las máquinas Cray entregadas anteriormente juntas. La simulación pasó de un reino 2-D o un 3-D burdo a un reino 3-D más fino porque la computación no tenía que depender de una memoria virtual lenta.

Usos y sucesores

El Cray-2 fue desarrollado predominantemente para los Departamentos de Defensa y Energía de los Estados Unidos . Los usos tendían a ser para la investigación de armas nucleares o el desarrollo oceanográfico ( sonar ). Sin embargo, el primer Cray-2 (número de serie 1) se usó en el Centro Nacional de Computación de Energía de Fusión Magnética en el Laboratorio Nacional Lawrence Livermore para la investigación de energía no clasificada. También encontró su camino en agencias civiles (como el Centro de Investigación Ames de la NASA ), universidades y corporaciones en todo el mundo. Por ejemplo, Ford y General Motors utilizaron el Cray-2 para procesar modelos complejos de análisis de elementos finitos de carrocerías de automóviles y para realizar pruebas de choque virtuales de componentes de carrocería antes de la producción.

El Cray-2 habría sido reemplazado por el Cray-3 , pero debido a problemas de desarrollo, solo se construyó un Cray-3 y nunca se pagó. El descendiente espiritual del Cray-2 es el Cray X1 , ofrecido por Cray .

Comparación con computadoras posteriores

En 2012, Piotr Luszczek (ex estudiante de doctorado de Jack Dongarra ), presentó resultados que mostraban que un iPad 2 coincidía con el rendimiento histórico del Cray-2 en un punto de referencia LINPACK integrado .

Trivialidades

Debido al uso de refrigeración líquida, al Cray-2 se le dio el sobrenombre de "Burbujas", y las bromas comunes alrededor de la computadora hacían referencia a este sistema único. Las bromas incluían carteles de "No pescar", representaciones en cartón del monstruo del lago Ness saliendo del tanque del intercambiador de calor, peces de plástico dentro del intercambiador, etc. El consumo de energía del Cray-2 era de 150-200 kW. La investigación realizada en el Laboratorio Nacional Lawrence Livermore a principios de la década de 1990 indicó que, hasta cierto punto, el poliéter perfluorado utilizado para enfriar los circuitos Cray-2 se descompondría para formar el gas extremadamente tóxico perfluoroisobutileno . En ese momento, Cray había creado un póster que mostraba la "cámara de burbujas" transparente por la que pasaba el líquido refrigerante para lograr un efecto visual, con un derrame del mismo material brillando en el piso; la broma era que si esto realmente ocurría, la instalación tendría que ser evacuado. El fabricante del líquido desarrolló un depurador que podría colocarse en línea con la bomba que degradaría catalíticamente este producto de descomposición tóxico.

Cada pila vertical de módulos lógicos se encontraba encima de una pila de módulos de potencia que alimentaban barras colectoras de 5 voltios , cada una de las cuales entregaba aproximadamente 2200 amperios. El Cray-2 estaba alimentado por dos motores-generadores, que tomaban 480 V trifásicos .

Ver también

Referencias

enlaces externos

Registros
Precedido por
Cray X-MP /
4713 megaflops
La supercomputadora más poderosa del mundo
1985-1987
Sucedido por
Cray Y-MP / 832
2.144 gigaflops