POTENCIA9 - POWER9

PODER9
Información general
Lanzado 2017
Diseñada por IBM
Fabricante (s) común (es)
Rendimiento
Max. Frecuencia de reloj de la CPU 4 GHz
Cache
Caché L1 32 + 32 KiB por núcleo
Caché L2 512 KiB por núcleo
Caché L3 120 MiB por chip
Caché L4 vía Centaur
Arquitectura y clasificación
Min. tamaño de la característica 14 millas náuticas ( FinFET )
Conjunto de instrucciones Power ISA ( Power ISA v.3.0 )
Especificaciones físicas
Núcleos
Historia
Predecesor POTENCIA8
Sucesor Poder10

POWER9 es una familia de microprocesadores superescalares , de múltiples subprocesos y de múltiples núcleos basados ​​en el Power ISA anunciado en agosto de 2016 en la conferencia Hot Chips . Los procesadores basados en POWER9 están siendo fabricados utilizando un 14 nm FinFET proceso, en las versiones de 12 y 24 de núcleo, por escala a cabo y ampliar las aplicaciones, y posiblemente otras variaciones, ya que la arquitectura POWER9 está abierto para la concesión de licencias y modificación por el OpenPower Miembros de la fundación .

Summit , la segunda supercomputadora más rápida del mundo, se basa en POWER9, y también utiliza GPU Nvidia Tesla como aceleradores.

Diseño

Centro

El núcleo POWER9 viene en dos variantes, una multiproceso de cuatro vías llamada SMT4 y una de ocho vías llamada SMT8 . Los núcleos SMT4 y SMT8 son similares, en el sentido de que consisten en una serie de los llamados segmentos alimentados por programadores comunes. Un segmento es un núcleo de procesamiento rudimentario de un solo subproceso de 64 bits con unidad de almacenamiento de carga (LSU), unidad de entero (ALU) y una unidad escalar vectorial (VSU, haciendo SIMD y punto flotante). Una súper rebanada es la combinación de dos rebanadas. Un núcleo SMT4 consta de una caché L1 de 32  KiB (1 KiB = 1024 bytes), una caché de datos L1 de 32 KiB, una unidad de búsqueda de instrucciones (IFU) y una unidad de secuenciación de instrucciones (ISU) que alimenta dos superbandas. Un núcleo SMT8 tiene dos conjuntos de cachés L1 e IFU e ISU para alimentar cuatro superbandas. El resultado es que las versiones de POWER9 de 12 y 24 núcleos constan cada una de la misma cantidad de segmentos (96 cada una) y la misma cantidad de caché L1.

Un núcleo POWER9, ya sea SMT4 o SMT8, tiene una tubería de 12 etapas (cinco etapas más corta que su predecesor, el POWER8 ), pero tiene como objetivo retener la frecuencia de reloj de alrededor de 4 GHz. Será el primero en incorporar elementos de Power ISA v.3.0 que se lanzó en diciembre de 2015, incluidas las instrucciones VSX-3 . El diseño de POWER9 está hecho para ser modular y se utiliza en más variantes de procesador y se utiliza para la concesión de licencias, en un proceso de fabricación diferente al de IBM. En el chip hay coprocesadores para compresión y criptografía, así como una gran caché eDRAM L3 de baja latencia.

El POWER9 viene con una nueva arquitectura de controlador de interrupciones llamada "Motor de virtualización de interrupciones externas" (XIVE) que reemplaza una arquitectura mucho más simple que se usó en POWER4 a POWER8. XIVE también se utilizará en Power10 .

Escalar horizontalmente / escalar hacia arriba

  • IBM POWER9 SO  : variante de escalamiento horizontal , optimizada para computadoras de dos sockets con un ancho de banda de hasta 120 GB / s (1 GB = mil millones de bytes) para memoria DDR4 conectada directamente (prevista para su lanzamiento en 2017)
  • IBM POWER9 SU  : variante de ampliación, optimizada para cuatro sockets o más, para grandes máquinas NUMA con hasta 230 GB / s de ancho de banda a memoria intermedia (utiliza señalización "25,6 GHz" con la interfaz PowerAXON 25 GT / seg Link)

Ambas variantes de POWER9 pueden enviarse en versiones con algunos núcleos deshabilitados debido a razones de rendimiento , ya que Raptor Computing Systems vendió por primera vez chips de 4 núcleos, e incluso IBM vendió inicialmente sus sistemas AC922 con no más de chips de 22 núcleos, aunque ambos tipos de los chips tienen 24 núcleos en sus troqueles.

E / S

Muchas instalaciones están integradas en el chip para ayudar con el rendimiento masivo de E / S fuera del chip :

  • La variante SO tiene controladores DDR4 integrados para RAM conectada directamente, mientras que la variante SU utilizará la arquitectura Centaur fuera del chip introducida con POWER8 para incluir caché eDRAM L4 de alto rendimiento y controladores de memoria para RAM DDR4.
  • Los BlueLink interconexiones para una estrecha unión de gráficos co-procesadores de Nvidia (más de NVLink v.2 ) y OpenCAPI aceleradores.
  • Conexiones PCIe v.4 de propósito general para conectar ASIC regulares , FPGA y otros periféricos, así como dispositivos CAPI 2.0 y CAPI 1.0 diseñados para POWER8.
  • Multiprocesador ( sistema multiprocesador simétrico ) une para conectar otros procesadores POWER9 en la misma placa base, o en otros recintos estrechamente unidos.

Tipos de chips

Los chips POWER9 se pueden fabricar con dos tipos de núcleos y en una configuración Scale Out o Scale Up. Los núcleos POWER9 son SMT4 o SMT8, con núcleos SMT8 destinados a los sistemas PowerVM , mientras que los núcleos SMT4 están destinados a los sistemas PowerNV, que no utilizan PowerVM y principalmente ejecutan Linux. Con POWER9, los chips hechos para Scale Out pueden admitir memoria conectada directamente, mientras que los chips Scale Up están diseñados para usarse con máquinas con más de dos sockets de CPU y usan memoria intermedia.

POWER9 chips
PowerNV PowerVM
24 × núcleo SMT4 12 × núcleo SMT8
Poner a escala Nimbo desconocido
Aumentar proporcionalmente Cúmulo

Módulos

IBM Portal for OpenPOWER enumera los tres módulos disponibles para el chip Nimbus, aunque la variante Scale-Out SMT8 para PowerVM también usa el módulo / socket LaGrange:

  • Sforza : 50 mm × 50 mm, 4 DDR4, 48 carriles PCIe, 1 XBus 4B
  • Monza : 68,5 mm × 68,5 mm, 8 DDR4, 34 carriles PCIe, 1 XBus 4B, 48 carriles OpenCAPI
  • LaGrange : 68,5 mm × 68,5 mm, 8 DDR4, 42 carriles PCIe, 2 XBus 4B, 16 carriles OpenCAPI

Los módulos Sforza utilizan un zócalo de 2601 clavijas de matriz de red terrestre (LGA).

Sistemas

Sistemas informáticos Raptor / Ingeniería Raptor

Talos II : plataforma de servidor / estación de trabajo de dos sockets que utiliza procesadores POWER9 SMT4 Sforza; disponible como servidor 2U, servidor 4U, torre o placa base EATX. Comercializado como seguro y controlable por el propietario con software y firmware gratuitos y de código abierto. Inicialmente se envía con opciones de chip de 4 núcleos, 8 núcleos, 18 núcleos y 22 núcleos hasta que haya chips con más núcleos disponibles.

Talos II Lite : versión de un solo zócalo de la placa base Talos II, fabricada con la misma PCB.

Blackbird : plataforma microATX de un solo zócalo que utiliza procesadores SMT4 Sforza (variante de hasta 8 núcleos y 160 W), 4 a 8 núcleos, 2 ranuras de RAM (que admiten hasta 256 GiB en total)

Asociación entre Google y Rackspace

Barreleye G2 / Zaius : plataforma de servidor de dos sockets que utiliza procesadores LaGrange; Tanto el chasis Barreleye G2 como el Zaius utilizan la placa base Zaius POWER9

IBM

Power Systems AC922 - 2U, 2 × POWER9 SMT4 Monza, con hasta 6 × GPU Nvidia Volta, 2 × aceleradores CAPI 2.0 adjuntos y 1 TiB DDR4 RAM. AC aquí es una abreviatura de Accelerated Computing; este sistema también se conoce como "Witherspoon" o "Newell".

Power Systems L922 - 2U, 1–2 × POWER9 SMT8, 8–12 núcleos por procesador, hasta 4 TiB DDR4 RAM (1 TiB = 1024 GiB), PowerVM con Linux .

Power Systems S914 - 4U, 1 × POWER9 SMT8, 4–8 núcleos, hasta 1 TiB DDR4 RAM, PowerVM con AIX / IBM i / Linux.

Power Systems S922 - 2U, 1–2 × POWER9 SMT8, 4–10 núcleos por procesador, hasta 4 TiB DDR4 RAM, PowerVM con AIX / IBM i / Linux.

Power Systems S924 - 4U, 2 × POWER9 SMT8, 8–12 núcleos por procesador, hasta 4 TiB DDR4 RAM, PowerVM con AIX / IBM i / Linux.

Power Systems H922 - 2U, 1–2 × POWER9 SMT8, 4–10 núcleos por procesador, hasta 4 TiB DDR4 RAM, PowerVM con SAP HANA (en Linux) con AIX / IBM i en hasta el 25% del sistema.

Power Systems H924 - 4U, 2 × POWER9 SMT8, 8–12 núcleos por procesador, hasta 4 TiB DDR4 RAM, PowerVM con SAP HANA (en Linux) con AIX / IBM i en hasta el 25% del sistema.

Power Systems E950 - 4U, 2–4 × POWER9 SMT8, 8–12 núcleos por procesador, hasta 16 TiB de RAM DDR4 con búfer

Power Systems E980 - 1–4 × 4U, 4–16 × POWER9 SMT8, 8-12 núcleos por procesador, hasta 64 TiB de RAM DDR4 con búfer

Consola de administración de hardware 7063-CR2 : 1U, 1 × POWER9 SMT8, 6 núcleos, 64-128 GB de RAM DDR4.

Computación pingüino

Magna PE2112GTX : servidor de dos sockets de 2U para computación de alto rendimiento con procesadores LaGrange. Fabricado por Wistron.

Supercomputadoras IBM

Oblea POWER9 con certificados TOP500 para Summit y Sierra

Summit y Sierra  : el Departamento de Energía de los Estados Unidos, junto con el Laboratorio Nacional Oak Ridge y el Laboratorio Nacional Lawrence Livermore, contrató a IBM y Nvidia para construir dos supercomputadoras, Summit y Sierra , que se basan en procesadores POWER9 junto con las GPU Volta de Nvidia. Está previsto que estos sistemas estén en línea en 2017. Sierra se basa en el nodo de cálculo Power Systems AC922 de IBM. Los primeros racks de Summit se entregaron al Laboratorio Nacional de Oak Ridge el 31 de julio de 2017.

MareNostrum 4 : uno de los tres grupos en el bloque de tecnologías emergentes del cuarto superordenador MareNostrum es un grupo POWER9 con GPU Nvidia Volta. Se espera que este clúster proporcione más de 1,5 petaflops de capacidad informática cuando se instale. El bloque de tecnologías emergentes del MareNostrum 4 existe para probar si los nuevos desarrollos podrían ser "adecuados para futuras versiones de MareNostrum".

Soporte del sistema operativo

Al igual que su predecesor, POWER9 es compatible con FreeBSD , IBM AIX , IBM i , Linux (ambos se ejecutan con y sin PowerVM) y OpenBSD .

La implementación del soporte de POWER9 en el kernel de Linux comenzó con la versión 4.6 en marzo de 2016.

Red Hat Enterprise Linux (RHEL), SUSE Linux Enterprise (SLES), Debian Linux y CentOS son compatibles a partir de agosto de 2018.

Ver también

Referencias

enlaces externos