Vídeo: TSE atribui demora na apuração a falta de testes em supercomputador (Novembro 2024)
A lista mais recente dos supercomputadores mais rápidos do mundo não mudou muito, mas o programa anual de supercomputação (SC14) contou com muita discussão sobre novos sistemas na lista, além de vários anúncios de computação de alto desempenho, como novos aceleradores da Intel e Nvidia.
O supercomputador Tianhe-2 da China, que usa CPUs Intel Xeon e aceleradores Xeon Phi, permaneceu em primeiro lugar na lista do Top500, com desempenho máximo de 54, 9 petaflops (quatrilhões de operações de ponto flutuante por segundo). Este ano, de fato, os nove principais sistemas foram idênticos à nova adição em 10º lugar - uma máquina de sistema do governo dos EUA não especificada que é um Cray CS-Storm alimentado por CPUs Intel Xeon E5-2660 v2 e GPUs Nvidia K40, conectadas via Infiniband.
Mais abaixo na lista, havia 78 novos sistemas, embora até esse seja um novo recorde. No geral, parece que estamos vendo uma desaceleração na taxa de crescimento da energia agregada dos 500 sistemas.
Os rankings desses sistemas são baseados no benchmark LINPACK, embora haja vários esforços para criar novos benchmarks voltados para diferentes tipos de computação. Achei interessante que, em um discurso no show, Horst Simon, editor da lista Top500, disse que, apesar do objetivo de alcançar um computador exascale - 1 exaflops por segundo (aproximadamente 1.000 petaflops) - até 2020, ele acredita que provavelmente leve-nos até o final de 2024. Em parte, isso ocorre porque precisaremos de mais técnicas de economia de energia - como fotônica de silício e integração e empacotamento 3D - para manter a energia necessária para um sistema de escala exacta em até 20 megawatts. Estes são grandes sistemas.
Apesar da falta de grandes mudanças no topo, ouvimos alguns novos anúncios - principalmente os da Intel e Nvidia, que poderiam apontar o caminho para máquinas mais rápidas.
A Nvidia, cujas GPUs e linguagem de programação CUDA realmente iniciaram o movimento em direção a aceleradores e coprocessadores em computação de alto desempenho, estava presente em todo o show com muitos sistemas. Atualmente, oferece o acelerador K40 e, no show, anunciou a próxima versão, o Tesla K80, que usa uma abordagem de GPU dupla para oferecer o que a empresa diz ter desempenho quase duas vezes maior e dobrar a largura de banda de memória de seu antecessor.
A Nvidia diz que o K80 oferece 4.992 núcleos CUDA e 24 megabytes de RAM e tem uma capacidade de pico de 2, 91 teraflops por placa. É interessante que o K80 esteja disponível agora e que muitos dos fabricantes de sistemas já estejam oferecendo sistemas com a placa. Por exemplo, a Dell exibiu seus novos servidores PowerEdge C4130, que permitem instalar até quatro placas aceleradoras Nvidia (ou aceleradores Intel Xeon Phi) em um servidor 1U, com a versão K80 oferecendo até 7, 2 teraflops em cada caixa. Isso é apenas uma quantidade louca de poder de computação em um rack (embora um que consuma muita energia e precise de muito resfriamento).
Enquanto isso, a Intel anunciou que a próxima versão do seu chip Xeon Phi - uma versão conhecida como Knight's Landing para a qual os primeiros sistemas comerciais devem começar a ser comercializados no próximo ano - agora tem mais de 50 clientes planejando usar a nova versão do processador da peça (onde o Xeon Phi atua como processador do sistema) em novos supercomputadores. Muitos outros sistemas estão usando a versão da placa PCIe do coprocessador do produto.
Entre os clientes da Knights Landing estão o supercomputador Trinity, um esforço conjunto entre os laboratórios nacionais de Los Alamos e Sandia e o supercomputador Cori, anunciado pelo Centro de Computação Científica de Pesquisa Energética Nacional (NERSC) do Departamento de Energia dos EUA (DOE). O Knight's Landing deve oferecer cerca de 3 teraflops de desempenho e integrará a tecnologia Omni-Path Fabric da Intel baseada em fotônica de silício, que a empresa disse que ofereceria velocidade de linha de 100 Gbps e latência de malha de switch até 56% menor do que as alternativas InfiniBand. (Observe que os fornecedores InfiniBand agora também estão falando sobre novas versões.)
A Intel disse que o acompanhamento, conhecido como Knight's Hill, será construído usando a tecnologia de processo de 10nm da Intel e usará a próxima geração do tecido Omni-Path. Ele seguirá o desembarque de Knight, mas o momento exato não foi divulgado.
Não deve ficar de fora da equação a AMD, que anunciou e estava mostrando sua placa de CPU única FirePro S9150, que, segundo ela, pode oferecer 2, 53 teraflops de desempenho. Este sistema, programado usando o OpenCL, já está sendo enviado.
De fato, um novo supercomputador chamado L-CSC do GSI Helmholtz Center, baseado nas GPUs S9150 e nas CPUs Intel Xeon 2690v2 de 10 núcleos, liderou a nova versão da lista Green500, que lista os supercomputadores em ordem de potência de processamento por watt. Isso marcou a primeira vez que um sistema conseguiu superar 5 gigaflops / watt (bilhões de operações por segundo por watt). Observe nessa lista, o segundo lugar do sistema foi o Suiren, equipado com aceleradores de múltiplos núcleos PEZY-SC e CPUs Xeon; enquanto o restante dos 10 principais usa GPUs Nvidia Tesla, mostrando o alcance desses sistemas.
Existem outras opções mais incomuns também. A Micron está mostrando seu chip Automata, essencialmente um chip para fins especiais, projetado para correspondência de padrões, para uso em segurança de rede e pesquisa genômica. Isso está sendo desenvolvido em uma placa PCIe 3 com 32 chips e está previsto para ser lançado no primeiro trimestre de 2015, inicialmente em baixos volumes. (A empresa também está por trás do seu Hybrid Memory Cube para a próxima geração de memória para esses sistemas.) A IBM possui seu processador TrueNorth, que espera apontar o caminho para uma "computação semelhante ao cérebro". A NEC está trabalhando na próxima geração de seu processador vetorial SX-ACE, que, segundo ela, é mais fácil de programar do que as GPUs. E, é claro, a ARM está tentando entrar no mercado de servidores também, com o X-Gene1 da Applied Micro sendo usado como um processador conectado a várias placas aceleradoras.
Vários fornecedores estavam mostrando novos sistemas. Além do sistema Dell que mencionei anteriormente, a Lenovo mostrou um sistema de processador duplo resfriado a água baseado em um processador Intel Xeon E5-2798A personalizado (com 16 núcleos executando até 3, 2 GHz), que fornece 1, 083 teraflops. E disse que no próximo ano o processador Knights Landing Xeon Phi permitirá um sistema "peta-cubo" que oferece mais de um petaflop em apenas dois racks 42U padrão.
Os servidores One Stop mostraram um acelerador de computação de alta densidade, que usa o PCIe Gen3 para suportar até 16 placas aceleradoras de ponta de um ou vários servidores, com a empresa dizendo que fornece até 89, 6 teraflops usando placas Tesla K80. Isso pode funcionar com o processador Power8 da IBM. A Huawei estava mostrando a disponibilidade nos EUA do X6800 Data Center Server e uma versão com refrigeração líquida do servidor blade FusionServer 9000.
Para conectar sistemas, a Obsidian Technologies lançou sua iniciativa InfiniCortex, projetada para ter uma conexão InfiniBand de 100 Gigabit por longas distâncias. A empresa anunciou o apoio da Agência de Ciência, Tecnologia e Pesquisa de Cingapura (A * STAR). E a Mellanox mostrou 100 Gigabit Infiniband trabalhando mais de 100 metros via fibra e 8 metros via cobre.
Para criar os maiores supercomputadores, as organizações geralmente recorrem a empresas como IBM e Cray para montar os sistemas, embora isso geralmente leve anos para serem construídos. O maior anúncio desse tipo na feira foi um sistema de US $ 80 milhões conhecido como Shaheen II na Universidade de Ciência e Tecnologia King Abdullah, na Arábia Saudita, para um Cray XC40, incluindo um dispositivo de análise de gráficos Urika-GD.
E, é claro, logo antes do show, o DOE concedeu à IBM (e aos fornecedores de componentes Nvidia e Mellanox) um contrato enorme para o que seriam os dois maiores supercomputadores do país, cada um com mais de 100 petaflops.
Nota do editor: Esta publicação foi atualizada em 26/11. O Tianhe-2 tem um desempenho máximo de 54, 9 petaflops, não teraflops.