Lar Visão de futuro Estamos recebendo dois novos supercomputadores maciços

Estamos recebendo dois novos supercomputadores maciços

2024

Vídeo: Conheça os Supercomputadores do Mundo! (Novembro 2024)

O governo dos EUA fez hoje uma grande aposta que os supercomputadores mais rápidos ajudarão a resolver alguns dos maiores problemas da ciência, com planos de construir dois supercomputadores enormes, cada um dos quais seria várias vezes mais rápido que as máquinas mais rápidas de hoje.

Isso inclui US $ 325 milhões para a construção dos novos supercomputadores, incluindo uma nova máquina chamada Summit no Oak Ridge National Laboratories (ORNL) e outra chamada Sierra no Lawrence Livermore National Laboratory (LLNL), além de US $ 100 milhões para pesquisa e desenvolvimento em condições extremas. escalar a tecnologia de supercomputação em um programa chamado FastForward2. A Summit deve entregar de 150 a 300 petaflop / s de pico (quadrilhões de cálculos de ponto flutuante por segundo) e a Sierra mais de 100 petaflop / s, em comparação com os 54, 9 petaflop / s de pico da máquina mais rápida da atualidade (o Tianhe-2) na estrada para "computação exascale".

Para colocar isso em perspectiva, o poder total de computação dos sistemas Top500 em alguns meses atrás era de 274 petaflop / s (uma nova lista do Top500 será lançada na próxima semana em conjunto com o programa SuperComputing 14). Ambos os sistemas serão construídos pela IBM e serão baseados nas CPUs da arquitetura IBM Power, nas GPUs Nvidia Tesla e nas interconexões Mellanox.

Tom Rosamilla, vice-presidente sênior do IBM Systems & Technology Group, descreveu os sistemas como usando uma nova "arquitetura centrada em dados" projetada para eliminar a movimentação de dados o máximo possível, colocando os dados mais próximos da computação. A IBM diz que isso foi projetado para fornecer modelagem, simulação, aplicativos e análises de ponta em termos de custo-benefício no Big Data, e tira proveito da iniciativa OpenPower (da qual Nvidia e Mellanox são membros).

Como parte disso, ele usará as GPUs Nvidia Tesla com base em sua arquitetura Volta seguinte (que deve ser lançada em 2017, seguindo a arquitetura Pascal prevista para 2016) e na tecnologia NVLink da empresa para conexões entre todos os processadores em um único nó do servidor. Sumit Gupta, Gerente Geral de Computação Acelerada por GPU da Tesla para a Nvidia, descreveu o NVLink como a "primeira interconexão de alta velocidade para a GPU", permitindo comunicações ponto a ponto entre uma GPU e outra GPU, bem como entre a GPU e a GPU. CPU de energia. (A primeira geração do NVLink deve chegar em 2016; os novos sistemas usarão a segunda geração.) Os nós nos sistemas serão conectados usando a próxima geração da interconexão InfiniBand Mellanox EDR de 100 Gb / s.

A IBM disse que cada sistema terá um desempenho máximo "bem superior a 100 petaflops", equilibrado com mais de cinco petabytes de memória dinâmica e flash, e será capaz de mover dados para o processador a mais de 17 petabytes por segundo (que o empresa diz que é equivalente a mover mais de 100 bilhões de fotos por segundo).

Jeffrey Nichols, diretor de laboratório associado das Ciências da Computação e da Computação da ORNL, descreveu a arquitetura como "um número menor de nós com uma pegada de memória compartilhada muito maior" e disse que deveria permitir que os desenvolvedores otimizassem e executassem com mais eficiência as cargas paralelas atualmente em execução na corrente do ORNL Sistema Titan. O ORNL diz que seu sistema Summit incluirá mais de 3400 nós com cada nó, incluindo vários processadores IBM Power 9 e várias GPUs Nvidia Volta, com mais de 512 GB de DDR4 e memória de alta largura de banda (em um design coerente, para que ele possa trabalhar com todos os CPUs e GPUs), juntamente com 800 GB de RAM não volátil, oferecendo mais de 40 teraflops de desempenho máximo. Ele terá um sistema GPFS Storage Server com 1TB / s de largura de banda de E / S e 120 PB de capacidade de disco. Isso deve substituir o atual sistema Titan da ORNL, que é um sistema Cray baseado nos processadores AMD Opteron e nos processadores Nvidia Kepler, capazes de 27 petaflop / s, com Nichols dizendo que a Summit deve fornecer de 5 a 10 vezes o desempenho do Titan. O Summit está previsto para ser entregue em 2017 e disponível para usuários em 2018.

Os aplicativos-alvo para o sistema Summit incluem ciência da combustão (tentando aumentar a eficiência dos motores de combustão em 25 a 50%), ciência da mudança climática, armazenamento de energia e energia nuclear. Nichols disse que a Summit deve permitir que o ORNL "expanda os horizontes" da ciência que eles estão fazendo nos laboratórios.

O sistema LLNL, chamado Sierra, é direcionado ao programa de simulação e computação avançada (ASC) da Administração Nacional de Segurança Nuclear (NNSA), desenvolvido principalmente na ciência e avaliação de armas. De acordo com Mike McCoy, diretor do programa ASC do LLNL, o supercomputador permite que o laboratório faça simulações no estoque nuclear do país sem precisar voltar aos testes nucleares. Ele disse que o código de simulação de armas 3D do laboratório é "uma das aplicações mais complicadas do planeta". Ele observou que esse não é o caso do governo comprar um sistema pronto para uso, mas sim um "co-design", onde os programadores e projetistas de sistemas trabalham juntos na arquitetura.

Ambos os sistemas, que fazem parte de um programa do Departamento de Energia conhecido como Laboratórios Nacionais de Oak Ridge, Argonne e Lawrence Livermore (CORAL), visam acelerar o desenvolvimento da computação de alto desempenho. A IBM diz que a programação para esses sistemas pode começar hoje, mas os sistemas não serão instalados até 2017 ou 2018. Como parte do programa CORAL, o Argonne National Lab também receberá novos supercomputadores, mas ainda não o anunciou.

No geral, Nichols disse que via Summit e Sierra como "primeiros passos em direção à escala exascale" e disse que estava ansioso por futuros sistemas no mesmo caminho arquitetônico e esperava uma longa colaboração com os fornecedores. Cerca de cinco anos após a entrega da Summit, ele disse, ele espera ter um computador exascale.

Além disso, hoje a AMD anunciou que recebeu US $ 32 milhões em dois prêmios DOE, como parte do projeto FastForward2, para pesquisar a arquitetura de nós em escala exascale com base em suas unidades de processamento acelerado (APUs) baseadas em Heterogeneous System Architecture (HSA) e para ajudar a projetar uma nova padrão para futuras interfaces de memória. O DOE disse que AMD, Cray, IBM, Intel e Nvidia estarão liderando os projetos FastForward2. (Intel e Cray não estão envolvidos com os supercomputadores anunciados hoje, mas continuam sendo grandes players no espaço, por isso será interessante ver se eles estão envolvidos nos planos de Argonne.)