Vídeo: 13 Ideias Criativas Para Presentes! (Novembro 2024)
Houve algumas surpresas na conferência Supercomputing 17 deste mês, incluindo uma exibição muito boa para o acelerador PEZY-SC2, bem como a mudança de direção da Intel para sua linha Xeon Phi. Além disso, também vimos os primeiros sistemas criados no processador escalonável Xeon da Intel (Skylake) e o primeiro a apresentar o acelerador Volta da Nvidia.
Mas talvez a mais notável seja a notícia de que os sistemas chineses agora representam 202 dos 500 supercomputadores da mais nova lista das 500 melhores, em comparação com apenas 143 dos EUA. Os sistemas americanos dominaram a lista desde sua criação, há 25 anos, e apenas alguns meses atrás, os EUA tinham 169 sistemas em comparação aos 160 da China. O mesmo acontece quando se trata de desempenho agregado, com os sistemas chineses combinados respondendo por 35, 4% dos o desempenho total dos 500 principais sistemas.
Os computadores mais rápidos do mundo continuam sendo as duas grandes máquinas chinesas que estão no topo da lista há vários anos: Sunway TaihuLight, do Centro Nacional de Supercomputação da China em Wuxi, com desempenho sustentado do Linpack de mais de 93 petaflops (93 mil trilhões de pontos flutuantes) operações por segundo) e o Tianhe-2, do Centro Nacional de Supercomputadores da China em Guangzhou, com desempenho sustentado de mais de 33, 8 petaflops. Essas continuam sendo as máquinas mais rápidas e com uma margem enorme. O sistema Piz Daint do Swiss National Supercomputing Center, um sistema Cray que usa Intel Xeons e Nvidia Tesla P100s, ficou em terceiro lugar com o Linpack com desempenho sustentado de 19, 6 petaflops.
A maior mudança no topo é um novo sistema em quarto lugar: uma versão atualizada do supercomputador Gyoukou, um sistema ZettaScaler-2.2 implantado na Agência Japonesa de Ciência e Tecnologia da Terra-Marinha. Esta máquina usa aceleradores PEZY-SC2, um chip de 2048 núcleos de segunda geração que fornece um desempenho máximo de 4.096 teraflops em dupla precisão, além dos processadores Intel Xeon convencionais, para um total de 19.860.000 núcleos. (Uma máquina ZettaScaler anterior com o PEZY-SC2 chegou à lista em um nível mais baixo na versão de junho). Isso fornece o maior número de núcleos usados juntos - também conhecido como o nível mais alto de simultaneidade - visto até o momento, superando o TaihuLight, que possui 10, 6 milhões de núcleos. A máquina Gyoukou alcançou um desempenho sustentado no Linpack de 19, 14 petaflops, mas o interessante é que ela usa 1, 35 megawatts de potência, em comparação com 2, 27 megawatts no PizDaint, 17, 8 megawatts no Tinahe-2 e 15, 4 megawatts no Taihulight. Ainda há muita energia, mas é uma grande redução em comparação com outros sistemas e uma forte indicação de que as preocupações com a energia são importantes, mesmo para as máquinas mais rápidas do mundo. Também é importante notar que isso mostra como as novas arquiteturas podem reduzir drasticamente o consumo de energia.
O principal sistema dos EUA continua sendo o supercomputador Titan no Laboratório Nacional de Oak Ridge, um sistema de cinco anos que usa aceleradores de GPU Nvidia K20x e entrega 17, 59 petaflops, que agora está em quinto lugar na lista.
Na mais recente lista do Green 500 dos supercomputadores com maior eficiência energética, quatro dos cinco principais slots - incluindo os três principais - foram para sistemas japoneses recém-instalados, todos baseados na arquitetura ZettaScaler-2.2 e no acelerador PEZY-SC2. O mais eficiente deles é o Shoubu System B, instalado no Centro Avançado de Computação e Comunicação da RIKEN. O Sistema Shoubu B atingiu 17, 0 gigaflops / watt; O Shoubu System B e os próximos dois sistemas, que usam 16, 8 e 16, 7 gigaflops / watt respectivamente, estão todos na metade inferior da lista das 500 melhores. O quinto sistema no ranking Verde é o sistema Gyoukou mencionado acima - o sistema número quatro na lista das 500 melhores, com 14, 2 gigaflops / watt.
Essas são grandes descobertas para o acelerador PEZY-SC2 e podem apontar para direções futuras para arquiteturas de supercomputação.
O quarto supercomputador mais ecológico é o sistema interno DGX SaturnV Volta da Nvidia, que alcançou 15, 1 gigaflops / watt, e ocupa o 149º lugar na lista das 500 melhores. Este sistema possui 22.440 núcleos Volta (que parecem ser contados de uma maneira um pouco diferente na lista do que alguns outros núcleos.) A Nvidia está tendo um ano muito bom para seu acelerador e tem grandes esperanças de que mais máquinas usem o Volta Arquitetura GPU.
Como de costume, os principais fornecedores estavam elogiando seus sucessos na lista, com a Intel notando que suas CPUs estavam em seis dos dez principais sistemas e um recorde de 471 em 500 sistemas. A Intel também observou que seus novos processadores escalonáveis Xeon estavam em 18 supercomputadores com mais de 25 petaflops de desempenho. Mas o que pode ser mais notável é que a Intel disse que está cancelando o Knights Hill, o sucessor planejado de 10nm do processador de 14nm Knights Landing Xeon Phi. A empresa disse que agora está planejando uma nova plataforma para sistemas exascale (1.000 petaflops) até 2021, mas não divulgou nenhum detalhe.
A Nvidia enfatizou que tinha 34 novos sistemas com seus aceleradores na lista, elevando o total da empresa para 87. A Nvidia e o parceiro IBM estavam gritando sobre a possibilidade de que, até a próxima lista em junho, a máquina Summit em Oak Ridge O Laboratório Nacional (ORNL) deve estar entre as máquinas no topo da lista. Esta máquina possui 4600 nós, cada um com duas CPUs básicas IBM Power 9 e 6 aceleradores Nvidia Volta, com um desempenho projetado de cerca de 200 petaflops. Isso difere da solução interna da Nvidia, na medida em que as CPUs e GPUs se comunicam pelo NVLink 2.0 de maneira coerente em cache usando o OpenCAPI, para que as GPUs possam acessar diretamente a RAM principal do sistema. O Summit será seguido pela máquina Sierra no Laboratório Nacional Lawrence Livermore e pela máquina AI Bridging Cloud Infrastructure (ABCI) no Japão.
Fiquei interessado em ouvir Cray anunciar um supercomputador "pronto para produção" baseado no processador Cavium ThunderX2 na arquitetura Armv8-A de 64 bits, agora disponível como parte de seu supercomputador XC50. Máquinas baseadas em ARM estão sendo testadas no Barcelona Supercomputer Center (cuja máquina Mare Nostrum agora ocupa o número 16 na lista das 500 melhores), bem como o supercomputador "Post-K" no Japão e o supercomputador Isambard no Reino Unido. A Cavium teve alguns benchmarks iniciais no ThunderX2, que mostrou que o chip de 14nm teve um desempenho melhor em aplicativos com vários threads ou com memória limitada do que o Skylake Xeons da Intel, embora a Intel continue sendo líder em teraflops single-threaded e raw. Observe que, além do design do Cavium, a Qualcomm também anunciou um chip para servidor baseado em ARM chamado Centriq.
Em outras notícias do processador, a AMD anunciou que aumentou a produção de seus processadores Epyc, embora esses ainda não estejam em nenhum dos sistemas Top 500, enquanto a NEC anunciou versões da sua placa aceleradora Vector Engine PCIe para sua nova série de supercomputadores SX-Aurora TSUBASA, que ter uma largura de banda de memória particularmente rápida.
No lado das interconexões, a Mellanox disse que 77% dos novos sistemas da lista das 500 principais usam o InfiniBand, enquanto a Intel divulgou sucessos recentes com sua Omni-Path Architecture, que é usada principalmente nos sistemas Xeon Scalable Processor (Skylake). Enquanto isso, vários fornecedores buscam a Gen-Z, projetada para ser uma abordagem centrada na memória e com menor latência para conexões de alta velocidade entre computação e dispositivos de memória / armazenamento.
Além disso, é interessante notar que, pela primeira vez, todas as máquinas no Top 500 agora estão executando o Linux.
Entre a forte primeira impressão do PEZY-SC2, a decisão da Intel de despejar a Knights Mill por uma nova arquitetura, a Volta da Nvidia, e a nova concorrência da AMD, dos fornecedores de ARM e da NEC, agora é um momento emocionante no mundo da supercomputação. As listas do próximo ano devem ser bastante interessantes, pois vemos quais arquiteturas realmente executam e quais são mais eficientes, pois muitos fornecedores e sites de supercomputadores tentam se posicionar na corrida para produzir um computador de escala exascale (1000 petaflop) com um sub Consumo de energia de -20 megawatt.
Curioso sobre a velocidade da sua banda larga na Internet? Teste agora!