Lar Visão de futuro Intel vê papel crescente na computação heterogênea fpgas

Intel vê papel crescente na computação heterogênea fpgas

Vídeo: Building an Accelerator Functional Unit for the Intel® FPGA Programmable Acceleration Card N3000 (Outubro 2024)

Vídeo: Building an Accelerator Functional Unit for the Intel® FPGA Programmable Acceleration Card N3000 (Outubro 2024)
Anonim

Ultimamente, grande parte da discussão interessante sobre processadores girava em torno do uso de diferentes tipos de chips e núcleos, em oposição aos núcleos de computação de uso geral comuns em CPUs convencionais. Vimos todos os tipos de combinações diferentes de chips usados ​​para tarefas de computação específicas, incluindo CPUs, GPUs, DSPs, ASICS personalizados e matrizes de portas programáveis ​​em campo (FPGs), e cada vez mais estamos vendo aplicativos que combinam aspectos de todos os estes, algumas vezes em um sistema e outras em um único chip.

Até a Intel - há muito tempo a defensora dos núcleos de computação de uso geral que dobravam de velocidade a cada dois anos - entrou em ação com a compra da Altera, uma das principais fabricantes de FPGA. Recentemente, tive a oportunidade de conversar com Dan McNamara, gerente geral do Grupo de Soluções Programáveis ​​da Intel (PSG), que antes era conhecido como Altera, que esclareceu os planos da Intel nessa área e deu mais detalhes sobre os planos da empresa para conectar diferentes tipos de núcleos e diferentes morrem juntos em pacotes de chips de alta velocidade.

"O mundo está se tornando heterogêneo", disse McNamara, observando que agora existe uma percepção comum de que você não pode resolver todos os problemas com núcleos de uso geral. ASICs personalizados - como as unidades de processamento de tensores ou TPUs do Google podem acelerar certos tipos de funções muito além do CPUS ou GPUs tradicionais, mas isso leva muito tempo para ser criado. Em contraste, ele disse, os FPGAs permitem código personalizável que oferece muitos dos benefícios de desempenho dos ASICs sem esperar dois anos pelo design e fabricação de chips. Um desenvolvedor pode alterar algoritmos dentro de um FPGA imediatamente, enquanto uma CPU, GPU ou chip personalizado funciona de maneira fixa.

McNamara também disse que os FPGAs são de latência muito baixa e podem ser altamente paralelos, com diferentes partes de um chip trabalhando simultaneamente em aplicativos como processamento ou comunicação de imagem.

A Intel agora está vendendo o Arria 10 FPGA, fabricado no processo de 20 nm da TSMC, e oferece um pacote que combina um processador Xeon (Broadwell) e o Arria 10. Isso é usado em aplicativos como pesquisas e análises em escala da Web. McNamara disse que os FPGAs podem acelerar a pesquisa em até 10 vezes e observou que a Microsoft tem sido pública sobre o uso desses FPGAs para acelerar a pesquisa.

Ultimamente, uma grande área de aprimoramento tem sido a criação de pacotes mais rápidos de vários chips que podem combinar matrizes de chips criadas em diferentes processos e talvez de diferentes fabricantes. Isso inclui pacotes que contêm uma CPU e um FPGA, como a combinação Xeon / Arria; um FPGA com diferentes transceptores, como no Stratix 10 FPGA da Intel; ou mesmo partes diferentes de uma CPU completa, como a Intel descreveu em sua recente tecnologia e dia de fabricação.

A Intel criou uma nova tecnologia chamada EMIB (bridge de interconexão multi-chip incorporada), que estreou no Stratix 10. No EMIB, a matriz principal é criada no processo de 14nm da Intel e os transceptores no processo de 16nm da TSMC.

No geral, McNamara disse que várias áreas estão adotando mais FPGAs usando essas embalagens. Ele falou sobre sites de grande escala, que estão vendo a demanda mudar rapidamente e onde uma combinação de FPGA / CPU pode funcionar bem em áreas como pesquisa, análise e streaming de vídeo, além de transformação de rede, onde tendências como redes definidas por software e a virtualização das funções de rede estão gerando a necessidade de mais processamento de pacotes. Outras áreas de foco incluem aplicativos 5G e sem fio, direção autônoma e aplicativos de inteligência artificial (IA). Na IA, McNamara disse que ASICs otimizados e potência bruta do computador podem ser os melhores para treinamento (a Intel comprou a Nervana), mas disse que os FPGAs costumam ser melhores em inferência, devido à sua flexibilidade e baixa latência, e observou que a ZTE usou o Arria 10s para mostra pontuações de reconhecimento de imagem muito impressionantes.

Pessoalmente, estou curioso para ver se as futuras CPUs realmente levarão componentes diferentes e os combinarão usando EMIB ou uma tecnologia semelhante para mudar o que pensamos como um chip de processador. Estou intrigado com a idéia de que os sistemas do futuro possam usar muitos núcleos diferentes - alguns programáveis ​​(FPGA) e outros fixos (uma mistura de ASICs personalizados e CPUs e GPUs tradicionais) para fazer coisas em conjunto que melhoram o que qualquer um a tecnologia pode fazer por conta própria.

Intel vê papel crescente na computação heterogênea fpgas