Lar Visão de futuro AMD e Intel abrem frente de gráficos em batalha de processadores

AMD e Intel abrem frente de gráficos em batalha de processadores

Vídeo: AMD e Intel juntas? Entenda a tecnologia Embedded Multi-die Interconnected Bridge (Novembro 2024)

Vídeo: AMD e Intel juntas? Entenda a tecnologia Embedded Multi-die Interconnected Bridge (Novembro 2024)
Anonim

Em uma série de anúncios recentes, a Intel e a AMD revelaram várias mudanças importantes nas arquiteturas de seus processadores x86, que prometem transformar a maneira como os processadores x86 serão usados ​​nos próximos anos.

Na semana passada, a AMD anunciou uma nova arquitetura de memória que visa aproximar a computação de CPU e GPU. A Intel divulgou uma nova ênfase na melhoria de sua posição nos gráficos de PC mais tradicionais. Ontem, a Intel anunciou uma versão completamente nova da microarquitetura para sua série Atom de processadores, que deve tornar esses chips muito mais poderosos e potencialmente fechar a brecha entre o Atom e a família de processadores Core mais tradicional da empresa.

Nova arquitetura de memória da AMD

O anúncio da AMD do que chama de acesso uniforme à memória heterogêneo (hUMA) não foi uma grande surpresa, pois a empresa vem conversando sobre Heterogeneous Systems Architecture (HSA) há muito tempo.

O conceito é muito simples. Mesmo em um chip que possui a CPU e o processamento gráfico (GPU) na mesma matriz, como nas unidades de processamento acelerado (APUs) da AMD, a memória usada pela CPU e pelos gráficos permaneceu em conjuntos separados. Embora exista fisicamente a mesma memória, a CPU e a GPU usam ponteiros diferentes para a memória. Para usar a GPU para computação, um programa precisa copiar os dados da parte da memória usada pela CPU para a parte usada pelos gráficos, fazer o cálculo e copiá-lo novamente. Tudo isso leva tempo. Com um verdadeiro sistema de memória unificada que inclui gráficos, isso não será necessário.

A AMD está promovendo isso como parte da HSA Foundation, que inclui ARM, Qualcomm, Samsung, Texas Instruments, MediaTek e Imagination. Em particular, essa abordagem usa um tempo de execução de software conhecido como HSAIL e um conjunto de interfaces para aplicativos acelerados por HSA.

Esta semana, a AMD detalhou como, em sua arquitetura hUMA, a CPU e a GPU podem alocar dinamicamente a memória de todo o espaço de memória e usá-la junto com o mesmo esquema de endereçamento virtual. A memória será coerente bidirecional, portanto, qualquer atualização na memória feita pela CPU ou GPU será vista pelos outros elementos de processamento. A GPU agora suporta memória paginável, com páginas virtuais, para que possa trabalhar com conjuntos de dados maiores (da mesma forma que as CPUs atualmente funcionam). A idéia é que a CPU e a GPU possam trabalhar juntas de forma mais eficiente. A AMD disse que os desenvolvedores poderão escrever aplicativos acelerados por HSA usando linguagens de programação padrão, como Python, C ++ e Java.

A AMD não é a única empresa que considera importante a computação heterogênea e a HSA Foundation também possui seus concorrentes. A Nvidia tem sido um grande defensor do que costumava chamar GP-GPU, pressionando suas APIs CUDA e prometendo que uma versão futura de seus processadores gráficos suportará memória unificada. Várias das grandes plataformas de software têm suas próprias alternativas: as extensões DirectCompute da Microsoft para o DirectX para computação GP-GPU e a API Renderscript do Google para computação heterogênea. Talvez o mais importante seja o fato de o Khronos Group, um consórcio da indústria, promover o padrão OpenCL.

A grande questão será qual desses padrões atrairá desenvolvedores. O primeiro processador da AMD a suportar o hUMA será o seu processador Kaveri, previsto para ser lançado até o final de 2013 (embora provavelmente não esteja em sistemas até o início do próximo ano). A AMD também está fornecendo a APU para o PlayStation 4 e há rumores de que esteja fornecendo a APU para a próxima geração do Xbox. Parece provável que outros membros da HSA Foundation também possam usar a arquitetura hUMA, embora nenhum ainda tenha que anunciar esses projetos. Juntos, isso pode ser suficiente para criar massa crítica para desenvolvedores e ferramentas e, se for o caso, isso pode ser muito importante.

Intel duplica gráficos em Haswell

No final da semana passada, a Intel revelou mais detalhes sobre o seu próximo processador de quarta geração, um produto de 22 nm conhecido como Haswell. A Intel havia divulgado anteriormente uma série de novos recursos para Haswell, incluindo novas instruções AVX2 para trabalhar com vetores inteiros maiores e instruções de adição múltipla combinada (FMA) para ponto flutuante. Essas são coisas que os usuários finais provavelmente não verão, exceto em termos de desempenho aprimorado em cargas de trabalho bastante especializadas.

O mais interessante sobre o novo anúncio é o foco em gráficos, uma área em que os concorrentes AMD e Nvidia certamente lideraram.

Mas a Intel está dando alguns grandes passos com os processadores Haswell. A Intel há muito tempo diz que adicionará mais gráficos à matriz de alguns modelos da Haswell, incluindo uma versão de ponta conhecida como GT3. Efetivamente, trata-se apenas de unidades adicionais de instruções gráficas, acima dos valores atuais dos processadores Ivy Bridge. Por si só, essa é uma grande mudança, já que em seus produtos a Intel normalmente dedica mais espaço para o espaço da CPU, enquanto as APUs concorrentes da AMD dedicam mais espaço para gráficos.

Mas a Intel recentemente mostrou outra variante, o que chama de gráficos GT3e, que adiciona um segundo dado com 128 MB de DRAM incorporada ao pacote que contém o dado Haswell e foi projetado para acelerar o desempenho dos gráficos. Na semana passada, a Intel anunciou que as versões de alta velocidade dos gráficos GT3 agora serão chamadas Iris, e aquelas com a DRAM incorporada serão chamadas Iris Pro, já que a Intel espera obter alguma vantagem de marca dos novos níveis de gráficos.

Em particular, a linha Haswell será segmentada com versões com uma pequena quantidade de gráficos (GT1) chamada HD Graphics; com os gráficos GT2 (equivalente ao high-end da linha Ivy Bridge) denominados HD Graphics 4200 a 4600, dependendo da velocidade; com gráficos GT3, mas rodando a 15 watts, chamado HD Graphics 5000; as partes com gráficos GT3 rodando a 28 watts e acima agora serão chamadas Intel Iris Graphics 5100; e aqueles com os gráficos GT3e e gráficos incorporados chamados Iris Pro 5200. (A Intel nunca foi uma das que nomeava a simplicidade.)

Os números de peça da Intel permanecem complicados, mas observe que um número de peça que começa com 4 indica Haswell, enquanto um que começa com 3 indica Ivy Bridge. A empresa está usando o MQ para indicar peças padrão para notebooks GT3 e o HQ para indicar peças que possuem a DRAM incorporada.

Como parte do anúncio, a Intel compartilhou os números de desempenho das novas peças, mostrando melhorias significativas de desempenho em comparação com os processadores existentes da empresa. A Intel mostrou números sugerindo um desempenho Ultrabook de até 1, 5 vezes a geração anterior, com aproximadamente o mesmo consumo de energia (e o dobro do desempenho com um chip de alta potência voltado para notebooks um pouco maiores, aqueles com telas de 14 polegadas e maiores), o dobro dos gráficos desempenho em notebooks tradicionais e quase três vezes o desempenho em sistemas de desktop.

A Intel diz que os novos gráficos Iris e Iris Pro são comparáveis ​​a GPUs discretas, e isso é um grande negócio. (Como sempre, tomo todos os números de desempenho com um pouco de sal até poder testar os produtos.) Tenho certeza de que ainda haverá muito mais peças gráficas para desktop discretas de alto desempenho da AMD e Nvidia para aplicativos de jogos e estações de trabalho, mas normalmente essas partes usam muita energia. Em laptops de tamanho normal, onde o envelope de energia é muito menor, os gráficos na matriz são mais importantes, mas ainda existe um grande mercado para gráficos discretos. A Intel parece estar mirando nesse mercado. Ultrabooks e outros notebooks finos normalmente não têm o requisito de energia para executar gráficos discretos, portanto, gráficos aprimorados na matriz são certamente bem-vindos.

Nova microarquitetura Atom da Intel

Em muitos aspectos, porém, o maior anúncio da Intel considerou sua arquitetura de baixo consumo de energia, destinada a substituir a arquitetura usada na atual arquitetura Atom da empresa. A família Atom é conhecida principalmente por ser usada em dispositivos móveis, como tablets e, em menor grau, em alguns smartphones. A nova arquitetura, conhecida como Silvermont, também se destina a uma variedade de data centers e mercados incorporados.

A arquitetura representa uma grande mudança. Em vez do mecanismo de execução em ordem usado nas versões anteriores da arquitetura Atom, incluindo a arquitetura Saltwell usada nas versões atuais de 32 nm da empresa, a Silvermont adiciona um mecanismo de execução fora de ordem, como é usado nos processadores Core e Xeon da Intel. Isso deve melhorar significativamente o processamento de aplicativos de thread único. Ele oferece uma nova arquitetura de malha de sistema, projetada para escalar até oito núcleos (provavelmente para aplicativos como microsservidores). Por fim, adiciona novas instruções (para equiparar-se às usadas na versão Westmere dos processadores Core) e novas tecnologias de segurança e virtualização.

A nova arquitetura possui um design modular baseado em módulos que contêm dois núcleos, 1 MB de cache L2 compartilhado (latência muito baixa, alta largura de banda) e uma interface ponto a ponto dedicada à malha SoC. Observe que isso substitui o conceito de multi-threading que a Intel tem promovido fortemente e, de fato, soa um pouco como a abordagem modular da AMD usada em seus atuais chips de desktop e servidor. (A Intel, no entanto, se esforçou para explicar que não era a mesma coisa; os módulos da AMD compartilham mais coisas, incluindo ponto flutuante.) Os módulos podem ser combinados para incluir até oito núcleos.

Para o consumo de energia, a Intel diz que a nova arquitetura permite uma faixa dinâmica de energia mais ampla e permite a cada núcleo sua própria frequência e gerenciamento de energia independentes, permitindo que cada um suba e desça no desempenho e no consumo de energia. (Ao contrário dos processadores móveis, é mais parecido com o que a Qualcomm usa com seus núcleos Krait do que com a combinação ARM big.LITTLE mais padrão.) Também foi projetado com gerenciamento aprimorado de energia e entrada e saída mais rápidas dos modos de espera, recursos que são particularmente importantes no mercado móvel.

A empresa diz que pode ajustar melhor a energia entre o núcleo da CPU e outros elementos, como gráficos, permitindo uma implementação mais sofisticada do modo burst.

No geral, a Intel diz que a nova arquitetura e uma mudança para o processo FinFet SoC de 22 nm da empresa devem permitir chips que ofereçam desempenho três vezes maior ou potência cinco vezes menor do que os atuais chips Atom. Em geral, a Intel disse que seu núcleo "eficiente" pode superar um processador quad-core atual ineficiente sob restrições de energia. (Mais uma vez, como sempre, esperarei que os produtos julguem isso.)

Assim como a atual linha Atom, a arquitetura Silvermont provavelmente será usada em uma variedade de processadores, desde os voltados para dispositivos móveis até sistemas maiores. Isso deve incluir o Avoton, destinado a microsservidores, o Rangely, destinado a dispositivos de rede, o Merrifield, destinado a smartphones, e o Bay Trail, destinado a tablets e conversíveis. Dessas, a mais aguardada é a plataforma Bay Trail de 22 nm, que a Intel espera ter no mercado a tempo de os tablets estarem disponíveis na temporada de festas, com mais detalhes em breve.

No geral, a arquitetura Silvermont parece um grande passo em relação à arquitetura Atom existente, e estou particularmente intrigado ao ver como o Bay Trail, com base nessa arquitetura, realmente se comporta. Até o momento, houve uma diferença de desempenho notável entre a gama básica da família Core e os átomos de última geração, mas essa arquitetura parece que poderia estar realmente diminuindo a diferença.

Conclusão: Gráficos e poder definem a concorrência

Todos os principais processadores que você vê atualmente - seja um chip Intel ou AMD voltado para desktops ou laptops ou um chip baseado em ARM voltado para smartphones e tablets - têm vários núcleos de CPUs, normalmente vários núcleos de GPU (exceto chips de servidor) e todos os tipos de outra lógica especializada, para coisas como processamento de imagem, codificação e decodificação de vídeo e manipulação de criptografia.

À medida que o processo do chip diminui, mais transistores podem ser incluídos em um único chip. Mas quais recursos integrar (e como integrá-los) continuam sendo um diferencial importante entre os fornecedores de chips, assim como o design e a microarquitetura específicos dos próprios chips.

Esses anúncios mostram as vantagens e desvantagens que a Intel e a AMD estão fazendo e devem ter implicações enormes para a computação nos próximos anos.

Para desktops e laptops, a Intel parece não apenas tentar alcançar a AMD com desempenho gráfico incorporado adicionando mais unidades de execução, mas também tentar avançar com recursos como DRAM incorporada, aproveitando sua tecnologia de processo conduzir. A AMD também não ficará quieta com seus gráficos, por isso deve ser uma combinação interessante. Enquanto isso, a AMD está se esforçando para integrar melhor os recursos gráficos e da CPU, o que pode resultar em uma nova maneira de programação; isso leva mais tempo, mas pode se tornar incrivelmente importante.

A batalha entre o Kaveri da AMD e o Haswell da Intel poderia, portanto, ser mais interessante do que a competição Intel-AMD dos últimos anos. Haswell certamente enviará primeiro. (Espero ver sistemas neste verão, em comparação com o Kaveri no início do próximo ano.) Novamente, isso é principalmente para desktops e notebooks convencionais. Jogadores e usuários de estações de trabalho ainda desejam, sem dúvida, emparelhar um ou outro chip com soluções gráficas discretas da AMD ou da Nvidia.

Para tablets e, eventualmente, telefones, a abordagem heterogênea da arquitetura de sistemas que a AMD e outros estão adotando pode se tornar ainda mais importante, embora novamente demore um pouco para ver se os aplicativos realmente tiram vantagem disso. A nova arquitetura da Intel deve torná-la mais competitiva neste espaço. Parece realmente um grande passo à frente, mas seus concorrentes também continuarão se movendo.

Estou um pouco curioso para saber se coisas como a plataforma Bay Trail, baseada em Silvermont, para o Atom, são realmente rápidas o suficiente para que elas apareçam em notebooks de baixo custo mais populares ou mesmo em desktops. Os tablets baseados no Atom de hoje já rodam o Windows razoavelmente bem e, com as melhorias, podem ser suficientes para muitos usuários comuns, mesmo que fiquem atrás do desempenho de Haswell ou Kaveri (ou o atual Sandy Bridge da Intel e o atual Richmond da AMD, por isso importam).

Deverá criar uma competição emocionante no próximo ano.

AMD e Intel abrem frente de gráficos em batalha de processadores