Lar Visão de futuro Processadores móveis de 2018: a ascensão dos recursos de aprendizado de máquina

Processadores móveis de 2018: a ascensão dos recursos de aprendizado de máquina

Índice:

Vídeo: Concurso 5420 da Quina (Novembro 2024)

Vídeo: Concurso 5420 da Quina (Novembro 2024)
Anonim

Não é de surpreender que os smartphones deste ano apresentem processadores mais rápidos do que os do ano passado - isso acontece todos os anos. Mas o que há de novo neste ano é a predominância de recursos de aprendizado de máquina que praticamente todos os fornecedores de processadores estão promovendo como uma maneira de diferenciar seus dispositivos. Isso é verdade para os fornecedores de telefones que projetam seus próprios chips, os fornecedores independentes ou de comerciantes que vendem processadores para fornecedores de telefones e até os fabricantes de IP que projetam os núcleos que são usados ​​nos próprios processadores.

fundo

Primeiro, um pouco de fundo: todos os processadores de aplicativos modernos incluem projetos (geralmente chamados de propriedade intelectual ou propriedade intelectual) de outras empresas, principalmente empresas como ARM, Imagination Technologies, MIPS e Ceva. Esse IP pode aparecer de várias formas - por exemplo, o ARM vende de tudo, desde uma licença básica para sua arquitetura de 32 bits e 64 bits, até núcleos específicos para CPUs, gráficos, processamento de imagem etc., que os designers de chips podem usar para criar processadores. Normalmente, os projetistas de chips combinam e combinam esses núcleos com projetos próprios e fazem várias escolhas em relação à memória, interconexões e outros recursos, em um esforço para equilibrar o desempenho com os requisitos de energia, tamanho e custo.

Na parte frontal da CPU, a maioria dos chips possui uma combinação de núcleos maiores que são mais poderosos e rodam mais rápido e mais quente, e núcleos menores que são mais eficientes. Normalmente, os telefones usam os núcleos menores na maioria das vezes, mas para tarefas exigentes mudam para os núcleos de alto desempenho e usam uma combinação de núcleos e GPU e outros núcleos para gerenciar melhor as necessidades de desempenho e considerações térmicas (você não pode execute os núcleos de alto desempenho por muito tempo, porque eles superaquecerão e geralmente você não precisa). Os exemplos mais conhecidos para os grandes núcleos são os núcleos Cortex-A75 e A73 da ARM; os núcleos menores correspondentes seriam o A55 e o A53. Nos telefones de última geração de hoje, muitas vezes você vê quatro de cada, no que é conhecido como layout octa-core, embora alguns fornecedores tenham adotado outras abordagens.

Para os gráficos, há mais diversidade: alguns fornecedores escolhem a linha Mali da ARM, outros escolhem o PowerVR da Imagination Technologies e outros optam por projetar seus próprios núcleos gráficos. E há ainda mais diversidade quando se trata de coisas como processamento de imagem, processamento de sinal digital e, mais tarde, funções de IA.

maçã

A Apple começou a aumentar suas capacidades de IA em seus anúncios de outono, incluindo o chip "A11 Bionic" usado no iPhone 8 e 8 Plus, além do iPhone X.

O A11 Bionic é uma arquitetura de seis núcleos, com dois núcleos de alto desempenho e quatro núcleos de eficiência. A Apple projeta seus próprios núcleos (sob uma licença de arquitetura ARM) e tradicionalmente promove o desempenho de thread único. Este é um avanço do A10 Fusion de quatro núcleos, e a Apple disse que os núcleos de desempenho no A11 são até 25% mais rápidos que no A10, enquanto os quatro núcleos de eficiência podem ser até 70% mais rápidos que o chip A10 Fusion. Ele também disse que o processador gráfico é até 30% mais rápido.

A Apple fala sobre o chip ter um "Neural Engine" de núcleo duplo, que pode ajudar no reconhecimento de cenas no aplicativo da câmera, e Face ID e Animoji no iPhone X. A empresa também lançou uma API chamada CoreML, para ajudar terceiros. desenvolvedores criam aplicativos que tiram vantagem disso.

A Apple normalmente não fornece muitas informações sobre seus processadores, mas diz que o mecanismo neural A11 Bionic é um design de núcleo duplo que pode executar até 600 bilhões de operações por segundo para processamento em tempo real.

Diferentemente da maioria dos outros fabricantes de processadores, a Apple não integra o modem em seus processadores de aplicativos e, em vez disso, usa modems Qualcomm ou Intel independentes. Houve alguma controvérsia sobre se a Apple suporta apenas os recursos de seus modems Qualcomm que também são suportados pela Intel; na prática, isso significa que os iPhones suportam agregação de operadora de três vias, mas não alguns dos recursos mais avançados.

Huawei

A Huawei também chegou cedo ao impulso da IA ​​e chamou o Kirin 970, anunciado na feira da IFA no outono passado, "a primeira unidade de processamento de IA móvel do mundo". O Kirin 970 é usado agora no Huawei Mate 10. Ele inclui quatro núcleos de CPU Cortex-A73 com velocidade de até 2, 4 GHz e quatro A53s com velocidade de até 1, 8 GHz, juntamente com a GPU Mali G72 MP12 da ARM.

O que é particularmente novo no 970 é o que a Huawei chama de NPU, ou Unidade de processamento neural. A empresa disse que as tarefas que podem ser transferidas para esse processador podem ter 25 vezes o desempenho e 50 vezes a eficiência em comparação com as que estão sendo executadas no cluster da CPU. Isto visa, em particular, um reconhecimento de imagem mais rápido e uma melhor fotografia. No show, a Huawei disse que o telefone pode processar 1, 92 TeraFLOPs de 16 bits.

O Kirin 970 possui um processador de sinal de imagem dupla, um modem LTE categoria 18 com agregação de 5 operadoras e MIMO 4 por 4 que deve permitir uma velocidade máxima de download de 1, 2 Gbps.

No Mobile World Congress, a Huawei anunciou seu primeiro modem 5G, o Balong 5G01, que seria o primeiro modem 5G a ser lançado. Parece provável que alguns processadores de aplicativos futuros também adotem esse modem, mas isso ainda não foi anunciado. Tecnicamente, todos esses produtos são criados pela subsidiária HiSilicon da empresa.

Qualcomm

O chip que provavelmente estará no coração da maioria dos principais telefones Android nos EUA este ano é o Snapdragon 845 da Qualcomm. Esta é uma atualização do Snapdragon 835, usado na maioria dos telefones Android premium de 2017, e já é usado em as versões norte-americanas do Galaxy S9.

Como a maioria dos outros fornecedores, a Qualcomm está promovendo as redes neurais e a IA como uma das maiores áreas de melhorias no chip deste ano, junto com um foco maior na "imersão" - o que significa essencialmente melhores imagens.

Na área de IA, a Qualcomm gosta de falar em ter um NPE (Mecanismo de processamento neural) de múltiplos núcleos, que usa uma nova versão de seu DSP Hexagon, além de CPU e GPU para inferir.

O chip possui o Hexagon 685 DSP, que a Qualcomm diz que pode mais que dobrar o desempenho do processamento de IA; uma CPU Kryo 385, que, segundo ela, fornece um aumento de desempenho de 25 a 30% para seus núcleos de desempenho (quatro núcleos ARM Cortex-A75 com velocidade de até 2, 85 GHz) e um aumento de desempenho de até 15% para seus "núcleos de eficiência (quatro Núcleos Cortex-A55 com até 1, 8 GHz), com todos compartilhando um cache L3 de 2 MB; e uma GPU Adreno 630, que a Qualcomm afirma apoiar uma melhoria de desempenho de 30% ou uma redução de energia de 30%, além de até 2, 5 vezes displays mais rápidos.

Na área de IA, o chip suporta um grande número de estruturas de aprendizado de máquina diferentes, e a empresa diz que isso funciona para coisas como classificação de objetos, detecção de rosto, segmentação de cena, reconhecimento de alto-falante e etc. Dois aplicativos destacados são efeitos de bokeh ao vivo (para produzir retratos com um fundo desfocado) e sensor de profundidade ativo e luz estruturada, o que deve permitir um melhor reconhecimento do rosto. Ao passar a dedução da nuvem para o dispositivo, a Qualcomm obtém os benefícios de baixa latência, privacidade e confiabilidade aprimorada.

Na área de imagem, o chip possui uma nova versão do Spectra ISP da Qualcomm, captura de vídeo Ultra HD aprimorada com redução de ruído de vários quadros, capacidade de capturar vídeo de 16 megapixels a 60 quadros por segundo e vídeo em câmera lenta a 480 quadros por segundo. Para VR, o 845 suporta monitores com resolução de 2K por 2K a 120 quadros por segundo, um grande avanço em relação aos 1, 5K por 1, 5K a 60 quadros por segundo suportados pelo 835.

Outros recursos incluem uma unidade de processamento segura, que usa seu próprio núcleo para armazenar informações de segurança fora do kernel e funciona com a CPU e o recurso TrustZone da Qualcomm.

O 845 integra o modem X20 que a Qualcomm introduziu no ano passado, capaz de suportar LTE Categoria 18 (com velocidade de até 1, 2 Gbps), agregação de até 5 operadoras e MIMO 4X4, e usa técnicas como acesso assistido por licença para acelerar velocidades possíveis em mais áreas.

O chip é fabricado no processo de baixa potência e 10nm da Samsung.

A Qualcomm também fabrica a família de processadores de aplicativos Snapdragon 600, liderada pelo 660, usada por muitos fornecedores chineses, incluindo Oppo e Vivo. Na preparação para o Mobile World Congress, ela introduziu a família Snapdragon 700, que possui muitos dos mesmos recursos da família 800, incluindo o DSP Hexagon, ISP Spectra, gráficos Adreno e CPU Kryo. Em comparação com o 660, a Qualcomm diz que oferecerá uma melhoria de 2x nos aplicativos de IA do dispositivo e uma melhoria de 30% na eficiência de energia.

Samsung

Enquanto usa processadores Qualcomm na maioria dos telefones norte-americanos, em muitos outros mercados, a Samsung usa seus próprios processadores Exynos e está começando a disponibilizar esses processadores para outros fabricantes de telefones.

Seu novo topo de linha é o Exynos 9810, que a Samsung utilizará nas versões internacionais do Galaxy S9 e S9 +.

Mais uma vez, a Samsung está desenvolvendo novos recursos para o "software baseado em aprendizado profundo", que, segundo ele, ajuda o processador a identificar com precisão itens ou pessoas nos telefones, e apóia o senso profundo de reconhecimento de rosto.

O 9810 também é um chip octa-core, com quatro núcleos A55 para eficiência de energia e quatro designs de CPU personalizados para desempenho. A Samsung diz que esses novos núcleos, que podem rodar até 2, 9 GHz, têm um pipeline mais amplo e memória cache otimizada, dando a eles o dobro do desempenho de núcleo único e 40 por cento mais desempenho de múltiplos núcleos em comparação com o seu antecessor, no ano passado, 8895. Os benchmarks publicados mostram melhorias no mundo real, mas não tanto quanto reivindicado; continuo cético em relação a todos os benchmarks móveis até o momento.)

Outros recursos incluem gráficos Mali-G72 MP18, suporte para telas de até 3840 por 2400 e telas de 4096 por 2160, um processador de sinal de imagem duplo (ISP) e suporte para captura de 4K a 120 quadros por segundo. O 9810 também possui um modem Categoria 18 com agregação de 6 operadoras e MIMO 4 por 4 para downlink (2 CA para uplink), com velocidade máxima de 1, 2 Gbps no downlink e upload de 200 Mbs. No papel, isso corresponde aos modems da Categoria 18 que a Qualcomm e a Huawei têm em seus principais chips atuais. Como o Snapdragon 845, ele é fabricado no processo FinFET de 10nm e segunda geração da Samsung.

MediaTek

A MediaTek tem sido mais participante nos telefones de médio e baixo porte e, no mês passado, lançou um novo chip chamado Helio P60, voltado para o mercado "Novo Premium" - telefone de médio porte na faixa de US $ 200 a US $ 400 que oferece todo o recursos básicos dos telefones mais sofisticados. O primeiro telefone anunciado que usará esse chip é o Oppo R15.

O principal processador da empresa, anunciado no ano passado, é o Helio X30, que é um processador deca-core voltado para telefones premium. Isso inclui dois núcleos de CPU ARM Cortex-A73 em até 2, 5 GHz, quatro núcleos Cortex-A53 em até 2, 2 GHz e quatro núcleos A35 que podem rodar em até 1, 9 GHz, juntamente com os gráficos PowerVR Series 7XT Plus da Imagination em 800 GHz e um modem LTE de categoria 10 capaz de agregação de 3 operadoras no downlink. É um chip interessante, produzido no processo de 10 nm do TSMC, e apóia a ideia de que mais núcleos podem ser mais flexíveis. Entre os telefones anunciados para uso, estão o Meizu Pro 7 Plus com tela dupla e o Vernee Apollo 2 (câmera frontal de 8MP, câmera traseira de 16MP + 13MP).

No ano passado, a MediaTek anunciou dois processadores de mercado intermediário, o Helio P23 e P30, voltados para os mercados globais e especificamente para a China, cada um com oito núcleos Cortex-A53 rodando a 2, 53 GHz e gráficos Mali G71 MP2. Esses são os chips que o P60 foi projetado para substituir, oferecem mais potência e possibilitam uma série de novos recursos.

O P60 oferece mais desempenho e é um retorno à grande configuração LITTLE que a ARM e a MediaTek promoveram nos anos anteriores, combinando quatro dos mais poderosos ARM Cortex-A73 em até 2, 0 GHz com quatro dos mais eficientes Cortex-A53 núcleos, também a 2, 0 GHz. Juntam-se a elas uma GPU ARM Mali G72 NMP3 em até 800 MHz e são controladas pela quarta versão da tecnologia CorePilot da MediaTek para agendar onde as tarefas são executadas. Comparado aos P23 e P30, o MediaTek diz que o P60 oferece um aprimoramento de desempenho de 70% nas operações de CPU e GPU.

O MediaTek também está entrando no movimento da IA, com o P60 incluindo sua plataforma NeuroPilot para aceleração de hardware de rede neural. Isso suporta o Google Android Neural Network (NN) e as estruturas comuns de IA, incluindo TensorFlow, TensorFlow Lite, Caffe e Caffe 2. Esse é efetivamente um processador de sinal digital especializado capaz de 280 GMACs (bilhões de operações de acumulação múltipla por segundo). Ele foi projetado para ser usado para coisas como reconhecimento facial para desbloquear um telefone (algo que vimos em telefones de última geração, mas não telefones de médio alcance até agora) e reconhecimento de objetos, mesmo em vídeos, a 60 quadros por segundo.

Além disso, a P60 possui vários novos recursos de imagem, incluindo três processadores de sensor de imagem que podem suportar uma configuração de câmera dupla de 16 e 20 MP ou uma única câmera de até 32 MP. (Eu ainda não vi um telefone em produção com um sensor de câmera com tantos megapixels, mas eles supostamente estão chegando.) Esses sensores adicionam recursos de redução de ruído, além de bokeh em tempo real (o embaçamento do fundo usado nos modos retrato).

O chip inclui um modem que suporta downloads de Categoria 7 (até 300 Mbps) e uploads de Categoria 13 (até 150 Mbps com agregação de 2 operadoras). É fabricado no processo FinFet de 12nm da TSMC, que a empresa ajuda a proporcionar economia de energia de 25% em aplicativos com uso intensivo de energia, como jogos, e economia de energia geral de 12%.

Spreadtrum

A Spreadtrum, que fabrica modems vendidos principalmente no mercado chinês, anunciou uma parceria com a Intel que usará o modem 5G da Intel e CPUs compatíveis com ARM. Ainda faltam alguns anos para que os detalhes ainda não estejam disponíveis.

Observe que, embora o Spreadtrum não seja muito visível nos EUA, ele rastreia apenas a Qualcomm e a MediaTek no mercado comercial de processadores de aplicativos. Ele vende principalmente produtos com CPUs ARM e seu próprio modem 4G, mas tem um acordo com a Intel e pertence a ela uma minoria. Isso resultou em um chip com CPUs Intel e modem da Spreadtrum (o oposto do novo anúncio).

BRAÇO

Obviamente, não são apenas os fabricantes de chips que vêem a IA como a próxima grande onda, e as empresas que fazem o IP também estão dando um grande empurrão nessa área.

A ARM, a mais bem-sucedida entre os fabricantes de IP, anunciou um pacote de IP para aprendizado de máquina no mês passado, incluindo hardware e software, e fez isso no Mobile World Congress.

Apelidado de Projeto Trillium, isso inclui designs de processador (IP) para Machine Learning (ML) e Object Detection (OD), juntamente com uma nova biblioteca de software.

O processador ML foi projetado para ficar dentro de um processador de aplicativo e executar próximo ao CPU, GPU e núcleo de exibição. A biblioteca de software, conhecida como ARM NN (rede neural), foi projetada para suportar estruturas como TensorFlow, Caffe e Android NN. Isso permite que esses aplicativos executem apenas o software em processadores existentes que possuem CPUs e gráficos ARM; embora, é claro, seja acelerado consideravelmente quando executado em processadores que incluem os núcleos ML. Software de terceiros também funcionará no núcleo do processador. A ARM diz que o núcleo do ML foi projetado desde o início especificamente para executar redes neurais. Ele pode executar aplicativos de 8 e 16 bits, embora a tendência seja se concentrar em 8 bits para simplificar.

O processador OD foi projetado para ficar ao lado de um ISP (processador de sinalização de imagem), a fim de fornecer detecção de objetos de baixa potência, especificamente para aplicações como detecção de rosto e rastreamento de movimento. Este é um bloco de hardware dedicado projetado para ser usado com novas tecnologias de sensores, como câmeras estereoscópicas.

A ARM disse que o novo IP estará disponível para visualização do desenvolvedor em abril e estará disponível no final deste ano, mas, dado um ciclo de tempo típico, é improvável que os novos núcleos do processador apareçam nos chips até 2019 ou mais tarde. Obviamente, o software, que funciona em núcleos existentes, poderia ser implantado muito antes.

A ARM também lançou algumas novas soluções para a Internet das Coisas, incluindo uma nova solução SIM chamada Kigen, projetada para ser construída dentro de SoCs para dispositivos de baixa energia para substituir os cartões SIM físicos atuais.

Imagination Technologies

A Imagination, conhecida por seus gráficos PowerVR, anunciou seu IP de rede neural no outono passado, o PowerVR 2NX Neural Network Acceleration (NNA). Essa é uma arquitetura flexível com um a oito núcleos, cada um dos quais pode ter 256 unidades multi-acumular (MACs) de 8 bits. A Imagination disse que pode executar mais de 3, 2 trilhões de operações por segundo.

Ceva

Outros fornecedores de IP também estão entrando no mercado. A Ceva, conhecida por seus núcleos DSP, acaba de anunciar o NeuPro, uma família de núcleos de processadores de IA projetados para dispositivos de ponta. Elas se baseiam nos processadores que a empresa vendeu na área de visão computacional e usam a estrutura CDNN para uma variedade de "processos de IA". Isso funcionará com as estruturas comuns de aprendizado de máquina e as converterá para execução em processadores móveis para inferências. A empresa planeja processadores que variam de 2 a 12, 5 teraops por segundo (TOPS) projetados para produtos de consumo, vigilância e ADAS (para veículos autônomos). A Ceva afirmou que um grande cliente automotivo planeja habilitar 100 TOPS de desempenho usando menos de 10 watts de potência. O licenciamento começará no segundo semestre deste ano.

A Ceva também anunciou sua plataforma PentaG de DSPs para modems de banda base 5G. A empresa diz que seus atuais DSPs estão em 40% dos aparelhos do mundo, cobrindo cerca de 900 milhões de telefones por ano, e em modems da Intel, Samsung e Spreadtrum. A nova plataforma possui mais IA, usada principalmente para "adaptação de links". No mundo 5G, os aparelhos podem ter vários links para uma estação base, e a Ceva diz que seu hardware e software ajudam a determinar o melhor link a cada poucos milissegundos. Isso pode economizar bastante energia em comparação com o uso de software sozinho. Este não é um DSP de uso geral ou chip de rede neural, mas sim um projetado especificamente para comunicações. Foi anunciado recentemente e deve estar disponível no terceiro trimestre.

A Ceva também está fazendo um grande esforço para os DSPs no mercado de estações base 5G e afirmou que até 50% da nova infraestrutura de rádio 5G usará o IP DSP da empresa, incluindo sistemas da Nokia e ZTE.

Qual a probabilidade de você recomendar o PCMag.com?

Processadores móveis de 2018: a ascensão dos recursos de aprendizado de máquina