Lar O negócio Google simplifica o aprendizado de máquina com sql

Google simplifica o aprendizado de máquina com sql

Índice:

Vídeo: Тестировщик с нуля / Урок 20. SQL для тестировщика. Как создать таблицы в MySQL для QA (Outubro 2024)

Vídeo: Тестировщик с нуля / Урок 20. SQL для тестировщика. Как создать таблицы в MySQL для QA (Outubro 2024)
Anonim

O Google agora adicionou recursos de aprendizado de máquina (ML) ao seu Google BigQuery, a oferta de banco de dados em nuvem em escala de petabytes (PB) da empresa. Agora chamada BigQuery ML, a nova versão permite que você use instruções SQL (Structured Query Language) simples para criar e implantar modelos de ML para análises preditivas.

Essas não são apenas boas notícias para cientistas de dados que usam o Google. Também é bom para operadores de negócios interessados ​​em aprimorar seus recursos de análise de dados, pois adiciona um concorrente mais eficaz a uma lista bastante pequena de fornecedores capazes de oferecer esse nível de sofisticação via nuvem. Os outros dois nomes mais conhecidos são Serviço de banco de dados relacional da Amazon e Azure SQL da Microsoft, e você pode encontrar mais em nosso recente resumo de serviço de banco de dados em nuvem.

A desgraça de todos os vendedores e compradores de produtos de dados sempre foi a lacuna de habilidades. Isso é especialmente verdadeiro para os interessados ​​em ML e análise preditiva, pois essas disciplinas geralmente exigem conhecimento de novas tecnologias e linguagens de consulta.

"Para cada cientista de dados, existem centenas de analistas trabalhando com dados e a maioria usando SQL", disse Sudhir Hasbe, diretor de gerenciamento de produtos do Google Cloud, à PCMag. Algo precisava dar para que o poder de um exército de analistas de dados fosse desvendado do gargalo criado por poucos e sobrecarregados cientistas de dados.

A resposta do Google a esse dilema é nada menos que notável. Embora a ML seja uma tendência quente e apareça em todos os tipos de produtos em todos os lugares, ainda é um território firmemente cientista de dados. Muitos fornecedores avançaram na simplificação da tecnologia, mas a verdade feia é que você pode simplificá-la muito e ainda é muito difícil para mais de 99% da população humana usar. No entanto, precisamos ser capazes de usá-lo porque o ML pode fazer mais e mais rápido do que um grupo de seres humanos super-inteligentes.

O Google está plantando ML no Google BigQuery para que fique mais próximo dos dados. O aplicativo trará recursos de ML mais rapidamente do que os modelos tradicionais de ML, em parte porque a análise de dados pode ser realizada na fonte. Agora, na versão beta, o BigQuery ML permite que analistas (e cientistas de dados) executem análises preditivas, como previsão de vendas e criação de segmentos de clientes, exatamente sobre os dados em que estão armazenados. Isso por si só é uma atualização respeitável e notável.

No entanto, o Google foi além disso, adicionando um recurso que permite aos analistas de dados usar instruções SQL simples para criar e implantar modelos de ML. No momento, as opções são modelos de regressão linear e regressão logística para análise preditiva, pois esses são os dois modelos mais usados.

Aqui está uma ilustração que o Google forneceu para demonstrar como os analistas de dados usariam esse recurso:

O Google planeja adicionar mais opções de ML a esse recurso ao longo do tempo, segundo Hasbe. "Precisamos ouvir nossos clientes sobre quais modelos eles desejam adicionar, para que possamos fornecer os mais úteis primeiro", disse ele.

Atualizações adicionais do Google BigQuery

No topo da lista substancial de atualizações após o ML estão o recurso de agrupamento, o BigQuery GIS (Sistemas de Informações Geográficas), um novo conector de dados do Google Sheets e um novo conector de dados do Google Sheets.

O cluster também está na versão beta e permite a criação de tabelas em cluster em uma movimentação de otimização de dados que agrupa linhas com chaves de cluster semelhantes. Isso reduz os custos, pois melhora o desempenho e permite ao Google BigQuery cobrar do usuário apenas pelos dados digitalizados, e não por toda a tabela ou partição.

O BigQuery GIS está atualmente em alfa e é usado para análise de dados geoespaciais. Enquanto a equipe do Google Cloud fez parceria com o Google Earth Engine para criar o BigQuery GIS, você precisa trazer seus próprios dados geoespaciais para a tabela. Isso não é um problema em vários setores, incluindo sistemas de carros conectados, Internet das Coisas (IoT), manufatura, varejo, cidades inteligentes e telemática. Sem mencionar agências governamentais que vão desde a Agência de Proteção Ambiental (EPA) e a Agência Nacional de Inteligência Geoespacial até a Administração Nacional Oceânica e Atmosférica (NOAA) e todos os ramos militares, é claro.

O BigQuery GIS usa a biblioteca S2, que agora possui mais de um bilhão de usuários por meio de uma variedade de produtos, como o Google Earth Engine e o Google Maps. Se você precisar de mais dados geoespaciais, o governo federal compartilhará uma quantidade imensa deles no GeoPlatform.

Um novo conector de dados do Planilhas Google provavelmente encantará muitos analistas de dados simplesmente porque é muito prático para o uso diário. Você pode acessar o Google BigQuery no Google Sheets (programa de planilhas) e usar ferramentas do Google Sheets, como o Explore, que é uma ferramenta combinada de colaboração, visualização de dados e consulta de idioma natural.

O Google BigQuery agora também possui uma nova interface de usuário (UI) na versão beta. Um dos elementos mais interessantes é a funcionalidade de visualização com um clique, suportada pelo Google Data Studio. Ao todo, é uma ótima rodada de atualizações para um serviço já elegante. Essas atualizações serão testadas na próxima rodada de análises da solução de banco de dados como serviço (DBaaS) da PCMag, depois que os erros forem solucionados e os produtos tiverem passado dos respectivos status alfa e beta.

O PCMag EIC Dan Costa discute o futuro dos dados:
Google simplifica o aprendizado de máquina com sql