Lar Pareceres Big data é apenas uma grande farsa | john c. dvorak

Big data é apenas uma grande farsa | john c. dvorak

Vídeo: А.И. Большая жирная ложь - шоу доктора данных (Outubro 2024)

Vídeo: А.И. Большая жирная ложь - шоу доктора данных (Outubro 2024)
Anonim

O recém-emergente meme "big data" nunca foi definido de maneira significativa e definitiva. É o novo termo mais amorfo que eu já vi há uma década. É um daqueles termos "de quem vê" usado para animar um seminário e, eventualmente, encharcar investidores.

Vamos começar perguntando o que significa big data? Muitos dados? Mais dados do que você pode manipular? Dados amorfos? Dados fora de controle? Dados úteis para análise? Dados inúteis? Sobrecarga de informação?

Se você ler o suficiente sobre big data, é tudo o que precede e mais. A chave não são os dados, mas o desafio de como lidar com os dados e o que fazer com os próprios dados.

Em outras palavras, como podemos fazer com que essa enorme pilha de dados, que conseguimos acumular, seja útil de maneiras novas e lucrativas? Os pools de dados podem vir de qualquer lugar através de vários mecanismos de computação, como postagens no Facebook, registros da NSA, listas de distribuição, clientes, etc.

Eu diria que a maioria dos leitores desta coluna são eles próprios repositórios de big data. Acabei de comprar uma unidade de 3 Terabyte para backup. Eu tenho muitos dados para fazer backup! Big data!

Uma ferramenta útil que eu possa imaginar seria uma ferramenta de análise de grande volume de dados que a polícia poderia usar para considerá-lo culpado de algum crime aleatório examinando seus arquivos. Ou pelo menos encontre algo que o envergonhe. Big data!

Tudo isso remete a um comentário feito por um ex-CEO da American Express, que disse a uma audiência que, se a empresa quisesse (e isso se aplica a todas as empresas de cartão de crédito), ela poderia usar seus hábitos e tendências pessoais de compra para montar uma lista completa. dossiê e definitivamente diga se você está tendo um caso ou não. Big data!

Pelo que sei, é exatamente isso que o big data faz melhor: espionar indivíduos.

O comentário popular da indústria é que, de alguma forma, bancos de dados enormes que contêm informações sobre você serão usados ​​para seu benefício. Sim, você sabe, então você terá um interesse pelo que realmente interessa. Publicidade direcionada. Isso beneficia a todos!

Aqui está como isso funciona. Estou interessado em comprar uma nova câmera e ouvir sobre o novo Bogus One. Eu li um artigo no PCMag.com sobre a câmera, depois fui à Amazon e verifique os preços e avaliações de usuários. Parece que ninguém gosta da câmera. É um pedaço óbvio de porcaria. Todos os revisores evitaram a câmera. Os compradores odeiam a câmera. Esta não é uma câmera que eu quero. Mas o software de análise de big data decide me fornecer centenas de anúncios, em todas as páginas da web que eu visito, todos mostrando a câmera Bogus One. Big data!

É pior que isso. Se as coisas fossem na outra direção e eu decidisse que gostava e queria a câmera e realmente a comprasse, ainda receberia anúncios incentivando-me a comprar a câmera. Big data!

A publicidade direcionada para "big data" é a maior carga de bobagem de todos os tempos.

OK, então vamos esquecer esse fiasco e passar a usar big data para tendências. O big data pode encontrar várias agulhas em vários palheiros. Então, você obteria algo assim: Quarenta por cento de todos os compradores da Subaru são vegetarianos / veganos e 80% deles são democratas. Mas esse número aumentou para 60% e 90%, respectivamente, se estamos falando de um Subaru Outback. Além disso, aumenta para 99% vegetariano / vegan e 99% democrata se o carro for pintado de verde.

Os teóricos do big data teriam um dia de campo no seminário com essas informações. Mas ignora todas as variáveis ​​que podem mudar os cálculos e as tendências, que são infinitas. Por quanto tempo algum desses big data em particular permanecerá se o CEO da Subaru for a uma reunião em um interior verde e declarar que "Todas as baleias devem ser aniquiladas!"?

Nem é preciso muito para mudar a dinâmica das conclusões de big data. Apesar do que diz o sujeito da American Express, os dados são realmente cegos. É por isso que você recebe anúncios de produtos que você já comprou.

O big data faria você chegar a conclusões.

Se alguém compra dez livros sobre como fazer uma bomba, isso significa que ele quer explodir o Edifício Federal? E se ele fosse um especialista em descarte de bombas e isso não estivesse incluído em seu cargo como consultor de polícia? O big data ainda não pode saber tudo. Não pode saber o que você está pensando. Estou pensando, por exemplo, que a câmera Bogus One é uma merda. O big data não pode saber disso, a menos que eu seja interrogado. E eu posso mentir sobre isso.

Nada disso parece bom ou saudável para a sociedade. Saltando para conclusões, fazendo suposições, agindo em suposições falsas. Caçando o público com s inúteis.

Big data como um conceito elevado nunca se definirá completamente e sofrerá uma morte miserável. Eu espero.

Big data é apenas uma grande farsa | john c. dvorak