Vídeo: MLB | Gaffe Oddities (Novembro 2024)
Como o streaming de vídeo se tornou popular e mais móvel, fiquei imaginando como as empresas que transmitem vídeo adaptam sua tecnologia para lidar com o crescimento. Por isso, fiquei intrigado quando tive a oportunidade de conversar com a MLB Advanced Media (MLBAM) para ver como a empresa está lidando com o impressionante crescimento no streaming de vídeo, especialmente ao vivo para beisebol e muitas outras atividades.
Joseph Inzerillo, vice-presidente executivo e CTO da MLBAM, falou sobre como os fluxos da empresa realmente cresceram nos últimos cinco anos. Em 2009, ele disse, a empresa processou 19.000 transmissões de vídeo ao vivo; neste ano, serão cerca de 400.000, incluindo o MLB.com e os vários aplicativos da MLB (como o MLB At Bat), e o streaming que ele faz para outros esportes. Ele disse que o At Bat foi o aplicativo esportivo de maior crescimento em 2013, com mais de 10 milhões de downloads e 6 milhões de partidas por dia. Mas a MLBAB também lida com streaming para uma variedade de outros aplicativos, desde aplicativos de beisebol como o Home Run Derby até a WWE wrestling e 120 Sports, uma nova rede de esportes digitais liderada pela Sports Illustrated.
Os fãs "votam com os olhos", disse Inzerillo, observando que o streaming de vídeo e os aplicativos móveis estão crescendo muito rapidamente. Ele disse que via o tablet como "o aparelho de televisão da próxima geração". Um novo projeto importante inclui o rastreamento de jogadores, que rastreia a posição de todas as pessoas em campo, para que ele possa monitorar melhor coisas como campo, reação à bola, eficiência da rota, etc. Atualmente, ele está trabalhando em três estádios com planos de rolar em 2015, junto com mais aplicativos voltados para o consumidor. Mas isso resulta em "três ordens de grandeza" mais dados coletados do que as estatísticas tradicionais de beisebol. Outros projetos incluem o iBeacon, que está sendo implantado em 28 estádios para uso no aplicativo At the Ballpark da MLB, e um grande impulso para aumentar a conectividade do estádio.
Dez anos atrás, quando ele começou a trabalhar na MLB.com, Inzerillo disse que a organização tinha um data center com 60 máquinas, praticamente todas elas "caixas de pizza" padrão - servidores de 1U. Agora, possui seis data centers - dois em Nova York, Omaha e San Francisco (com um novo em Omaha), cada um com uma média de mais de 600 máquinas. Somente este ano, ele disse que o MLB.com criou três novos data centers com um total de cerca de 2.000 computadores (com o que ele quer dizer blades ou soquetes) e 600 dispositivos de streaming. A maior parte das novas máquinas são servidores Cisco UCS (Unified Computing Systems), que, segundo ele, foram escolhidos principalmente pela facilidade de implantação, provisionamento e administração.
A maioria do MLB.com e seus produtos associados são executados em seus próprios datacenters. Ele disse que a organização usa infraestrutura de nuvem pública (principalmente a Amazon) quando coisas como elasticidade são importantes, como notificações por push, mas disse que isso representa apenas 10 a 15% do uso da empresa. A nuvem pública não era preferida para desempenho em tempo real.
Em Nova York, a MLB possui dois data centers, um que realiza principalmente a aquisição de conteúdo (trazendo-o de todos os estádios, etc.) hospedado nos escritórios da MLB em Nova York e outro que distribui, hospedado em uma instalação de comunicações nível 3 nas proximidades.
Isso envolve muitos dados - Inzerillo disse que a MLB gera cerca de 15 petabytes de dados por ano e que, com o rastreamento de jogadores e novas opções de vídeo, pode crescer para 25 petabytes no próximo ano. Isso não conta dados em CDNs (redes de dados de conteúdo etc.)
No total, ele disse que a organização possui cerca de três quartos de petabyte de dados em armazenamento on-line (em uma mistura de armazenamento flash e disco) e 30 a 60 petabytes de armazenamento near-line, consistindo de fitas com conteúdo de jogos anteriores e temporadas.
Ele disse que não era o que costuma ser considerado "big data" em termos dos recursos analíticos necessários, embora isso possa mudar com o rastreamento dos jogadores, mas certamente conta como big data em termos do tamanho dos dados usados.