Lar Visão de futuro As ferramentas cognitivas e de conversação ocupam o centro do palco no microsoft build

As ferramentas cognitivas e de conversação ocupam o centro do palco no microsoft build

Vídeo: Episódio 2: LUIS Microsoft (Language Understanding Intelligent Service) (Novembro 2024)

Vídeo: Episódio 2: LUIS Microsoft (Language Understanding Intelligent Service) (Novembro 2024)
Anonim

O que mais me surpreendeu na conferência Microsoft Build desta semana foi a ênfase nos serviços cognitivos e de conversação, pois a Microsoft lançou sua visão de como esses serviços transformarão os aplicativos no futuro e tentou convencer os desenvolvedores a aderirem a essa visão.. Muito disso não será aparente para os usuários finais até mais tarde - os maiores recursos para os usuários finais no momento serão as melhorias no assistente pessoal da Cortana e os novos recursos de tinta na "Anniversary Edition" do Windows 10, que serão lançados neste verão. Mas o esforço para garantir que a Microsoft acompanhe seus rivais em aprendizado de máquina, agentes inteligentes e aplicativos de mensagens é mais voltado aos desenvolvedores no momento, já que a empresa já possui aplicativos básicos, mas precisa de um ecossistema para torná-los mais impressionantes.

O maior tema novo introduzido pelo CEO Satya Nadella foi "conversas como plataforma", que parece envolver a adoção de plataformas de conversação - da Cortana ao Skype e aplicativos de terceiros - e o acréscimo de inteligência. A idéia é adicionar entendimento, preferências e, principalmente, contexto a esses aplicativos.

Ele disse que há três atores principais nessas conversas: pessoas, assistentes digitais e bots. Do lado a pessoa, ele falou sobre aplicativos como o Skype Translate, que tentam permitir melhores conversas em vários idiomas. Um assistente digital, ele disse, saberá sobre você em vários dispositivos e pode ajudar nas tarefas diárias, como agendar compromissos. Bots são novos aplicativos com os quais você pode conversar em linguagem natural, e ele falou sobre uma visão na qual você pode chamar bots em uma conversa.

Tudo isso está levando a uma nova plataforma, disse ele, onde a linguagem humana se torna a interface do usuário, os bots se tornam os novos aplicativos e os assistentes digitais são como "meta-aplicativos", como o navegador, que existem em parte para chamar outros aplicativos., com todos esses aplicativos, incluindo inteligência. Ele disse que essa mudança de plataforma seria tão grande quanto a GUI, a Web ou o toque no celular.

Nadella falou sobre como a visão "não era homem versus máquina, mas sim homem com máquinas", com pessoas fornecendo empatia, emoções e julgamentos, e máquinas fornecendo poder computacional. Mas ele disse que era importante ter uma "abordagem baseada em princípios" para o aprendizado de máquina, e usá-lo para aumentar as habilidades e experiências humanas, ser confiável (em termos de privacidade, segurança e conformidade), inclusivo e respeitoso.

No último ponto, ele disse que era importante que esses aplicativos representassem "o melhor da humanidade, não o pior", e apontou para Tay, o experimento fracassado da Microsoft em introduzir um bot de bate-papo na semana passada, que teve que ser retirado um dia depois quando começou a repetir comentários ofensivos. Nadella admitiu que a empresa entendeu errado, dizendo que "percebemos rapidamente que não estava à altura", mas disse que continuaria a incubar essas tecnologias, observando que seus bots na China e no Japão não tiveram os mesmos problemas..

Entre os novos detalhes estão a Cortana chegando ao Outlook, para entender melhor seus e-mails, contatos e calendário e fazer coisas como reagendar compromissos - uma ótima idéia, se não completamente nova - e sugerir coisas que você pode querer fazer a seguir com base no seu calendário, e-mail ou nas conversas que você está tendo. E uma nova versão do Skype agora disponível adiciona suporte à Cortana e pode suportar bots em seus chats de vídeo, para fazer coisas como transcrever chamadas de vídeo curtas e ser acessível para todos os tipos de serviços. A Microsoft chamou isso usando o Skype como uma "tela de conversa". Isso também não parece ser uma idéia nova - coisas como o WeChat e o Facebook Messenger têm bots há muito tempo - mas mostra como a Microsoft está tentando transformar isso em uma plataforma. Também mostra como isso pode funcionar em várias plataformas, com a demonstração iniciando em um PC com Windows e concluindo no Skype em um telefone Android.

Mas a maioria das notícias reais parece estar em novas ofertas para desenvolvedores, com o que agora é conhecido como Cortana Intelligence Suite (anteriormente Cortana Analytics Suite, um bom exemplo de quais termos estão em alta em um determinado ano).

Este é efetivamente um tempo de execução criado na plataforma do Azure que inclui uma estrutura de bot, serviços cognitivos e aprendizado de máquina.

A estrutura do bot facilita a criação de um bot ou a conexão de um com outros serviços. Os desenvolvedores podem criá-los em node.js ou C #, e uma demonstração envolveu a criação de um bot que solicita pizzas do Domino's. O que eu achei mais interessante aqui é que ele deve ser uma estrutura aberta, com bots que podem funcionar não apenas dentro da Cortana e Skype, mas também Slack, Telegram, SMS simples e outros serviços. Obviamente, alguns dos serviços alternativos mais interessantes não estavam nessa lista - incluindo o Siri da Apple, o Alexa da Amazon ou o Messenger ou WhatsApp do Facebook.

Outra demonstração mostrou como algumas ferramentas futuras tornarão mais fácil para os desenvolvedores adicionar ou alterar regras de bots e sua compreensão da linguagem natural. Pode sugerir outras palavras que as pessoas possam usar que tenham significados semelhantes, usar o entendimento da linguagem natural baseada no aprendizado de máquina para melhorar o vocabulário ao longo do tempo ou entregar solicitações a um assistente humano se o bot não entender o que fazer.

Finalmente, a empresa introduziu um conjunto muito maior de serviços cognitivos, movendo até 22 serviços distintos dos 5 do ano passado. Esses serviços abrangem uma ampla variedade de cenários, incluindo reconhecimento de objetos, fala, conhecimento e pesquisa. Um exemplo envolveu um Bot de legenda que adiciona legendas às imagens, usando uma combinação de reconhecimento de objetos e linguagem natural. Outra ferramenta chamada CRIS (Serviço de Inteligência de Reconhecimento Personalizado) parecia fazer um trabalho muito melhor de conversão de fala em texto do que os métodos convencionais. Por fim, eles demonstraram o uso das ferramentas para fazer análises nos feeds do Twitter, amostrando fotos de perfil para determinar a idade e o sexo de um pôster.

Obviamente, a Microsoft anunciou uma variedade de outras ferramentas direcionadas aos desenvolvedores, incentivando o Windows a ser a plataforma que eles usam para desenvolver aplicativos, independentemente da plataforma. A mais surpreendente dessas novas ferramentas - pelo menos até os rumores da semana passada - é a adição do shell BASH do Linux, mas outras ferramentas incluem um conversor de aplicativos de desktop para mover aplicativos tradicionais de desktop Win32 para novos aplicativos universais; um grande impulso para as ferramentas de desenvolvimento cruzado do Xamarin, sugerindo que os desenvolvedores possam criar o núcleo de um aplicativo de plataforma cruzada e as mudanças específicas para cada ambiente, incluindo Android, iOS e Windows, tudo em uma plataforma Windows.

Além disso, a Microsoft exibiu o "modo dev", uma ferramenta para transformar um Xbox One na máquina de uma plataforma de desenvolvedor, que é vendida hoje; e disse que a primeira versão do HoloLens também estava disponível para desenvolvedores a partir de hoje.

Nadella começou a manhã falando sobre como agora estamos vendo mais discussões sobre o papel da tecnologia em nossa sociedade, porque a tecnologia se tornou popular e incorporada em nossas vidas diárias, empresas e economias. Ele disse que há perguntas sobre se a tecnologia está impulsionando o crescimento econômico para todos, ou se o crescimento econômico parou, apesar dos gastos com tecnologia; se está permitindo empregos ou substituindo-os; e se está habilitando ou atrapalhando valores duradouros, como a privacidade.

"Sou otimista", disse ele, acreditando que a tecnologia pode impulsionar o crescimento econômico em todo o mundo, nos capacitar em nossas vidas diárias e apoiar nosso valor duradouro. Para fazer isso, ele disse, devemos garantir o uso da tecnologia de maneira a possibilitar isso, trazendo-a de volta à atual missão da Microsoft para "capacitar todas as pessoas e todas as organizações do planeta a alcançar mais". Isso, ele disse, deve começar com os desenvolvedores.

Ele terminou a palestra com um vídeo que mostrava como Saqib Shaikh, desenvolvedor cego da Microsoft, conseguiu usar técnicas cognitivas com os óculos inteligentes Pivothead para obter informações sobre o mundo ao seu redor. Exemplos incluem ouvir pessoas brincando em um parque e passar os óculos para ouvir que era uma jovem garota jogando frisbee. Este é apenas um projeto de pesquisa agora, mas foi bastante inspirador, e Nadella trouxe o desenvolvedor para o palco.

Para mim, vi a palestra como um movimento no sentido de estabelecer novas plataformas baseadas no aprendizado de máquina e em bots, além de reconhecer que, por mais bem-sucedido que o Windows tenha sido, a Microsoft está longe de ser dominante na nuvem e basicamente perdeu a batalha. para se tornar uma importante plataforma de telefonia móvel. (De fato, apenas uma demonstração de toda a palestra foi realizada no Windows Phone e essa foi uma demonstração do Skype que poderia ter sido feita no Android com a mesma facilidade.) Não é de surpreender que a Microsoft esteja olhando para a próxima plataforma - onde, claro, enfrentará concorrentes tradicionais e novos.

As ferramentas cognitivas e de conversação ocupam o centro do palco no microsoft build