Lar Pareceres O Santo Graal da tradução de voz, agora no skype | john c. dvorak

O Santo Graal da tradução de voz, agora no skype | john c. dvorak

Vídeo: MC Fioti - Luz do Luar feat. MC Ju Bronx e MC Vagninho (kondzilla.com) (Outubro 2024)

Vídeo: MC Fioti - Luz do Luar feat. MC Ju Bronx e MC Vagninho (kondzilla.com) (Outubro 2024)
Anonim

Se você seguisse a revolução do computador desde o início do microprocessador, saberia que há várias promessas iniciais que ainda precisam ser cumpridas.

Um deles é o discurso traduzido on-the-fly, em que você diz algo em inglês e é repetido em outro idioma, como o espanhol, quase em tempo real. Embora ainda esteja em andamento, a Microsoft está agora um passo mais perto com o Skype Translator, cuja primeira fase foi lançada esta semana.

Se isso chega perto de funcionar e não é uma piada, é o produto da década. No momento, o Skype Translator suporta traduções de espanhol para inglês e inglês para espanhol, mas há mais idiomas a serem seguidos.

O problema típico desse tipo de coisa é o nível de dificuldade ultrajante. Ainda não vi um pacote de tradução decente que faça traduções de texto em texto que funcionem bem. A tradução de fala tem um nível de dificuldade totalmente diferente, especialmente em tempo real.

A Microsoft tem um filme que mostra duas crianças falando em espanhol e inglês que faz parecer que funciona bem. Mas vi um sistema semelhante demonstrado pela IBM há quase 20 anos que nunca viu a luz do dia. A versão da IBM foi desenvolvida na década de 1990, quando havia uma mania de reconhecimento de fala liderada pela Lernout & Hauspie, uma empresa que faliu - antes de passar por um escândalo de fraude em 2001. Antes disso, porém, estava comprando todas as tecnologias da fala empresa que poderia, incluindo Dragon Systems, Berkeley Speech Technologies, Fonix, Dictaphone e outros. A Microsoft detinha uma participação de 8% na L&H e acabou com algumas das tecnologias como presente de despedida.

Agora o Skype Translator aparece de repente. Coincidência? Seja qual for o caso, toda essa tecnologia levou muito tempo para chegar a esse ponto.

Veja as traduções miseráveis ​​de texto em texto feitas pelo Google e outros. O texto não evita nem pode evitar os erros mais óbvios. Nada disso se aproxima da complexidade da tradução de fala, que requer um processamento pesado de sinal.

Sou colecionador de vinhos e frequentemente visito sites de vinícolas francesas. Meu francês é bom, então eu costumo ativar a tradução para acelerar a leitura do site. Aqui estamos em 2014 e nenhum dos tradutores pode descobrir que a tradução do Château Margaux é Château Margaux, não Castle Margaux. Quão difícil é abster-se e não traduzir uma palavra comumente usada em um nome próprio, como castelo, geralmente se referindo a uma vinícola específica, para a palavra castelo? Aparentemente é impossível. Todos fazem isso.

Quão difícil é escrever alguma exceção no código que informa ao tradutor que ele está em um site sobre vinho de Bordeaux? Enquanto estiver nesse site, a palavra castelo não significa castelo. Freqüentemente, o tradutor tenta decodificar o restante do nome do castelo, com resultados ridículos. O melhor que você geralmente pode fazer com a tradução de texto é saber o que o site diz.

Pergunte a si mesmo: se o texto é tão difícil, como a Microsoft gerenciará a fala?

É quase impossível, mesmo no mesmo idioma. Pegue o serviço de telefone do Google Voice. Possui uma função de captura de mensagem de fala em texto. Nunca recebi uma mensagem de voz em texto que se aproxime do que a pessoa realmente disse. Nem uma vez.

Admito que em uma sala silenciosa, quando você fala de maneira clara e clara, o reconhecimento de voz se dá bem. Eu o uso para mensagens de texto no meu telefone Android. Mas em uma conversa real, ninguém fala assim. Admiro a Microsoft por lançar isso. Mas não funcionará como anunciado.

Dito isto, é pelo menos algo para brincar. Pode até desencadear uma nova geração de pesquisa. Então não vou reclamar muito.

Todo mundo quer isso. Vamos voltar a trabalhar nisso.

O Santo Graal da tradução de voz, agora no skype | john c. dvorak