Google traz reconhecimento de fala mais rápido no dispositivo para o Gboard

Falar para escrever textos no celular é algo que tomamos como certo a maior parte do tempo. Mas é um processo complicado, tanto que o trabalho pesado é feito remotamente, e o resultado final é enviado de volta aos nossos dispositivos. Mas o Google elaborou uma maneira de reduzir o processo ao ponto de poder ser executado localmente, e os frutos desse trabalho estão chegando ao Gboard.

Descomprimidos, os modelos que o Gboard tradicionalmente usa para reconhecimento de fala ocupam cerca de dois gigabytes. Isso é impraticável para ser armazenado em um smartphone, portanto, quando você toca no ícone do microfone, sua fala gravada é enviada para os servidores do Google para serem convertidos em texto, e esse texto é enviado de volta. O Google conseguiu treinar um modelo menor e com eficácia semelhante usando a tecnologia de transdutores de rede neural recorrente

Esse modelo é capaz de rodar no dispositivo com a mesma precisão que os baseados em servidor, mas ainda ocupa 450 megabytes de espaço de armazenamento – não muito pequeno o suficiente para armazenar localmente na maioria dos smartphones.

Por meio de um processo chamado quantização de modelo, o Google conseguiu reduzir ainda mais o tamanho do modelo, levando a um pacote que ocupa apenas 80 megabytes. Isso também aumenta a velocidade da transcrição. O novo modelo também funciona em um nível de caractere, de modo que o texto transcrito aparecerá letra a letra, em vez de palavras inteiras de uma vez, como acontece agora.

Você pode ver uma comparação entre servidores e transcrição no dispositivo abaixo:

A funcionalidade aprimorada fala-para-texto será inicialmente exclusiva dos dispositivos Pixel em inglês americano, embora não haja atualmente nenhuma indicação de quando ela está chegando. O Google está “esperançoso” de que estará disponível “em mais idiomas e em domínios de aplicação mais amplos” logo em seguida.

Você pode ler uma explicação muito mais detalhada do projeto no Blog do Google AI.

Via Android Police

Um comentário sobre “Google traz reconhecimento de fala mais rápido no dispositivo para o Gboard

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *