Falar para escrever textos no celular é algo que tomamos como certo a maior parte do tempo. Mas é um processo complicado, tanto que o trabalho pesado é feito remotamente, e o resultado final é enviado de volta aos nossos dispositivos. Mas o Google elaborou uma maneira de reduzir o processo ao ponto de poder ser executado localmente, e os frutos desse trabalho estão chegando ao Gboard.

Descomprimidos, os modelos que o Gboard tradicionalmente usa para reconhecimento de fala ocupam cerca de dois gigabytes. Isso é impraticável para ser armazenado em um smartphone, portanto, quando você toca no ícone do microfone, sua fala gravada é enviada para os servidores do Google para serem convertidos em texto, e esse texto é enviado de volta. O Google conseguiu treinar um modelo menor e com eficácia semelhante usando a tecnologia de transdutores de rede neural recorrente

Esse modelo é capaz de rodar no dispositivo com a mesma precisão que os baseados em servidor, mas ainda ocupa 450 megabytes de espaço de armazenamento – não muito pequeno o suficiente para armazenar localmente na maioria dos smartphones.

Por meio de um processo chamado quantização de modelo, o Google conseguiu reduzir ainda mais o tamanho do modelo, levando a um pacote que ocupa apenas 80 megabytes. Isso também aumenta a velocidade da transcrição. O novo modelo também funciona em um nível de caractere, de modo que o texto transcrito aparecerá letra a letra, em vez de palavras inteiras de uma vez, como acontece agora.

Você pode ver uma comparação entre servidores e transcrição no dispositivo abaixo:

A funcionalidade aprimorada fala-para-texto será inicialmente exclusiva dos dispositivos Pixel em inglês americano, embora não haja atualmente nenhuma indicação de quando ela está chegando. O Google está “esperançoso” de que estará disponível “em mais idiomas e em domínios de aplicação mais amplos” logo em seguida.

Você pode ler uma explicação muito mais detalhada do projeto no Blog do Google AI.

Gboard - the Google Keyboard
Gboard - the Google Keyboard
Developer: Google LLC
Price: Free

Via Android Police