As mesmas ferramentas que gerem as funcionalidade de reconhecimento de fala no Google Assistant agora podem ser usadas por um público mais vasto. A Google Cloud Speech API, que entrou na versão open beta no verão de 2016, está agora disponível para todos os developers de aplicações de terceiros.

A Google afirma que a Cloud Speech API pode reconhecer mais de 80 idiomas e variantes. Os developers podem, entre outras coisas, criar produtos e serviços usando essas ferramentas para transcrever o texto de utilizadores que falam para um microfone. De facto, pode fazer uma demonstração rápida dessa funcionalidade na página da API do Google Speech.

Além disso, a API permite que os developers disponibilizem comandos de voz para aplicações e serviços, além de transcrever arquivos de áudio. A Google afirma que desde a versão open beta para a API iniciada no ano passado, milhares de clientes já a usaram, e o seu acesso permitiu que a Google adicionasse muitas melhorias. Isso inclui melhor precisão de transcrição para arquivos de áudio mais longos, tempo de processamento mais rápido e suporte para mais formatos de arquivos como WAV, Opus e Speex.

A Google disponibilizou alguns exemplos de como a Cloud Speech API foi implementada pelas empresas. Um deles, o japonês Clarion, usa-o para sistemas de navegação e entretenimento. Diz que, combinado com o uso da API do Google Places, permite que os clientes tenham acesso aos seus destinos com segurança.

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui