As mesmas ferramentas que gerem as funcionalidade de reconhecimento de fala no Google Assistant agora podem ser usadas por um público mais vasto. A Google Cloud Speech API, que entrou na versão open beta no verão de 2016, está agora disponível para todos os developers de aplicações de terceiros.
A Google afirma que a Cloud Speech API pode reconhecer mais de 80 idiomas e variantes. Os developers podem, entre outras coisas, criar produtos e serviços usando essas ferramentas para transcrever o texto de utilizadores que falam para um microfone. De facto, pode fazer uma demonstração rápida dessa funcionalidade na página da API do Google Speech.
Além disso, a API permite que os developers disponibilizem comandos de voz para aplicações e serviços, além de transcrever arquivos de áudio. A Google afirma que desde a versão open beta para a API iniciada no ano passado, milhares de clientes já a usaram, e o seu acesso permitiu que a Google adicionasse muitas melhorias. Isso inclui melhor precisão de transcrição para arquivos de áudio mais longos, tempo de processamento mais rápido e suporte para mais formatos de arquivos como WAV, Opus e Speex.
A Google disponibilizou alguns exemplos de como a Cloud Speech API foi implementada pelas empresas. Um deles, o japonês Clarion, usa-o para sistemas de navegação e entretenimento. Diz que, combinado com o uso da API do Google Places, permite que os clientes tenham acesso aos seus destinos com segurança.