A continuación hablaremos de tecnologías para trabajar con voz en la web, como el reconocimiento y la síntesis de voz. Este artículo no incluirá ejemplos de código o descripciones técnicas complejas, mi objetivo es mostrarles las capacidades de estas tecnologías y su nivel de madurez utilizando una aplicación simple como ejemplo, la cual fue desarrollada como parte del estudio de este tema. Puede ver el código de esta aplicación en GitHub .
Qué nos ofrece la API Web Speech
Muchos estarán de acuerdo conmigo en que la dirección en los mapas y las búsquedas largas en el teléfono son más fáciles de ingresar por voz. Un asistente de voz a menudo responde a nuestras solicitudes. Estas tecnologías son utilizadas por muchas aplicaciones móviles, pero ¿con qué frecuencia ve esto en los sitios?
Los beneficios para los usuarios móviles son obvios, pero no solo para ellos. La API Web Speech aumenta la accesibilidad de una aplicación web para personas con discapacidades y niños. En algunos casos, la tecnología también puede ser útil para usuarios de escritorio, por ejemplo, en chats web.
Intente abrir el enlace para ver un ejemplo de cómo funciona la API de Web Speech en su Google Chrome (le contaré las razones por las que recomiendo este navegador en particular más adelante). La página que abrió se divide en dos partes:
- Generación de voz: intente ingresar una frase en el idioma seleccionado y presione PLAY.
- – START, .
, .
? , , -.
Speech API , ? , , — .
, , , :
- -
, , .
, , Google Chrome. , Chrome , API. , .
, ( , ) , Web Speech API . Firefox, Edge Safari, , , — .
, , , ?
, Web Speech API , , . , API, — , .
Pocketsphinx Tensorflow. , PWA (Progressive Web Application) — , .
. API . =)
API. , .
— , -. , Web Speech API, .
.