Mi Yandex.Station Mini puede emitir dos sonidos simultáneamente, ¿pero el tuyo? (UPD. Cómo comandar una voz femenina)

Yandex.Station Mini adquirido recientemente. Si, quién no sabe, este es un pequeño altavoz inteligente controlado por voz y gestos. Dentro está la asistente de voz de Alice: enciende la música, responde preguntas y hace recados. Fue adquirido como una "radio inteligente" para la cocina, la posterior creación de una casa inteligente con sus propias habilidades.







Después de "emparejar" con los sistemas operativos Winodows 7, 10, Ubuntu 16.04, habiendo jugado mucho con sus capacidades, me familiaricé con la documentación oficial.





, Bluetooth — :



: «, Bluetooth» , .



Bluetooth , Bluetooth.



.



Bluetooth, . , , .










Después de leerlo, me molesté mucho. Por un lado, existen tremendas posibilidades para el control del habla, la creación de habilidades, el hogar inteligente. Por otro lado, utilizando las capacidades de carga del puerto USB 3.0 de una computadora portátil, obtenemos un panel de control de voz con un rango de un buen punto de Wi-Fi, sin ningún ajuste especial, ¡hasta 100 metros!



Decidí verificar la frase de contraseña en un altavoz emparejado a través de Bluetooth con una computadora. “Alice, enciende la radio Mayak. Y la radio empezó a cantar ... Y en paralelo estaba el sonido de la computadora. Como resultado, la documentación oficial ha sido refutada, el dispositivo ha recibido nuevas funciones desde agosto de 2020. Para dos transmisiones, se recomienda ordenar una transmisión como de costumbre, usando los comandos de Alice, la transmisión a través de Bluetooth se puede controlar mediante los controles de volumen de la computadora, también usando un teclado inalámbrico con teclas de control o, si lo hay, botones separados de control de volumen de la computadora portátil desde el extremo del dispositivo.



¿Quién más puede hacer este experimento?



UPD1. Para analizar por qué hay problemas con las voces femeninas a la hora de controlar un altavoz inteligente, daré varios gráficos.



Este es un gráfico de la potencia promedio de 20 hablantes de ruso. Como puede ver, el habla es muy desigual, la densidad espectral se concentra en la región de 200 ... 600 Hertz.

(Fig. Extraída de "Materiales educativos OKSO 210000. Ingeniería electrónica, ingeniería de radio y comunicaciones. Conferencias para profesores y estudiantes universitarios". 3. Formación del habla y características del habla)



Ahora veamos cómo nos escucha el hablante inteligente.





(Tomado del video, usuario de YouTube Prokhor Ponomarev , publicación Medición de la respuesta de frecuencia usando el iPad, contra el Behringer ECM8000 .

Estamos interesados ​​en la curva azul. Esta es la respuesta de frecuencia del micrófono del iPad 4, en principio, este es el estándar que un altavoz inteligente podría alcanzar. Pero esto , lo más probable es que por ese precio simplemente no invirtieron en él de manera programática.



De esto concluye el autor. Mire atentamente los gráficos: los hombres pueden pronunciar una orden en el rango más bajo del habla y, debido a la mayor masa exhalada, “respirar de manera más uniforme” al dar la orden. En las mujeres, la frecuencia promedio de la voz es mayor, la presencia de un mayor número de sonidos inarmónicos no permite que la sensibilidad de una matriz de 4 micrófonos alcance una meseta uniforme. Por lo tanto, una simple conclusión cotidiana: para la voz de una mujer es necesario apagar las emociones, tratar de hablar "con la energía masculina" del bajo, dejando caer el formante inferior.



También se llevaron a cabo una serie de mediciones indirectas de voz, en las que se entrenó el sistema de reconocimiento. Hasta ahora, la conclusión general es que se entrenó con voces masculinas.



Debajo del spoiler hay varias capturas de pantalla técnicas de la conexión de Yandex.Station Mini a Windows.

Conexión de Yandex.Station Mini a Windows


Windows.





. ! Qualcomm !





.






All Articles