Probamos el Home Assistant Voice, la alternativa a Alexa que es 100% local y privada

Probamos el Home Assistant Voice, la alternativa a Alexa que es 100% local y privada

8.4
Sergio De Luz

Os presentamos un completo análisis de Home Assistant Voice (Preview Edition), un altavoz inteligente que se integra de forma nativa en el popular sistema de domótica Home Assistant, y que nos permitirá tener la máxima privacidad ya que todo el procesamiento es 100% local si así lo quieres. Este primer dispositivo de Home Assistant es el complemento ideal para Assist, el asistente del propio sistema de domótica que nos permite dar órdenes a un chatbot, el sistema lo interpreta, y ejecuta ciertas órdenes que nosotros le demos. Si quieres saber si merece la pena este altavoz inteligente, a continuación, vais a saberlo todo en detalle.

Este nuevo dispositivo vale unos 60 euros aproximadamente, es como un altavoz de Amazon Alexa, pero con posibilidad de ser completamente local. Un aspecto muy importante que debes tener en cuenta, es que, si quieres que sea 100% local, tendrás que tener un hardware como un procesador Intel N100 o superior. Cuanto más potente sea el procesador, más rápido interpretará todas las órdenes y la experiencia de usuario será mejor. Estamos seguro que muchos de vosotros no usáis Amazon Alexa o Google Assistant porque os preocupa la privacidad, pues esta alternativa local es perfecta para ti.

Principales características

Este Home Assistant Voice PE (Preview Edition) dispone de un procesador ESP32-S3 como SoC principal con 16MB de memoria flash, además, cuenta con 8MB de PSRAM. Para el procesamiento del audio cuenta con un procesador específico, concretamente el XMOS XU316, y que tiene características especiales como cancelación del eco, cancelación de ruido y permite controlar la ganancia de forma automática. Este modelo dispone de un micrófono dual para escuchar lo mejor posible nuestras órdenes, aunque tenemos un pequeño altavoz, lo cierto es que no tiene una calidad tan buena como los Amazon Alexa de gama media-alta, pero tenemos una salida jack de 3,5mm por si queremos conectar un altavoz más potente o bien a una barra de sonido. Otra característica interesante, es que tenemos un puerto para conectar sensores y otros accesorios.

El Home Assistant PE dispone de un botón físico para habilitar o deshabilitar el micrófono por hardware, para tener la máxima privacidad. También tenemos un botón que rota para subir o bajar el volumen físicamente, aunque esto mismo podremos hacerlo a través del propio Home Assistant. En cuanto a la conectividad inalámbrica, tenemos Wi-Fi en 2.4GHz para conectarnos a la red inalámbrica de nuestro router, también disponemos de Bluetooth 5.0 para realizar la configuración iniciar del dispositivo a través de la app de Home Assistant, con el objetivo de facilitarnos enormemente esta tarea.

Este modelo necesita una fuente de alimentación de 5V y 2A, el conector es USB tipo C, de hecho, en la caja no tenemos ni la fuente de alimentación ni el correspondiente cable, podemos usar cualquiera compatible con un móvil. Las dimensiones de este dispositivo es de 84 x 84 x 21 mm y tiene un peso de tan solo 96 gramos, la carcasa es de plástico y tiene un color blanco semitransparente.

El software incorporado en este altavoz inteligente es ESPHome, ya viene preparado para su instalación y puesta en marcha Plug&Play con Home Assistant, y así no tener que hacer configuraciones avanzadas. El firmware del ESP32 y del chip XMOS es código abierto, por si quieres hacer desarrollos adicionales sobre la base proporcionada.

Análisis externo

Este altavoz inteligente viene en una caja de pequeñas dimensiones, ya que el propio dispositivo es muy pequeño, y, además, no tenemos ni la fuente de alimentación ni tampoco tenemos un cable USB tipo C para alimentarlo. En la parte frontal podemos ver que estamos ante el nuevo Home Assistant Voice, y es la versión «Preview Edition», también podemos ver el logo del sistema de domótica de Home Assistant.

En la parte trasera de la caja podemos ver el contenido de la caja, que básicamente es una guía de instalación rápida, la garantía limitada del producto y las recomendaciones de seguridad al usarlo. También tenemos los requisitos del dispositivo, básicamente son que necesitamos alimentarlo con un cable USB tipo C y una fuente de alimentación, y que es necesario tener una conexión Wi-Fi en nuestro hogar para conectarlo a la red local doméstica y comunicarlo con nuestro sistema de domótica de Home Assistant.

En el lateral derecho podemos ver el logo de ESPHome, ya que este dispositivo funciona perfectamente con este software integrado en el sistema de domótica. En el lateral izquierdo podemos ver el logo de la Open Home Foundation donde tenemos el proyecto de Home Assistant, y también tenemos el logo de Nabu Casa que nos permitirá tener acceso a nuestro sistema de domótica a través de la nube.

En el interior de la caja podemos ver toda la documentación y el dispositivo en cuestión, el contenido de la caja es el siguiente:

  • Home Assistant Voice Preview Edition
  • Pegatina de OKAY NABU para empezar a hablar con el sistema de domótica.
  • Tarjeta con código QR para llevarnos directamente a la guía de instalación en su web oficial.
  • Garantía limitada e información de seguridad.

Nada más abrir la caja encontraremos una pegatina que nos dice que para hablar con Home Assistant simplemente debemos decir «OKAY NABU». También podemos ver una tarjeta con un código QR para irnos directamente a la guía de instalación y configuración, esto es perfecto para no tener que incorporar un folleto en papel, además, la instalación y puesta en marcha es realmente sencilla como os enseñaremos más adelante. Por último, tenemos la documentación sobre la garantía limitada y la información de seguridad.

El diseño de este dispositivo es bastante minimalista, en la parte frontal encontraremos los micrófonos para escucharlo todo, y también un botón rotatorio para subir o bajar el volumen, además, veremos LEDs de estado que se encenderán y harán diferentes efectos cuando digamos alguna orden. En los laterales del equipo podemos ver el altavoz, así como un interruptor para activar o desactivar físicamente los micrófonos, para así tener privacidad máxima en nuestro hogar.

En la zona trasera es donde encontraremos los dos conectores, en la parte izquierda veremos el jack de 3,5mm que nos permitirá conectar la salida de audio de este dispositivo a un altavoz más potente, a una barra de sonido, o allí donde quieras escuchar lo que nos tiene que decir el altavoz inteligente. En la parte derecha encontraremos el puerto USB tipo C, este puerto nos permitirá alimentar el dispositivo con una fuente de alimentación de 5V y 2A. Hay que tener en cuenta que, en la caja, no tenemos ni la fuente de alimentación ni tampoco el cable para ello, así que tendremos que comprarlo de forma adicional o usar alguno de los que tengamos en nuestra casa.

En la parte posterior del Home Assistant Voice Preview Edition es donde podemos ver una pegatina con el modelo exacto del equipo, la identificación de la FCC, la dirección MAC del Wi-Fi así como el número de serie del dispositivo. También tenemos los diferentes logos de las certificaciones que ha pasado este equipo para poder comercializarse. En la propia pegatina también encontraremos los logos de Home Assistant, Nabu Casa, indicaciones de los puertos físicos, así como un código QR que es básicamente el número de serie del dispositivo.

Tal y como habéis visto, este altavoz inteligente, el primero de Home Assistant, tiene un diseño minimalista, pero perfecto para ponerlo en cualquier lugar de nuestro hogar y poder interactuar con Assist. Ahora os vamos a enseñar qué configuraciones previas debes tener en el sistema de domótica para que este equipo funcione a la perfección.

Configuración previa de Home Assistant

Antes de instalar este dispositivo Home Assistant Voice PE, es totalmente necesario configurar el sistema de domótica con algunos complementos muy importantes para que todo funciona correctamente. Los complementos que debemos instalar son:

  • Piper: este complemento nos permitirá transformar el texto en voz, es decir, cuando el asistente responda a algo, este complemento se encargará de pasarlo a voz y hablará a través del altavoz del dispositivo. Podremos elegir entre diferentes voces disponibles, el español también está disponible, aunque la máxima calidad disponible hoy en día es «medium», a diferencia del inglés que es high en algunas voces. En la siguiente imagen podéis ver cómo es la configuración que hemos realizado nosotros:

Os recomendamos leer la documentación de Piper donde encontraréis más información sobre qué ajustes podemos realizar.

  • Whisper: este complemento se encargará de transformar la voz en texto, es muy importante configurar bien este complemento, porque todas las órdenes que recibirá el dispositivo realmente son texto, o bien los LLM que podemos integrar como Google Gemini, ChatGPT y otros. Whisper nos permitirá elegir entre diferentes modelos para la transcripción, dependiendo del elegido, será más rápido, pero con menor acierto de palabras correctas, o más lento pero con mayor acierto. Es necesario que pruebes y tengas un cierto equilibrio para tener la mejor experiencia de usuario. En la siguiente imagen podéis ver cómo es la configuración que hemos realizado nosotros:

Os recomendamos leer la documentación de Whisper donde encontraréis más información sobre qué ajustes podemos realizar.

Este altavoz inteligente es 100% local y privado, siempre que elijas que el procesamiento lo realice Home Assistant, porque también podrías elegir procesarlo en la nube de Nabu Casa, e incluso enviarlo a Google Gemini (gratis) e incluso ChatGPT (de pago, pero realmente barato). Nuestra recomendación a la hora de elegir privado o en la nube, es la siguiente:

  • Si donde tienes alojado Home Assistant, tienes un procesador potente como el Intel N100 o mejor, podrás tenerlo local y tendrás una buena experiencia de usuario.
  • Si lo tienes en una Raspberry Pi o un equipo muy limitado en recursos, es mejor que lo envíes a la nube para su procesamiento, porque si no tardará muchísimo y la experiencia de usuario será muy mala.

Ahora que ya tenéis todo el software necesario para la instalación y puesta en marcha, os vamos a enseñar el proceso paso a paso.

Instalación y puesta en marcha

Lo primero que debemos hacer es conectar a la alimentación el dispositivo, esperamos un minuto y después abrimos la aplicación de Home Assistant para Android o iOS. El propio móvil detectará que tenemos a nuestro alrededor un dispositivo, y podremos añadirlo rápidamente gracias al Bluetooth que incorpora el Home Assistant Voice Preview Edition.

Al pinchar en «Añadir«, tenemos que poner tanto el SSID como la contraseña de acceso a la red Wi-Fi de nuestro router o sistema Wi-Fi Mesh. Es muy importante que elijamos un SSID que esté disponible en la banda de 2.4GHz, este dispositivo no soporta la banda de 5GHz o 6GHz, debe ser obligatoriamente la banda de 2.4GHz. Si tienes problemas de conexión, desactivar el Smart Connect de tu router o también conocido como band-steering, otra forma es que desactives la banda de 5GHz de forma temporal para conectar el dispositivo.

Ahora tenemos que pulsar el botón físico del dispositivo que tenemos en la parte frontal, esperamos unos segundos y se conectará a la red Wi-Fi sin problemas, y así nos lo indicará la aplicación oficial.

Ahora el propio sistema de domótica reconocerá que hay un dispositivo en la red local llamado Home Assistant Voice, pinchamos en «Añadir» para proceder con la integración. Nos preguntará si queremos añadirlo, y pulsamos en el botón de «Enviar» para empezar con dicho proceso. Lo primero que hará el sistema es comprobar si hay alguna actualización de software, si hay actualización se encargará de descargarla y aplicarla de forma automática, si no hay actualización seguirá el proceso de instalación dándonos la bienvenida.

De forma predeterminada, tenemos la orden de «OKAY NABU» para despertar el dispositivo, aunque también podemos elegir otros comandos como «Hey Jarvis» o «Hey Mycroft». En nuestro caso personal, todos los comandos para despertar funcionan realmente bien, excepto el «Hey Jarvis» que es necesario decirlo en un inglés bastante bueno y con acento, de lo contrario, no lo reconocerá. Podemos cambiar la palabra de activación en cualquier momento.

Una configuración muy importante es ubicar el asistente de voz en un área, es fundamental que tengas bien organizado tu hogar en áreas y en plantas, porque posteriormente podemos controlar los dispositivos de un área de forma más inteligente. Por ejemplo, si decimos «enciende las luces» encenderá todas las luces del área donde está el dispositivo, y lo mismo para la orden de «apagar», no siendo necesario especificar el área para ello.

Otra configuración importante, es que podemos gestionar las respuestas a través de Home Assistant Cloud, o bien de forma 100% local para proteger nuestra privacidad al máximo. En nuestro caso personal, hemos usado la segunda opción. Para ello, tenemos que configurar la palabra clave para despertarlo, el asistente que tengamos (por defecto es el propio de Home Assistant, pero podemos añadir Google Gemini, ChatGPT de OpenAI y muchos más), además, también debemos elegir la voz. Lo más importante de todo es el agente de conversación, y que es el cerebro del asistente y es el que procesará los comandos de texto entrantes.

Si nos vamos directamente a ESPHome, podemos ver a este dispositivo en concreto. Podemos ver el modelo del equipo, la versión de firmware instalada, la dirección MAC, así como la posibilidad de configurar nuevamente el asistente de voz. Los controles que podemos realizar en Home Assistant con este dispositivo es:

  • Controlar el volumen del altavoz.
  • Si Assist está procesando información.
  • Estado del botón físico si lo pulsamos.
  • Otros dispositivos con Assist.
  • En la parte de configuración del dispositivo, podemos:
    • Elegir el asistente
    • Detección de finalización del habla, si queremos que sea rápida la finalización o tarde más por si queremos darle más órdenes.
    • Habilitar el LED siempre.
    • Silenciar el dispositivo por software, recuerda que puedes hacerlo por hardware con el interruptor.
    • Elegir la palabra de activación.
    • Si queremos que suene un sonido al despertarlo con la palabra clave, y tener un cierto «feedback» de que nos ha reconocido.

Después de todo esto, nos saldrá si tenemos este dispositivo en alguna automatización, escena o script, además de mostrarnos un completo registro del dispositivo.

Como podéis ver, la puesta en marcha de este dispositivo es realmente sencillo, lo más complejo es configurar Whisper de forma equilibrada, para que sea rápido pero fiable, de lo contrario, la experiencia de usuario no será del todo buena. Además, también es muy importante configurar correctamente la sección de «Asistente de voz», ya que es fundamental exponer las diferentes entidades para que podamos controlarlas.

En el menú de «Ajustes / Asistente de voz» es donde podemos entrar y configurarlo fácilmente. Si pinchamos donde pone «Home Assistant» podemos configurar el asistente de voz adecuadamente, sobre todo si has integrado Gemini o ChatGPT en el sistema de domótica.

En este menú debemos elegir las diferentes configuraciones del asistente de voz, concretamente, debemos elegir:

  • Nombre del asistente de voz y el idioma que vamos a hablar.
  • Agente de conversación: puede ser el propio Home Assistant, o bien usar Google Gemini AI y también ChatGPT u otros. Al elegir Gemini, ChatGPT u otras IA que no sean la local, nos aparecerá una opción para procesar primero localmente, y si no encuentra respuesta, entonces que lo envíe a las IA de terceros.
  • Voz a texto: debemos elegir faster-whisper, es necesario haber instalado y configurado Whisper con anterioridad. También elegiremos el idioma español.
  • Texto a voz: debemos elegir Piper, es necesario haber instalado y configurado Piper con anterioridad. También elegiremos el idioma español, y una voz de las disponibles.

En nuestro caso, hemos integrado tanto ChatGPT de OpenAI como también Google Generative AI, con el objetivo de tener un sistema 100% local en un primer momento, y que, si no es capaz de proporcionarnos buenos resultados, automáticamente lo suba a terceras IA.

Como podéis ver, tenemos la opción de «Preferir manejar comandos localmente», y la deberíamos habilitar siempre, a no ser que usemos Home Assistant únicamente como agente de conversación.

Si pulsamos en las opciones de ChatGPT, podemos hacer que no controle nuestro sistema de domótica, y simplemente lo usemos para contar chistes, preguntar qué tiempo hace y cualquier cosa que no tenga que ver con controlar el sistema de domótica.

En la sección de «Ajustes / Dispositivos y servicios» podemos ver la integración de Google Generative AI. Si quieres saber cómo integrar esta IA, os recomendamos acceder a la documentación oficial de cómo añadir Google Generative AI en Home Assistant.

En la sección de «Ajustes / Dispositivos y servicios» podemos ver la integración de ChatGPT en la sección de OpenAI. Si quieres saber cómo integrar esta IA, os recomendamos acceder a la documentación oficial de cómo añadir ChatGPT en Home Assistant. Un aspecto muy importante, es que debemos pagar como mínimo unos 6 dólares para tener acceso a esta IA a través de la API, no es gratuita como sí ocurre con Google Generative AI. No obstante, una vez que hemos pagado 6 dólares, y dependiendo del uso que le demos, así como la configuración, estimamos que este saldo nos puede durar un año entero (el saldo caduca al año).

Otro aspecto esencial para poder enviar comandos por voz y controlar la domótica, es exponer las diferentes entidades para tener el control sobre ellas. Antes de ponerte a decirle comandos, os recomendamos hacer algunas configuraciones que son esenciales para el buen funcionamiento de Assist:

  • Organiza las entidades en áreas: cuando configuramos un nuevo dispositivo, tenemos la posibilidad de colocar ese dispositivo en cuestión en un área que nosotros queramos, como el salón, baño principal, habitación principal, o cualquier ubicación que tú quieras. También tenemos la posibilidad de colocar las entidades que tenemos en el interior de este dispositivo, dentro de un área específica, porque por defecto tenemos todas las entidades en la misma área que el dispositivo. Imaginemos que tenemos un Shelly 2PM, una fase la tenemos en las luces del salón, y otra fase en las luces del pasillo, pues puedes poner cada entidad en un área diferente, aunque el dispositivo en sí esté en el salón (por ejemplo). Es fundamental para que funcione todo a la perfección más adelante.
  • Organiza las áreas en plantas: ya que estás organizando las entidades en áreas, que organices las áreas en plantas, por si tienes una casa con varias plantas. Así tendrás todo muy bien organizado y en un futuro podrás sacarle el máximo partido.
  • Renombra las entidades, scripts o sensores: los asistentes no entenderán que enciendas las luces del salón si tienen un nombre «light.shelly2pm_4345353». Tienes dos opciones, o bien ir entidad por entidad renombrándolas para darle un nombre más «humano», o bien configurar un alias para referirte a dicha entidad. Nuestra recomendación es que primero renombres las entidades, y si los sensores o scripts manuales no puedes renombrarlos o es demasiado trabajo, que uses los alias para ello.
  • Controla bien las tildes a la hora de renombrar: el sistema de voz a texto pondrá las tildes donde corresponda, si decimos «dime cuánta energía exportada», y la entidad se llama «energia exportada», no lo reconocerá localmente según hemos comprobado, así que pon las tildes donde corresponda, o bien configura el alias con ello.

En la siguiente galería podéis ver todas las entidades que hemos expuesto a Assist, para que puedan ser controladas a través del sistema de domótica. Por ejemplo, tenemos sensores virtuales llamados autoconsumo_diario que no hemos cambiado su nombre, podemos poner el alias «autoconsumo» para no tener que modificarlo.

Ahora os vamos a explicar nuestra experiencia con este dispositivo, ya que llevamos varias semanas de pruebas para realizar diferentes acciones, os enseñaremos también qué entidades tenemos expuestas para poder ser controladas con Assist.

Pruebas con Assist y el Home Assistant Voice PE

En RedesZone llevamos varias semanas usando de forma normal este dispositivo, usando diferentes configuraciones y combinaciones de ellas, para ver cuál es la mejor configuración para nuestro uso en concreto. Hemos grabado un completo vídeo donde vamos a dar un total de 15 órdenes por cada configuración, para que veáis el funcionamiento de cada opción, y cómo se comporta, en todas ellas vamos a dar órdenes para actuar sobre el sistema de domótica o bien para recibir información de sensores. No vamos a probar lo típico de «cuéntame un chiste», «quién es tal persona» o preguntas similares, porque lo que nos interesa de verdad es poder controlar la domótica en nuestro hogar.

Las preguntas y las órdenes que vamos a realizar son las siguientes:

  1. Enciende el aire acondicionado del ático. (Entidad climate)
  2. Activa el modo frío del aire acondicionado del ático a 19ºC (Entidad climate)
  3. Apaga el aire acondicionado del ático. (Entidad climate)
  4. ¿Cuál es el autoconsumo? (Entidad sensor virtual que devuelve kWh)
  5. ¿Qué humedad hay en la cocina? (Sensor que devuelve humedad en %)
  6. ¿Qué temperatura hay en la cocina? (Sensor que devuelve temperatura en ºC)
  7. Activa el extractor. (Entidad de ventilador)
  8. Apaga el extractor. (Entidad de ventilador)
  9. Enciende las luces del comedor y las luces del mueble. (Entidad de luz)
  10. Apaga todas las luces del salón. (Entidad de luz)
  11. ¿Cuál es la temperatura de la habitación principal? (Entidad climate y no un sensor)
  12. Enciende la luz del baño principal. (Entidad de luz)
  13. Apaga la luz del baño principal. (Entidad de luz)
  14. Enciende el agua caliente. (Es un script)
  15. Enciende todas las luces del salón, del baño principal y las luces del pasillo planta baja.

Primera prueba 100% local

En esta primera prueba hemos usado procesamiento 100% local en todo momento, con el objetivo de ver cómo se comporta con los comandos locales, y con las entidades expuestas anteriormente. Lógicamente, no vamos a probar todas las entidades porque se haría muy largo, pero sí algunas de cada tipo de entidad (luces, ventiladores, sensores virtuales, script y climate).

Hemos usado Piper con la siguiente configuración:

voice: es_ES-davefx-medium
speaker: 0
length_scale: 1
noise_scale: 0.667
noise_w: 0.333
max_piper_procs: 1
debug_logging: false
update_voices: true

Hemos usado Whisper con la siguiente configuración:

model: auto
language: es
beam_size: 5
debug_logging: false

Lo más crítico de Whisper es elegir el «model» adecuado, si lo dejamos en auto lo elegirá por nosotros en función del procesador.

Segunda prueba 100% local con Whisper modelo medium

En esta segunda prueba hemos usado procesamiento 100% local en todo momento, la única diferencia con el anterior es el modelo elegido en Whisper, el resto es lo mismo.

Hemos usado Whisper con la siguiente configuración:

model: medium-init8
language: es
beam_size: 5
debug_logging: false

Lo más crítico de Whisper es elegir el «model» adecuado, si elegimos uno «large» y nuestro procesador no es bastante potente, es posible que ni siquiera arranque el complemento, aunque esperemos hasta 5 minutos.

Tercera prueba con Google Generative AI y Whisper en auto

En esta tercera prueba hemos usado procesamiento 100% en la nube usando el servicio de Google Generative AI, recordad que esta opción es completamente gratis.

Hemos usado Piper con la siguiente configuración:

voice: es_ES-davefx-medium
speaker: 0
length_scale: 1
noise_scale: 0.667
noise_w: 0.333
max_piper_procs: 1
debug_logging: false
update_voices: true

Hemos usado Whisper con la siguiente configuración:

model: auto
language: es
beam_size: 5
debug_logging: false

Cuarta prueba con Google Generative AI y Whisper en medium-init8

Esta prueba es exactamente igual que la anterior, pero la configuración de Whisper es la siguiente:

model: medium-init8
language: es
beam_size: 5
debug_logging: false

De esta forma, debería detectar mucho mejor todas las palabras y peticiones.

Quinta prueba con ChatGPT y Whisper en auto

En esta prueba hemos usado procesamiento 100% en la nube usando el servicio de ChatGPT de OpenAI, usando el modelo gpt-4o-mini con Top P a 1 y Temperature a 1 (valores predeterminados), recordad que esta opción es de pago, tenemos que desembolsar 6 dólares, aunque seguramente tengas para todo un año.

Hemos usado Piper con la siguiente configuración:

voice: es_ES-davefx-medium
speaker: 0
length_scale: 1
noise_scale: 0.667
noise_w: 0.333
max_piper_procs: 1
debug_logging: false
update_voices: true

Hemos usado Whisper con la siguiente configuración:

model: medium-init8
language: es
beam_size: 5
debug_logging: false

Sexta prueba con ChatGPT y local

Esta prueba es exactamente igual que la anterior, con la misma configuración de ChatGPT, pero activando la ejecución local en un primer momento.

En el siguiente vídeo podéis ver todas las pruebas realizadas.

Ahora que ya sabéis cómo funciona este nuevo Home Assistant Voice Preview Edition integrado en el sistema de domótica, vamos a ver qué conclusiones podemos sacar.

Conclusiones finales

Los altavoces inteligentes con máxima privacidad han llegado para quedarse, buena muestra de ello es este nuevo Home Assistant Voice Preview Edition que es la primera y única versión hasta el momento. A nivel de hardware este dispositivo funciona realmente bien, sus micrófonos detectan nuestra voz si estamos en la misma habitación sin problemas, incluso si tenemos la TV encendida o hay mucho ruido, aunque si hay demasiado ruido no entenderá las órdenes, es algo completamente normal. A la hora de activar el dispositivo, lo que no nos ha gustado es que el «Hey Jarvis» no lo reconoce del todo bien, a no ser que tengamos un buen acento inglés, no obstante, las otras dos palabras clave funcionan perfectamente para los spanishhablantes.

Tal y como habéis visto en las pruebas y explicaciones previas, es muy importante configurar adecuadamente las entidades, tanto su nombre, área, planta, así como los alias si fuera necesario. Recuerda que energía no es lo mismo que «energia» sin tilde, así que debes tenerlo en cuenta a la hora de nombrar los diferentes dispositivos, entidades y también los alias. La instalación y puesta en marcha de este dispositivo es realmente fácil y rápida, no tiene ninguna complicación, lo más difícil es configurar todo el software necesario para su puesta en marcha básica, ya que tenemos que configurar Piper y Whisper, este último es la clave de todo a la hora de hablar y que el sistema nos entienda, ya que toda la voz la pasará a texto, y debe reconocernos correctamente. Dependiendo del modelo elegido, tendremos un mejor reconocimiento de voz, pero es posible que tarde demasiado tiempo en pasarlo a texto, ejecutar las órdenes y que nos diga que está todo hecho. También es muy importante dimensionar bien el «modelo» con el procesador de nuestro Home Assistant, si no tenemos un procesador Intel N100 o superior, sufrirá bastante y la experiencia de usuario no será del todo buena.

La integración de Google Generative AI y de ChatGPT es realmente sencilla, este último es de pago por acceder a través de API, es algo que debes tener en cuenta, además, dependiendo del modelo elegido es más caro o menos. No obstante, creemos que una de las mejores combinaciones es usar el procesamiento local primero, y, si no nos entiende, que haga uso de ChatGPT para que acate nuestras órdenes y no tengamos que volver a repetirle la orden. Nuestra recomendación es que primero pruebes la solución de Google que es gratis, aunque después de muchas pruebas, creemos que ChatGPT es bastante superior hoy en día, además, si vas a probar ChatGPT tendrás que pagar unos 6 dólares por acceder, así que ya que lo has pagado lo usarás hasta que se te acabe el saldo disponible.

Tal y como habéis visto en el vídeo, la mejor combinación de todas es usar ChatGPT siempre y el modelo de Whisper en medium-int8, porque tarda un poco menos que si primero debe procesar la orden localmente, y si falla, pasárselo a ChatGPT. Después la mejor combinación es ChatGPT + local, a continuación, las diferentes combinaciones funcionan igual de regular o mal, lo peor es tener el Whisper en «auto» porque no nos entenderá casi nada si tenemos un procesador que no sea potente.

Puntos fuertes

  • Hardware del Home Assistant Voice PE muy bueno, tiene un altavoz decente, micrófonos que escuchan perfectamente, y un diseño bonito.
  • Botones físicos para despertarlo, subir o bajar el volumen, así como desactivar el micrófono físicamente. Estos botones son bastante útiles, aunque también podríamos hacer lo mismo a través del propio sistema de domótica, no obstante, nos permitirá no tener que abrir la aplicación del sistema de domótica.
  • Integración perfecta en el sistema de domótica, con una puesta en marcha y configuración realmente fácil y rápida. Hay que tener en cuenta que, los usuarios con Home Assistant, son amantes de la tecnología y suelen controlar bastante sobre ello.
  • Podemos controlar o consultar cualquier entidad del sistema de domótica: luces, ventiladores, scripts, sensores de humedad y temperatura, entidades de tipo climate y mucho más. Esto es súper útil para poder obtener estados a través del altavoz, no solamente podemos darle órdenes sino también consultar estados.
  • Integración de otras IA como Google Generative AI que es gratis, e incluso el popular ChatGPT de Open AI, este último es de pago, pero es el que mejor funciona sin lugar a dudas.
  • El funcionamiento de ChatGPT con el Home Assistant Voice es muy bueno, sin lugar a dudas, es nuestra recomendación, aunque tengas que pagar 6 dólares anuales (porque caducan los créditos al año de comprarlos).
  • Muy estable a nivel inalámbrico y de conexión con Home Assistant, no se ha desconectado en ningún momento, siempre responde a la palabra de activación perfectamente.

Puntos débiles

  • Ajustar la configuración idónea de Whisper en función de la velocidad del procesador y el tiempo de respuesta puede llevarnos tiempo, tendrás que probar diferentes configuraciones y ver qué resultados te dan.
  • Ajustar la configuración idónea de IA de terceros también te puede llevar algo de tiempo.
  • En general, no es tan simple todo como Alexa o Google Home, requiere más trabajo para que funcione de forma similar.
  • Si eliges procesamiento 100% local, muchas órdenes no podrás realizarlas, simplemente no funcionan.

Teniendo en cuenta el funcionamiento en términos generales, que es 100% local para mantener nuestra privacidad (si no configuras una IA externa), su precio de unos 60 euros y el tiempo y pruebas que debemos invertir para adaptarlo bien y que no falle, la valoración de RedesZone es 8,5/10.

Esperamos que os haya gustado nuestro análisis, si tenéis alguna duda os responderemos encantados.

Frontal del Home Assistant Voice Preview Edition en detalle
Home Assistant Voice Preview Edition
Wi-Fi Compatible con 2.4GHz con Wi-Fi 4
Gestión App Home Assistant para smartphones
Compatibilidad
9
Rendimiento
7
Opciones de configuracion
10
Facilidad de uso
7
Precio
9

Puntuación global

8.4
¡DEJA TU VALORACIÓN!
PUNTUACIÓN DE LOS LECTORES:
0
¡Sé el primero en comentar!
Logo redeszone.net
Navega gratis con cookies…

Navegar por redeszone.net con publicidad personalizada, seguimiento y cookies de forma gratuita. i

Para ello, nosotros y nuestros socios i necesitamos tu consentimiento i para el tratamiento de datos personales i para los siguientes fines:

Las cookies, los identificadores de dispositivos o los identificadores online de similares características (p. ej., los identificadores basados en inicio de sesión, los identificadores asignados aleatoriamente, los identificadores basados en la red), junto con otra información (p. ej., la información y el tipo del navegador, el idioma, el tamaño de la pantalla, las tecnologías compatibles, etc.), pueden almacenarse o leerse en tu dispositivo a fin de reconocerlo siempre que se conecte a una aplicación o a una página web para una o varias de los finalidades que se recogen en el presente texto.

La mayoría de las finalidades que se explican en este texto dependen del almacenamiento o del acceso a la información de tu dispositivo cuando utilizas una aplicación o visitas una página web. Por ejemplo, es posible que un proveedor o un editor/medio de comunicación necesiten almacenar una cookie en tu dispositivo la primera vez que visite una página web a fin de poder reconocer tu dispositivo las próximas veces que vuelva a visitarla (accediendo a esta cookie cada vez que lo haga).

La publicidad y el contenido pueden personalizarse basándose en tu perfil. Tu actividad en este servicio puede utilizarse para crear o mejorar un perfil sobre tu persona para recibir publicidad o contenido personalizados. El rendimiento de la publicidad y del contenido puede medirse. Los informes pueden generarse en función de tu actividad y la de otros usuarios. Tu actividad en este servicio puede ayudar a desarrollar y mejorar productos y servicios.

La publicidad que se presenta en este servicio puede basarse en datos limitados, tales como la página web o la aplicación que esté utilizando, tu ubicación no precisa, el tipo de dispositivo o el contenido con el que está interactuando (o con el que ha interactuado) (por ejemplo, para limitar el número de veces que se presenta un anuncio concreto).

  • Un fabricante de automóviles quiere promocionar sus vehículos eléctricos a los usuarios respetuosos con el medioambiente que viven en la ciudad fuera del horario laboral. La publicidad se presenta en una página con contenido relacionado (como un artículo sobre medidas contra el cambio climático) después de las 18:30 h a los usuarios cuya ubicación no precisa sugiera que se encuentran en una zona urbana.
  • Un importante fabricante de acuarelas quiere realizar una campaña publicitaria en Internet para dar a conocer su última gama de acuarelas con la finalidad de llegar tanto a artistas aficionados como a profesionales y, a su vez, se evite mostrar el anuncio junto a otro contenido no relacionado (por ejemplo, artículos sobre cómo pintar una casa). Se detectará y limitará el número de veces que se ha presentado el anuncio a fin de no mostrarlo demasiadas veces.

La información sobre tu actividad en este servicio (por ejemplo, los formularios que rellenes, el contenido que estás consumiendo) puede almacenarse y combinarse con otra información que se tenga sobre tu persona o sobre usuarios similares(por ejemplo, información sobre tu actividad previa en este servicio y en otras páginas web o aplicaciones). Posteriormente, esto se utilizará para crear o mejorar un perfil sobre tu persona (que podría incluir posibles intereses y aspectos personales). Tu perfil puede utilizarse (también en un momento posterior) para mostrarte publicidad que pueda parecerte más relevante en función de tus posibles intereses, ya sea por parte nuestra o de terceros.

  • En una plataforma de redes sociales has leído varios artículos sobre cómo construir una casa en un árbol Esta información podría añadirse a un perfil determinado para indicar tuinterés en el contenido relacionado con la naturaleza, así como en los tutoriales de bricolaje (con el objetivo de permitir la personalización del contenido, de modo que en el futuro, por ejemplo, se te muestren más publicaciones de blogs y artículos sobre casas en árboles y cabañas de madera).
  • Has visualizado tres vídeos sobre la exploración espacial en diferentes aplicaciones de televisión. Una plataforma de noticias sin relación con las anteriores y con la que no has tenido contacto en el pasado crea un perfil basado en esa conducta de visualización marcando la exploración del espacio como un tema de tu posible interés para para otros vídeos.

El contenido que se te presenta en este servicio puede basarse en un perfilde personalización de contenido que se haya realizado previamente sobre tu persona, lo que puede reflejar tu actividad en este u otros servicios (por ejemplo, los formularios con los que interactúas o el contenido que visualizas), tus posibles intereses y aspectos personales. Un ejemplo de lo anterior sería la adaptación del orden en el que se te presenta el contenido, para que así te resulte más sencillo encontrar el contenido (no publicitario) que coincida con tus intereses.

  • Has leído unos artículos sobre comida vegetariana en una plataforma de redes sociales. Posteriormente has usado una aplicación de cocina de una empresa sin relación con la anterior plataforma. El perfil que se ha creado sobre tu persona en la plataforma de redes sociales se utilizará para mostrarte recetas vegetarianas en la pantalla de bienvenida de la aplicación de cocina.
  • Has visualizado tres vídeos sobre remo en páginas web diferentes. Una plataforma de video, no relacionada con la página web en la que has visualizado los vídeos sobre remo, pero basandose en el perfil creado cuando visistaste dicha web, podrá recomendarte otros 5 vídeos sobre remo cuando utilices la plataforma de video a través de tu televisor .

La información sobre qué publicidad se te presenta y sobre la forma en que interactúas con ella puede utilizarse para determinar lo bien que ha funcionado un anuncio en tu caso o en el de otros usuarios y si se han alcanzado los objetivos publicitarios. Por ejemplo, si has visualizado un anuncio, si has hecho clic sobre el mismo, si eso te ha llevado posteriormente a comprar un producto o a visitar una página web, etc. Esto resulta muy útil para comprender la relevancia de las campañas publicitarias./p>

  • Has hecho clic en un anuncio en una página web/medio de comunicación sobre descuentos realizados por una tienda online con motivo del “Black Friday” online y posteriormente has comprado un producto. Ese clic que has hecho estará vinculado a esa compra. Tu interacción y la de otros usuarios se medirán para saber el número de clics en el anuncio que han terminado en compra.
  • Usted es una de las pocas personas que ha hecho clic en un anuncio que promociona un descuento por el “Día de la madre”de una tienda de regalos en Internet dentro de la aplicación de una web/medio de comunicación. El medio de comunicación quiere contar con informes para comprender con qué frecuencia usted y otros usuarios han visualizado o han hecho clic en un anuncio determinado dentro de la aplicación y, en particular, en el anuncio del “Día de la madre” para así ayudar al medio de comunicación y a sus socios (por ejemplo, las agencias de publicidad) a optimizar la ubicación de los anuncios.

La información sobre qué contenido se te presenta y sobre la forma en que interactúas con él puede utilizarse para determinar, por ejemplo, si el contenido (no publicitario) ha llegado a su público previsto y ha coincidido con sus intereses. Por ejemplo, si hasleído un artículo, si has visualizado un vídeo, si has escuchado un “pódcast” o si has consultado la descripción de un producto, cuánto tiempo has pasado en esos servicios y en las páginas web que has visitado, etc. Esto resulta muy útil para comprender la relevancia del contenido (no publicitario) que se te muestra.

  • Has leído una publicación en un blog sobre senderismo desde la aplicación móvil de un editor/medio de comunicación y has seguido un enlace a una publicación recomendada y relacionada con esa publicación. Tus interacciones se registrarán para indicar que la publicación inicial sobre senderismo te ha resultado útil y que la misma ha tenido éxito a la hora de ganarse tu interés en la publicación relacionada. Esto se medirá para saber si deben publicarse más contenidos sobre senderismo en el futuro y para saber dónde emplazarlos en la pantalla de inicio de la aplicación móvil.
  • Se te ha presentado un vídeo sobre tendencias de moda, pero tu y otros usuarios habéis dejado de visualizarlo transcurridos unos 30 segundos. Esta información se utilizará para valorar la duración óptima de los futuros vídeos sobre tendencias de moda.

Se pueden generar informes basados en la combinación de conjuntos de datos (como perfiles de usuario, estadísticas, estudios de mercado, datos analíticos) respecto a tus interacciones y las de otros usuarios con el contenido publicitario (o no publicitario) para identificar las características comunes (por ejemplo, para determinar qué público objetivo es más receptivo a una campaña publicitaria o a ciertos contenidos).

  • El propietario de una librería que opera en Internet quiere contar con informes comerciales que muestren la proporción de visitantes que han visitado su página y se han ido sin comprar nada o que han consultado y comprado la última autobiografía publicada, así como la edad media y la distribución de género para cada uno de los dos grupos de visitantes. Posteriormente, los datos relacionados con la navegación que realizas en su página y sobre tus características personales se utilizan y combinan con otros datos para crear estas estadísticas.
  • Un anunciante quiere tener una mayor comprensión del tipo de público que interactúa con sus anuncios. Por ello, acude a un instituto de investigación con el fin de comparar las características de los usuarios que han interactuado con el anuncio con los atributos típicos de usuarios de plataformas similares en diferentes dispositivos. Esta comparación revela al anunciante que su público publicitario está accediendo principalmente a los anuncios a través de dispositivos móviles y que es probable que su rango de edad se encuentre entre los 45 y los 60 años.

La información sobre tu actividad en este servicio, como tu interacción con los anuncios o con el contenido, puede resultar muy útil para mejorar productos y servicios, así como para crear otros nuevos en base a las interacciones de los usuarios, el tipo de audiencia, etc. Esta finalidad específica no incluye el desarrollo ni la mejora de los perfiles de usuario y de identificadores.

  • Una plataforma tecnológica que opera con un proveedor de redes sociales observa un crecimiento en los usuarios de aplicaciones móviles y se da cuenta de que, en funciónde sus perfiles, muchos de ellos se conectan a través de conexiones móviles. La plataforma utiliza una tecnología nueva para mostrar anuncios con un formato óptimo para los dispositivos móviles y con un ancho de banda bajo a fin de mejorar su rendimiento.
  • Un anunciante está buscando una forma de mostrar anuncios en un nuevo tipo de dispositivo. El anunciante recopila información sobre la forma en que los usuarios interactúan con este nuevo tipo de dispositivo con el fin de determinar si puede crear un nuevo mecanismo para mostrar la publicidad en ese tipo de dispositivo.

El contenido que se presenta en este servicio puede basarse en datos limitados, como por ejemplo la página web o la aplicación que esté utilizando, tu ubicación no precisa, el tipo de dispositivo o el contenido con el que estás interactuando (o con el que has interactuado) (por ejemplo, para limitar el número de veces que se te presenta un vídeo o un artículo en concreto).

  • Una revista de viajes, para mejorar las experiencias de viaje en el extranjero, ha publicado en su página web un artículo sobre nuevos cursos que ofrece una escuela de idiomas por Internet. Las publicaciones del blog de la escuela se insertan directamente en la parte inferior de la página y se seleccionan en función de la ubicación no precisa del usuario (por ejemplo, publicaciones del blog que explican el plan de estudios del curso para idiomas diferentes al del país en el que este te encuentras).
  • Una aplicación móvil de noticias deportivas ha iniciado una nueva sección de artículos sobre los últimos partidos de fútbol. Cada artículo incluye vídeos alojados por una plataforma de streaming independiente que muestra los aspectos destacados de cada partido. Si adelantas un vídeo, esta información puede utilizarse para determinar que el siguiente vídeo a reproducir sea de menor duración.

Se puede utilizar la localización geográfica precisa y la información sobre las características del dispositivo

Al contar con tu aprobación, tu ubicación exacta (dentro de un radio inferior a 500 metros) podrá utilizarse para apoyar las finalidades que se explican en este documento.

Con tu aceptación, se pueden solicitar y utilizar ciertas características específicas de tu dispositivo para distinguirlo de otros (por ejemplo, las fuentes o complementos instalados y la resolución de su pantalla) en apoyo de las finalidades que se explican en este documento.

O sin cookies desde 1,67€ al mes

Por solo 1,67€ al mes, disfruta de una navegación sin interrupciones por toda la red del Grupo ADSLZone: adslzone.net, movilzona.es, testdevelocidad.es, lamanzanamordida.net, hardzone.es, softzone.es, redeszone.net, topesdegama.com y más. Al unirte a nuestra comunidad, no solo estarás apoyando nuestro trabajo, sino que también te beneficiarás de una experiencia online sin cookies.