Inicio » Abastecimiento de productos » Piezas y accesorios para vehículos » Muévase para un nuevo pasajero: asistentes de voz con IA en el vehículo

Muévase para un nuevo pasajero: asistentes de voz con IA en el vehículo

Mano del hombre tocando el sistema multimedia con asistente personal de aplicación en la pantalla del coche

Ser propietario de un vehículo con funciones avanzadas que no comprendes del todo puede ser una experiencia estresante. ¿Puede ayudar un asistente de IA?

SoundHogPrincipal

La tecnología de asistente de voz no es un concepto nuevo para muchos. Desde SIRI hasta Alexa, la mayoría de nosotros habríamos tenido un encuentro con la tecnología basada en IA de esta forma. Sin embargo, los asistentes de voz en el vehículo son una aplicación que puede ser nueva para algunos, ya que permiten la asistencia de voz en el vehículo que da como resultado una solución de manos libres para brindar una variedad de información dentro de la cabina del vehículo.

La empresa de reconocimiento de voz y audio Soundhound dice que fue la primera en ofrecer un asistente de voz en el vehículo que combina IA generativa con un asistente de voz establecido. Recientemente, la compañía anunció nuevos avances en la tecnología, que permiten a los conductores tener acceso a la información del manual del vehículo de una manera sencilla y simplificada.

Hablamos con Michael Zagorsek, director de operaciones de SoundHound, para analizar las nuevas funciones y lo que pueden lograr, así como para considerar el futuro de esta tecnología.

Michael Zagorsek
Michael Zagorsek

Just Auto (JA): ¿Quién es SoundHound y qué hace la empresa?

Michael Zagorsek (MZ): Nos consideramos un proveedor independiente líder de tecnología de inteligencia artificial de voz para automoción. En esencia, lo que hacemos es brindar a los OEM un asistente de voz de marca blanca para que los conductores o pasajeros puedan interactuar con la información del vehículo dentro y fuera del automóvil con solo su voz.

Comenzamos a desarrollar nuestra tecnología en 2005. La lanzamos en 2015 junto con gran parte de lo que estaban haciendo Amazon y Google. La diferencia clave es que los grandes proveedores de tecnología estaban ampliando sus servicios de voz al automóvil, mientras que nosotros estábamos aumentando el vehículo y, por lo tanto, las propias capacidades y fortalezas de las marcas OEM.

En última instancia, podríamos hacer muchos filtros y seguimientos para aplicaciones automotrices, incluso en formas que los grandes proveedores de tecnología no podrían. La diferencia clave es que no se trata simplemente de poner una interfaz de voz en algo como ChatGPT; Tenemos todos nuestros dominios: clima, navegación, puntos de interés, que son en tiempo real y que pueden combinarse con algo como ChatGPT o cualquier otro modelo de lenguaje grande. Creemos que esas dos cosas juntas (ingeniería de software con aprendizaje automático) crean el asistente más sólido, y eso es algo que lanzamos el año pasado.

Somos predominantes en las marcas Hyundai y en múltiples mercados de Europa. Somos una asociación estratégica profunda con Stellantis y sus 20 marcas, así como con Togg, un fabricante de automóviles turco, y estamos hablando con varios otros OEM.

¿Podría hablarnos de la nueva función de IA generativa que se lanzó recientemente?

Uno de los elementos centrales de lo que ofrecemos es la idea de que puede acceder a información fuera y dentro del vehículo. El manual del automóvil en sí siempre ha sido un desafío para los fabricantes de automóviles. Es obviamente denso y muy completo; Encontrar cosas es obviamente un desafío para todos. Este es uno de esos "puntos débiles" que tiene todo aquel que posee un automóvil.

Uno de los elementos centrales de lo que ofrecemos es la idea de que puede acceder a información fuera y dentro del vehículo.

Lo que podemos hacer es asimilarlo y luego, utilizando nuestra combinación de ingeniería de software y grandes modelos de lenguaje, hacer que ese manual sea accesible con voz mediante el uso de una combinación patentada de indexación y búsqueda. La flexibilidad de los modelos de lenguaje grandes ofrece mucho espacio para la interpretación. No es necesario que la gente sepa el nombre de la función. Simplemente dicen, por ejemplo: "¿Cuál es esa característica si estás en una colina para no deslizarte hacia abajo?" El asistente determina que estás hablando de la función de asistencia en pendiente.

Esto realmente fortalece nuestra propuesta de valor. Básicamente, creemos que la experiencia de voz debería ser una extensión del propio vehículo.

En segundo lugar, a medida que los automóviles se centran más en el software, la idea de un manual impreso se vuelve más obsoleta porque el software se actualiza por aire (OTA) y obviamente no existe una versión impresa actualizada del mismo. Más fabricantes de equipos originales tendrán su manual disponible digitalmente dentro del propio sistema de información y entretenimiento, pero incluso eso obviamente presenta desafíos de acceso, como se puede imaginar.

¿Esta tecnología será compatible con cualquier vehículo?

Cada vehículo tiene capacidad de voz hasta cierto punto. Yo diría que la parte heredada es la capacidad integrada. Esto es antes de que los vehículos se conecten a la nube o a cualquier servicio. Tendrían una funcionalidad muy limitada.

Cuando ingresamos al mercado, comenzamos a ofrecer capacidad en la nube para automóviles conectados. Lo que sucedería es que ofreceríamos nuestras capacidades a través de nuestra plataforma en el vehículo y luego a través de ella pondríamos a disposición esta función de inteligencia del vehículo.

No somos dogmáticos acerca de que las empresas de automóviles unidireccionales deban implementar esto. En algunos casos, si quieren seguir usando Amazon o Google, ciertamente pueden hacerlo. Creemos que tener un asistente de voz propietario independiente conviviendo con esto es realmente una extensión de su estrategia de marca.

Creemos que tener un asistente más completo y de marca es la mejor manera de hacerlo que cuente con esta tecnología, pero obviamente hay varias formas de hacerlo.

¿Qué predice que sucederá en este espacio durante los próximos tres años?

Yo diría que las últimas innovaciones en torno a estas tecnologías de IA generativa realmente han despertado a las personas a las posibilidades de una IA verdaderamente conversacional.

Esto funciona tanto para automóviles como para parlantes inteligentes o cualquier cosa que admita voz. ChatGPT abre la puerta a muchos casos de uso que antes no existían. Las personas que viajan en automóvil pueden decir: “Viajo a este lugar; ¿Tiene algún consejo para mí?" Una vez que la gente empiece a darse cuenta de que esto puede empezar a tener un impacto significativo en sus vidas, veremos mucha más actividad allí.

Yo diría que las últimas innovaciones en torno a estas tecnologías de IA generativa realmente han despertado a las personas a las posibilidades de una IA verdaderamente conversacional.

Las otras categorías de cosas con las que la gente ha coqueteado, pero que aún no se han manifestado, se parecen un poco más a algo que llamaremos "inteligencia emocional". Si me siento de cierta manera, el asistente de voz puede reconocerlo y responder en consecuencia. Es esa noción de detección de emociones. Si estoy enojado, ¿existe la oportunidad de manejar esa emoción a través de una respuesta?

Por ejemplo, ahora mismo, cuando le pides un chiste a la IA, el texto a voz tiene el mismo tono que si le estuvieras pidiendo que navegara hasta la gasolinera más cercana. Creo que habrá mucha innovación para que el texto a voz real modifique su respuesta según el contexto de lo que dice. Creo que eso realmente desbloqueará más esa sensación de que estás teniendo una conversación con algo que parece un poco más inteligente que un robot que simplemente recibe órdenes.

Además, la identificación por voz y la identificación por voz: la tecnología existe, pero no se ha manifestado en los OEM. Entonces, imagina si entras en tu vehículo y saludas. Su vehículo reconoce su voz y dice "hola". Esto ciertamente está a nuestro alcance, y puedo ver que esto suceda en los próximos años.

Por último, pero no menos importante, la monetización y el comercio están en nuestra hoja de ruta. Parte de nuestro negocio es que vemos servicios habilitados por voz, así como restaurantes, pedidos de comida y servicios de autoservicio, todo ello con mucho potencial.

La idea es que puedas pedir comida o consultar cualquier duda a un negocio a través de la voz natural. Nuestra estrategia siempre ha sido incorporar esos servicios al vehículo y hacer del mismo una puerta de entrada mucho más sólida al mundo que nos rodea. En los próximos años, veremos eso, y es interesante para los OEM porque sus precios de desafío de ingresos se están volviendo más ajustados. Sabemos que los vehículos eléctricos no se venden con fines de lucro, por lo que formas adicionales de ingresos son fundamentales, y creemos que la interacción de voz puede desbloquear parte de eso.

¿Hay algo más que creas que la gente debería saber sobre la IA?

Cuando la gente imaginó por primera vez un asistente de voz, yo diría que en los primeros días (tal vez hace siete o diez años) vieron la tecnología y lo que potencialmente podría hacer en la práctica. Estaban contentos con eso, pero su imaginación también era mucho más poderosa. Las películas de ciencia ficción introducían conceptos como Jarvis para Iron Man. Siempre existió esta brecha entre lo que la gente deseaba que pudiera hacer y lo que hizo.

Creo que los avances están llegando tan rápido que la idea de que puedas tener un asistente que pueda hablar contigo y que esté ahí para ayudarte está más a tu alcance que nunca.

Estamos a punto de que las personas se den cuenta de que realmente pueden hablar con su asistente de voz en lugar de simplemente ordenarlo. Creo que una vez que la gente adopta ese comportamiento, nunca volverá atrás. Una vez que haya desbloqueado valor con la IA, ésta se convertirá en parte de lo que hace y de cómo interactúa. La idea es que realmente estamos en condiciones de adoptar verdaderamente ese asistente de voz conversacional.

Fuente de Solo coche

Descargo de responsabilidad: La información establecida anteriormente es proporcionada por just-auto.com independientemente de Alibaba.com. Alibaba.com no representa ni garantiza la calidad y confiabilidad del vendedor y los productos.

¿Le resultó útil este artículo?

Sobre el Autor

Deja un comentario

Su dirección de correo electrónico no será publicada. Las areas obligatorias están marcadas como requeridas *

Ir al Inicio