Accueil » Approvisionnement en produits » Pièces et accessoires de véhicules » Déplacez-vous pour un nouveau passager : assistants vocaux IA embarqués dans le véhicule

Déplacez-vous pour un nouveau passager : assistants vocaux IA embarqués dans le véhicule

Main d'homme touchant le système multimédia avec application assistant personnel à l'écran dans la voiture

Posséder un véhicule doté de fonctionnalités avancées que vous ne comprenez pas très bien peut être une expérience stressante. Un assistant IA peut-il vous aider ?

SoundHogMain

La technologie des assistants vocaux n’est pas un concept nouveau pour beaucoup. De SIRI à Alexa, la plupart d’entre nous auraient été confrontés à une technologie basée sur l’IA sous cette forme. Cependant, les assistants vocaux embarqués sont une application qui peut être nouvelle pour certains, permettant une assistance vocale embarquée qui se traduit par une solution mains libres pour fournir une variété d'informations à l'intérieur de l'habitacle du véhicule.

La société de reconnaissance audio et vocale Soundhound affirme avoir été la première à proposer un assistant vocal embarqué combinant l'IA générative avec un assistant vocal établi. Récemment, la société a annoncé de nouveaux développements technologiques, permettant aux conducteurs d'accéder aux informations du manuel du véhicule de manière simplifiée et simple.

Nous avons parlé à Michael Zagorsek, COO SoundHound, pour discuter des nouvelles fonctionnalités et de ce qu'elles peuvent réaliser, ainsi que pour réfléchir à l'avenir de cette technologie.

Michael Zagorsek
Michael Zagorsek

Just Auto (JA) : Qui est SoundHound et que fait l'entreprise ?

Michael Zagorsek (MZ): Nous nous considérons comme l’un des principaux fournisseurs indépendants de technologie d’IA vocale pour l’automobile. Essentiellement, nous fournissons aux équipementiers un assistant vocal en marque blanche afin que les conducteurs ou les passagers puissent interagir avec les informations du véhicule à l'intérieur et à l'extérieur de la voiture avec simplement leur voix.

Nous avons commencé à développer notre technologie en 2005. Nous l'avons lancée en 2015 parallèlement à une grande partie de ce que faisaient Amazon et Google. La principale différence est que les grands fournisseurs de technologie étendaient leurs services vocaux dans la voiture, alors que nous faisions augmenter le véhicule et donc les capacités et les points forts des marques OEM.

En fin de compte, nous pourrions effectuer beaucoup de filtrage et de suivi pour les applications automobiles, même d'une manière que les grands fournisseurs de technologie ne pouvaient pas faire. La principale différence est qu’il ne s’agit pas simplement de mettre une interface vocale sur quelque chose comme ChatGPT ; nous avons tous nos domaines : météo, navigation, points d'intérêt – qui sont en temps réel, qui peuvent être couplés à quelque chose comme ChatGPT ou tout autre grand modèle de langage. Nous pensons que ces deux éléments réunis (génie logiciel et apprentissage automatique) créent l'assistant le plus robuste, et c'est quelque chose que nous avons lancé l'année dernière.

Nous sommes prédominants dans les marques Hyundai et sur de multiples marchés en Europe. Nous avons un partenariat stratégique approfondi avec Stellantis et leurs 20 marques, ainsi qu'avec Togg, un constructeur automobile turc, et nous sommes en discussion avec plusieurs autres équipementiers.

Pourriez-vous discuter de la nouvelle fonctionnalité d’IA générative qui a récemment été lancée ?

L’un des éléments centraux de ce que nous proposons est cette idée selon laquelle vous pouvez accéder aux informations à l’extérieur et à l’intérieur du véhicule. Le manuel automobile lui-même a toujours été un défi pour les constructeurs automobiles. C'est évidemment épais et très complet ; trouver des choses est évidemment un défi pour tous. C’est l’un de ces « problèmes » que connaissent tous ceux qui possèdent une voiture.

L’un des éléments centraux de ce que nous proposons est cette idée selon laquelle vous pouvez accéder aux informations à l’extérieur et à l’intérieur du véhicule.

Ce que nous sommes en mesure de faire, c'est d'ingérer cela, puis d'utiliser notre combinaison d'ingénierie logicielle et de grands modèles de langage, de rendre ce manuel accessible vocalement en utilisant une combinaison propriétaire d'indexation et de recherche. La flexibilité des grands modèles de langage laisse une grande marge d’interprétation. Les gens n'ont pas besoin de connaître le nom de la fonctionnalité. Ils disent simplement, par exemple : « Quelle est cette fonctionnalité si vous êtes sur une colline pour ne pas glisser ? » L'assistant détermine que vous parlez de la fonction d'assistance au maintien en côte.

Cela renforce vraiment notre proposition de valeur. Essentiellement, nous pensons que l’expérience vocale devrait être une extension du véhicule lui-même.

Deuxièmement, à mesure que les voitures sont de plus en plus centrées sur les logiciels, l'idée d'un manuel imprimé devient de plus en plus obsolète car le logiciel est mis à jour par liaison radio (OTA) et il n'existe évidemment pas de version imprimée à jour de celui-ci. De plus en plus de constructeurs auront leur manuel disponible sous forme numérique dans le système d'infodivertissement lui-même, mais même cela présente évidemment des défis d'accès, comme vous pouvez l'imaginer.

Cette technologie sera-t-elle compatible avec n’importe quel véhicule ?

Chaque véhicule est doté d'une capacité vocale dans une certaine mesure. Je dirais que la partie héritée est la capacité intégrée. Ceci avant que les véhicules ne soient connectés au Cloud ou à tout service. Ils auraient des fonctionnalités très limitées.

Lorsque nous sommes entrés sur le marché, nous avons commencé à proposer une fonctionnalité Cloud pour les voitures connectées. Ce qui se passerait, c'est que nous offririons nos capacités via notre plate-forme sur le véhicule, puis grâce à cela, nous rendrions cette fonctionnalité d'intelligence du véhicule disponible.

Nous ne sommes pas dogmatiques sur le fait que les constructeurs automobiles à sens unique devraient mettre en œuvre cette mesure. Dans certains cas, s’ils souhaitent continuer à utiliser Amazon ou Google, ils le peuvent certainement. Avoir un assistant vocal propriétaire indépendant à côté de cela est, à notre avis, vraiment une extension de leur stratégie de marque.

Nous pensons qu’avoir un assistant plus complet et de marque est la meilleure voie à suivre qui intègre cette technologie, mais cela peut évidemment se produire de plusieurs manières.

Que pensez-vous qu’il se passera dans cet espace au cours des trois prochaines années ?

Je dirais que les dernières innovations autour de ces technologies d’IA générative ont vraiment fait prendre conscience aux gens des possibilités d’une IA véritablement conversationnelle.

Cela fonctionne autant pour les voitures que pour les haut-parleurs intelligents ou tout ce qui est activé par la voix. ChatGPT ouvre la porte à de nombreux cas d'utilisation qui n'existaient pas auparavant. Les personnes en voiture peuvent dire : « Je me rends à cet endroit ; Avez-vous des conseils pour moi?" Une fois que les gens commenceront à réaliser que cela peut avoir un impact significatif sur leur vie, nous verrons beaucoup plus d’activité dans ce domaine.

Je dirais que les dernières innovations autour de ces technologies d’IA générative ont vraiment fait prendre conscience aux gens des possibilités d’une IA véritablement conversationnelle.

Les autres catégories de choses avec lesquelles les gens ont flirté, mais qui ne se sont pas encore manifestées, s'apparentent un peu plus à ce que nous appellerons « l'intelligence émotionnelle ». Si je ressens une certaine sensation, l'assistant vocal peut le reconnaître et répondre en conséquence. C'est cette notion de détection des émotions. Si je suis en colère, y a-t-il une possibilité de gérer cette émotion à travers une réponse ?

Par exemple, à l’heure actuelle, lorsque vous demandez à l’IA une blague, la synthèse vocale est sur le même ton que si vous lui demandiez de naviguer jusqu’à la station-service la plus proche. Je pense qu'il y aura beaucoup d'innovation dans la synthèse vocale pour modifier sa réponse en fonction du contexte de ce qu'elle dit. Je pense que cela débloquera vraiment davantage le sentiment que vous avez une conversation avec quelque chose qui semble un peu plus intelligent qu'un robot qui prend simplement des commandes.

En outre, l'identification vocale et l'identification vocale – la technologie existe, mais elle ne s'est pas manifestée chez les constructeurs OEM. Alors imaginez si vous entrez dans votre véhicule et dites bonjour. Votre véhicule reconnaît votre voix et vous dit « bonjour ». C’est certainement à notre portée, je pourrais le voir se produire dans les prochaines années.

Enfin, mais non des moindres, la monétisation et le commerce figurent en bonne place sur notre feuille de route. Une partie de notre activité réside dans le fait que nous voyons des services vocaux ainsi que des restaurants, des commandes de nourriture, des services au volant – un grand potentiel.

L’idée est que vous pouvez commander de la nourriture ou poser des questions à une entreprise par votre voix naturelle. Notre stratégie a toujours été d’intégrer ces services dans le véhicule et de faire de la voiture une porte d’entrée beaucoup plus solide vers le monde qui nous entoure. Nous le constaterons au cours des prochaines années, et c’est intéressant pour les équipementiers car leurs prix de défi en matière de revenus deviennent de plus en plus serrés. Nous savons que les véhicules électriques ne sont pas vendus avec profit, des formes de revenus supplémentaires sont donc essentielles, et nous pensons que l’interaction vocale peut en débloquer une partie.

Selon vous, y a-t-il autre chose que les gens devraient savoir sur l’IA ?

Lorsque les gens ont imaginé pour la première fois un assistant vocal, je dirais que dès le début – il y a peut-être sept à dix ans – ils ont vu la technologie et ce qu'elle pouvait potentiellement faire en pratique. Ils en étaient contents, mais leur imagination était aussi beaucoup plus puissante. Les films de science-fiction introduisaient des concepts comme Jarvis pour Iron Man. Il y avait toujours cet écart entre ce que les gens souhaitaient qu’elle fasse et ce qu’elle faisait.

Je pense que les progrès arrivent si rapidement que l’idée que vous puissiez avoir un assistant capable de vous parler et d’être là pour vous est plus à portée de main que jamais.

Nous sommes sur le point de réaliser que les gens peuvent vraiment parler à leur assistant vocal plutôt que de simplement le commander. Je pense qu'une fois que les gens adoptent ce comportement, ils ne reviendront plus jamais. Une fois que vous avez libéré de la valeur grâce à l’IA, celle-ci devient partie intégrante de ce que vous faites et de la façon dont vous interagissez. L’idée est que nous sommes vraiment en mesure d’adopter véritablement cet assistant vocal conversationnel.

Source à partir de Juste une voiture

Avis de non-responsabilité : les informations présentées ci-dessus sont fournies par just-auto.com indépendamment d'Alibaba.com. Alibaba.com ne fait aucune représentation ni garantie quant à la qualité et à la fiabilité du vendeur et des produits.

Cet article a-t-il été utile?

A propos de l'auteur

Laisser un commentaire

Votre adresse email n'apparaitra pas. Les champs obligatoires sont marqués *

Remonter en haut