Startseite » Produktbeschaffung » Fahrzeugteile & Zubehör » Wechseln Sie für einen neuen Passagier: KI-Sprachassistenten im Fahrzeug

Wechseln Sie für einen neuen Passagier: KI-Sprachassistenten im Fahrzeug

Die Hand eines Mannes berührt das Multimediasystem mit dem persönlichen Assistenten der App auf dem Bildschirm im Auto

Der Besitz eines Fahrzeugs mit erweiterten Funktionen, die Sie nicht ganz verstehen, kann eine stressige Erfahrung sein. Kann ein KI-Assistent helfen?

SoundHogMain

Für viele ist die Sprachassistententechnologie kein neues Konzept. Von SIRI bis Alexa, die meisten von uns hätten in dieser Form eine Begegnung mit KI-basierter Technologie gehabt. Allerdings handelt es sich bei Sprachassistenten im Fahrzeug um eine Anwendung, die für einige möglicherweise neu ist. Sie ermöglichen eine Sprachunterstützung im Fahrzeug, die zu einer Freisprechlösung führt, mit der eine Vielzahl von Informationen im Fahrzeuginnenraum bereitgestellt werden können.

Das Audio- und Spracherkennungsunternehmen Soundhound sagt, es sei das erste Unternehmen gewesen, das einen fahrzeuginternen Sprachassistenten angeboten habe, der generative KI mit einem etablierten Sprachassistenten kombiniert. Kürzlich kündigte das Unternehmen Weiterentwicklungen der Technologie an, die es Fahrern ermöglichen, auf vereinfachte und einfache Weise auf Fahrzeughandbuchinformationen zuzugreifen.

Wir haben mit Michael Zagorsek, COO SoundHound, gesprochen, um die neuen Funktionen und ihre Möglichkeiten zu besprechen und über die Zukunft dieser Technologie nachzudenken.

Michael Zagorsek
Michael Zagorsek

Just Auto (JA): Wer ist SoundHound und was macht das Unternehmen?

Michael Zagorsek (MZ): Wir verstehen uns als einen führenden unabhängigen Anbieter von Sprach-KI-Technologie für die Automobilindustrie. Im Wesentlichen stellen wir OEMs einen White-Label-Sprachassistenten zur Verfügung, damit Fahrer oder Passagiere nur mit ihrer Stimme mit den Fahrzeuginformationen innerhalb und außerhalb des Autos interagieren können.

Wir haben bereits 2005 mit der Entwicklung unserer Technologie begonnen. Wir haben sie 2015 parallel zu vielen anderen Aktivitäten von Amazon und Google auf den Markt gebracht. Der entscheidende Unterschied besteht darin, dass die großen Technologieanbieter ihre Sprachdienste auf das Auto ausgeweitet haben, während wir das Fahrzeug und damit die Fähigkeiten und Stärken der OEM-Marken erweitert haben.

Letztendlich könnten wir viele Filter- und Nachverfolgungsfunktionen für Automobilanwendungen durchführen, sogar auf eine Weise, die große Technologieanbieter nicht könnten. Der Hauptunterschied besteht darin, dass es nicht nur darum geht, eine Sprachschnittstelle in etwas wie ChatGPT einzubauen; Wir haben alle unsere Domänen: Wetter, Navigation, Points of Interest – die in Echtzeit sind und mit etwas wie ChatGPT oder anderen großen Sprachmodellen gekoppelt werden können. Wir glauben, dass diese beiden Dinge zusammen (Softwareentwicklung mit maschinellem Lernen) den robustesten Assistenten ergeben, und das haben wir letztes Jahr eingeführt.

Wir sind bei Hyundai-Marken und in mehreren Märkten in Europa führend. Wir pflegen eine tiefe strategische Partnerschaft mit Stellantis und seinen 20 Marken sowie mit Togg, einem türkischen Automobilhersteller, und wir sprechen mit mehreren anderen OEMs.

Könnten Sie etwas über die neue generative KI-Funktion sagen, die kürzlich eingeführt wurde?

Eines der Kernelemente unseres Angebots ist die Idee, dass Sie sowohl außerhalb als auch innerhalb des Fahrzeugs auf Informationen zugreifen können. Das Autohandbuch selbst war schon immer eine Herausforderung für Autohersteller. Es ist offensichtlich umfangreich und sehr umfassend; Dinge zu finden ist offensichtlich eine Herausforderung für alle. Dies ist einer dieser „Schmerzpunkte“, die jeder hat, der ein Auto besitzt.

Eines der Kernelemente unseres Angebots ist die Idee, dass Sie sowohl außerhalb als auch innerhalb des Fahrzeugs auf Informationen zugreifen können.

Was wir tun können, ist, dies aufzunehmen und dann mithilfe unserer Kombination aus Software-Engineering und großen Sprachmodellen dieses Handbuch mithilfe einer proprietären Mischung aus Indizierung und Suche per Sprache zugänglich zu machen. Die Flexibilität großer Sprachmodelle bietet viel Interpretationsspielraum. Die Leute müssen den Namen der Funktion nicht kennen. Sie sagen zum Beispiel nur: „Was ist das für eine Funktion, wenn man auf einem Hügel steht, damit man nicht herunterrutscht?“ Der Assistent erkennt, dass es sich um den Berganfahrassistenten handelt.

Das stärkt unser Wertversprechen wirklich. Im Wesentlichen glauben wir, dass das Spracherlebnis eine Erweiterung des Fahrzeugs selbst sein sollte.

Zweitens wird die Idee eines gedruckten Handbuchs mit der zunehmenden Softwareorientierung von Autos immer obsoleter, da die Software drahtlos (OTA) aktualisiert wird und es offensichtlich keine aktuelle gedruckte Version davon gibt. Immer mehr OEMs werden ihr Handbuch digital im Infotainmentsystem selbst zur Verfügung stellen, aber selbst das stellt natürlich Schwierigkeiten beim Zugriff dar, wie Sie sich vorstellen können.

Wird diese Technologie mit jedem Fahrzeug kompatibel sein?

Jedes Fahrzeug verfügt bis zu einem gewissen Grad über Sprachfunktionen. Ich würde sagen, der alte Teil davon ist die eingebettete Fähigkeit. Dies geschieht, bevor Fahrzeuge mit der Cloud oder anderen Diensten verbunden werden. Sie hätten eine sehr eingeschränkte Funktionalität.

Als wir in den Markt einstiegen, begannen wir, eine Cloud-Funktion für vernetzte Autos anzubieten. Was passieren würde, wäre, dass wir unsere Fähigkeiten über unsere Plattform im Fahrzeug anbieten würden und dadurch dann diese Fahrzeugintelligenzfunktion verfügbar machen würden.

Wir sind nicht dogmatisch, wenn es darum geht, dass Einwegauto-Unternehmen dies umsetzen sollten. Wenn sie Amazon oder Google weiterhin nutzen möchten, ist dies in einigen Fällen durchaus möglich. Die Tatsache, dass daneben ein unabhängiger proprietärer Sprachassistent steht, ist unserer Meinung nach eine echte Erweiterung ihrer Markenstrategie.

Wir sind der Meinung, dass ein umfassenderer und gebrandeter Assistent mit dieser Technologie der bessere Weg ist, aber es gibt natürlich mehrere Möglichkeiten, die umgesetzt werden können.

Was wird Ihrer Meinung nach in den nächsten drei Jahren in diesem Bereich passieren?

Ich würde sagen, dass die neuesten Innovationen rund um diese generativen KI-Technologien die Menschen wirklich für die Möglichkeiten einer echten Konversations-KI sensibilisiert haben.

Dies funktioniert für Autos genauso wie für intelligente Lautsprecher oder alles, was sprachgesteuert ist. ChatGPT öffnet die Tür zu vielen Anwendungsfällen, die es vorher nicht gab. Leute im Auto können sagen: „Ich fahre zu diesem Ort; Hast du einen Rat für mich?“ Sobald die Menschen erkennen, dass es sich sinnvoll auf ihr Leben auswirken kann, werden wir dort viel mehr Aktivitäten erleben.

Ich würde sagen, dass die neuesten Innovationen rund um diese generativen KI-Technologien die Menschen wirklich für die Möglichkeiten einer echten Konversations-KI sensibilisiert haben.

Die anderen Kategorien von Dingen, mit denen Menschen geflirtet haben, die sich aber noch nicht manifestiert haben, ähneln eher dem, was wir „emotionale Intelligenz“ nennen. Wenn ich mich auf eine bestimmte Weise fühle, kann der Sprachassistent dies erkennen und entsprechend reagieren. Es ist dieser Begriff der Emotionserkennung. Wenn ich wütend bin, gibt es dann eine Möglichkeit, diese Emotion durch eine Reaktion in den Griff zu bekommen?

Wenn Sie beispielsweise die KI jetzt um einen Witz bitten, hat die Text-to-Speech-Funktion denselben Ton, als ob Sie sie bitten würden, zur nächsten Tankstelle zu navigieren. Ich denke, dass es beim eigentlichen Text-to-Speech viele Innovationen geben wird, um seine Reaktion basierend auf dem Kontext dessen, was er sagt, zu modifizieren. Ich denke, das wird wirklich das Gefühl hervorrufen, dass man ein Gespräch mit etwas führt, das etwas intelligenter zu sein scheint als ein Roboter, der nur Befehle entgegennimmt.

Auch Spracherkennung und Stimmerkennung – die Technologie existiert, hat sich aber bei OEMs noch nicht manifestiert. Stellen Sie sich vor, Sie steigen in Ihr Fahrzeug und sagen Hallo. Ihr Fahrzeug erkennt Ihre Stimme und sagt „Hallo“. Das ist sicherlich in greifbarer Nähe, ich könnte mir vorstellen, dass das in den nächsten Jahren passieren wird.

Zu guter Letzt stehen Monetarisierung und Handel ganz oben auf unserer Roadmap. Ein Teil unseres Geschäfts besteht darin, dass wir sprachgesteuerte Dienste sowie Restaurants, Essensbestellungen und Drive-Ins als großes Potenzial sehen.

Die Idee ist, dass Sie mit natürlicher Stimme Essen bestellen oder einem Unternehmen Fragen stellen können. Unsere Strategie bestand schon immer darin, diese Dienste in das Fahrzeug zu integrieren und das Auto zu einem viel stärkeren Tor zur Welt um uns herum zu machen. Wir sehen das in den nächsten Jahren, und es ist für OEMs interessant, weil ihre Umsatzherausforderungspreise immer strenger werden. Wir wissen, dass Elektrofahrzeuge nicht mit Gewinn verkauft werden, daher sind zusätzliche Einnahmequellen von entscheidender Bedeutung, und wir glauben, dass Sprachinteraktion einen Teil davon freisetzen kann.

Gibt es Ihrer Meinung nach noch etwas, was die Leute über KI wissen sollten?

Ich würde sagen, als sich die Menschen zum ersten Mal einen Sprachassistenten vorstellten, erkannten sie in den frühen Tagen – vielleicht vor sieben bis zehn Jahren – die Technologie und ihre möglichen praktischen Möglichkeiten. Sie waren damit zufrieden, aber ihre Vorstellungskraft war auch viel stärker. Science-Fiction-Filme führten Konzepte wie Jarvis für Iron Man ein. Es gab immer eine Kluft zwischen dem, was die Leute sich wünschten, und dem, was es tat.

Ich denke, die Fortschritte kommen so schnell, dass die Idee, dass Sie einen Assistenten haben könnten, der mit Ihnen sprechen kann und für Sie da ist, greifbarer denn je ist.

Wir stehen kurz davor, dass den Menschen klar wird, dass sie tatsächlich mit ihrem Sprachassistenten sprechen können, anstatt ihm nur Befehle zu erteilen. Ich denke, wenn Menschen einmal in dieses Verhalten eingedrungen sind, werden sie nie wieder zurückkommen. Sobald Sie den Wert der KI erschlossen haben, wird sie einfach Teil Ihrer Arbeit und Interaktion. Der Gedanke ist, dass wir wirklich in der Lage sind, diesen Sprachassistenten für Gespräche wirklich zu nutzen.

Quelle aus Nur Auto

Haftungsausschluss: Die oben dargelegten Informationen werden von just-auto.com unabhängig von Alibaba.com bereitgestellt. Alibaba.com gibt keine Zusicherungen und Gewährleistungen hinsichtlich der Qualität und Zuverlässigkeit des Verkäufers und der Produkte.

War dieser Artikel hilfreich?

Über den Autor

Hinterlasse einen Kommentar

E-Mail-Adresse wird nicht veröffentlicht. Pflichtfelder sind MIT * gekennzeichnet. *

Nach oben scrollen