Casa » Approvvigionamento di prodotti » Ricambi e accessori per veicoli » Spostati per un nuovo passeggero: assistenti vocali AI di bordo

Spostati per un nuovo passeggero: assistenti vocali AI di bordo

Man mano che tocca il sistema multimediale con l'assistente personale dell'app sullo schermo in auto

Possedere un veicolo con funzionalità avanzate che non capisci del tutto può essere un'esperienza stressante. Un assistente AI può aiutare?

SoundHogMain

La tecnologia dell’assistente vocale non è un concetto nuovo per molti. Da SIRI ad Alexa, la maggior parte di noi avrebbe avuto a che fare con la tecnologia basata sull'intelligenza artificiale in questa forma. Tuttavia, gli assistenti vocali a bordo del veicolo sono un'applicazione che potrebbe essere nuova per alcuni, poiché consentono l'assistenza vocale a bordo del veicolo che si traduce in una soluzione a mani libere per fornire una varietà di informazioni all'interno dell'abitacolo del veicolo.

La società di riconoscimento audio e vocale Soundhound afferma di essere stata la prima a offrire un assistente vocale a bordo del veicolo che combina l'intelligenza artificiale generativa con un assistente vocale affermato. Recentemente, l'azienda ha annunciato ulteriori sviluppi nella tecnologia, consentendo ai conducenti di accedere alle informazioni del manuale del veicolo in modo semplice e semplificato.

Abbiamo parlato con Michael Zagorsek, COO SoundHound, per discutere delle nuove funzionalità e dei risultati che possono ottenere, oltre a considerare il futuro di questa tecnologia.

Michael Zagoršek
Michael Zagoršek

Just Auto (JA): chi è SoundHound e cosa fa l'azienda?

Michael Zagorsek (MZ): Ci consideriamo un fornitore indipendente leader di tecnologia AI vocale per il settore automobilistico. In sostanza, ciò che facciamo è fornire agli OEM un assistente vocale con etichetta bianca in modo che conducenti o passeggeri possano interagire con le informazioni del veicolo all'interno e all'esterno dell'auto semplicemente con la propria voce.

Abbiamo iniziato a sviluppare la nostra tecnologia nel 2005. L'abbiamo lanciata nel 2015 insieme a gran parte di ciò che stavano facendo Amazon e Google. La differenza fondamentale è che i grandi fornitori di tecnologia stavano estendendo i loro servizi vocali all'interno dell'auto, mentre quello che stavamo facendo noi era aumentare il veicolo e quindi le capacità e i punti di forza dei marchi OEM.

Alla fine potremmo fare molti filtri e follow-up per le applicazioni automobilistiche, anche in modi che i grandi fornitori di tecnologia non potrebbero. La differenza fondamentale è che non si tratta solo di mettere un'interfaccia vocale su qualcosa come ChatGPT; abbiamo tutti i nostri domini: meteo, navigazione, punti di interesse – che sono in tempo reale, che possono essere accoppiati con qualcosa come ChatGPT o qualsiasi altro modello linguistico di grandi dimensioni. Crediamo che queste due cose insieme (ingegneria del software e apprendimento automatico) creino l'assistente più robusto, ed è qualcosa che abbiamo lanciato l'anno scorso.

Siamo predominanti nei marchi Hyundai e in numerosi mercati in Europa. Abbiamo una profonda partnership strategica con Stellantis e i suoi 20 marchi, nonché con Togg, un produttore automobilistico turco, e stiamo parlando con molti altri OEM.

Potresti parlare della nuova funzionalità di intelligenza artificiale generativa lanciata di recente?

Uno degli elementi centrali di ciò che offriamo è l'idea che sia possibile accedere alle informazioni all'esterno e all'interno del veicolo. Il manuale stesso dell’auto è sempre stato una sfida per le case automobilistiche. È ovviamente denso e molto completo; trovare le cose è ovviamente una sfida per tutti. Questo è uno di quei "punti dolenti" che hanno tutti coloro che possiedono un'auto.

Uno degli elementi centrali di ciò che offriamo è l'idea che sia possibile accedere alle informazioni all'esterno e all'interno del veicolo.

Ciò che siamo in grado di fare è assimilarlo e poi, utilizzando la nostra combinazione di ingegneria del software e modelli linguistici di grandi dimensioni, rendere il manuale accessibile con la voce utilizzando un mix proprietario di indicizzazione e ricerca. La flessibilità dei modelli linguistici di grandi dimensioni offre ampio spazio all’interpretazione. Le persone non devono conoscere il nome della funzione. Dicono semplicemente, ad esempio: "Cos'è quella caratteristica se sei su una collina per non scivolare giù?" L'assistente determina che stai parlando della funzione di assistenza in salita.

Ciò rafforza davvero la nostra proposta di valore. Essenzialmente, crediamo che l'esperienza vocale debba essere un'estensione del veicolo stesso.

In secondo luogo, poiché le automobili stanno diventando sempre più incentrate sul software, l’idea di un manuale stampato diventa sempre più obsoleta perché il software viene aggiornato via etere (OTA) e ovviamente non esiste una versione stampata aggiornata. Sempre più OEM avranno il loro manuale disponibile digitalmente all'interno del sistema di infotainment stesso, ma anche questo ovviamente presenta sfide per l'accesso, come puoi immaginare.

Questa tecnologia sarà compatibile con qualsiasi veicolo?

Ogni veicolo ha fino a un certo punto capacità vocali. Direi che la sua parte ereditaria è la capacità incorporata. Ciò avviene prima che i veicoli vengano connessi al Cloud o a qualsiasi servizio. Avrebbero funzionalità molto limitate.

Quando siamo entrati nel mercato, abbiamo iniziato a offrire funzionalità Cloud per le auto connesse. Ciò che accadrebbe è che offriremo le nostre capacità attraverso la nostra piattaforma sul veicolo e quindi renderemo disponibile questa funzionalità di intelligenza del veicolo.

Non siamo dogmatici riguardo al fatto che le società automobilistiche a senso unico dovrebbero implementarlo. In alcuni casi, se vogliono continuare a utilizzare Amazon o Google, possono certamente farlo. Avere un assistente vocale proprietario indipendente che convive insieme a questo è, riteniamo, davvero un'estensione della loro strategia di marchio.

Riteniamo che avere un assistente più completo e brandizzato sia la strada migliore che includa questa tecnologia, ma ovviamente ci sono diversi modi in cui ciò può accadere.

Cosa prevedi che accada in questo ambito nei prossimi tre anni?

Direi che le ultime innovazioni attorno a queste tecnologie di intelligenza artificiale generativa hanno davvero risvegliato le persone alle possibilità di un’intelligenza artificiale veramente conversazionale.

Questo funziona per le auto tanto quanto per gli altoparlanti intelligenti o qualsiasi cosa sia abilitata alla voce. ChatGPT apre le porte a molti casi d'uso che prima non esistevano. Le persone in macchina possono dire: “Sto viaggiando verso questa località; avete qualche consiglio da darmi?" Una volta che le persone inizieranno a rendersi conto che può iniziare ad avere un impatto significativo sulle loro vite, vedremo molte più attività lì.

Direi che le ultime innovazioni attorno a queste tecnologie di intelligenza artificiale generativa hanno davvero risvegliato le persone alle possibilità di un’intelligenza artificiale veramente conversazionale.

Le altre categorie di cose con cui le persone hanno flirtato, ma che non si sono ancora manifestate, sono un po' più sulla falsariga di qualcosa che chiameremo "intelligenza emotiva". Se mi sento in un certo modo, l'assistente vocale può riconoscerlo e rispondere di conseguenza. È quella nozione di rilevamento delle emozioni. Se sono arrabbiato, c'è un'opportunità per gestire quell'emozione attraverso una risposta?

Ad esempio, in questo momento quando chiedi all’IA uno scherzo, la sintesi vocale ha lo stesso tono come se le chiedessi di dirigersi verso la stazione di servizio più vicina. Penso che ci sarà molta innovazione per la sintesi vocale vera e propria per modificare la sua risposta in base al contesto di ciò che sta dicendo. Penso che questo sbloccherà davvero di più quella sensazione di avere una conversazione con qualcosa che sembra un po' più intelligente di un robot che prende semplicemente comandi.

Inoltre, l'identificazione vocale e l'identificazione vocale: la tecnologia esiste, ma non si è manifestata negli OEM. Quindi, immagina di entrare nel tuo veicolo e salutare. Il tuo veicolo riconosce la tua voce e dice "ciao". Questo è certamente a portata di mano, potrei vederlo accadere nei prossimi anni.

Infine, ma non meno importante, la monetizzazione e il commercio rientrano nella nostra tabella di marcia. Parte della nostra attività è che vediamo servizi abilitati alla voce, nonché ristoranti, ordinazione di cibo, drive-through: un grande potenziale.

L'idea è che puoi ordinare cibo o porre domande a un'azienda attraverso la voce naturale. La nostra strategia è sempre stata quella di portare questi servizi a bordo del veicolo e rendere l’auto un punto di accesso molto più forte verso il mondo che ci circonda. Nei prossimi anni lo vedremo, ed è interessante per gli OEM perché i loro prezzi in termini di entrate stanno diventando sempre più ristretti. Sappiamo che i veicoli elettrici non vengono venduti con profitto, quindi ulteriori forme di entrate sono fondamentali e crediamo che l’interazione vocale possa sbloccare una parte di questo.

C’è qualcos’altro che pensi che le persone dovrebbero sapere sull’intelligenza artificiale?

Quando le persone hanno immaginato per la prima volta un assistente vocale, direi i primi giorni – forse sette o dieci anni fa – hanno visto la tecnologia e cosa poteva potenzialmente fare in pratica. Ne erano contenti, ma la loro immaginazione era anche molto più potente. I film di fantascienza introducevano concetti come Jarvis per Iron Man. C'è sempre stato questo divario tra ciò che la gente desiderava potesse fare e ciò che ha fatto.

Penso che i progressi stiano arrivando così rapidamente che l'idea di poter avere un assistente che possa parlarti ed essere lì per te è più a portata di mano che mai.

Siamo sul punto di capire che le persone possono davvero parlare con il proprio assistente vocale anziché semplicemente comandarlo. Penso che una volta che le persone adottano questo comportamento, non torneranno più indietro. Una volta sbloccato il valore con l'intelligenza artificiale, diventa semplicemente parte di ciò che fai e del modo in cui interagisci. L'idea è che siamo davvero nella posizione di abbracciare veramente quell'assistente vocale conversazionale.

Fonte da Solo auto

Dichiarazione di non responsabilità: le informazioni sopra riportate sono fornite da just-auto.com indipendentemente da Alibaba.com. Alibaba.com non rilascia alcuna dichiarazione o garanzia in merito alla qualità e all'affidabilità del venditore e dei prodotti.

questo articolo è stato utile?

Circa l'autore

Lascia un tuo commento

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati con *

Scorrere fino a Top