Início » Fornecimento de produtos » Peças e acessórios para veículos » Mudança para um novo passageiro: assistentes de voz com IA no veículo

Mudança para um novo passageiro: assistentes de voz com IA no veículo

Mão de homem tocando no sistema multimídia com assistente pessoal de aplicativo na tela do carro

Possuir um veículo com recursos avançados que você não entende muito bem pode ser uma experiência estressante. Um assistente de IA pode ajudar?

SoundHogPrincipal

A tecnologia de assistente de voz não é um conceito novo para muitos. Do SIRI ao Alexa, a maioria de nós teria tido um encontro com a tecnologia baseada em IA nesta forma. No entanto, os assistentes de voz no veículo são uma aplicação que pode ser nova para alguns, permitindo assistência de voz no veículo que resulta numa solução mãos-livres para fornecer uma variedade de informações dentro da cabine do veículo.

A empresa de reconhecimento de áudio e fala Soundhound afirma que foi a primeira a oferecer um assistente de voz no veículo que combina IA generativa com um assistente de voz estabelecido. Recentemente, a empresa anunciou novos desenvolvimentos na tecnologia, permitindo que os motoristas tenham acesso às informações do manual do veículo de forma simplificada e fácil.

Conversamos com Michael Zagorsek, COO SoundHound, para discutir os novos recursos e o que eles podem alcançar, bem como considerar o futuro desta tecnologia.

Michael Zagorsek
Michael Zagorsek

Just Auto (JA): Quem é SoundHound e o que a empresa faz?

Michael Zagorsek (MZ): Consideramo-nos um fornecedor independente líder de tecnologia de IA de voz para o setor automotivo. Em essência, o que fazemos é fornecer aos OEMs um assistente de voz com etiqueta branca para que os motoristas ou passageiros possam interagir com as informações do veículo dentro e fora do carro apenas com a voz.

Começamos a desenvolver nossa tecnologia em 2005. Lançamos em 2015 junto com muito do que a Amazon e o Google estavam fazendo. A principal diferença é que os grandes fornecedores de tecnologia estavam a alargar os seus serviços de voz ao automóvel, enquanto o que estávamos a fazer era aumentar o veículo e, portanto, as próprias capacidades e pontos fortes das marcas OEM.

Em última análise, poderíamos fazer muita filtragem e acompanhamento para aplicações automotivas, mesmo de maneiras que os grandes fornecedores de tecnologia não poderiam. A principal diferença é que não se trata apenas de colocar uma interface de voz em algo como o ChatGPT; temos todos os nossos domínios: clima, navegação, pontos de interesse – que são em tempo real, que podem ser acoplados a algo como ChatGPT ou qualquer outro grande modelo de linguagem. Acreditamos que essas duas coisas juntas (engenharia de software com aprendizado de máquina) criam o assistente mais robusto, e isso é algo que lançamos no ano passado.

Somos predominantes nas marcas Hyundai e em vários mercados na Europa. Temos uma parceria estratégica profunda com a Stellantis e suas 20 marcas, bem como com a Togg, uma fabricante automotiva turca, e estamos conversando com vários outros OEMs.

Você poderia discutir o novo recurso de IA generativa que foi lançado recentemente?

Um dos elementos centrais do que oferecemos é a ideia de que você pode acessar informações fora e dentro do veículo. O próprio manual do carro sempre foi um desafio para as montadoras. É obviamente denso e muito abrangente; encontrar coisas é obviamente um desafio para todos. Este é um daqueles “pontos problemáticos” que todo mundo que possui um carro tem.

Um dos elementos centrais do que oferecemos é a ideia de que você pode acessar informações fora e dentro do veículo.

O que somos capazes de fazer é assimilar isso e, em seguida, usando nossa combinação de engenharia de software e grandes modelos de linguagem, tornar esse manual acessível por voz, usando uma combinação proprietária de indexação e pesquisa. A flexibilidade de grandes modelos de linguagem oferece muito espaço para interpretação. As pessoas não precisam saber o nome do recurso. Eles apenas dizem, por exemplo: “Qual é essa característica se você está em uma colina para não escorregar?” O assistente determina que você está falando sobre o recurso de assistência em subidas.

Isso realmente fortalece nossa proposta de valor. Essencialmente, acreditamos que a experiência de voz deve ser uma extensão do próprio veículo.

Em segundo lugar, à medida que os carros se tornam mais centrados no software, a ideia de um manual impresso torna-se mais obsoleta porque o software é atualizado pelo ar (OTA) e obviamente não existe uma versão impressa atualizada dele. Mais OEMs terão seus manuais disponíveis digitalmente no próprio sistema de infoentretenimento, mas mesmo isso obviamente apresenta desafios de acesso, como você pode imaginar.

Esta tecnologia será compatível com qualquer veículo?

Cada veículo tem capacidade de voz até certo ponto. Eu diria que a parte legada disso é a capacidade incorporada. Isso ocorre antes de os veículos serem conectados à nuvem ou a quaisquer serviços. Eles teriam funcionalidade muito limitada.

Quando entramos no mercado, começamos a oferecer capacidade de nuvem para carros conectados. O que aconteceria é que ofereceríamos nossas capacidades por meio de nossa plataforma no veículo e, então, disponibilizaríamos esse recurso de inteligência do veículo.

Não somos dogmáticos sobre se alguma empresa de automóveis unidirecionais deveria implementar isso. Em alguns casos, se quiserem continuar usando a Amazon ou o Google, certamente poderão. Ter um assistente de voz proprietário independente convivendo com isso é, em nossa opinião, realmente uma extensão de sua estratégia de marca.

Achamos que ter um assistente mais completo e de marca é o melhor caminho a seguir que apresenta essa tecnologia, mas obviamente há várias maneiras de isso acontecer.

O que você prevê que acontecerá neste espaço nos próximos três anos?

Eu diria que as mais recentes inovações em torno destas tecnologias generativas de IA realmente despertaram as pessoas para as possibilidades de uma IA verdadeiramente conversacional.

Isso funciona tanto para carros quanto para alto-falantes inteligentes ou qualquer coisa habilitada para voz. ChatGPT abre a porta para muitos casos de uso que não existiam antes. As pessoas que estão no carro podem dizer: “Estou viajando para este local; Você tem algum conselho para mim?" Quando as pessoas começarem a perceber que isso pode começar a impactar significativamente suas vidas, veremos muito mais atividades lá.

Eu diria que as mais recentes inovações em torno destas tecnologias generativas de IA realmente despertaram as pessoas para as possibilidades de uma IA verdadeiramente conversacional.

As outras categorias de coisas com as quais as pessoas flertaram, mas que ainda não se manifestaram, estão um pouco mais na linha de algo que chamaremos de “inteligência emocional”. Se estou me sentindo de determinada maneira, o assistente de voz pode reconhecer e responder de acordo. É essa noção de detecção de emoções. Se estou com raiva, existe uma oportunidade de controlar essa emoção através de uma resposta?

Por exemplo, agora mesmo, quando você pede uma piada à IA, o texto para fala tem o mesmo tom como se você estivesse pedindo para navegar até o posto de gasolina mais próximo. Acho que haverá muita inovação no texto em fala para modificar sua resposta com base no contexto do que está sendo dito. Acho que isso realmente desbloqueará mais a sensação de que você está conversando com algo que parece um pouco mais inteligente do que um robô que apenas recebe comandos.

Além disso, identificação de fala e identificação de voz – a tecnologia existe, mas não se manifestou nos OEMs. Então, imagine se você entrar no seu veículo e cumprimentar. Seu veículo reconhece sua voz e diz “oi”. Isso certamente está ao nosso alcance, posso ver isso acontecendo nos próximos anos.

Por último, mas não menos importante, a monetização e o comércio estão no nosso roteiro. Parte do nosso negócio é que vemos serviços habilitados por voz, bem como restaurantes, pedidos de comida, drive-throughs – muito potencial.

A ideia é que você possa pedir comida ou tirar dúvidas a uma empresa por meio de voz natural. A nossa estratégia sempre foi trazer esses serviços para o veículo e fazer do automóvel uma porta de entrada muito mais forte para o mundo que nos rodeia. Nos próximos anos, veremos isso, e é interessante para os OEMs porque os preços que desafiam as receitas estão se tornando mais baixos. Sabemos que os VE não estão a ser vendidos com lucro, pelo que formas adicionais de receita são críticas e acreditamos que a interação por voz pode desbloquear parte disso.

Há mais alguma coisa que você acha que as pessoas deveriam saber sobre IA?

Quando as pessoas imaginaram pela primeira vez um assistente de voz, eu diria que nos primeiros dias – talvez há sete a dez anos – elas viram a tecnologia e o que ela poderia potencialmente fazer na prática. Eles ficaram felizes com isso, mas a imaginação deles também era muito mais poderosa. Os filmes de ficção científica introduziam conceitos como Jarvis para o Homem de Ferro. Sempre houve essa lacuna entre o que as pessoas desejavam que ela pudesse fazer e o que ela fazia.

Acho que os avanços estão chegando tão rapidamente que a ideia de que você poderia ter um assistente que possa falar com você e esteja ao seu lado está mais ao seu alcance do que nunca.

Estamos prestes a perceber que as pessoas podem realmente falar com seu assistente de voz em vez de apenas comandá-lo. Acho que uma vez que as pessoas tenham esse comportamento, elas nunca mais voltarão. Depois de desbloquear valor com IA, ele se torna parte do que você faz e de como interage. A ideia é que estamos realmente em condições de abraçar verdadeiramente esse assistente de voz conversacional.

Retirado de Apenas carro

Isenção de responsabilidade: as informações estabelecidas acima são fornecidas por just-auto.com independentemente do Alibaba.com. Alibaba.com não faz nenhuma representação e garantia quanto à qualidade e confiabilidade do vendedor e dos produtos.

Esse artigo foi útil?

Sobre o autor

Deixe um comentário

O seu endereço de e-mail não será publicado. Os campos obrigatórios são marcados com *

Voltar ao Topo