Ex-alunos de Stanford, nos EUA, estão criando aplicativo para alterar sotaques

Startup Sanas já arrecadou mais de US$ 5 milhões em uma rodada de investimentos, e busca facilitar a comunicação entre pessoas

Shawn Zhang, Maxim Serebryakov e Andrés Pérez Soderi desenvolvem o aplicativo
Shawn Zhang, Maxim Serebryakov e Andrés Pérez Soderi desenvolvem o aplicativo Andrés Pérez Soderi/Reprodução

Catherine E. Shoichetda CNN

Ouvir notícia

Três ex-alunos da Universidade de Stanford, nos Estados Unidos, perceberam a tristeza na voz de um amigo quando ele contou a notícia. “Gente, eu tive que largar meu emprego”.

Para eles, não fazia sentido. Ele era fluente em inglês e espanhol, extremamente amigável e especialista em engenharia de sistemas. Por que ele não foi capaz de manter um trabalho em um call center?

Seu sotaque, disse o amigo, tornava difícil para muitos clientes entendê-lo. Alguns até lançaram insultos por causa da maneira como ele falava. Os três alunos perceberam que o problema era ainda maior do que a experiência do amigo. Então, eles fundaram uma startup para resolver isso.

Agora a empresa, Sanas, está testando um software movido a inteligência artificial que visa eliminar falhas de comunicação alterando o sotaque das pessoas em tempo real. Um funcionário de call center nas Filipinas, por exemplo, poderia falar normalmente ao microfone e acabar soando mais como alguém do estado de Kansas para um cliente do outro lado da linha.

Os call centers, dizem os fundadores da startup, são apenas o começo. O site da empresa anuncia seus planos como “Discurso, reimaginado”.

Eventualmente, eles esperam que o aplicativo que estão desenvolvendo seja usado por uma variedade de setores e indivíduos. Poderia ajudar os médicos a entender melhor os pacientes, dizem eles, ou ajudar os netos a entender melhor seus avós.

“Temos uma visão muito grande para a Sanas”, disse o CEO Maxim Serebryakov. E para Serebryakov e seus cofundadores, o projeto é pessoal.

“As vozes das pessoas não estão sendo ouvidas tanto quanto seus sotaques”

O trio que fundou a Sanas se reuniu na Universidade de Stanford, mas originalmente eram todos de países diferentes – Serebryakov, agora o CEO, é da Rússia, Andrés Pérez Soderi, agora diretor financeiro, é da Venezuela, e Shawn Zhang, agora o diretor de tecnologia, é da China.

Eles não são mais alunos de Stanford. Serebryakov e Pérez se formaram, e Zhang largou a faculdade para se concentrar em dar vida à Sanas.

Eles lançaram a empresa no ano passado, e deram a ela um nome que pode ser facilmente pronunciado em vários idiomas “para destacar nossa missão global e desejar aproximar as pessoas”, diz Pérez.

Com o passar dos anos, os três dizem que experimentaram como os sotaques podem atrapalhar a comunicação.

“Todos nós viemos de origens internacionais. Vimos em primeira mão como as pessoas o tratam de maneira diferente apenas por causa da maneira como você fala”, disse Serebryakov. “É de partir o coração às vezes”.

Zhang diz que sua mãe, que veio da China para os Estados Unidos há mais de 20 anos, ainda o faz falar com o caixa quando vão fazer compras juntos porque ela fica envergonhada.

“Esse é um dos motivos pelos quais me juntei a Max e Andrés na construção desta empresa, tentando ajudar aquelas pessoas que pensam que suas vozes não estão sendo ouvidas tanto quanto seus sotaques”, diz ele.

Serebryakov diz que viu como seus pais são tratados em hotéis quando o visitam nos Estados Unidos – como as pessoas fazem suposições quando ouvem seu sotaque. “Eles falam um pouco mais alto. Eles mudam seu comportamento”, diz ele.

Pérez diz que, depois de frequentar uma escola britânica, no início ele teve dificuldade em entender o sotaque americano quando chegou aos Estados Unidos. Ele também cita a dificuldade do pai quando ele tenta usar o assistente de voz da Amazon, Alexa, que sua família deu a ele no Natal.

“Descobrimos rapidamente, quando Alexa estava acendendo as luzes em lugares aleatórios da casa e tornando-as rosa, que ela não entendia o sotaque do meu pai”, diz Pérez.

Call centers estão testando a tecnologia

O inglês é a língua mais usada no mundo. Cerca de 1,5 bilhão de pessoas falam – e a maioria delas não são falantes nativos. Só nos Estados Unidos, milhões de pessoas falam inglês como segunda língua.

Isso criou um mercado crescente para aplicativos que ajudam os usuários a praticar a pronúncia do inglês. Mas a Sanas está usando inteligência artificial para fazer uma abordagem diferente.

A premissa é que, em vez de aprender a pronunciar palavras de maneira diferente, a tecnologia pode fazer isso por você. Não haveria mais a necessidade de um treinamento de redução de sotaque caro ou demorado. E a compreensão seria quase instantânea.

Serebryakov diz que sabe que o sotaque e a identidade das pessoas podem estar intimamente ligados, e ele enfatiza que a empresa não está tentando apagar o sotaque ou insinuando que uma forma de falar é melhor do que outra.

“Permitimos que as pessoas não precisem mudar a maneira de falar para ocupar uma posição, para ocupar um emprego. Identidade e sotaques são essenciais. Eles estão interligados”, diz ele. “Você nunca quer que alguém mude seu sotaque apenas para satisfazer outra pessoa”.

Atualmente, o algoritmo da Sanas pode converter o inglês de e para os sotaques americano, australiano, britânico, filipino, indiano e espanhol, e a equipe está planejando adicionar mais. Eles podem adicionar um novo sotaque ao sistema treinando uma rede neural com gravações de áudio de atores profissionais e outros dados – um processo que leva várias semanas.

A equipe da Sanas fez duas demonstrações para a CNN. Em um deles, um homem com sotaque indiano é ouvido lendo uma série de frases literárias. Em seguida, essas mesmas frases são convertidas em um sotaque americano. Confira:

Outro exemplo apresenta frases que podem ser mais comuns em uma configuração de central de atendimento, como “se você me der seu nome completo e número do pedido, podemos prosseguir e começar a fazer a correção para você”.

Os resultados com sotaque americano soam um tanto artificiais e afetados, como vozes de assistente virtual como Siri e Alexa, mas Pérez diz que a equipe está trabalhando para melhorar a tecnologia.

“O sotaque muda, mas a entonação é mantida”, diz ele. “Continuamos a trabalhar para tornar o resultado o mais natural, emocionante e excitante possível.”

O feedback inicial dos call centers que estão testando a tecnologia foi positivo, diz Pérez. Eles dizem que seus planos para a empresa renderam US$ 5,5 milhões em um financiamento inicial de investidores no início deste ano.

Como os fundadores da startup veem seu futuro

O investimento permitiu que a Sanas aumentasse seu quadro de funcionários. A maioria dos funcionários da empresa, com sede em Palo Alto, Califórnia, vem de experiências internacionais. E isso não é coincidência, diz Serebryakov.

“O que estamos construindo ressoou com tantas pessoas, até mesmo as pessoas que contratamos … É realmente emocionante de ver”, diz ele. Enquanto a empresa está crescendo, ainda pode demorar um pouco até que a Sanas apareça em uma loja de aplicativos ou em um telefone celular perto de você.

A equipe diz que está trabalhando com empresas maiores de terceirização de call center por enquanto, e optando por uma implantação mais lenta para usuários individuais, para que possam refinar a tecnologia e garantir a segurança.

Mas, eventualmente, eles esperam que a Sanas seja usada por qualquer pessoa que precisar – em outras áreas também. Pérez acredita que ele desempenha um papel importante, ajudando as pessoas a se comunicarem com seus médicos.

“Qualquer segundo perdido em mal-entendidos por causa do tempo ou na mensagem errada é potencialmente muito, muito impactante”, diz ele. “Nós realmente queremos ter certeza de que não há nada perdido na tradução”.

Algum dia, diz ele, também poderá ajudar as pessoas a aprender idiomas, melhorar a dublagem em filmes e ajudar os assistentes de voz inteligentes em casas e nos carros a entenderem diferentes sotaques.

E não apenas em inglês: a equipe da Sanas também espera adicionar outros idiomas ao algoritmo. Os três cofundadores ainda estão trabalhando nos detalhes. Mas como essa tecnologia pode tornar a comunicação melhor no futuro, dizem eles, é algo fácil de entender.

Este conteúdo foi criado originalmente em inglês.

versão original

Mais Recentes da CNN