Contents

UG Labs arrecada US$ 7 milhões para infundir IA de conversação em jogos infantis

UG Labs arrecadou US$ 7 milhões em financiamento para infundir IA conversacional e interatividade de voz em jogos infantis.

O UG Labs, com sede em Tel Aviv, Israel, lançou a rodada liderada pela MoreVC, com a participação dos VCs de tecnologia profunda Amiti Venture e Mediatek, juntamente com anjos privados.

UG Labs desenvolveu uma metodologia inovadora para desenvolvimento de jogos que engloba interação baseada em voz e inteligência artificial através da utilização de algoritmos e fontes de informação exclusivas.

A tecnologia de ponta integrada ao motor de jogo do UG facilita diálogos irrestritos que influenciam espontaneamente a progressão do jogo, resultando em interações não ensaiadas com personagens não-jogadores. Esta abordagem inovadora atende principalmente às preferências do nosso público mais jovem, garantindo um encontro de jogo excepcional e cativante que promove simultaneamente o envolvimento familiar a um nível profundo.

A inovação fundamental do UG Labs está centrada na integração de sistemas de reconhecimento automático de fala (ASR) e modelos avançados de grandes linguagens (LLMs), permitindo uma comunicação perfeita entre usuários e aplicativos alimentados por IA.

Numa conversa recente com a GamesBeat, o nosso CEO, Ariel Leventhal, destacou o aspecto inovador da nossa tecnologia de reconhecimento de voz, que se adapta aos padrões de fala individuais ao longo do tempo, melhorando, em última análise, as suas capacidades de compreensão. Ele enfatizou que achamos esse avanço particularmente intrigante quando aplicado a discussões relativas às crianças.

A proficiência linguística das crianças ainda não está totalmente desenvolvida, uma vez que os seus padrões de fala ainda estão num estado de mudança e o seu domínio da linguagem ainda não é o ideal.

Através da personalização do paradigma do consentimento espiritual, podemos alcançar uma maior compreensão das crianças. Essencialmente, isto representa um ato de inclusão para com as crianças com acesso limitado a sistemas de reconhecimento de fala, resultando numa melhor compreensão para aquelas que anteriormente eram incompreendidas.

A organização reconhece palavrões, linguagem discriminatória e comentários depreciativos para determinados grupos de pessoas, com o objetivo de garantir que as conversas sejam conduzidas num ambiente livre de conteúdos nocivos ou materiais ofensivos, a que se referem como “segurança narrativa”.

Origens

/pt/images/ug-labs-raises-7m-to-infuse-conversational-ai-into-games-for-kids.jpg

O CEO da Ug Labs, Ariel Leventhal, é retratado ao lado do Diretor de Tecnologia da empresa, Shachar Mendelowitz.

Fundada em 2022 pelo CEO Ariel Leventhal e pelo CTO Shachar Mendelowitz, a UG Labs é uma empresa inovadora focada em incorporar diálogos espontâneos e adequados à idade e personalidades distintas em jogos, com ênfase particular em títulos projetados para crianças.

A experiência profissional de Leventhal inclui atuar como ex-gerente geral e vice-presidente de pesquisa e desenvolvimento da K Health. Antes de sua gestão na K Health, ele ocupou o cargo de Chefe de Pesquisa e Desenvolvimento na Fraud Sciences, onde liderou o desenvolvimento de seu sistema de inteligência artificial, que levou à sua aquisição pelo PayPal em um negócio avaliado em US$ 169 milhões.

Mendelowitz tem um histórico impressionante como cofundador e líder em várias empresas de alta tecnologia, como Healthy.io Digital Healthcare e TowerSec Automotive Cybersecurity, que mais tarde foram adquiridas por empresas proeminentes como a Samsung. Antes desses empreendimentos, ele atuou como engenheiro sênior na equipe pioneira da SpaceIL, contribuindo para sua participação bem-sucedida na prestigiada competição Google Lunar X-Prize.

Leventhal expressou seu entusiasmo pelos avanços na inteligência artificial durante uma entrevista recente à GamesBeat. No início de 2023, ele observou a tendência emergente da IA ​​conversacional e notou o seu impacto potencial em vários campos. Além disso, ele destacou o rápido progresso feito na tecnologia de reconhecimento de fala, citando inovações de empresas notáveis ​​como Facebook e Google que despertaram seu interesse.

Leventhal observou que embora estes assistentes virtuais sejam competentes nas suas respetivas tarefas, falta-lhes a capacidade de melhorar e evoluir através da interação com os utilizadores. Ele enfatizou que, embora possam compreender os comandos com precisão, não têm a capacidade de adaptar e melhorar as suas capacidades de comunicação com base nas preferências individuais do utilizador e nas nuances linguísticas.

Elinor Schops foi recrutada pela organização um ano antes de seu cargo atual, principalmente devido ao seu interesse pela tecnologia inovadora que tinha o potencial de revolucionar a indústria de jogos para jovens.

A integração do nosso kit de desenvolvimento de software (SDK) em videogames tem sido altamente benéfica”, observou Schops. “Isso não apenas aumenta o envolvimento das crianças, mas também melhora a sua retenção à medida que elas investem mais na exploração das diversas possibilidades apresentadas no jogo. Além disso, cada sessão oferece experiências únicas e as conversas levam a novos locais dentro do jogo, proporcionando uma gama ilimitada de habilidades para os usuários descobrirem. “Schops continuou: “Além disso, ao conversar com os editores de jogos, observamos seu entusiasmo em incorporar nossa tecnologia. em seus produtos. Parece que as aplicações potenciais do nosso SDK neste contexto são ilimitadas.

A corporação é composta por uma força de trabalho de vinte pessoas e acumulou um total de US$ 23 milhões em financiamento até o momento.

Como funciona

/pt/images/ug-labs-raises-7m-to-infuse-conversational-ai-into-games-for-kids-1.jpg

A UG Labs está atualmente envolvida no desenvolvimento de modelos de linguagem alimentados por inteligência artificial (LLMs) projetados especificamente para uso em jogos educativos infantis, bem como tecnologia de reconhecimento de fala (ASR) que pode interpretar com precisão a entrada falada de jovens jogadores.

Os modelos de reconhecimento de fala avançado (ASR) e modelo de linguagem grande (LLM) foram treinados usando dados coletados pela Gramática Entendida (UG), permitindo que o sistema compreenda indivíduos com diversas proficiências em alfabetização, dialetos e dificuldades de comunicação. Especificamente, os modelos ASR servem como estrutura de suporte para trocas conversacionais, oferecendo orientação aos usuários em intervalos pré-determinados, preservando o conteúdo único de cada interação por meio de referência a interações anteriores.

A incorporação da interação por voz e da adaptabilidade em nosso sistema aumenta significativamente o envolvimento e a persistência do usuário, tornando cada encontro único e ao mesmo tempo posicionando o participante no centro da experiência. Nosso conteúdo é personalizado para corresponder à proficiência linguística, maturidade, léxico e preferências do indivíduo. Além disso, esta tecnologia fundamental também pode ser perfeitamente assimilada em brinquedos interconectados, infundindo-lhes vivacidade e personalidade, imbuindo assim conjuntos de jogos, bonecos e andróides com uma sensação de vitalidade e caráter.

O advento de novos avanços na inteligência artificial relativos à conversação nos levou a compreender que este fenômeno não se limita apenas ao reconhecimento de fala. Em vez disso, abrange uma série de dimensões que incluem, mas não se limitam à maneira como as crianças conversam, interagem, percebem e articulam os seus pensamentos. Consequentemente, o nosso foco mudou da concepção de um sistema de reconhecimento de fala personalizado, voltado especificamente para jovens, para a adoção de uma abordagem mais holística destinada a promover a interatividade completa entre eles.

Ele prosseguiu afirmando: “Consequentemente, o nosso foco mudou para o desenvolvimento de um sistema de segurança robusto, uma plataforma de diálogo interactiva e um modelo de linguagem avançado que não só melhore a nossa compreensão das crianças, mas também nos dote da capacidade de comunicar eficazmente com elas.

Avançando nas conversas do jogo por meio da segurança

/pt/images/ug-labs-raises-7m-to-infuse-conversational-ai-into-games-for-kids-2.jpg

UG Labs: um novo paradigma de design de jogos

Um dos formidáveis ​​​​obstáculos para a realização da interatividade vocal reside no domínio da eficácia conversacional, da fidelidade acústica relativa aos mecanismos de reconhecimento de fala e da capacidade de articulação verbal coerente por meio de vozes sintéticas.

O UG Labs enfrenta os obstáculos acima mencionados através da integração de soluções de base tecnológica, promovendo um ambiente caracterizado pela segurança e apelo cativante para os utilizadores finais. Por outro lado, o curso do jogo ocorre de acordo com parâmetros de segurança predeterminados estabelecidos pelo desenvolvedor do jogo, garantindo uma progressão apartidária que não é planejada nem influenciada pelo usuário ou pelo sistema de jogo.

Nossa tecnologia de Reconhecimento Automático de Fala (ASR) possui recursos avançados que vão além da simples compreensão da fala das crianças; pode facilitar o progresso através de vários níveis de jogo, mantendo o contexto das conversas anteriores, fornecendo respostas genuínas adaptadas ao histórico de entrada de cada usuário individual.

A integração de interações vocais na base das experiências de jogo transforma o jogo tradicional baseado em toque em uma experiência mais dinâmica e interativa. A tecnologia Universal Gaming (UG) tem potencial para permear vários gêneros de jogos; no entanto, estabelecerá uma classe inteiramente nova de jogos para celular que priorizam a comunicação verbal como modo principal de jogo. Uma solução de fala flexível e abrangente permite uma vasta gama de possibilidades tanto para usuários pré-alfabetizados quanto para usuários em fase inicial de alfabetização.

O principal obstáculo à interatividade por voz sempre foi a qualidade da conversa, o reconhecimento de fala e a geração de voz. De vozes desajeitadas a experiências inseguras e motores que não entenderam o que você disse. Ao combinar soluções de última geração em todas essas frentes, a UG finalmente consegue para quebrar essa barreira.

Os parâmetros para o discurso neste ambiente de jogo foram estabelecidos para garantir um ambiente seguro e controlado no qual o diálogo improvisado possa ocorrer entre os jogadores e o motor do jogo, aderindo às diretrizes estabelecidas pelo editor do jogo, descrevendo a conduta apropriada e as ações proibidas.

A tecnologia central da UG para a criação de designs avançados de conversação depende de um sistema proprietário de Reconhecimento Automático de Fala (ASR), que foi treinado usando dados coletados exclusivamente pela UG, a fim de melhorar seu desempenho geral e torná-lo adequado para aplicações práticas. Ressalta-se que crianças pequenas tendem a apresentar maiores desafios na tentativa de compreensão da fala devido a fatores como vocabulário limitado e dificuldade de articular determinados sons ou palavras.

Utilizando os modelos de Reconhecimento de Fala Artificial (ASR) treinados pela Gramática Universal (UG), o sistema é capaz de compreender as nuances da comunicação exibidas por indivíduos de diversas faixas etárias, inclusive crianças. Ao compensar factores como a proficiência limitada em literacia, dificuldades de pronúncia, dialectos regionais ou outros desafios articulatórios, esta tecnologia avançada capacita a UG a manter um diálogo interactivo a um nível que se adapta ao estilo de comunicação único de cada indivíduo.

O sistema de IA empregado no diálogo do personagem virtual utiliza técnicas de andaimes que imitam a interação humana, reafirmando perguntas ou avisos quando necessário, permitindo que o avatar infantil mantenha o fluxo de comunicação. Esse processo ocorre em pontos pré-determinados da conversa quando o usuário passa por dificuldades, permitindo uma troca mais natural sem interferir na experiência. Além disso, o uso de andaimes garante espontaneidade e genuinidade nas interações, pois o interlocutor responde com base nas declarações anteriores do usuário. Além disso, esta técnica permite a navegação por diferentes estágios do jogo, com o diálogo tendo a capacidade de relembrar respostas passadas para continuidade.

Kids Labs da UG e iterações contínuas

/pt/images/ug-labs-raises-7m-to-infuse-conversational-ai-into-games-for-kids-3.jpg

Soluções anônimas do UG Labs.

Em 2022, a UG introduziu o Kids Labs nos Estados Unidos como uma plataforma para experimentar interfaces interativas guiadas por voz destinadas a crianças. Este esforço forneceu dados valiosos que contribuíram para melhorias e refinamentos iterativos da nossa tecnologia de Reconhecimento Automático de Fala (ASR). O feedback do usuário é considerado fundamental pela UG quando se trata de aprimorar esses modelos para garantir que paradigmas de comunicação mais eficazes sejam alcançados.

A estratégia de desenvolvimento contínuo da UG envolve a utilização de interações do usuário para melhorar o desempenho do modelo por meio de melhorias iterativas. Esta abordagem exige que todos os modelos sejam expostos a utilizadores finais genuínos, a fim de refinar as suas capacidades através de processos de formação e otimização.

O UG Labs reconhece os padrões únicos de comunicação das crianças e entende que os jovens muitas vezes possuem a capacidade de modificar seus pensamentos com fluidez durante uma conversa. Para acomodar isso, nossa equipe estabeleceu um grupo dedicado de pesquisa de experiência do usuário nos Estados Unidos para colaborar estreitamente com as famílias e orientá-las sobre os meios mais eficazes de utilização de nossas tecnologias inovadoras, garantindo ao mesmo tempo privacidade e segurança durante todo o processo de treinamento.

A organização não reteve as informações relativas aos menores, mas utilizou-as para gerar modelos mais avançados e refinados através de um processo contínuo de aprimoramento.

Leventhal destacou que sua incursão inicial em conversas baseadas em IA envolveu uma abordagem abrangente que abrange a compreensão, a fala e a geração de conteúdo textual e visual. Isso abriu caminho para o aproveitamento dessa tecnologia avançada em jogos e brinquedos, conforme sua declaração.

Ao aproveitar a nossa capacidade de compreender o desenvolvimento cognitivo das crianças e ajustar o nosso estilo de comunicação em conformidade, podemos estabelecer ligações significativas com elas e adaptar o conteúdo especificamente às suas necessidades e preferências únicas, conforme articulado pelo Sr.

Leventhal propõe utilizar a tecnologia não apenas para benefício pessoal, mas também com a intenção de auxiliar os desenvolvedores de jogos na criação de brinquedos inovadores e interativos para as gerações futuras.

Funciona com pessoas que têm o inglês como segunda língua e com aquelas cujas vozes são menos claras. A empresa está trabalhando com um regulador kidSAFE (sob a Comissão Federal de Comércio) para que a empresa possa estar em conformidade com a COPPA, a lei dos EUA que protege crianças nas comunicações online, disse Mendelowitz.

Playgrounds e personalização de modelos de linguagem

O UG Labs introduziu o Language Model Playgrounds (LLM), que serve como um ambiente seguro para crianças, filtrando efetivamente conteúdos e condutas inadequadas. Esta tecnologia inovadora permite-nos imbuir a nossa inteligência artificial com características distintas, como temperamento, atributos, inflexão vocal, ritmo e nível de suporte, tudo adaptado à idade e às capacidades de compreensão do indivíduo.

A utilização de playgrounds LLM na plataforma da Universal Grammar fornece uma experiência de usuário aprimorada e personalizada, ao mesmo tempo que elimina a dependência de recursos externos de inteligência artificial. Esta abordagem promove escalabilidade, oferece melhores acordos de nível de serviço e reduz despesas, promovendo assim a autonomia da empresa no domínio da tecnologia de IA.

Personagens baseados em LLM têm suas personalidades e padrões de fala controlados pelo UG Labs por meio da utilização do modelo de linguagem. Isso permite que eles tenham uma compreensão de certos aspectos do ambiente de jogo.

Mendelowitz articulou que estabelecemos e determinamos todos os parâmetros e restrições que servem como limites para um determinado sistema ou processo, de acordo com a sua afirmação.

A UG apresentou uma comparação entre um modelo externo de linguagem ampla (LLM), projetado para atender a um público amplo com idade mínima de treze anos, e seu próprio LLM interno, adaptado para acomodar indivíduos de todas as idades.

Nosso objetivo era transformar o papel de nossos filhos, de consumidores passivos de conteúdo em líderes e navegadores ativos, criando uma plataforma interativa com uma interface de conversação que lhes permite explorar caminhos improvisados, mantendo a segurança. Esta abordagem inovadora altera a sua ligação com a experiência digital.

Evitando problemas de direitos autorais

Na nossa organização, há uma ênfase significativa em evitar a utilização de conteúdo de propriedade intelectual (PI) e conteúdo de marca, a fim de evitar qualquer dano potencial à propriedade intelectual de outras empresas, independentemente do seu tamanho. Para garantir a conformidade com esta política, é essencial criarmos conteúdo original através dos nossos próprios processos, em vez de dependermos do trabalho de terceiros. Esta abordagem permite-nos manter a integridade do nosso conteúdo, respeitando ao mesmo tempo os direitos dos outros.

Mendelowitz reconhece que existem outras empresas no mercado disputando as mesmas oportunidades, mas a UG Labs colaborou com o programa Inception da Nvidia voltado para startups de IA. Esta parceria visa desenvolver soluções inovadoras em brinquedos e jogos educativos. No entanto, há menos concorrentes que se concentram especificamente no desenvolvimento de modelos linguísticos em larga escala e de tecnologias avançadas de reconhecimento de fala concebidas para crianças pequenas. Reconhecer e interpretar a fala de menores apresenta desafios únicos, necessitando de um maior nível de dedicação e conhecimento.

À partida, priorizamos a mobilidade. Nosso público-alvo abrange um grupo diversificado de indivíduos. A base da nossa plataforma assenta na geração de dados exclusivos através de modelos linguísticos avançados, que se desviam significativamente dos quadros linguísticos convencionais.

*️⃣ Link da fonte: