Activeloop arrecada US$ 11 milhões para oferecer às empresas uma maneira melhor de aproveitar dados multimodais para IA
Activeloop, com sede na Califórnia, uma startup que oferece um banco de dados dedicado para agilizar projetos de IA, anunciou hoje que levantou US$ 11 milhões em financiamento da série A da Streamlined Ventures, Y Combinator, Samsung Next (o braço de aceleração de startups do Grupo Samsung) e vários outros investidores.
A Activeloop, fundada pelo ex-aluno de Princeton, Davit Buniatyan, se destacou no cenário competitivo das plataformas de dados ao desenvolver uma solução inovadora que visa abordar uma das preocupações mais prementes enfrentadas pelas organizações hoje-utilizar efetivamente dados não estruturados e multimodais para treinar modelos de IA. Diz-se que esta tecnologia de ponta, conhecida como “Deep Lake”, permite às equipas desenvolver aplicações de IA a um custo significativamente reduzido, estimado em até 75% menos em comparação com as alternativas de mercado existentes, ao mesmo tempo que aumenta os seus níveis de produtividade em até 75%. para um fator de cinco.
À medida que um número crescente de empresas procura aproveitar os seus intrincados conjuntos de dados para aplicações de inteligência artificial adaptadas a vários fins, é digno de nota que a IA generativa tem o potencial de gerar ganhos financeiros substanciais, totalizando entre 2,6 biliões de dólares e 4,4 biliões de dólares em lucros corporativos anuais a nível global. , de acordo com um estudo realizado pela McKinsey & Company. Esta tecnologia transformadora pode influenciar significativamente vários domínios, tais como facilitar as interações de atendimento ao cliente, criar materiais promocionais inovadores através de meios automatizados e redigir código de software em resposta a comandos verbais.
Em que o Activeloop Deep Lake ajuda?
O treinamento de modelos de IA de alto desempenho exige o manuseio de grandes quantidades de dados não estruturados em várias modalidades, como texto, áudio e vídeo em escala de petabytes. Esse processo normalmente envolve a localização de conjuntos de dados pertinentes dispersos em repositórios desordenados e seu emprego consistente por meio do uso de diversos mecanismos de armazenamento e recuperação. Tais esforços exigem um trabalho substancial de programação e integração por parte do pessoal de engenharia, o que por sua vez aumenta as despesas globais do empreendimento.
Activeloop procura corrigir o tratamento díspar de dados complexos, promovendo um padrão uniforme através da implementação do Deep Lake. Esta solução inovadora permite o armazenamento de conteúdo multimídia, incluindo imagens, vídeos e anotações, em seu formato matemático nativo como tensores em sistemas de aprendizado de máquina, ao mesmo tempo em que permite o streaming contínuo desses tensores para várias plataformas, como Tensor Query Language, semelhante a SQL, mecanismos de visualização no navegador ou estruturas populares de aprendizado profundo, como PyTorch e TensorFlow.
Esta plataforma abrangente fornece aos desenvolvedores uma solução abrangente para gerenciar vários aspectos de seu trabalho, incluindo o processamento e recuperação de informações multimodais, monitorando e contrastando suas iterações em evolução e utilizando-as como entrada para algoritmos de aprendizado de máquina adaptados a aplicações específicas.

Procurando elefantes com Activeloop Deep Lake
Buniatyan destaca em sua discussão com esta plataforma que Deep Lake fornece os recursos padrão encontrados em data lakes tradicionais, como a integração de diversas fontes de dados em várias modalidades, ao mesmo tempo que se distingue por sua capacidade de transformar esses conjuntos de dados na representação tensorial comumente utilizada pelo aprendizado profundo. modelos para processamento de entrada.
Os tensores são gerenciados de forma eficiente, sendo armazenados em plataformas de armazenamento de objetos baseadas em nuvem, como o S3 da Amazon Web Services, ou localmente. Posteriormente, são transmitidos suavemente da nuvem para Unidades de Processamento Gráfico (GPUs), onde passam por treinamento sem nenhum desperdício de recursos computacionais. Por outro lado, as técnicas anteriores exigiam a cópia de dados em lotes, levando a períodos prolongados de inatividade da GPU.
aqueles disponíveis como soluções de código aberto e aqueles reservados para uso proprietário.
O componente de código aberto incorpora vários elementos, como formatação de conjunto de dados, mecanismos de controle de versão e inúmeras interfaces de programação de aplicativos (APIs) que facilitam tarefas como streaming e consulta. Em contraste, a seção proprietária inclui utilitários de visualização de alta qualidade, sistemas eficientes de recuperação de conhecimento e um mecanismo de streaming excepcionalmente rápido, que contribuem para elevar a usabilidade e o desempenho de sua oferta no mercado.
Embora o número específico de clientes ativados no Activeloop não tenha sido divulgado pelo nosso CEO, pode-se notar que esta plataforma de código aberto alcançou mais de um milhão de downloads até o momento, aumentando significativamente a proeminência da nossa empresa no mercado empresarial. Atualmente, nossa solução focada em empresas opera sob uma estrutura de preços de pagamento conforme o uso e é utilizada por diversas empresas da Fortune 500, abrangendo vários setores fortemente regulamentados, como biofarmacêutico, ciências biológicas, tecnologia médica, fabricação automotiva e serviços jurídicos.
Um cliente, a Bayer Radiology, usou o Deep Lake para unificar diferentes modalidades de dados em uma única solução de armazenamento, simplificando o tempo de pré-processamento de dados e possibilitando um novo recurso de “bate-papo com raios X”, permitindo que os cientistas de dados consultem varreduras em linguagem natural.
A funcionalidade inovadora de recuperação de conhecimento do Activeloop foi projetada para permitir que profissionais de dados desenvolvam soluções eficazes com custos reduzidos de até 75%, em comparação com outras opções disponíveis no setor. Além disso, esta tecnologia de ponta aumenta a precisão da recuperação de informação, o que tem particular relevância para os diversos setores atendidos pelo Activeloop.
Planeje crescer
Através da atual infusão de capital, a Activeloop pretende expandir as suas capacidades empresariais e, ao mesmo tempo, atrair um maior número de clientes para a sua plataforma de base de dados orientada por IA. Isso permitirá que esses usuários gerenciem com eficácia informações não estruturadas complexas e acessem facilmente insights valiosos.
A organização pretende utilizar o capital para ampliar sua força de trabalho técnica, visando aumentar a capacidade operacional e a eficiência.
Um avanço importante em nosso pipeline está próximo com o lançamento do Deep Lake versão 4, que apresenta maior simultaneidade para operações de entrada-saída, tornando-o a ferramenta mais eficiente para treinar conjuntos de dados de modelos por meio de seus recursos de streaming rápido, juntamente com um sistema abrangente para manter rastreabilidade completa de todos os dados utilizados durante todo o processo e integração perfeita com fontes externas. De acordo com Buniatyan, embora existam inúmeras organizações nesta indústria, não existe concorrência direta no nosso segmento de mercado.
Em essência, a sua ambição é permitir que as organizações evitem incorrer em despesas substanciais em sistemas internos personalizados para gestão e recuperação de informação, ao mesmo tempo que libertam os profissionais de engenharia da necessidade de executar tarefas manuais laboriosas e programação tediosa, aumentando assim a sua eficiência.
*️⃣ Link da fonte: