Google AI apresenta SOAR: uma melhoria algorítmica para pesquisa vetorial que introduz redundância eficaz e de baixa sobrecarga para ScaNN
A equipe de pesquisa de IA do Google desenvolveu a biblioteca de pesquisa vetorial ScaNN para atender aos requisitos de pesquisa eficiente por similaridade vetorial, que desempenha um papel crucial em vários modelos de aprendizado de máquina. Embora as técnicas existentes para calcular semelhanças vetoriais funcionem de forma eficaz em pequenos conjuntos de dados, elas lutam para serem ampliadas com conjuntos de dados cada vez maiores ou para acomodar aplicações emergentes. Para aumentar a velocidade e eficiência das buscas vetoriais, o algoritmo SOAR foi implementado como uma otimização do modelo ScaNN, visando reduzir a sobrecarga computacional sem comprometer a precisão.
A metodologia convencional do ScaNN envolve o emprego de uma técnica de agrupamento em que cada ponto de dados é afiliado a um cluster solitário de k-means. No entanto, esta estratégia encontra complicações quando o vetor de investigação exibe alto paralelismo com o resíduo, o que representa a discrepância entre um elemento e seu centróide de cluster atribuído. Tais instâncias frequentemente resultam em vizinhos mais próximos omitidos, especialmente em situações onde a compatibilidade da consulta com o centróide do cluster não reflete adequadamente sua afinidade com elementos individuais dentro do cluster. Para mitigar esta deficiência, o SOAR introduz redundância através de designações adicionais, permitindo que os pontos de dados pertençam a mais de um cluster. Além disso, ajusta a função de perda para otimizar a redundância autônoma e benéfica, garantindo que os clusters secundários
SOAR melhora a precisão da pesquisa do ScannN agrupando vetores e utilizando uma função de perda modificada para promover resíduos ortogonais. A técnica não apenas aumenta a precisão sem aumentar a computação, mas também diminui os recursos computacionais necessários para atingir um nível específico de precisão. Os resultados dos testes indicam que a incorporação do SOAR permite que o ScaNN retenha suas características de uso mínimo de memória, indexação rápida e compatibilidade com layouts de memória de hardware, ao mesmo tempo que obtém um aspecto algorítmico adicional vantajoso. Com SOAR, o ScaNN exibe velocidades de consulta substancialmente mais rápidas em comparação com outras bibliotecas que oferecem velocidades de indexação comparáveis. Consequentemente, isso o torna a seleção preferida para alcançar eficiência superior de pesquisa vetorial em várias avaliações, incluindo o conjunto de dados ann-benchmarks glove-100 e o Big-ANN
Em resumo, este artigo propõe uma abordagem inovadora para resolver a questão da busca eficiente por similaridade vetorial, integrando SOAR na biblioteca ScaNN. Através da redução da redundância e otimização do processo de correspondência, o SOAR apresenta melhorias notáveis na precisão e eficiência da pesquisa, mantendo fatores críticos como uso de memória e velocidade de indexação. Esta descoberta destaca o papel crucial que o progresso algorítmico desempenha no atendimento aos requisitos cada vez mais exigentes das tarefas de aprendizado de máquina relativas à pesquisa vetorial.
Confira o jornal e o blog. Todo o crédito desta pesquisa vai para os pesquisadores deste projeto. Além disso, não se esqueça de nos seguir no Twitter. Junte-se ao nosso canal Telegram, canal Discord e grupo LinkedIn.
Convidamos cordialmente aqueles que apreciam nossos esforços a assinarem nossa newsletter, pois é uma excelente plataforma para se manterem informados sobre nossos últimos empreendimentos e atualizações que certamente despertarão seu interesse.
Não perca a oportunidade de fazer parte de nossa extensa comunidade de mais de 40.000 membros em nosso subreddit de aprendizado de máquina.
Para parceria de conteúdo, preencha este formulário aqui.
Delicie-se com nosso boletim informativo em rápida expansão, que é subscrito com entusiasmo por pesquisadores renomados de instituições conceituadas como Google, NVIDIA, Meta, Stanford, MIT, Microsoft e muito mais.
*️⃣ Link da fonte:
Artigo , Blog. , [Preencha este formulário aqui..](https://forms. gle/8PTBRjkaeG5sxif96),