O CEO da SingleStore vê pouco futuro para bancos de dados de vetores criados especificamente

SingleStore está avançando sua plataforma de banco de dados homônima com um novo lançamento hoje que expande a funcionalidade para cargas de trabalho generativas de IA, bem como cargas de trabalho de dados transacionais e analíticos.
O recém-introduzido banco de dados SingleStore Pro Max, que representa funcionalmente uma atualização da iteração existente do SingleStore 8.5, incorpora recursos inovadores de pesquisa de vetores indexados que permitem às empresas construir e facilitar aplicações de inteligência artificial, bem como aprimorar cenários de geração aumentada de recuperação (RAG).
A implementação de atualizações de pesquisa vetorial indexada no SingleStore Pro Max representa uma progressão evolutiva para o sistema de banco de dados, que pode ser rastreada até suas origens sob o nome de MemSQL. Na verdade, a história da empresa remonta a 2017, onde inicialmente fornecia suporte para diversas formas de vetores dentro de sua estrutura de banco de dados. Posteriormente, após uma transformação da marca em 2020, a SingleStore emergiu como uma plataforma unificada que abrange capacidades OLAP e OLTP.
À medida que as cargas de trabalho da geração AI aumentaram, também aumentou a necessidade de recursos de banco de dados vetoriais, com o surgimento de plataformas de banco de dados nativas, como o Pinecone. Nos últimos meses, os fornecedores de bancos de dados existentes, incluindo DataStax, Neo4j, MongoDB, PostgreSQL e até Oracle, adicionaram suporte a vetores. A capacidade de combinar os recursos de banco de dados existentes com vetores é crítica para as organizações, de acordo com o CEO da SingleStore, que acredita que o foco restrito de apenas ter um banco de dados criado especificamente apenas para vetores não é o caminho certo a seguir.
Na SingleStore, nossa plataforma abrangente de inteligência artificial (IA) oferece uma pilha Gen AI de ponta completa com vetores inteligentes, permitindo que os desenvolvedores criem e modelem aplicativos de IA inovadores. Nossa perspectiva difere das abordagens convencionais, pois consideramos que um banco de dados somente vetorial é apenas um recurso transitório, em vez de uma solução de longa data para a construção de sistemas robustos de IA. Na verdade, a incorporação de camadas adicionais de complexidade pode prejudicar a eficácia de uma pilha Gen AI, complicando a sua arquitetura. Consequentemente, o nosso objetivo é simplificar o ecossistema de IA, reduzindo complexidades em vez de adicioná-las.
Vetores potencializam a pesquisa híbrida em dados estruturados e não estruturados
SingleStore é um banco de dados híbrido de processamento transacional e analítico (HTAP) capaz de lidar com cargas de trabalho de processamento de transações online (OLTP) e processamento analítico online (OLAP). Essa funcionalidade permite armazenar, processar e consultar vários tipos de dados de diversas maneiras.
A versão Pro Max mais recente do SingleStore oferece suporte aprimorado para pesquisas vetoriais em dados estruturados e não estruturados por meio de algoritmos avançados, como Quantização de Produto (PQ), Mundo Pequeno Navegável Hierárquico (HNSW) e Indexação de Vetor Vizinho Mais Próximo Aproximado (ANN). Embora o SingleStore tenha introduzido inicialmente recursos de pesquisa vetorial em 2017, esta versão atualizada possui algoritmos mais eficientes e precisos para aprimorar a experiência do usuário.
O aprimoramento da pesquisa de vetores de índice oferece às organizações o potencial de aproveitar toda a extensão de seus dados armazenados no SingleStore, não apenas para fins de pesquisa, mas também para apoiar aplicações de inteligência artificial.
No ponto de vista de Verma, a utilização de um sistema de base de dados que atenda exclusivamente a dados baseados em vetores, em vez de abranger vários outros formatos de dados, poderia facilitar a entrada rápida de uma empresa no domínio da inteligência artificial. No entanto, esta abordagem não tem em conta o ecossistema de dados mais abrangente que prevalece na maioria das empresas.
A aplicação superficial de construções vetoriais não consegue ocultar a natureza complexa do estado dos dados subjacentes", afirmou.
Verma elucidou a aspiração do SingleStore de funcionar como uma alternativa de banco de dados vetorial dentro de um ecossistema de dados abrangente, consolidado e simplificado, abrangendo todos os recursos de informação necessários para uma organização.
O orador enfatizou que, para que um sistema de inteligência artificial prospere, é necessária a simplificação de processos complexos e a agregação de conjuntos de dados abrangentes. Isto permite que a IA opere de forma eficiente, mantendo ao mesmo tempo a sua vantagem competitiva.
Change Data Capture integra Apache Iceberg
Nos tempos contemporâneos, é incomum que as organizações armazenem todos os seus dados em um único banco de dados.
O processo de criação de pipelines de dados frequentemente envolve a integração de várias fontes de dados e repositórios em diversas plataformas. Dentro de um ambiente de banco de dados, Change Data Capture (CDC) é uma técnica frequentemente utilizada para extrair informações de fontes de dados externas.
O SingleStore Pro Max inclui recursos aprimorados de captura de dados alterados para integrar dados de bancos de dados MySQL e MongoDB, bem como data lakes baseados em Apache Iceberg em um único banco de dados.
Apache Iceberg, um formato de tabela de data lake de código aberto utilizado por empresas proeminentes como IBM e Snowflake, recebeu endosso significativo da Verma. Ele enfatiza que a SingleStore mantém um compromisso robusto com colaborações com a IBM e a Snowflake, e a incorporação do suporte Iceberg facilitará significativamente a integração perfeita entre sistemas.
Os recursos do CDC permitem que nossos clientes aproveitem o poder de integração de dados de múltiplas fontes em um repositório centralizado conhecido como SingleStore, que desempenha um papel indispensável na facilitação da recuperação de informações e fluxos de trabalho de geração aumentados, de acordo com a declaração de Verma.
*️⃣ Link da fonte:
SingleStore , DataStax , Oracle , Apache Iceberg ,