엔터프라이즈 데이터베이스에 AI를 도입하는 오픈 소스 SuperDuperDB
귀사의 브랜드 인지도를 높이기 위해 AI 임팩트 투어를 후원하고 웹사이트를 방문하여 이용 가능한 기회를 살펴보는 데 관심이 있으신가요?
샌프란시스코 기반 SuperDuperDB 팀이 AI 앱을 빌드하고 배포하는 방법을 간소화하기 위해 노력하는 인텔 이그나이트 포트폴리오 회사로, 오늘 오픈 소스 프레임워크 버전 0.1을 출시했습니다.
이 프레임워크는 Python 모듈로 활용할 수 있으며, 사용자는 현재 데이터베이스 인프라 내에서 벡터 기반 검색 기능과 함께 머신 러닝 알고리즘 및 선호도에 맞는 AI API와 같은 인공 지능 구성 요소를 통합할 수 있습니다. 이를 통해 개발자는 기존 데이터베이스 위에 아무런 장애 없이 고급 AI 솔루션을 구축할 수 있습니다.
이 플랫폼의 현재 기능은 잘 알려진 다양한 인공지능 모델과 데이터베이스를 포함하며, 데이터 생태계 내 혁신을 전문으로 육성하는 Hetz.vc, Session.vc, MongoDB의 벤처 캐피탈 사업부와 같은 유명 투자회사의 지지를 받고 있습니다.
SuperDuperDB의 지지는 회사의 선구자적 정신과 기술이 지닌 무한한 가능성을 상징하는 상징과도 같습니다. 데이터 스토리지 플랫폼과 인공지능을 연결하여 데이터와 인공지능의 원활한 통합을 통해 조직을 위한 인공지능 솔루션의 생성 및 관리를 용이하게 함으로써, 이 두 요소가 조화로운 파트너십의 필수 요소인 소프트웨어 엔지니어링의 새로운 패러다임을 촉진하는 것이 슈퍼데이터의 목표입니다. 슈퍼듀퍼DB의 선구적인 CEO인 티모 하겐노우(Timo Hagenow)는 이 뜻깊은 날을 기념하는 연설에서 이러한 소감을 밝혔습니다.
프레임워크는 오늘부터 제품 헌트 에서 사용할 수 있습니다.
SuperDuperDB로 AI 문제 해결
인공지능은 현대 기업 운영의 필수적인 부분이 되었지만, 고급 머신러닝 알고리즘과 독점 데이터 세트의 잠재력을 최대한 활용하여 전략적 이점을 제공하는 소프트웨어를 개발하는 데는 수많은 과제가 있습니다.
실제로 다양한 머신러닝 모델과 애플리케이션 프로그래밍 인터페이스(API)에 액세스할 수 있음에도 불구하고 개발자가 이러한 기술을 실제 환경에 배포하려면 여전히 상당한 리소스를 투자해야 합니다. 이를 위해서는 기본 데이터베이스 시스템에서 정보를 검색하고 일련의 섬세하고 취약한 파이프라인을 통해 특수 벡터 데이터베이스로 전송하는 복잡한 프로세스를 포함하는 ‘머신 러닝 운영’(MLOps) 및 ‘개발’ 영역의 도구를 활용해야 합니다.이러한 노력에는 상당한 시간이 필요하며 때로는 프로젝트의 적시 시작을 방해할 수 있습니다.
알고리즘 프로세스를 컴퓨팅 리소스에 배포하는 것을 단순화하거나 복잡한 파이프라인 네트워크를 통해 이러한 알고리즘을 데이터와 얽어매는데, 이는 MLOps의 포괄적인 용어에 해당합니다. 이 인사이트는 하겐나우가 저희 플랫폼과의 인터뷰에서 공유한 내용입니다.
조직 내 여러 팀에서 사용하는 다양한 알고리즘 솔루션의 통합을 용이하게 하는 동시에 수집된 데이터에 상당한 가치를 부여하기 위해 Hagenow 박사와 그의 동료들은 일반적으로 이러한 시스템을 외부에서 구현하는 기존 방식과 달리 핵심 데이터베이스 계층에서 인공 지능 모델을 배포할 수 있는 새로운 플랫폼인 SuperDuperDB를 개발했습니다. 이 혁신적인 아키텍처는 대규모 머신 러닝 작업을 위한 확장성과 함께 실시간 처리 기능을 촉진하여 데이터 과학자와 도메인 전문가 모두에게 원활한 접근성을 제공합니다.
SuperDuperDB의 설치 프로세스는 오픈 소스 Python 패키지를 통해 얻을 수 있으므로 간단합니다. 이를 통해 개발자는 모든 범위의 AI 모델과 API를 수용하는 확장 가능한 단독 플랫폼을 구축하여 데이터베이스와 직접 통신할 수 있습니다. 그 결과, 탁월한 AI 개발 및 배포 에코시스템이 구축됩니다. 이 환경은 실험적인 환경에서 하나의 개별 디바이스만으로 독립적으로 활용할 수도 있고, 최고 수준의 오픈 소스 배포 도구를 사용하여 클라우드 또는 온사이트에서 확장 가능한 컴퓨팅 리소스를 통해 구현할 수도 있습니다. 이렇게 함으로써 개발자와 관리자는 전체 프로세스에 걸쳐 알고리즘, 정보, 컴퓨팅 리소스, 인프라를 완벽하게 감독할 수 있다고 Hagenow는 설명합니다.
개발자는 이 솔루션을 활용하여 분류, 회귀, 추천 시스템과 같은 작업에 일반적으로 사용되는 머신러닝 모델과 LLM 기반 대화형 인터페이스 및 벡터 검색을 지원하는 최첨단 생성 AI 모델을 포함한 광범위한 머신러닝 모델에 액세스할 수 있습니다. 또한 고유한 사용 사례를 위해 특별히 설계된 고도로 맞춤화된 모델을 지원합니다. 벡터 검색의 경우, 이 플랫폼은 공급업체가 제공하는 데이터베이스 내 벡터 기능과 자체적인 강력한 벡터 인덱싱 기능을 모두 활용할 수 있습니다.
초강력 파트너 에코시스템
업계 생태계의 저명한 구성원들로부터 상당한 관심과 지지를 받고 있는 혁신적인 제품으로, 기업에서 사용하는 다양한 데이터베이스 플랫폼과 모델링 기법에 맞는 강력한 인프라 솔루션을 제공합니다.
이 플랫폼은 MongoDB, PostgreSQL, MySQL, SQLite, DuckDB, Snowflake, BigQuery, ClickHouse, DataFusion, Druid, Impala, MSSQL, Oracle, pandas, Polars, PySpark, Trino 및 S3를 포함한 광범위한 데이터베이스를 지원합니다. 이 외에도 Python AI 에코시스템에서 볼 수 있는 다양한 머신 러닝 프레임워크, PyTorch, Sklearn, Hugging Face와 같은 다양한 머신 러닝 프레임워크 및 OpenAI, Anthrophic, Cohere와 같은 회사의 인기 있는 AI API 제품과의 호환성을 제공합니다.
최고 경영자가 최근 대화에서 밝힌 바와 같이, 몽고DB는 공식적으로 저희 회사를 기술 파트너 중 하나로 지정했습니다. 그 결과, 우리는 Cisco와 같은 존경받는 고객과 협력하여 여러 차례 웨비나 및 라이브 코딩 데모를 진행했습니다. 또한 현재 인텔 및 기타 여러 주제별 전문가(중소기업)와 함께 다양한 개념 증명 프로젝트를 검토하고 있습니다. 그러나 현재로서는 이러한 노력과 관련된 구체적인 성장 지표를 공개할 수 없습니다.
슈퍼듀퍼DB의 아키텍처
이 회사의 CEO는 보다 강력한 협력 관계를 구축하기 위해 저명한 데이터베이스 제공업체와 논의를 시작하여 에코시스템을 강화하기 위해 노력하고 있다고 강조했습니다. 궁극적으로는 데이터브릭스와 스노우플레이크 같은 유명 엔터프라이즈 데이터 플랫폼과의 원활한 통합을 목표로 하고 있습니다. 실제로 이 회사는 이미 스노우플레이크 전용 애플리케이션 개발에 착수했으며, 이 애플리케이션은 스노우플레이크의 마켓플레이스를 통해 제공될 예정입니다.
애플리케이션 전반에 걸친 잠재력
이 기술이 널리 채택되면 사용자 친화적인 인터페이스와 간소화된 프로세스로 인해 다양한 산업 분야에서 AI 솔루션을 더 쉽게 개발하고 구현할 수 있습니다.
SuperDuperDB의 혁신과 MongoDB Atlas Vector Search의 통합을 통해 개발자가 인공지능에 접근할 수 있는 경로가 상당히 빨라졌습니다. 이 유리한 조합을 통해 금융 분야의 사기 식별, 물류 분야의 공급망 개선, 의료 및 생명 과학 분야의 신약 개발 등 다양한 분야의 전문가들이 고급 애플리케이션을 신속하고 손쉽게 개발 및 배포할 수 있습니다.MongoDB의 산업 솔루션 부문 최고 기술 책임자인 보리스 비알렉은 이번 개발로 개발자들이 그 어느 때보다 효과적으로 최첨단 소프트웨어를 개발할 수 있게 되었다고 말합니다.
SuperDuperDB는 다른 데이터베이스 내 AI 제품과 차별화되는 점이 있는데, MindsDB나 PostgresML과 같은 대안은 SQL 기반인 반면, SuperDuperDB는 Python을 우선으로 합니다. 이러한 차이점 덕분에 AI 연구 및 개발에 일반적으로 사용되는 프로그래밍 언어와 보다 원활하게 통합할 수 있습니다.
SuperDuperDB는 사용자에게 복잡하지 않고 일반적인 Python 인터페이스를 제공하는 동시에 전문가가 모델 가중치 및 훈련 정보를 포함하여 가능한 모든 구현 깊이에 액세스할 수 있도록 합니다. 또한 개발자는 데이터베이스 내에서 바이너리 코드로 표현할 수 있는 시각적 미디어, 사운드 파일 및 기타 데이터 형식을 처리할 수 있습니다. 이러한 탁월한 기능은 현재 시중에 나와 있는 다른 모든 AI 리소스와 차별화됩니다.