Contents

데이터브릭스, 미스트랄에 투자하고 데이터 인텔리전스 플랫폼에 AI 모델 도입

/images/databricks-invests-in-mistral-and-brings-its-ai-models-to-data-intelligence-platform.jpg

오늘, 알리 고드시가 이끄는 빠르게 성장하는 데이터 인프라 기업 데이터브릭스 가 파리에 본사를 둔 미스트랄 고성능 대규모 언어 모델(LLM) 제품군으로 글로벌 AI 커뮤니티에 큰 파장을 일으키고 있는 자금력이 풍부한 스타트업인 Mistral과의 제휴를 발표했습니다.

데이터브릭스는 시리즈 A 펀딩 라운드의 일환으로 미스트랄에 미공개 재정 지원을 약속하는 한편, 자사의 데이터 인텔리전스 플랫폼에 미스트랄의 일부 언어 모델(LLM)을 통합했습니다.

향후 조정은 이러한 모델을 원활하게 통합하여 기업 사용자가 인공지능 생성 목적으로 자신의 정보와 함께 손쉽게 활용할 수 있도록 지원하는 한편, 데이터브릭스 플랫폼에서 제공하는 기존의 안전 조치, 기밀 유지 기준 및 규제 감독을 변경하지 않고 유지할 수 있도록 할 것입니다.

이번 개발로 업계 파트너십을 통해 공격적인 행보를 이어가고 있는 미스트랄에 또 하나의 주목할 만한 유통 파트너가 추가되었습니다. 얼마 전에는 데이터 클라우드 서비스를 통해 데이터브릭스와 직접 경쟁하는 스노우플레이크와 비슷한 파트너십을 발표했으며, 후자는 기업 탈취에 대한 비판과 규제 당국의 관심을 촉발한 마이크로소프트 .

기본 통합할 모델 선택

오늘 게시된 블로그 게시물 에서 데이터브릭스는 미스트랄과의 파트너십을 통해 오픈 소스인 미스트랄 7B와 믹스트랄 8x7B의 두 텍스트 생성 모델을 기본 통합할 예정이라고 확인했습니다.

첫 번째 고려 중인 모델은 비교적 컴팩트한 70억 개의 파라미터로 구성된 Transformer 아키텍처로, 8k 컨텍스트 길이를 사용하여 광범위하게 학습되었습니다. 이 모델은 콘텐츠 제공 측면에서 매우 효율적인 것으로 알려져 있습니다. 반대로 두 번째 대안은 영어, 프랑스어, 이탈리아어, 독일어, 스페인어와 같은 언어를 능숙하게 수용하는 전문가 모델의 희소 혼합(SMoE)을 구성합니다. 이 방식은 32k 컨텍스트 길이를 지원하여 GSM-8K 및 MMLU 벤치마크를 포함한 다양한 성능 평가에서 경쟁사보다 월등히 뛰어납니다. 또한 메타의 라마 2 70B 및 OpenAI의 GPT-3

와 같은 다른 저명한 모델과 비교할 때 추론 시간이 현저히 빨라졌습니다. 데이터브릭스 데이터 인텔리전스 플랫폼을 사용하는 개인은 이제 마켓플레이스에서 이 두 모델을 기능 및 다양한 배포 방법에 관한 자세한 내용과 함께 찾을 수 있습니다.

데이터브릭스는 플랫폼 콘솔에서 액세스할 수 있는 대화형 환경인 Mosaic AI Playground를 제공합니다. 사용자는 이러한 사전 구축된 모델을 Mosaic AI Model Serving에서 제공하는 최적화된 엔드포인트 솔루션으로 활용하거나 플랫폼에 저장된 고유한 데이터 세트를 사용하여 개인화 및 조정할 수 있습니다(Mosaic AI Foundation Adaptation). 이를 통해 특정 사용 사례를 해결하기 위해 이러한 모델을 맞춤형으로 구현할 수 있습니다.

데이터브릭스는 엔드투엔드 인공 지능 솔루션의 개발, 평가 및 배포를 용이하게 하도록 설계된 광범위한 도구를 제공합니다. 사용자는 사전 학습된 여러 미스트랄 AI 모델을 나란히 비교하여 여정을 시작하거나 토큰별로 이러한 모델을 획득하도록 선택할 수 있습니다. 두 가지 접근 방식 모두 프로세스를 신속하게 시작할 수 있습니다.

스노우플레이크와의 협업에 관한 데이터브릭스 발표는 플랫폼의 기존 데이터 리소스를 사용해 차세대 인공 지능 애플리케이션을 개발하고자 하는 사람들에게 흥미로운 발전이 될 것입니다. 그러나 이번 계약에는 성능 면에서 GPT-4 바로 다음 순위에 있는 미스트랄이 개발한 뛰어난 언어 모델인 미스트랄 라지(Mistral Large)는 포함되지 않는다는 점에 유의해야 합니다. 이 새로운 서비스는 최대 32,000개의 토큰에 대한 방대한 문맥 이해를 유지하면서 여러 언어에 걸친 놀라운 언어 능력으로 Anthropic의 클로드 2, Google의 제미니 프로, GPT-3.5와 같은 다른 주요 모델을 능가합니다. 스노우플레이크의 데이터 클라우드 내 혁신적인 Cortex 서비스는 이제 Mixtral

미스트랄 라지 포함과 관련하여 이 사이트에서 보낸 질문은 작성 시점에 답변되지 않은 상태로 남아 있습니다. 기타 오픈 소스, 상업적으로 사용 가능한 모델 데이터브릭스에서 제공하는 메타의 라마-2, 코드엘라마, 스테이블 디퓨전 XL 및 모자이크의 MPT 제품군이 있습니다.

미스트랄, 파트너십 지속

미스트랄은 데이터브릭스 및 스노우플레이크 외에도 다양한 기업과 협력하고 있습니다.

2023년 여름에 역사상 가장 큰 규모의 유럽 시드 펀딩을 확보한 이 단체는 이후 인상적인 시리즈 A 펀딩 라운드에 성공했습니다. 오픈AI, 앤트로픽, 구글 등 주목할 만한 경쟁자가 있는 인공 지능 분야에서 영향력을 확대하고 존경받는 기업으로 자리매김하기 위해 회사는 실질적인 업계 협력과 파트너십을 우선시하고 있습니다.

최근 미스트랄은 자사 모델을 Azure 클라우드 플랫폼에 통합하기 위해 Microsoft로부터 1,600만 달러의 투자를 유치했습니다.이번 계약으로 미스트랄은 OpenAI와 함께 마이크로소프트의 플랫폼을 통해 자사 모델을 제공하는 두 회사 중 하나가 되었습니다.

또한 IBM 와 개의 개별 파트너십을 체결하여 왓슨X에서 미스트랄 8x7B를 사용할 수 있게 했고, Perplexity 및 Amazon과도 파트너십을 맺었습니다. 이 스타트업이 다른 어떤 파트너십을 확보하여 인지도를 높이고 다양한 분야에서 AI 사용 사례를 추진할 수 있을지 지켜보는 것도 흥미로울 것입니다.