Contents

스타트업 펜, NVIDIA NeMo를 통한 제너레이티브 AI 성공 사례

머신러닝은 Waseem Alshikh가 대학에서 교과서를 정독하는 데 도움이 되었습니다. 이제 그는 제너레이티브 AI 을 활용하여 수백 개의 회사를 위한 콘텐츠를 제작하고 있습니다.

시리아 출신으로 그곳에서 자란 알시크는 레바논의 고등 교육 기관에 도착했을 때 영어 실력이 제한적이었습니다. 그러나 그는 소프트웨어 프로그래밍에 탁월한 재능을 가지고 있었으며, 이는 학업 과정에서 귀중한 자산이 되었습니다.

그는 한 권에 천 페이지에 달하는 엄청난 양의 교과서를 받았던 첫날을 회상하며 모두 영어로 쓰여진 교과서를 받았다고 회상했습니다.

그는 문학 작품을 구문 분석하고 생성된 요약을 분석하는 초보적이지만 효과적인 통계 분류 알고리즘을 개발했습니다.

개념에서 회사로

두바이에서 근무할 때 만났던 메이 하비브를 만나 자신의 비애를 털어놓았습니다. 두 사람은 인공지능을 활용해 웹사이트, 블로그, 광고 및 기타 디지털 플랫폼용 콘텐츠를 빠르게 생성함으로써 최소한의 자원으로 생산성을 높여야 하는 마케팅 부서를 지원하는 것을 목적으로 하는 스타트업 벤처를 설립하는 데 동의했습니다.

“처음에는 변압기 모델 이 발표되기 전까지는 이러한 기술이 없었는데, 이 기술을 기반으로 구축할 수 있었습니다.“라고 이 스타트업의 CTO인 알시크는 말합니다.

/images/startup-pens-generative-ai-success-story-with-nvidia-nemo.jpg 공동 창립자 Habib, CEO, Alshikh, CTO.

인공 지능에 처음 진출하면서 여러 엔지니어를 채용했고, 이들과 거의 반년 동안 협업하여 거의 작동하지 않고 약 1억 2,800만 개의 매개변수 수를 자랑하는 신경망 모델을 구축했습니다. 이 지표는 일반적으로 AI 시스템의 기능을 평가하는 데 활용됩니다.

그 과정에서 이 젊은 회사는 몇 가지 사업을 수주하고 Writer 으로 이름을 변경하고 NVIDIA와 연결되었습니다.

스타트업 가속화

" NVIDIA NeMo 를 소개받은 후 3개, 20개, 현재 400억 개의 파라미터로 산업 수준의 모델을 구축할 수 있었고, 지금도 계속 확장 중입니다.“라고 그는 말합니다.

NeMo는 기업이 학습 데이터세트를 큐레이팅하고, 대규모 언어 모델( LLM )을 구축 및 사용자 지정하고, 대규모로 프로덕션에서 실행할 수 있도록 지원하는 애플리케이션 프레임워크입니다. 한국 스웨덴 등 전 세계 다양한 조직에서 현지 언어와 산업에 맞게 LLM을 커스터마이징하는 데 사용하고 있습니다.

수십억 개의 매개변수가 포함된 방대한 모델을 구축하는 능력이 단기간 내에 크게 향상되었습니다. 이전에는 이러한 작업을 수행하는 데 약 4개월 반이 걸렸지만 이제는 단 16일 만에 달성할 수 있게 되었습니다.“라고 알시크는 Nemos가 이룬 놀라운 발전을 강조했습니다.

모델, 기회를 만들다

올해 상반기에는 20명 미만의 AI 전문가 그룹이 네모를 활용하여 각각 300억 개에서 훨씬 더 많은 양의 파라미터를 자랑하는 10개의 인공지능 모델을 만들었습니다.

앞서 언급한 개발은 상당한 전망을 제시합니다. 현재 200개 이상의 기업이 금융, 의료, 소매 등 다양한 산업 분야에서 작가 제품이 제공하는 맞춤형 재무 모델 설계를 활용하고 있습니다.

/images/startup-pens-generative-ai-success-story-with-nvidia-nemo-1.jpg 작가 요약 도구는 인터뷰나 이벤트의 오디오 녹음에서 서면 요약을 생성합니다.

앞서 언급한 이 스타트업은 딜로이트, 로레알, 인튜이트, 우버, 포춘 500대 기업 등 저명한 기업을 포함하여 인상적인 고객 명단을 확보하고 있습니다.

필자가 NeMo를 활용하여 이룬 성과는 이미 수많은 추가 기업이 NeMo의 서비스를 이용하고 있기 때문에 더 광범위한 이야기의 서막에 불과합니다.

이 소프트웨어는 곧 누구나 사용할 수 있게 될 것입니다. 이 소프트웨어는 NVIDIA AI Enterprise , 제너레이티브 AI 워크로드를 가속화하도록 최적화되고 엔터프라이즈급 지원, 보안 및 애플리케이션 프로그래밍 인터페이스 안정성으로 뒷받침되는 풀스택 소프트웨어의 일부입니다.

/images/startup-pens-generative-ai-success-story-with-nvidia-nemo-2.jpg Writer는 엔터프라이즈 사용자를 위한 풀스택 플랫폼을 제공합니다.

한 달에 1조 건의 API 호출

Writer의 모델은 자체 시스템이나 클라우드 서비스에서 자체 호스팅하는 방법과 Writer에서 호스팅을 제공하고 API(애플리케이션 프로그래밍 인터페이스)를 활용하는 방법 모두에서 활용할 수 있습니다.

단 두 명이 주로 관리하는 클라우드 인프라가 한 달에 1조 건에 달하는 놀라운 API 호출을 처리할 수 있으며, 그 결과 초당 9만 개 이상의 단어가 생성됩니다. 이러한 놀라운 성과에도 불구하고, 저희의 AI 모델은 훨씬 더 많은 리소스를 보유한 훨씬 더 큰 규모의 조직에서 만든 모델과 경쟁할 수 있습니다.

/images/startup-pens-generative-ai-success-story-with-nvidia-nemo-3.jpg NVIDIA NeMo는 데이터 큐레이션에서 추론에 이르는 제너레이티브 AI의 엔드투엔드 흐름을 지원합니다.

Writer는 NeMo와 함께 패키징된 Triton 추론 서버 을 사용하여 고객을 위해 프로덕션 모델을 실행합니다. 알시크는 LLM 을 실행하는 많은 회사에서 사용하는 트리톤이 대체 프로그램보다 지연 시간을 줄이고 처리량을 늘릴 수 있다고 보고합니다.

서비스 운영 비용을 10만 달러에서 2만 달러로 줄임으로써 가치 있고 영향력 있는 기능을 개발하는 데 추가 리소스를 할당할 수 있게 되었습니다.“라고 그는 말합니다.

넓은 지평

작가는 최첨단 스타트업을 육성하는 프로그램인 엔비디아 인셉션 의 멤버이기도 합니다. “Inception 덕분에 NeMo를 미리 사용해 볼 수 있었고, 필요한 도구를 찾고 사용하는 과정을 안내해 준 훌륭한 분들을 만날 수 있었습니다.“라고 그는 말합니다.

작가용 텍스트 제품이 탄력을 받으면서 플로리다와 캘리포니아에 거주하는 알시크는 향후 잠재적인 발전을 위한 새로운 지평을 모색하고 있습니다. 제너레이티브 인공 지능 분야가 계속 확장됨에 따라 그는 이미지, 오디오, 시각 미디어, 심지어 3차원 공간과 같은 영역에서의 가능성을 구상하고 있습니다.

멀티모달리티가 이 분야에서 성취의 정점을 이룬다는 그의 분명한 진술에서 알 수 있듯이, 우리는 멀티모달리티가 이 분야에서 성취의 정점을 이룬다고 믿습니다.

이 페이지 를 확인하여 NeMo를 시작하세요. 그리고 여기에서 멀티모달 NeMo의 얼리 액세스 프로그램에 대해 알아보세요 .

이 글을 읽고 즐거움을 느꼈다면 저자가 추천하는 대로 다양한 온라인 플랫폼에서 지인들과 여러분의 생각과 의견을 공유해 보시기 바랍니다.

제한된 인력과 재정 자원으로 상당한 수익을 달성하며 수많은 비즈니스를 위한 고품질 콘텐츠를 제작하는 혁신적인 기업인 스타트업 라이터의 운영에 대한 통찰력을 얻을 수 있습니다.