프로젝트 바아니에서 영어 가이니로, 이 IISc 교수의 행보
IISc 방갈로르의 프라산타 쿠마르 고쉬 교수는 다양한 언어와 방언으로 음성 데이터를 수집하는 독특한 방법을 알아냈습니다. 첫 번째 단계로 80개 지역을 방문하여 현지인에게 사진을 보여주고 설명을 부탁한 다음 녹음하는 방식으로 구글의 지원을 받은 프로젝트 Vaani 은 약 16,000시간의 음성 데이터를 확보했습니다.
이 팀은 프로젝트를 대중에게 공개했으며 현재 수집된 데이터의 약 10%를 수작업으로 전사하고 있습니다. 이들의 궁극적인 목표는 인도 내 773개 지역에 걸쳐 150,000시간 분량의 음성 자료를 모으는 것입니다. 최근 AIM과의 대화에서 고쉬는 “인도는 단순히 하나의 언어나 다양한 방언이 아니라 광범위한 탐구가 필요한 방대한 정보 저장소"라고 강조했습니다.
이 외에도 Ghosh와 그의 연구 그룹은 힌디어, 벵골어, 마라티어, 텔루구어, 보즈푸리어, 칸나다어, 마가디어, 차티스가리어, 마이틸리어 등 다양한 인도 언어를 위한 고급 텍스트 음성 변환 및 음성 텍스트 변환 모델을 개발하는 데 중점을 둔 Respine과 Syspin이라는 두 가지 추가 이니셔티브에 적극적으로 참여하고 있습니다.
빌 앤 멜린다 게이츠 재단에서 자금을 지원하는 Respin 은 음성을 텍스트로 변환하는 ASR 프로젝트인 인도 언어 음성 인식(Recognising Speech in Indian languages)의 약자입니다. 현재 이 프로젝트는 농업과 금융에 초점을 맞추고 있으며 오픈 소스로 제공되고 있습니다. 반면
Syspin 는 9개 인도 언어의 음성을 남성 목소리와 여성 목소리로 합성하는 텍스트 음성합성 모델입니다. 고쉬는 “인도 전역의 모든 지역을 커버하는 것이 목표"라며 모든 언어의 모든 방언을 커버하는 것이 중요하다고 강조했습니다.
인공지능이 문제를 해결해야 한다
인도 언어와 인공지능에 대한 고쉬의 열정은 인도 내 의료 문제를 해결하고자 하는 열망에서 비롯되었습니다. 그는 오랜 기간 동안 파킨슨병과 매우 유사한 신경 질환으로 언어 장애를 초래하는 구음장애에 대한 해결책을 찾는 데 전념해 왔습니다. 이러한 목표를 추구하기 위해 고쉬는 방갈로르에 위치한 국립정신건강 및 신경과학연구소(NIMHANS)와 힘을 합쳤습니다.
고쉬는 인간의 능력이 아닌 인공지능(AI)이 장애를 가진 개인을 이해할 수 있는 잠재력에 대한 믿음을 표명했습니다. 정보를 수집하는 과정에서 그는 장애가 없는 사람들을 위해 설계된 기술을 구축하기 위한 기반이 충분하지 않다는 사실을 알게 되었습니다.그 결과, 그는 이러한 애플리케이션을 위한 강력한 기반을 구축한다는 개념을 고안해냈습니다.
이러한 노력에 참여하면서 Ghosh는 인도어로 기술을 개발하여 다양한 언어와 관용구를 사용하여 의사소통하는 인도의 여러 지역에 거주하는 개인에게 혜택을 줄 수 있는 것이 중요하다는 것을 깨달았습니다.
의료 분야 외에도 Ghosh는 영어 Gyani 라는 프로젝트를 통해 인도에서 교육에 AI를 활용하는 데도 주력하고 있습니다. 과학기술부의 지원을 받는 이 프로젝트는 IMPRINT 프로젝트라고도 불립니다. “우리는 젊은 구직자들이 집에서 바로 구어체 영어와 컴퓨터 기술을 배울 수 있는 도구를 만들고 있습니다.“라고 Ghosh는 말합니다.
듀오링고와 비슷한 방식으로 고쉬는 음성 명령을 사용하여 전체 애플리케이션을 제어할 수 있는 잠재력을 강조했는데, 이는 그의 팀이 적극적으로 개발 중인 부분입니다. 그는 사람마다 같은 단어를 다르게 발음하는 사례를 들며 음성 피드백을 활용하여 개인의 발음과 언어 습득 과정을 안내하는 것이 중요하다고 강조했습니다. 또한 고쉬는 적절한 발음을 숙달하는 것이 언어 능력을 향상시키려는 사람들의 취업 전망을 어떻게 향상시킬 수 있는지에 대해서도 설명했습니다.
책임감 있는 AI에 집중
현대 사회에서 인공지능이 널리 보급된 점을 고려할 때, 고쉬 박사는 인도의 학술 및 연구 기관이 설명 가능하고 윤리적인 AI 관행을 우선시해야 한다고 생각합니다.“라고 그는 주장했습니다. “이 분야는 전통적인 경계를 넘어 우리 삶의 모든 측면에 스며들고 있습니다.“라고 그는 자세히 설명했습니다.
현재 의료 애플리케이션을 위한 모델 개발이 강조되고 있는 상황에서 연구자들은 이러한 모델의 안전성과 정확성을 보장하기 위해 수집 과정과 운영 모두에 세심한 주의를 기울이는 것이 중요합니다. Ghosh가 지적한 것처럼 단순히 효과적인 모델을 만드는 것만으로는 충분하지 않으며, 편향된 가정을 포함하지 않고 정확한 예측에 필요한 모든 관련 정보를 포함하는 것도 마찬가지로 중요합니다.
오픈 소스 Indic 언어 모델에 대한 토론에서 Ghosh는 특정 문제를 해결하는 데 있어 영어 모델의 한계로 인해 이러한 모델을 개발하는 것이 중요하다고 강조했습니다. 그는 라자스탄과 같은 시골 지역에서는 사람들이 주로 영어나 힌디어가 아닌 현지 언어로 의사소통을 한다고 설명했습니다. 따라서 프로젝트의 목표는 이러한 지역 사회에 모국어를 사용하여 솔루션을 제공하는 것입니다.