인공지능 이미지가 '놀랍다'고 생각했던 초기 사용자들은 DALL-E 2의 첫 날을 회상합니다.
확대 / “미국 고딕 양식의 우주비행사 부부를 그린 그랜트 우드의 그림"이라는 프롬프트로 생성된 DALL-E 2의 AI 생성 이미지입니다. 열심히 그리는 AI 그림 / X
2022년 4월 6일 OpenAI의 DALL-E 2 가 로 데뷔했을 때, 컴퓨터가 텍스트 설명만으로 비교적 사실적인 이미지를 주문형으로 만들 수 있다는 아이디어는 많은 사람들을 경악하게 했습니다. 이 발사는 인공지능 역사에서 혁신적이고 격동적인 시기를 시작했으며, 경이로움과 함께 오늘날까지 인공지능 분야에 울려 퍼지고 있는 양극화된 윤리적 논쟁으로 특징지어집니다.
지난주 OpenAI 은 DALL-E 2의 웹 버전에 대한 차세대 크레딧 구매 기능을 해제하여 사실상 죽였습니다. 기술적 관점에서 볼 때 OpenAI가 최근 이 서비스에 대한 지원을 중단하기 시작한 것은 그리 놀라운 일이 아닙니다. 2년 전의 이미지 생성 모델은 당시로서는 획기적이었지만 이후 DALL-E 3의 더 높은 수준의 디테일에 밀려났고, OpenAI는 최근 DALL-E 3 편집 기능 을 출시하기 시작했습니다.
그러나 DALL-E 2를 시작할 때 함께했던 끈끈한 아티스트와 기술 애호가 그룹에게 이 서비스의 일몰은 AI 기술이 무한한 창의성을 향한 마법의 포털처럼 느껴졌던 시기의 씁쓸한 종말을 의미합니다. 일러스트레이터 더글러스 보네빌 는 Ars와의 인터뷰에서 “DALL-E 2의 등장은 정말 놀라웠습니다.“라고 말했습니다. “출시 초기에는 우리 모두가 AI가 가져올 무한한 자유에 대한 짜릿한 감정이 있었습니다. 무언가에서 다른 무언가로 해방되는 느낌이었지만 정확히 무엇인지는 명확하지 않았습니다.”
잠재 우주비행사의 등장
DALL-E 2 이전에도 AI 이미지 생성 기술은 한동안 배경에서 구축되어 왔습니다. 1950년대 그래픽 디스플레이를 갖춘 컴퓨터가 등장한 이래로 사람들은 컴퓨터로 개의 이미지를 개 만들어 왔습니다. 1960년대 초에는 베라 몰나 , 게오르그 네스 , 만프레드 모어 같은 아티스트들이 컴퓨터가 그림을 그리게 하고, 생성적으로 알고리즘을 사용하여 예술 작품을 만들었습니다. 1990년대 칼 심스 와 같은 예술가들의 실험은 이 과정에 신경망을 가장 먼저 도입한 사례 중 하나입니다.
컴퓨터 아트에서 AI의 사용은 2015년에 Google의 DeepDream 이 컨볼루션 신경망을 사용하여 기존 이미지에 사이키델릭한 디테일을 부여하면서 다시 주목받기 시작했습니다.그 후 구글 연구원 그룹이 2017년에 발견한 아키텍처 인 트랜스포머 모델을 기반으로 한 발전기가 등장했습니다. OpenAI의 DALL-E 1 은 2021년 초에 기술 데모로 데뷔했고, 디스코 확산 은 그해 말에 출시되었습니다. 이러한 선구자에도 불구하고 DALL-E 2는 각 사용자가 보고 싶은 내용에 대한 설명을 입력하면 그에 맞는 이미지가 눈앞에 나타나도록 하는 텍스트-이미지 생성의 주류 돌파구를 마련한 것이 틀림없습니다.
2022년 4월 OpenAI가 처음 DALL-E 2를 발표했을 때, 트위터의 특정 구석은 미친 과학자 곰 인형 , 말을 탄 우주비행사 등 초현실적인 예술 작품의 사례로 빠르게 채워졌습니다. 많은 사람들이 진정으로 충격을 받았습니다. “그래, 가짜라고? 가짜라고 말해줘요. 만우절 농담이 좀 늦었네요.” 은 트위터에서 개의 초기 반응을 읽었습니다. “제 마음은 몇 번이나 날아갈 수 밖에 없습니다. 더 이상은 못 참겠어요.” 은 5월에 트위터 사용자에게 이렇게 썼습니다.
DALL-E 2 작품 스레드에서 수집 곧 이어서 OpenAI와 200명의 엄선된 베타 테스터 그룹이 올린 다른 예시들이 이어졌습니다.
1990년대 토요일 아침 만화인 스팀펑크와 디지털 아트 스타일로 “테디베어가 미친 과학자처럼 반짝이는 화학 물질을 섞는” AI가 생성하여 2022년 4월 6일에 공개된 이미지. OpenAI OpenAI가 생성하여 2022년 4월 6일에 공개한 “말을 타고 있는 우주비행사의 사진"의 AI 생성 이미지. OpenAI OpenAI에 의해 생성되어 2022년 4월 6일에 공개된 “베레모와 검은색 터틀넥을 입은 시바견"의 AI 생성 이미지입니다. OpenAI OpenAI가 생성하고 2022년 4월 6일에 공개된 “양모로 뜨개질을 하고 플라스틱으로 만든 후 벽에 스프레이 페인트로 칠한 괴물처럼 보이는 수프 그릇"의 AI 생성 이미지입니다. OpenAI “요하네스 베르메르의 ‘진주 귀걸이를 한 소녀’ 스타일의 해달"의 AI 생성 이미지로 OpenAI가 생성하여 2022년 4월 6일에 공개되었습니다. OpenAI
OpenAI가 베타 테스트 초대장을 배포하기 시작했을 때, 공통의 유대감은 새로운 기술을 함께 탐구하는 선구자 같은 아티스트들로 구성된 소규모 커뮤니티를 빠르게 탄생시켰습니다. “몇 명의 아티스트가 이 기술을 가지고 장난치던 시절이 있었습니다.우리는 모두 친구가 되었습니다.” 콘셉트 아티스트 다니엘 바스킨 는 2022년 3월 30일에 처음 DALL-E 2 사용 초대를 받고 4월 중순에 테스트를 시작했다고 말합니다. “처음 접속했을 때 무한한 대체 세계로 통하는 포털이 있는 것처럼 느껴졌습니다. ‘예술 제작’이라고 생각하지 않고 놀이처럼 느껴졌죠. 몇 시간 동안 잠에서 깨어 탐험하곤 했죠.”
“얼음 위에서 미끄러지는 동상 사진"과 같은 텍스트 프롬프트(캡션과 이미지 사이의 훈련을 통해 얻은 연관성에서 도출)에서 각 DALL-E 이미지가 나오기 때문에 베타 테스터들은 언어와 시각적 상상력을 새로운 방식으로 결합하는 자신을 발견했습니다. “마치 실험실에 풀어놓은 것 같았습니다.“라고 라피네라는 아티스트는 Ars와의 인터뷰에서 말했습니다. 라핀은 4월 6일에 DALL-E 2의 얼리 액세스를 받았고, 은 트위터에 개의 세대를 공유하기 시작했습니다. “이전에는 사용하지 않았던 방식으로 설명적인 언어를 사용했습니다.”
DALL-E 2는 완벽한 이미지를 만들어내지는 못했지만, 사소한 불일치로 인해 노련한 비주얼 크리에이터인 평가단의 마음을 사로잡는 매혹적인 그림의 본질을 사진에 부여했습니다. 인공지능의 단점은 실제 장인 정신에도 영향을 미쳤습니다. 라핀은 “캔버스에 그림을 그릴 때 접근 방식을 바꾸도록 유도했습니다.
DALL-E 2 출시 후 초기 단계에서 테스터 집단은 트위터를 통해 강한 유대감을 유지하며 혁신적인 플랫폼의 경계를 함께 탐구했습니다. 기술 중심지인 샌프란시스코에 거주하는 라핀은 이 기간 동안 두 명의 동료 DALL-E 2 테스터를 직접 만날 기회를 가졌습니다.
테스터들은 언어와 시각 예술의 교차점을 탐구하면서 스스로를 AI 모델이 흡수한 모든 것을 압축된 다차원 신경망으로 표현하는 용어인 ‘잠재 공간’의 탐험가라고 생각하기 시작했습니다. (2022년 후반, Replit의 CEO Amjad Masad 는 트위터에서 “잠재 우주 우주비행사"라는 용어를 로 만들었습니다.) “타임스퀘어에서 스케이트보드를 타는 곰돌이"와 같은 프롬프트의 각 단어는 개념적 잠재 공간의 다른 지점을 가리키는 주소의 일부처럼 작동하여 시각적 요소의 독특한 혼합을 전면에 내세웠습니다.
“스팀펑크 퍼비, 3D 렌더링, 스튜디오 조명"의 AI 생성 이미지로, Lapine의 요청에 따라 DALL-E 2에서 생성되었습니다. Lapine / OpenAI “선글라스, 50mm 렌즈, 스튜디오 조명을 착용한 멋진 아기 소의 사진"을 DALL-E 2로 생성한 AI 생성 이미지로, Lapine의 요청에 따라 생성되었습니다. Lapine / OpenAI “밀밭 위에 떠 있는 돼지 모양의 1920년대 비행선이 찍힌 오래된 사진"을 DALL-E 2가 Lapine의 요청에 따라 AI로 생성한 이미지입니다. Lapine / OpenAI “비바람이 몰아친 후 도시 보도 위 웅덩이에 고해상도 기름띠가 고층 빌딩에 반사되어 있는 사진"을 DALL-E 2로 생성한 AI 생성 이미지로, Lapine의 요청에 따라 생성되었습니다. Lapine / OpenAI “누구 차례에 쓰레기를 버릴 것인지에 대한 논쟁을 묘사한 고대 이집트 그림"의 AI 생성 이미지로, Lapine의 요청에 따라 DALL-E 2가 생성했습니다. Lapine / OpenAI
발명가 다니엘 퐁 은 이 사이트와의 인터뷰에서 “말 그대로 놀라웠습니다.“라고 말했습니다. 과학과 예술을 결합하는 것을 좋아하는 물리학자인 퐁은 DALL-E 2의 초기 테스터 중 한 명이었습니다. “AI에 인코딩된 잠재적 시각 공간을 탐색하고 제 아이디어와 감정을 설명하기 위해 빠른 속도로 개념적인 아트를 만들기 시작하면서 제 두뇌가 확장되는 것을 느낄 수 있었습니다. 때때로 격렬한 감정을 예술로 전환하는 데 이러한 도움을 받을 수 있다는 것은 정말 놀라운 일이었습니다.”
배스킨은 잠재적 공간의 일부를 물리적 장소로 개념화하기 시작했고, 이를 ’ 구역 ‘라고 불렀는데, 이는 그녀가 방문할 수 있는 존재하지 않는 가상 세계를 의미합니다. “창의적인 아이디어를 떠올릴 수 있는 구역을 찾고 호기심을 따라 다른 토끼굴을 찾아갔어요.“라고 그녀는 말했습니다. 그리고 다른 테스터들도 함께 참여했습니다. “서로의 세계를 공유하며 서로의 세계를 찾거나 내러티브 스토리텔링을 하기도 했죠. 게임을 만들기도 했죠.”
보네빌은 OpenAI의 잠재 공간에서의 경험을 흥미진진하고 마음을 확장하는 여정이었다고 기억합니다. 그는 DALL-E가 생성하는 모든 새로운 창작물이 이 신비로운 영역에 대한 새로운 통찰을 제공하는 것 같았다고 회상했습니다.
결국 광범위한 실험을 통해 생성된 수많은 시각적 표현의 축적은 각 시험관의 전자 기기의 저장 용량에 관한 문제가 되었습니다. “특별한 목적이나 배포 없이 약 만 장의 사진을 컴퓨터에 보관했는데, 꽤 즐거운 경험이었습니다.“라고 Baskin은 말합니다. “이 유틸리티 자체가 재미있고 동기 부여가 되는 오락의 한 형태였습니다.
“윤리적 의문이 너무 많아”
초기 DALL-E 2 테스터들은 놀라움과 흥분을 경험했지만, 초기 테스트 그룹 이외의 일부 사람들은 DALL-E 2가 인간 아티스트와 사진가의 기술을 흡수하여 그 능력을 얻었다는 사실을 깨닫고 기술에 대한 우려 를 표명했습니다.OpenAI는 예술 작품을 생성하기 위해 권리자와 상의 없이 인터넷에서 스크랩한 수억 개의 이미지와 제작자 모르게 Shutterstock에서 라이선스를 받은 이미지를 분석하여 DALL-E 2를 학습시켰습니다. ( OpenAI의 CEO인 샘 알트먼은 2022년 10월 “셔터스톡에서 라이선스를 받은 데이터는 DALL-E의 학습에 매우 중요했습니다.“라고 말했습니다).
블로거인 Andy Baio는 DALL-E에 액세스한 직후인 2022년 8월에 “DALL-E 2와 같은 신흥 기술을 사용하면서 이렇게 갈등을 느낀 적은 없었는데, 이 기술은 마술처럼 느껴지지만 윤리적 문제를 너무 많이 제기하여 모든 것을 추적하기는 어렵습니다.“라는 글을 썼습니다. 당시 바이오는 자신의 글에서 “인간의 창의성을 세탁하는 윤리"에 대해 세 가지 주요 의문을 제기했습니다:
방대한 양의 저작권이 있는 예술 작품을 허가나 크레딧 없이 사용하는 것이 도덕적으로 타당한지에 대한 질문은 타당한 우려입니다. 또한 개인이 사진작가, 일러스트레이터, 디자이너의 스타일을 모방한 독창적인 작품을 금전적 보상 없이 제작하도록 허용하는 것이 윤리적인지에 대한 문제도 제기될 수 있습니다. 또한 타인의 지적 재산에 기반한 서비스에 대한 사용료를 부과하는 것과 관련된 도덕적 딜레마도 있습니다.
이러한 도덕적 딜레마에 대한 대중의 의식이 사이버 공간에서 점차 확산되면서, 이러한 질문에 대한 개인의 응답 방식이 이분법화 경향을 보이는 것이 분명해졌습니다. 다양한 소셜 미디어 플랫폼의 상당수 사용자들은 (그 구조상 가장 극단적인 관점을 강조하고 증폭시키는 경향이 있는) ‘인공지능이 만든 예술 작품은 놀라운 업적이다’ 또는 ‘인공지능이 만든 예술 작품은 비난받을 만한 행위다’라는 두 가지 극단 중 하나에 빠르게 동조하는 모습을 보였습니다.
인공지능을 둘러싼 흥분 속에서 포착된 사람들은 바이오와 같은 온건파로, 인공지능의 발전에 감탄하면서도 윤리적 영향과 창작자에게 미칠 수 있는 결과에 대해서는 신중한 태도를 유지했습니다. 허깅 페이스의 인공지능 윤리 전문가인 마가렛 미첼 박사도 비슷한 생각을 공유했습니다. 그녀는 지금까지 이룬 인상적인 진전을 인정하면서도 활용된 데이터의 출처에 대한 우려를 표명했습니다.
처음에는 OpenAI가 철저히 비밀에 부쳐 논란을 최소화했습니다. 모든 세대의 소유권을 주장하고 폭력, 유명인, 성에 대한 콘텐츠 필터를 내장했으며 생성된 각 이미지에 작은 모서리 워터마크를 추가했습니다. 그리고 전 세계에서 약 200명만이 OpenAI 수준의 디테일로 이미지를 만들 수 있습니다.DALL-E 2가 2022년 9월에 출시되기 전의 작은 거품 생태계에서, 그리고 기술이 워낙 새롭기 때문에 데이터 스크래핑 문제는 처음에는 그렇게 큰 문제가 되지 않는 것처럼 보였습니다. 데이터 세트의 편견과 고정관념 에서 나타난 문제도 마찬가지였습니다(이 주제는 아베바 버하인 같은 연구자 덕분에 다른 곳에서 충분히 적절한 비판 을 받았지만 ).
확대 / 스테이블 디퓨전으로 생성된 이미지 모음입니다. 렌더링 방법에 대한 지식은 웹에서 스크랩한 이미지에서 얻었습니다. Lexica
그러나 이미지 합성 기술을 추구한 것은 OpenAI만이 아니었습니다. 머신러닝 연구자들이 CLIP , 잠재 확산 등 공개적으로 발표한 AI 이미징 기술을 통해 다른 사람들도 이미 유사한 기술을 개발하기 시작했습니다. 곧 미드저니(2022년 봄에 클로즈 베타로 시작)와 안정성 AI의 안정성 확산(2022년 8월에 정식 출시) 과 같은 다른 AI 이미지 모델 사용자들은 가이드 에서 아티스트의 이름을 사용하여 살아있는 아티스트의 스타일을 복제하는 도구의 기능을 공개적으로 목록화하기 시작하여 유도 기술을 개선하기 시작했습니다.
유명한 현대 예술가의 이름과 같은 특정 형태의 메타데이터와 해당 시각적 표현 사이의 연관성을 숨기려는 OpenAI의 노력으로 인해 앞서 언급한 문제는 DALL-E의 경우 널리 퍼져 있지 않았습니다. 그 결과 기존 크리에이터의 예술적 스타일을 재현하기가 어려웠습니다. 배스킨은 “재직하는 동안 OpenAI의 DALL-E 2 모델이 현재 아티스트들의 작품 세계를 잘 파악하지 못한다는 사실을 알게 되었습니다. 워크플로에서 우리는 일반적으로 개별 아티스트 이름을 언급하기보다는 ‘반사 표면’과 같은 설명 문구를 제출하는 것을 선호했는데, 이는 관행처럼 굳어졌습니다.
DALL-E 2에서 생성한 “흰색 테이블 위에 자몽 웨지와 세이지를 유리잔에 담은 빨간색과 분홍색 그라데이션 음료 사이로 비치는 햇빛"의 여러 AI 생성 이미지, Danielle Baskin의 요청에 따라 제작되었습니다. 다니엘 배스킨 / OpenAI “자연에 의해 매립되는 건물의 인형 집 복제품이 같은 건물 안에 남아 있는 모습"의 AI 생성 이미지로, 다니엘 배스킨의 요청에 따라 DALL-E 2가 생성했습니다. 다니엘 배스킨 / OpenAI 다니엘 배스킨의 요청에 따라 DALL-E 2가 생성한 유리 하트의 AI 생성 이미지입니다. 다니엘 배스킨 / OpenAI 금문교의 폴라로이드 사진을 기찻길로 변환한 AI 생성 이미지로, 다니엘 배스킨의 요청에 따라 DALL-E 2가 생성했습니다. 다니엘 배스킨 / OpenAI 다니엘 배스킨의 요청에 따라 DALL-E 2가 만든 “철사, 실, 오래된 전자제품으로 만든 귀여운 고양이"의 AI 생성 이미지입니다. 다니엘 배스킨 / OpenAI
그러나 2022년 말 다른 이미지 합성 도구가 공개되면서, 미드저니와 스테이블 디퓨전에서 AI가 생성한 이미지를 연상시키면서 기존 아티스트의 이름을 참조하는 관행이 반발을 불러일으켰습니다. 2022년 8월 13일, 아티스트 RJ 팔머는 트위터에 개의 바이럴 스레드 , 개의 글 를 시작하며 “이 AI가 다른 점은 현재 작업 중인 아티스트에 대해 명시적으로 학습되었다는 점입니다. 아래에서 AI가 생성한 이미지(왼쪽)를 보면, AI가 찢어낸 아티스트의 로고를 다시 만들려고 시도한 것을 볼 수 있습니다. 이것은 우리의 일자리를 원하고 있으며, 적극적으로 반 예술가적입니다.”
AI 생성 예술 에 대한 논란은 언론에서 비등점까지 커졌고, 당시 저희도 수십 개의 기사를 통해 자세히 다뤘습니다. 이 문제는 이후 Stability AI와 Midjourney(OpenAI는 제외)를 상대로 한 소송으로 이어졌고, 온라인 아티스트 커뮤니티에서는 AI 이미지 생성기가 작업 중인 아티스트를 착취하고 비하한다며 거세게 항의하는 시위가 벌어지기도 했습니다.
잠복 우주 비행사들이 AI가 생성하는 예술의 영역에 대해 더 깊이 파고들면서 OpenAI의 창작 샌드박스에 대한 초기의 경외감과 호기심을 품었던 완벽한 유리 울타리 안에 균열을 발견하기 시작했습니다.
의심, 환멸, 그리고 싸움
인공지능이 생성한 이미지가 등장하기 전, DALL-E 2의 초기 시험에 참여한 모든 사람은 예술가로서의 배경을 가지고 있었으며, 인공지능이 창작 표현에 미치는 영향에 대해 개인적인 신념을 가지고 고민했습니다.
스테이블 디퓨전의 공식 출시 전 예비 단계(2022년 4월부터 8월까지)에서 DALL-E 2 테스터들은 인공지능 이미지 생성 시스템을 학습시키는 데 저작권이 있는 자료를 활용하는 윤리적 의미에 대해 크게 우려하지 않았지만, 시간이 지나면서 점차 그러한 우려를 표명하기 시작했습니다.
DALL-E 2의 고유한 특성은 바스킨이 보기에 스테이블 디퓨전과 같은 후속 모델과 차별화됩니다. 후자의 모델들이 기존의 예술적 스타일을 넘어 다양한 예술적 스타일에 대한 보다 세련된 지식을 보여준 반면, DALL-E 2의 불완전함은 그만의 개성을 유지할 수 있게 해주었습니다.그러나 배스킨은 AI가 생성한 이미지를 활용하는 것이 어려움을 겪고 있는 예술가들의 경제적 복지에 미칠 수 있는 영향, 특히 그러한 콘텐츠가 적절한 보상 없이 상업적 목적으로 악용될 경우의 잠재적 파급력에 대해서도 중요한 우려를 제기했습니다.
DALL-E 2의 초기 단계에서 라핀은 인터넷에서 얻은 다른 사람의 작품과 이미지를 AI 모델 학습에 활용하는 것의 윤리적 의미에 대해 별다른 우려를 표명하지 않았습니다. 하지만 스테이블 디퓨전의 원동력이 된 데이터베이스를 살펴보다가 놀라운 사실을 발견한 후 그녀의 관점이 바뀌었습니다. 이후 LAION 데이터 세트에서 자신의 개인 의료 기록을 발견하고 아티스트들의 우려를 알게 된 라핀은 이후 플랫폼의 운영 방식이 명확하지 않다는 이유로 해당 플랫폼에 참여하지 않고 있습니다.
일부 테스터들이 인공적으로 생성된 수많은 예술품이 지적 재산권에 미치는 영향에 대해 고민하면서 미국 저작권청의 입장과 사법부의 판결을 둘러싼 불확실성이 존재했습니다. 인공지능이 제작한 저작물이 저작권법에 따라 보호받을 수 있는지에 대한 의문은 해결되지 않은 채로 남아있었습니다. 다니엘 퐁은 “AI 영역 내 지적 재산의 환경은 전면적인 재평가를 요구합니다.“라고 말합니다. 그러나 아티스트들은 AI 시스템과의 치열한 경쟁에 직면해 있는 동시에 이전보다 더 큰 자율성을 누리고 있는 혼란스러운 상황입니다. 이는 다면적인 딜레마를 야기합니다.
“트위터를 바벨탑으로 묘사한 이미지, 말풍선이 많은 수백 개의 커뮤니티가 있는 나선형으로 가늘어지는 원통형 탑, 피터 브뤼겔의 스타일, 바벨탑, 나무 패널에 오일, 오스트리아 비엔나 미술사 박물관, 뫼비우스"의 AI가 생성한 이미지를 DALL-E 2가 Danielle Fong의 요청에 따라 제작했습니다. 다니엘 퐁 / OpenAI “광섬유 소재로 만든 드레스를 입은 모델이 파란색으로 빛나고 반짝이는 아름다운 조명의 전문 사진"을 DALL-E 2로 생성한 AI 생성 이미지로, 다니엘 퐁의 요청에 따라 제작되었습니다. 다니엘 퐁 / OpenAI “제갈량이 스타크래프트를 플레이하는 중국 고전 그림"을 DALL-E 2로 생성한 AI 생성 이미지로, 다니엘 퐁의 요청에 따라 제작되었습니다. 다니엘 퐁 / OpenAI 다니엘 퐁의 요청에 따라 DALL-E 2가 생성한 “세상에서 가장 맛있고 건강한 음식"의 AI 생성 이미지입니다. 다니엘 퐁 / OpenAI 다니엘 퐁의 요청에 따라 DALL-E 2가 생성한 “기술 오빠"의 AI 생성 이미지입니다. 다니엘 퐁 / OpenAI
처음에 저는 인공지능이 생성한 예술과 그 저작권에 대해 도덕적 우려 없이 관대한 관점을 가졌습니다. 지금도 제 신념은 흔들리지 않고 있으며, 개인이 어떤 형태의 창작 콘텐츠를 온라인에 게시할 때마다 공정 사용 원칙에 따라 그 콘텐츠의 활용을 예상해야 한다고 굳게 믿고 있습니다.
스테이블 디퓨전에 대한 논란이 불거진 지 얼마 지나지 않아 보네빌은 며칠 동안 트위터에서 인공지능이 생성한 예술 작품에 대한 비판자들과 논쟁을 벌였습니다. “저는 대화를 크게 확대시킨 한 아티스트 애니메이터[RJ 팔머]에 대해 일부 댓글에서 강하게 비판했습니다.“라고 그는 회상했습니다. “여러 스레드에서 논쟁을 벌였지만 상황이 과열되자 곧 소용없다는 것을 깨달았습니다.” 돌이켜보면 보네빌은 당시의 논란이 쓸데없는 논쟁이었다고 생각합니다. “그는 “AI의 발전으로 인해 “싸울 가치가 없는 싸움이었다"고 말합니다.
바스킨은 AI가 생성한 예술이 널리 보급되더라도 인간 예술가들은 AI 모델이 다양한 스타일을 결합하여 수많은 인간 창작물을 대표하는 지나치게 생생한 합성 이미지로 표현하기 때문에 계속 가치를 유지할 것이라고 믿습니다. 그는 인간 예술가에 대한 수요 증가는 독특하고 수공예적인 예술 작품에 대한 새로운 매혹에서 비롯될 것으로 예상합니다.
“어떤 사람들은 분명히 잠재적 공간에서 길을 잃었다”
이를 둘러싼 다양한 논쟁에도 불구하고 보네빌은 2022년 초기 단계에서의 자신의 경험을 좋게 회상합니다. “그때 느꼈던 짜릿하고 거의 천진난만한 행복감을 대체할 수 있는 것은 없습니다.“라고 그는 말합니다. “그 시절은 정말 즐거웠고, 뛰어난 사람들을 만날 수 있는 기쁨도 누렸습니다.
모든 경험이 그렇듯, 우주비행사로서의 스릴은 결국 관련자들에게 가라앉았습니다. 보네빌이 지적했듯이, 개인마다 끝이 없는 것으로 인식될 수 있는 우주 공간의 광대함은 결국 이 도전과 관련된 초기의 흥분과 발견의 의미를 약화시켰습니다. 이러한 인식은 새로운 환경을 탐험할 때 유발되는 쾌감을 유발하는 신경학적 반응의 강도를 감소시켰습니다.
가까운 지인들을 제외한 더 넓은 영역에서는 2022년 11월 말 ChatGPT가 혁신적인 최신 AI 도구로 등장하면서 AI 기술에 대한 초기 열기가 곧 윤리적 영향에 대한 우려와 과도한 마케팅 소문으로 바뀌었습니다. 동시에 보네빌은 AI로 생성된 예술을 중심으로 한 온라인 커뮤니티에 매료되었고, 가장 큰 영향력을 발휘하는 사람들이 종종 경계를 허무는 사람들이라는 사실을 알게 되었습니다. 결국, AI가 제작한 시각적 콘텐츠의 끊임없는 유입은 단조롭고 영감을 주지 못했습니다.
더글러스 보네빌의 요청에 따라 DALL-E 2가 생성한 “비스무트색 사과를 한 입 베어 물고 그 안에 눈이 있는 35mm 사진"의 AI 생성 이미지입니다. 더글러스 보네빌 / OpenAI 더글러스 보네빌의 요청에 따라 DALL-E 2가 만든 “깊은 숲 속에서 큰 담배를 피우는 흰 토끼 그림, 에드워드 고리, 구스타프 도어의 작품"의 AI 생성 이미지입니다. 그의 “나쁜 토끼” 시리즈 중 일부입니다. Douglas Bonneville / OpenAI 더글러스 보네빌의 요청에 따라 DALL-E 2가 만든 “중앙에 빛나는 비스무트색 눈동자가 있고, 메탈릭 다이아몬드 에메랄드 눈동자가 있으며, 다이아몬드 눈물을 흘리는 젖은 장미 사진, 장미 페달 모양의 아이리스"의 AI 생성 이미지입니다. 더글러스 보네빌 / OpenAI 더글러스 보네빌의 요청에 따라 DALL-E 2가 만든 “HAV-V 1: 건초로 만든 세계 최초의 완전 재생 가능한 자동차"의 AI 생성 이미지입니다. 더글러스 보네빌 / OpenAI 겨울철 통나무집의 AI 생성 이미지. 보네빌은 이 이미지가 디스코 디퓨전 오리지널에 DALL-E 2로 페인팅한 것이라고 말합니다. 그는 “다른 시스템에서 생성된 AI 입력으로 인페인팅에 DALL-E를 사용한 첫 번째 사례"라고 말했습니다. 더글러스 보네빌 / OpenAI
발표자는 수많은 비주얼을 만드는 데 강한 심리적 의존성을 보이는 특정 개인 그룹을 관찰했습니다. 이 하위 그룹은 엄청난 양의 인공 지능 생성 이미지를 생성했으며, 일부 개인은 50,000개, 100,000개, 심지어 300,000개에 달하는 이미지를 생성했습니다. 특정 개인은 ‘잠재 공간’으로 알려진 이 현상에 의해 소비되는 것으로 나타났습니다.
특히 2022년 10월 엘론 머스크의 소유로 전환된 트위터의 변화로 인해 많은 사람들이 플랫폼을 떠나면서 AI 아트 커뮤니티는 더욱 분열되었습니다. 라핀은 현재 초창기 커뮤니티의 대부분의 사람들과 연락이 끊겼다고 말했습니다.
보네빌은 암호화폐와 연계되어 금전적 이득을 추구하는 특정 AI 예술가들을 끌어들인 NFT 시장의 침체로 인해 온라인에서 AI로 생성된 예술 커뮤니티의 평판이 더욱 훼손되었다고 강조합니다. 그는 이전에 긴밀하게 팔로우했지만 최근에는 활발하게 교류하지 않았던 한 개인의 최근 게시물을 떠올렸습니다. 그 사람은 AI 예술에 대한 환멸을 표현하며 이 매체를 통해 상상했던 이상적인 세상은 여전히 요원하다고 말했습니다.
DALL-E의 일몰 2
케이시 뉴턴은 이 웹사이트의 기사에서 새로운 기술의 출현을 ‘이전’과 ‘이후’의 시대로 구분하는 것으로 특징지었습니다.오늘날 우리는 인공지능(AI) 이미지 생성의 발전이 멈추지 않는 이분법의 후자에 속해 있는 자신을 발견하게 됩니다. Adobe, Meta, Google, Stability AI, Microsoft, Midjourney 등 여러 유명 기업에서 상용 AI 이미지 합성 툴을 제공하고 있습니다. 또한 OpenAI는 DALL-E 3의 발전 외에도 시청자를 놀라게 하는 합성 동영상을 제작하는 데에도 진전을 이루었습니다.
AI 이미지 생성기의 발전 속도로 인해 DALL-E 2는 오래 전에 기능이 대체되었지만, 독특한 스타일과 아웃페인팅 기능 에 매료된 핵심 사용자 그룹은 여전히 유지되고 있습니다. 지난 주 MIT 테크놀로지 리뷰 의 윌 더글러스 헤븐은 DALL-E 2를 사용하여 일어나지 않은 중요한 가족 행사의 이미지를 만든 합성 기억 라는 예술적 프로젝트 를 소개했습니다. “OpenAI가 DALL-E 2를 종료하고 DALL-E 3를 사용해야 할까 봐 정말 두렵습니다.“라고 프로젝트 제작자 Pau Garcia는 말했습니다.
현재 사용자 가 OpenAI 웹 사이트에서 이전에 DALL-E 2 인터페이스를 호스팅했던 URL 를 방문하면 “더 이상 신규 사용자의 DALL-E 2 사용을 허용하지 않습니다. DALL-E 3는 이미지 품질이 더 좋고, 즉각적인 준수 기능이 향상되었으며, 이미지 편집 기능을 출시하기 시작했습니다.“라는 메시지가 표시됩니다. 이 사이트와 통화한 OpenAI 대변인에 따르면 DALL-E 2는 무료 크레딧을 종료하고 이전에 크레딧을 구매한 적이 없는 사람에게는 크레딧 판매를 중단했지만, 기존 크레딧을 보유한 사람은 2025년 5월 1일까지 또는 구매 후 1년 중 먼저 도래하는 시점까지 사용할 수 있습니다. 현재로서는 DALL-E 2 API 을 개발자가 계속 사용할 수 있습니다.
2024년 4월 15일에 표시된 DALL-E 2의 웹페이지를 보여주는 이미지, Benj Edwards가 캡처한 것입니다.
OpenAI가 DALL-E 2를 단종할 때, 후속작인 DALL-E 3에서는 더 이상 사용할 수 없는 특정 기능이 존재했습니다. 여기에는 웹 인터페이스와 사진을 업로드하고 인페인팅 및 아웃페인팅 기술을 통해 조작할 수 있는 기능이 포함됩니다. 특히 DALL-E 3는 인페인팅을 지원하지만 이 기능은 이전에 생성한 이미지로 제한됩니다.
라핀은 DALL-E 2를 떠나면서 자신이 참여했던 선구적인 시대에 대한 향수를 표현합니다. 지금은 인공지능 기반의 크리에이티브 플랫폼에서 벗어나 있지만, 최첨단 기술의 얼리어답터로서 획기적인 개발에 참여했던 기억을 소중히 간직하고 있습니다. 라핀은 미지의 영역을 탐험하는 스릴과 그 결과 탄생한 매혹적인 꿈의 풍경에 대해 회상합니다.