인공 지능(AI)을 사용하는 이미지 생성기의 이야기는 또 다른 장을 얻었습니다(여러 각주 포함). 안정적인 확산. 텍스트 명령을 사용하여 이상한 장면을 만들 수 있어 올해 소셜 미디어에서 유명해진 DALL-E와 비슷하지만 두 가지 중요한 차이점이 있습니다. 이미 대중에게 공개되었고 오픈 소스라는 것입니다.
이 두 가지 점은 Stable Diffusion의 잠재력과 결합되어 장관을 이루고 더 중요하게는 믿을 수 있는 이미지를 생성하여 웹에서 논쟁과 우려를 불러일으켰습니다. 일부는 도구의 창의적인 가능성과 민주적인 범위에 대해 흥분하고 있습니다. 반면에 그것을 사용할 때 속마음을 걱정하는 사람들이 있습니다. 그리고 일부는 생성기가 예술적 스타일(아직 살아있는 사람들의 스타일 포함)을 거의 완벽하게 모방할 수 있다는 사실에 화를 냈습니다.
사실 Stable Diffusion은 다음을 사용하는 창의적인 도구의 물결을 타고 있습니다. 깊은 학습 (딥 러닝, 무료 번역) OpenAI에서 DALL-E 2와 같은 다른 도구와 함께 시각적 미디어를 생성합니다. 중도; 그리고 구글의 Imagen. 그리고 최근에 출시되었기 때문에 그 우주에는 여전히 그 무법의 지구 에너지가 있습니다.
안정적인 확산이란 무엇입니까?

AI 기반 이미지 생성기입니다. 그것으로 컴퓨터와 비교적 좋은 그래픽 카드(현재 Nvidia 카드에서만 작동)가 있는 사람은 누구나 상상할 수 있는 거의 모든 디지털 그림을 만들 수 있습니다. 반 고흐가 그린 비욘세 초상화? 있을 수있다. 도시의 전망 사이버 펑크 18세기 일본 예술가 호쿠사이의 스타일로? 할 수 있습니다.
예, 이 도구는 유명한 만화가부터 19세기 은판 사진 작가에 이르기까지 거의 모든 시각적 스타일을 모방할 수 있습니다(이는 실제로 존재했으며 Google에서 확인할 수 있습니다). 또한 도구에서 수요를 구성할 때 참조할 설명 문구와 이미지를 포함할 수도 있습니다.
Stable Diffusion은 에마드 모스타크, 스타트업 Stability AI의 창립자이자 CEO로서 오픈 소스 AI 프로젝트를 만드는 것을 사명으로 삼고 있습니다. 이러한 구실로 새로운 도구가 40월 말에 일반에 공개되었습니다. 그러나 XNUMX세를 앞둔 사업가에게 이번이 처음은 아니다.
2019년 원래 방글라데시 출신이지만 현재 영국에 거주하고 있는 Mostaque는 Symmitree를 설립했습니다. 이것의 목적 시작, 그가 옥스퍼드 대학을 졸업하고 14년 후에 만든 것은 가난한 사람들을 위한 기술 비용을 줄이는 것이었습니다. 아름다운 프로젝트지만 진행되지는 않았고 생성된 다음 해에 중단되었습니다. 그리고 2020년 말 Stability AI가 등장했습니다.
이미저를 AI와 함께 사용하는 방법은 무엇입니까?
Stable Diffusion의 데모 버전을 무료로 사용해 볼 수 있습니다. 브라우저에서 작동 같은 페이지에 액세스하는 경우에도 허긴페이스 (협력사 시작 도구 개발), DreamStudio (도구에 대해 Stability AI에서 만든 상업 페이지) 및 구글 콜라보. 그러나 모두 영어로 되어 있어 직관적인 인터페이스가 아닙니다. 멋진 이미지를 생성하는 도구를 얻는 데 시간이 걸리므로 인내심을 가져야 합니다. DreamStudio 페이지에서 도구를 다운로드하여 설치할 수도 있습니다.
AI 이미지 생성기를 사용하는 방법과 관련하여 일부에서는 이를 조립할 때 다른 도구를 선택하는 음악 프로듀서나 비주얼 아티스트와 마찬가지로 마치 악기처럼 작업한다는 아이디어를 지지합니다. 비트 또는 그림을 그립니다.
요즘에는 하나 이상의 AI 이미저가 있으며 각각 장단점이 있습니다. 그렇다면 그것들을 결합하여 무언가를 만들어 보지 않겠습니까? 그것이 Karen Cheng 감독이 시도한 것입니다. 그녀는 AI를 사용하여 옷 조각을 생성하고 비디오에 겹치는 아이디어를 내놓았고 Twitter의 스레드에서 전체 프로세스를 공유했습니다(이 경우 DALL-E 및 EbSynth를 사용함).
오픈 소스 및 기타 문제

좋아요, 지금까지 우리는 창의적인 프로젝트를 위한 Stable Diffusion(및 이와 유사한 생성기)의 잠재력을 보았습니다. 그러나 세상은 하나의 큰 디즈니랜드가 아닙니다. 인터넷이 훨씬 적습니다. 따라서 이러한 강력한 도구를 개방적이고 거의 제한이 없는 방식으로 출시하는 Stability AI의 태도의 까다로운 측면을 지적할 필요가 있습니다.
이 도구가 대중에게 공개되면서 문화적, 경제적 영향과 관련된 두려움으로 인해 많은 사람들이 경계 상태에 놓였습니다. Dall-e와 달리 Stable Diffusion 데이터베이스는 누구나 너무 많은 제한 없이 조정하고 사용할 수 있습니다.
실제로 이는 사람들이 Stable Diffusion을 사용하여 예를 들어 OpenAI가 Dall-e에 표시하는 이미지를 생성할 수 있음을 의미합니다. 이러한 유형의 이미지 중에는 폭력적인 장면, 음란물, 기업 및 저작권을 침해할 수 있는 장면, 딥 페이크 유명인사 및 허위사실 유포 및 가짜뉴스 제작.
도구의 "공식 버전"에는 과도한 노출 등을 차단하는 필터가 있습니다. 그러나 오픈소스 덕분에 이러한 장벽을 극복할 수 있습니다. 그리고 Stable Diffusion은 사용하려는 모든 사람이 사용할 수 있다는 점을 고려하면 숨겨진 동기로 사용을 제어(및 차단)하는 것은 기본적으로 불가능합니다. 이에 대해 Stability AI의 CEO는 다음과 같이 말했습니다.
우리는 개인의 책임을 믿습니다. 손상을 완화하기 위한 사용 정책 및 도구를 포함합니다.
Art Technica 웹사이트와의 인터뷰에서 Startup Stability AI의 창립자이자 CEO인 Emad Mostaque
혼란을 야기한 또 다른 전선은 예술가의 스타일을 모방하는 Stable Diffusion의 능력입니다. 요점은 회사가 허가를 요청하거나 어떤 종류의 합의도 없이 아티스트의 작업으로 도구를 "공급"했다는 것입니다. 이로 인해 많은 윤리 및 저작권 문제가 제기되었습니다.
회사의 다음 단계
그럼에도 불구하고 Stable Diffusion의 성공은 출시된 지 한 달도 되지 않았지만 이미 시장에서 Stability AI의 가치를 높였습니다. 이 회사는 미화 100억 달러(현재 시세로 R$ 523억 500만)의 자원을 조달하기 위해 투자자들과 미팅을 갖기도 했습니다. Forbes 소식통에 따르면 투자 회사는 스타트업의 가치를 2,6억 달러(R$ XNUMX억)로 높이는 거래를 성사시키는 데 관심을 표명했을 것입니다.
이 회사의 CEO는 최근 한 인터뷰에서 이렇게 말했다. 기계 학습 "주도적인 정부 및 기관"과의 파트너십을 목표로 하는 YouTuber Yannic Kilcher.
Mostaque는 또한 소셜 네트워크에서 Stability AI가 Stable Diffusion을 "교육"하기 위해 미화 600만 달러(R$3,1만)를 투자했다고 공유했습니다. 지금까지 투자는 성과를 거두었습니다.
참조 :
이미지생성 AI DALL-E 공개 테스트 진행 e DALL-E는 이제 예술 작품의 경계 너머에 있는 것을 상상합니다.
출처 : ARS Technica, 하 카다이, 안정성 AI, 테크 크런치, 포브스 e DevOps (개발 운영)
쇼메텍에 대해 자세히 알아보세요.
최신 뉴스를 이메일로 받아보시려면 등록하세요.