Stable Diffusion 모델 알아보기 안녕하세요, 구독자님.
다음 주면 3분기를 마감하고 새로운 분기의 첫 날을 맞이하게 됩니다. 잘 아시는 바와 같이 개천절 연휴가 있어서 몸과 마음을 쉬게 하고 산뜻(?)하게 시작할 수 있지 않을까 하는 기대를 해 봅니다. 하지만, 당장은 전세계 경기침체 기운과 국가간의 분쟁 등으로 인해 어수선한 상황이 계속 이어지고 있어서 그닥 편치 않은 시기인 것 같습니다.
이럴 땐 눈을 잠시 새롭고 재미난 것에 돌려보는 것이 정신건강에 도움이 될 것 같습니다. 예를 들면 인공지능이 만들어내는 그림 같은 것으로요... 그리고나서 차주에 코엑스에서 열리는 '제 53회 한국전자전'에 대해서도 짧게 언급 드릴게요. |
|
|
Stable Diffusion이란? 최근 아주 핫한 Text to Image, 즉 입력된 텍스트 문장을 이용하여 이미지를 생성하는 딥러닝 모델 중 하나입니다. 이와 같이 입력문장을 이미지로 생성하기 위한 모델들은 이제까지 다양한 접근을 시도했었습니다. VAE (Variational Auto-Encoder), GAN(Generative Advarsarial Network), Likelihood Based Model, Diffusion Model 등등이 그것이죠. 이 가운데 Stable Diffusion은 이름 그대로 Diffusion(확산) 기반의 모델입니다. Diffusion model 자체에 대한 이해를 위해서는 논문 리뷰 등을 하는 링크를 찾으면 되겠찌만 이곳 글 목적에는 안 맞으니 패스합니다. 복잡하지만 수식까지 포함해서 자세히 알고 싶다면 이곳을 참고하시고 좀 더 쉽게 설명된 것을 찾으려면 이곳을 참고해 보시기 바래요.
이 모델의 개발과 공개에는 다양한 기여자가 있는데 그들이 StabilityAI, CompVis, Runway팀, EleutherAI 등입니다. 공식 릴리즈에는 참조했던 다른 많은 모델과 협력한 팀에 대한 언급이 있습니다. (참조)
Stable Diffusion 모델은 DALLE-2와 유사한 수준의 품질을 제공하지만, 훨씬 낮은 사양의 GPU에서도 동작하죠. 심지어는 5GB 이하의 VRAM GPU에서도 동작하도록 변형된 구현체도 있습니다. (아래 관련정보 참조)
Stable Diffusion은 공개 후 전세계 수많은 사람들이 이를 테스트해 보고 글이나 유튜브에 공개하고 있죠. 다른 모델들 대비 월등히 뛰어난 것이냐면 꼭 그런 것은 아니지만 사용하는 개인들에게 직접 사용할 수 있는 자유를 선사했기 때문이라 생각됩니다. 10GB 미만의 VRAM을 가진 GPU만 있으면 누구나 집이나 사무실에서도 이 모델을 돌릴 수 있다니까 말입니다. 게다가 Creative ML OpenRAIL-M 라이선스로 공개되어 있어 상용으로도 사용할 수 있도록 하였습니다.
예전 뉴스레터에서 초거대 AI모델에 대해 언급한 적이 있었습니다. GPT-3와 같이 언어 쪽에 주로 사용되는 모델이 있는가 하면 OpenAI의 DALLE-2나 구글의 Imagen과 같이 prompt를 주면 이를 해석하여 이미지를 생성해 주는 모델도 있죠. 하지만 것들을 일반인들이 손쉽게 접하기는 힘들다고 말씀드린 바 있습니다. 서비스를 위해 필요한 인프라 비용 때문에 쓸만한 수준의 이미지를 만들어 내려면 다소간의 비용이 든다고 말이죠.
그런데 Stable Diffusion은 좀 상황이 다릅니다. 돈 많은 독지가(Emad Mostaque, StabilityAI 설립자)가 인프라 비용을 대는 바람에 누구나 제공되는 Gradio 앱을 통해서 테스트하고 결과물을 볼 수가 있습니다. (관련영상) 생성된 이미지 자체에 대한 저작권과 관련해서는 아직은 논쟁 중이므로 논외로 할게요.
테스트를 직접 해 볼 수 있다고요?
Stable Difussion을 테스트 해 볼 수 있는 링크는 이곳입니다. Stabilityai 라는 곳에서 HuggingFace에 올려둔 gradio 앱을 이용하는 것입니다. 아래는 그곳에서 테스트 해 본 예시 이미지입니다. 입력한 prompt로 아래 4장의 이미지를 생성하는데 소요되는 시간은 수십초 가량 밖에 되지 않습니다. prompt 내용에 따라 아주 다양한 이미지를 생성할 수 있습니다. 심지어 자신이 좋아하는 화가의 스타일을 적용할 수도 있죠.
|
|
|
이 모델에 대한 관련 정보는 어디에 있나요? 공식 링크를 포함해서 다양한 관련 정보가 있었습니다. 아래를 참조하세요.
|
|
|
제 53회 한국전자전 (KES 2022) 소개 |
|
|
어떤 전시회인가요? 한국전자전은 산업통상자원부가 주최하고 한국전자정보통신산업진흥회가 주관하는 국내 대표적인 전자,IT 분야 전시입니다. 제 53회라고 되어 있어서 설마... 하며 알아봤더니 정말 1969년 제 1회 전시가 있었더군요. 헉... 했습니다. 이렇게 오랜 역사를 지닌 전시가 국내에 다른 것들이 있을려나 모르겠습니다.
전시는 2022년 10월 4일(화)부터 7일(금)까지 코엑스 Hall A,B,C,D1에서 진행됩니다.
KES2022에는 몇 가지 세부 전시가 함께 진행됩니다. 전시장은 코엑스 1층 Hall A, B와 3층 Hall C, D1인데, 1층 전시장에서는 스마트비즈엑스포, 혁신산업대전, 메타버스코리아가, 3층 전시장에서는 반도체대전(SEDEX)가 진행됩니다. 물론 티케팅은 통합해서 하나로 돌아보실 수 있습니다.
어떤 것을 볼 수 있나요?
한국전자전에서는 아래와 같이 전자/전기, IT 전분야에 걸친 기술과 제품들을 보실 수 있습니다. ( 출처) |
|
|
소이넷 부스는 어디에 있나요?
저희 부스는 Hall B의 N112 입니다. 세부 전시 중 Inno FuTech 2022로 참여하고 있습니다. 오셔서 실행최적화 솔루션 SoyNet과 이를 이용해 최적화된 모델들의 Marketplace에 대한 설명과 실제 데모를 직접 눈으로 확인해 보세요. ^^ |
|
|
전시회를 참관하려면 어떻게 해야 하나요?
아래에 있는 이미지를 출력해서 가져오셔서 현장에서 등록을 하셔도 되고 이곳에서 미리 사전등록을 하고 오셔도 됩니다. (후자를 추천드립니다)
|
|
|
인공지능 서비스의 배포와 운영 시 도움이 필요하신가요?
(주)소이넷은 인공지능 서비스를 제공하는 기업들 가운데 서비스 배포와 운영에서 어려움을 겪고 계신 곳에 도움을 드릴 수 있습니다.
혹시 구독자님의 회사는 다음과 같은 어려움을 겪고 계시지 않나요?
- AI 모델을 개발하고 학습 후 서비스를 위한 성능 (Accuracy)는 달성했는데, 정작 최적화 엔지니어가 없어서 어플리케이션, 서비스로의 배포를 위한 실행최적화를 못하고 있어요!
- AI 서비스를 이미 제공하고 있지만, 비싼 클라우드 GPU 서버 인스턴스 사용료가 부담이 되네요. 흠... 경비를 절감할 수 있는 방안이 없을까?
- 서비스에 적합한 공개 SOTA 모델이 있지만 그대로 가져다 쓰기에는 우리 쪽 어플리케이션에 접목하기도 어렵고 운영 비용도 많이 들 것 같은데 어쩌지?
그렇다면 언제든 아래 연락처로 문의 주세요. 함께 해결책을 고민해 드리겠습니다.
- 메일 : support@soynet.io또는 sales@soynet.io
|
|
|
오늘의 뉴스레터는 여기까지 구독자님, 높고 푸른 가을하늘이 주는 여유로움을 가족, 친구들과 함께 나눌 수 있는 하루 보내시기 바라며 또 다른 소식으로 만나뵙겠습니다. |
|
|
구독해 주시면 좋은 소식, 정보로 보답하겠습니다. |
|
|
주식회사 소이넷 sales@soynet.io 경기 성남시 분당구 성남대로331번길 8 (킨스타워) 1503호
대표전화 : 031-8039-5377
|
|
|
|
|