근로자의 날과 어린이날, 직장인들에게는 뜻깊은(^^;) 이런 날이 둘이나 포함된 멋진 한 주입니다! 화창한 날씨에 짙은 초록 나뭇잎들, 온갖 화려한 꽃들, 살랑거리는 바람 등, 온통 마음을 싱숭생숭하게 만드는 것들 투성입니다. 하지만 몸은 일에 묶여 언제든 탈출하고픈 마음을 안타깝게 만들고 있죠. 헛... 저만 그런가요?
이번 주 소식은 특별한 주제 대신 인공지능 관련한 새로운 소식들 몇 가지와 차주에 있을 국제인공지능대전 전시회 안내로 대신 하겠습니다.
인공지능 관련 핫 뉴스
지난 소식 이후에 나왔던 소식 중 제 눈에 띈 것입니다.
OpenAI의 Brand Guideline 발표 (OpenAI , 인공지능신문 기사) OpenAI가 자사 제품들 (예:ChatGPT, DALL-E 등)의 상표(상호)에 대해 전반적인 가이드라인을 발표했습니다. 여기에는 ChatGPT의 API를 이용하면서도 별도의 솔루션인 것처럼 오해될 수 있는 'xxxxGPT' 와 같은 표현을 사용해서는 안 된다는 것이 포함되어 있습니다. 만약 이름은 xxxxGPT와 같이 쓰면서 자사 제품과는 무관하게 개발된 것이면 오해받지 않도록 명시를 해야한다죠. 참고로 OpenAI는 2022년 12월에 미국 특허청에 'GPT'라는 상표를 출원한 바 있다네요.
인공지능과는 직접적인 관련은 없지만, 관련 비즈니스 쪽에서 영향을 받을만한 기사라 생각되어 이것도 소개합니다.
비슷한 사업이면 규제샌드박스 승인 기간 반으로 줄인다 (바이라인네트웍스, 2023.5) 규제샌드박스(실증특례 또는 임시허가) 승인 시 기존에 신청한 제품이나 서비스와 내용, 방식 등이 유사하거나 동일하면 신속처리절차(패스트트랙)를 통해 승인에 소요되는 기간을 대폭 줄이겠다고 합니다.
Transformer 기반의 텍스트-오디오 모델로 입력된 텍스트 프롬프트에 해당하는 음성을 생성합니다. 특징적인 것은 음성 외에 음악, 배경소음, 음향효과 등이 가미될 수 있다는 것고 마치 사람이 얘기할 때 처럼 한숨이나 피식 웃음 등도 포함될 수 있다는 것입니다. MIT 라이선스의 오픈소스로 공개되었으니 이를 응용한 서비스도 곧 나오지 않을까 싶습니다. 참고로 공식지원되는 언어에 한국어도 포함되어 있어 아주 잘 되며 언어 별 다양한 Speaker(화자) library가 제공되고 있습니다. 다만, 출력이 13~14초 이내로 제한된다고 하니 이를 감안해서 사용하시면 될 것 같습니다.
Meta(Facebook)에서 발표한 모델로 이 또한 MIT 라이선스의 오픈소스로 공개되었습니다. 데모 링크를 통해, 직접 그린 이미지를 업로드해서 자신만의 영상을 직접 만들어 볼 수도 있습니다. 집에 아이가 있으시면 그림을 그려보라고 하고 데모 링크에 업로드해서 생성된 mp4 영상을 내려받아서 보여주시면 아주 재미있어 할 겁니다. 기본 모션 데이터는 포함되어 있는데, 혹시 자신만의 모션 데이터를 이용하고 싶으면 RGB 비디오(예:웹캠 촬영 영상)를 Rokoko라는 툴을 이용해서 BVH(BioVision hierarchical data) 파일로 내보내고 그것을 이용하시면 됩니다.
그림) 카메라 영상의 움직임을 따라서 움직이는 캐릭터들. 원본은 animated gif입니다. (출처)
'AI Expo Korea 2023' (2023 국제인공지능대전)
코엑스에서 5.10(수) – 5.12(금)까지 3일간 'AI Expo Korea 2023' (2023 국제인공지능대전) 전시가 진행됩니다. AI 도입을 위한 솔루션과 AI 융합 제품/플랫폼을 소개하는 대표적인 전시입니다. 많은 인공지능 업체가 각자의 솔루션을 가지고 나오겠죠. 최근 들어 ChatGPT와 생성모델의 등장으로 많은 응용 서비스들이 나오고 있고 사람들의 기대도 그만큼 높아진 터라 사뭇 기대됩니다. ^^
상세한 정보는 제공되는이곳을 참고하시고, 온라인 사전참관 등록은 이곳에서 진행하실 수 있습니다.