삼일절을 맞는 마음가짐에 대해 생각해 봅니다 안녕하세요, 구독자님.
즐거운 한주 보내셨나요?
내일은 일제 지배에 항거해 한일병합 조약의 무효와 우리나라의 독립을 선언한 3.1 운동이 일어난지 105주년이 되는 날입니다. 1919년 3월 1일, 민족대표 33인 가운데 29인은 서울 인사동에 있는 태화관에 모여 독립선언서(' 기미독립선언서')를 낭독하는 선언식을 거행했습니다. 탑골공원에서 진행된 것으로 알고 계신 분도 많을텐데 이는 모여있던 학생들 가운데 한 청년이 낭독한 것이라고 합니다. 선언 장소를 바꾼 것은 학생들의 희생을 염려한 것이었다는 설명도 있더군요. ( 링크) 이후 여기서 시작된 비폭력 만세운동은 전국적으로 퍼져나갔습니다. 독립선언이 있었던 3월 1일은 고종황제의 장례식이 있던 날이기도 했습니다. 당시 갑작스레 그것도 이상한 증세를 보이며 돌아가셔서 독살설이 퍼진 상태였죠.
이후 이 독립선언을 기초로 같은 해(1919년) 4월 11일 중국 상해에서 대한민국 임시정부가 수립되었습니다. 당시 임시정부에서의 삼일절의 명칭은 '독립선언일'로 불렀다고 합니다. 3.1운동과 임시정부와의 관련성은 헌법 전문에서도 볼 수 있는데, 대한민국 헌법 전문(개정)의 맨 첫 부분에 다음과 같이 적혀 있죠.
"유구한 역사와 전통에 빛나는 우리 대한국민은 3·1운동으로 건립된 대한민국임시정부의 법통과 불의에 항거한 4·19민주이념을 계승하고, 조국의 민주개혁과 평화적 통일의 사명에 입각하여 정의·인도와 동포애로써 민족의 단결을 공고히 하고, 모든 사회적 폐습과 불의를 타파하며, 자율과 조화를 바탕으로 자유민주적 기본질서를 더욱 확고히 하여 ......"
그런데... 검색을 해 보니 기미년(1919년) 독립선언 이전 1918년 11월 만주 길림에서 조소앙을 비롯해 해외에서 활동 중이던 독립운동가 39명이 참여한 대한독립선언서(大韓獨立宣言書) 선포(' 무오독립선언'이라고도 함)가 있었고, 1919년 2월에는 일본에서 동경유학생들을 중심으로 ' 2.8 독립선언서'가 선포되었다고 합니다. 이 두 선언은 1919년 3월에 있었던 기미독립선언 대비 상대적으로 덜 알려져 있지만, 하나는 최초이면서 만주에서 일제와 싸우던 독립운동가들이 대거 참여했다는 점에서, 또 다른 하나는 일제의 중심부에서 침략행위의 야만성을 폭로하고 독립을 부르짖었다는 측면에서 그 의미가 크다고 하겠습니다. ( 관련글)
'역사를 잊은 민족에게 미래는 없다'는 말이 있습니다. 힘이 없으면 외세에 휘둘릴 수 밖에 없다는 것은 우리나라가 겪어온 과거의 역사가 말해주고 있죠. 하지만, 이때의 '힘'은 단순히 군사력만을 의미하지는 않을 겁니다. 한 나라가 가진 자국의 인재, 주변국가들과의 외교 능력, 경제력과 문화가 가지는 힘 같은 것들도 포함될테니까요. 우리를 둘러싼 세계정세는 한치 앞을 가늠할 수 없는 상황이라 이 말을 다시 한번 되새겨 봐야 하지 않나 하는 생각을 하게 됩니다. 거기에 더해 과거의 일을 제대로 평가, 기록하고 이를 후손들에게 똑바로 전달할 의무는 현재를 살아가는 우리에게 있을텐데, 과연 지금 우리 세대는 이를 제대로 해 나가고 있는걸까 하는 물음도 늘 던져가며 살아야겠습니다. 물론 당시 독립운동을 하셨던 많은 분들께 감사하는 마음도 가져야겠죠. ^^
날씨가 점점 따뜻해지고 있습니다. 봄이 오고 있다는 얘기죠. 환절기가 가까워져 가니 다들 건강 유의하시고 의미있는 삼일절 연휴 맞으시기 바랍니다. |
|
|
퀄컴, 오픈소스 AI 모델 공개
Qualcomm AI가 80여개의 오픈소스 AI 모델을 HuggingFace에 공개했습니다. 여기에는 비전, 오디오, 음성 등을 처리할 수 있는 다양한 모델이 포함되어 있습니다. 이들은 또한 Qualcomm AI Hub( 링크)에서도 확인 가능합니다. 제공되는 모델들은 주로 자사의 Snapdragon 장치와 모바일 등에 Tensorflow Lite 혹은 Qualcomm AI Engine Direct SDK를 사용하여 배포할 수 있다고 합니다. ( 링크) |
|
|
지금부터는 구글에서 최근에 주목할만한 소식들을 많이 발표해서, 이것들을 몇 가지 요약 정리해 보겠습니다.
Gemini, 맥락을 고려하지 않은 이미지 생성으로 서비스 중단
구글의 생성형 AI 모델인 Gemini가 역사적 사실과 다른 이미지 생성을 하는 바람에 구설에 올랐습니다. 생성형 모델이 완전한 사실만을 보여주진 않는다는 것은 잘 알려진 일이죠. 하지만, 어느 정도는 역사적 사실의 맥락이 고려된 이미지가 나와야 하는데 그 선을 넘어버린 것이죠. 예를 들어 ‘1943년 독일군’이란 프롬프트로 동양인 여성이나 흑인 남성 이미지가 만들어진다거나 하는 것인데, 구글은 인종편견을 방지하기 위한 가이드라인을 너무 과도하게 설정한 것이 문제의 원인이라고 밝히고 이를 바로 잡기 위한 수정을 하기 위해 출시 20일만에 서비스를 중단했다고 합니다. ( 기사, 기사) |
|
|
프롬프트로 게임을 생성하는 Genie 공개
구글이 게임 메커니즘에 대한 사전 교육이 없이 사진이나 AI 생성 이미지, 개인이 직접 그린 스케치 등의 이미지를 기반으로 주어지는 프롬프트를 이용해 사용자가 컨트롤할 수 있는 2D 대화형 게임을 만드는 생성형 AI인 ' Genie'를 공개했습니다. 20,000 시간 이상의 2D 게임 비디오 영상을 학습하여 게임 플레이를 자율적으로 이해하게 되었다고 합니다. 캐릭터의 행동에 대한 훈련을 별도로 하지 않았음에도 캐릭터를 사용자가 제어할 수 있다고 하네요. AI가 스며드는 산업의 범위가 점차 확산되는 것 같아 두렵기도 합니다. 다음은 어느 영역일까... ( 링크) |
|
|
Gemma 모델군 오픈소스로 공개
구글이 최신 모델인 Gemini 기술 및 인프라를 기반으로 만들어진 Gemma라는 경량 생성형 모델군을 오픈소스로 공개했습니다. 사전학습(pre-trained), 지시 조정(instuction-tuned), 변형(variants) 버전이 지원되며, 개발 도구로는 개인정보 같은 민감 데이터를 학습데이터 셋에서 필터링하는 기술이 적용된 Responsible Generative AI Toolkit를 함께 제공합니다. 이번에 공개된 것은 2B, 7B 모델들인데 이미 비교 대상이 되는 다른 모델들의 성능을 뛰어 넘었었고, 클라우드 외에 모바일, 로컬 노트북/데스크탑에서 동작도 가능하며 GPU, TPU에 최적화하는 작업도 되어 있으며, Keras(3.0), Pytorch, JAX, HuggingFace Transformer 등의 멀티 플레임워크를 지원한다고 합니다. 써놓고 보니 이번 소식에는 구글 이야기가 많네요. ^^; ( 블로그) |
|
|
온디바이스 AI의 전망 언급
구글에서 내년 쯤이면 Gemini Ultrar급의 LLM을 스마트폰에 탑재할 수 있을 것이라는 전망을 내놨다고 합니다. 구글이 개발/판매 중인 픽셀폰의 최고 책임자의 언급에서 나왔다고 하니 완전히 허황된 얘기는 아니라고 생각됩니다. 다만, 아무리 압축 성과가 높다고 하더라도 클라우드 서버에서나 돌아갈 Gemini Ultra급 LLM을 스마트폰에 탑재하는 것은 어렵지 않을까 하는 생각이라 정식으로 나오기 전까지는 계속 반신반의할 것 같습니다. 구글이 이런 행보를 하는 이유는 그만큼 온디바이스 AI의 확산세가 가파르기 때문이기도 하고, 경쟁이 점점 치열해져가는 스마트폰 판매를 늘이기 위해서라도 레퍼런스폰인 픽셀폰에 최신 기능을 넣어서 발표하는 것이 필요하다는 판단에서가 아닐까 생각해 봅니다. 게다가 최근 열린 MWC 에서 지난 번 온디바이스AI를 발표한 삼성 외에도 다양한 업체들이 온디바스AI를 접목하려는 시도를 발표하고 있는 것도 이유가 될 수 있겠다 싶습니다. ( 기사) |
|
|
Multi-LoRA Composition for Image Generation
|
|
|
Microsoft와 일리노이 대학교 연구진이 텍스트 이미지 생성을 위한 새로운 접근방법으로 다중 LoRA(Low-Rank Adaptation) 구성방식인 LoRA Switch와 LoRA Composite를 발표했습니다. 별도의 미세조정없이 여러 개의 LoRA를 통합하는 것인데 기존 LoRA 가중치 병합 방식(LoRA Merge)과는 달리 개별 LoRA의 가중치는 그대로 유지하고 디코딩 프로세스에 중점을 두고 있습니다. 그러다보니 기존 방식에서 LoRA가 추가될 수록 디테일이 떨어지고 왜곡이 심해지던 현상을 개선할 수 있게 되었다고 합니다. GPT-4V를 이용해 구성 효율성과 이미지 품질을 평가했을 때 자동화된 평가와 인간 평가 모두 LoRA Merge 대비 뛰어난 것으로 확인되었다고 하네요.
|
|
|
EMO (Emote Portrait Alive)는 알리바바 그룹이 공개한 오디오 기반 초상화(portrait) 비디오 생성 프레임워크입니다. 참조 이미지 한장과 보컬 오디오 클립을 입력하면 오디오가 입혀진, 그것도 입모양과 안면 움직임 등이 자연스럽게 반영된 비디오 영상을 생성하는데, 250시간 이상의 영상과 1억 5천만 개 이상의 이미지를 학습 데이터셋으로 사용했다고 합니다. 공개된 데모 영상이 너무 자연스러워서 깃헙 게시판에는 실행 코드를 공개하기 전까지는 못 믿겠다는 반응도 일부 있었습니다. ^^; 이 경우처럼, 모델 공개 때 깃헙 링크를 함께 공개하면서 실행코드가 없는 경우들을 가끔 볼 수 있죠. 하지만 대부분 언제쯤 공개하겠다는 언급이라도 적혀 있는데 EMO는 그게 없어서 약간 아쉽습니다.
EMO는 얼굴 랜드마크나 3D 모델 방식을 사용하지 않고 직접 오디오 to 비디오 합성 방식을 적용했는데, 아무래도 전자의 방식이 연산량을 줄이는 장점이 있긴 하지만 표정의 풍부함과 자연스러움이 부족하다는 단점이 있었기 때문입니다. EMO의 네트워크 파이프라인은 프레임 인코딩과 확산과정으로 구성되는데, 프레임 인코딩 단계에서는 ReferenceNet을 통해 참조 이미지와 모션 프레임에서 Feature를 추출하고, 확산과정에서는 오디오, 얼굴 마스크, 멀티프레임의 노이즈 잠재입력, 머리 속도 정보를 백본 네트워크로 처리하여 캐릭터의 정체성을 보존하고 움직임 등을 안정적이고 자연스럽게 만들게 됩니다.
|
|
|
사진 : EMO의 네트워크 파이프라인 (출처) |
|
|
Genie에 대해서는 앞서 인공지능 뉴스 부분에서 언급한 바 있죠? Genie는 구글이 게임 메커니즘에 대한 사전 교육이 없이 사진이나 AI 생성 이미지, 개인이 직접 그린 스케치 등의 이미지를 기반으로 주어지는 프롬프트를 이용해 사용자가 컨트롤할 수 있는 2D 대화형 게임을 만드는 생성형 AI입니다. 기초 세계모델(foundation world model)로 시공간 비디오 토크나이저, 자동회귀 역학 모델, 그리고 확장 가능한 잠재 동작 모델로 구성됩니다. 20,000 시간 이상의 2D 인터넷 게임 비디오 영상 데이터셋으로 훈련해 게임 플레이를 자율적으로 이해하게 되었다고 합니다. 캐릭터의 동작에 대한 훈련을 별도로 하지 않았음에도 학습된 잠재 행동 공간을 통해 사용자가 프레임 별로 캐릭터를 제어할 수 있다고 합니다.
훈련 에이전트가 비디오 상의 행동을 모방할 수 있도록 함으로써, 게임이 아닌 일반 실생활을 에이전트로 훈련할 수 있는 가능성도 열었습니다. 앞서 언급된 것처럼 어떤 이미지든 이용할 수 있다고 했으므로 현실 세계의 사진을 이용해서 환경을 생성하고 그 속에 있는 사람이나 로봇 등의 캐릭터를 가상화시킨 세계를 만드는 것도 머지 않았다는 생각이 듭니다. 그것도 개인이 많은 비용이나 기술적인 어려움없이 말이죠.
참고로 Genie는 연구목적으로 논문과 결과 예시만 공개된 상태입니다.
|
|
|
사진 : Genie 모델의 학습 (상), Genie 개요 소개(하) (출처) |
|
|
인공지능 서비스의 배포와 운영 시 도움이 필요하신가요?
(주)소이넷은 인공지능 서비스를 제공하는 기업들 가운데 서비스 배포와 운영에서 어려움을 겪고 계신 곳에 도움을 드릴 수 있습니다.
혹시 구독자님의 회사는 다음과 같은 어려움을 겪고 계시지 않나요?
- AI 모델을 개발하고 학습 후 서비스를 위한 성능(Accuracy)은 달성했는데, 정작 최적화 엔지니어가 없어서 어플리케이션, 서비스로의 배포를 위한 실행최적화를 못하고 있어요!
- AI 서비스를 이미 제공하고 있지만, 비싼 클라우드 GPU 서버 인스턴스 사용료가 부담이 되네요. 흠... 경비를 절감할 수 있는 방안이 없을까?
- 서비스에 적합한 공개 SOTA 모델이 있지만 그대로 가져다 쓰기에는 우리 쪽 어플리케이션에 접목하기도 어렵고 운영 비용도 많이 들 것 같은데 어쩌지?
- 서비스에 사용되는 AI 모델을 통합적으로 관리, 배포, 모니터링을 하고 싶은데 그렇다고 비싸고 너무 복잡한 솔루션을 쓸 수는 없고 어쩌지?
- 비즈니스 도메인 기업이긴 한데 자체로 인공지능을 적용하기에는 기술적인 난이도도 있고... 어디 함께 공동 솔루션을 개발할 곳은 없을까?
그렇다면 언제든 아래 연락처로 문의 주세요. 함께 해결책을 고민해 드리겠습니다.
|
|
|
오늘의 뉴스레터는 여기까지 구독자님, 다음 번에도 재미나고 흥미로운 소식을 가지고
다시 찾아뵙겠습니다. |
|
|
구독해 주시면 좋은 소식, 정보로 보답하겠습니다. |
|
|
주식회사 소이넷 sales@soynet.io 경기 성남시 분당구 성남대로331번길 8 (킨스타워) 1503호
대표전화 : 031-8039-5377
|
|
|
|
|