'기회'라는 특별한 시간에 대해 얘기합니다. 안녕하세요, 구독자님.
이번 한 주도 보람차게 보내셨나요?
그리스 신화에 '시간'을 의미하는 신으로 크로노스(Chronos)와 카이로스(Kairos)가 나옵니다. 크로노스는 가이아의 열두 자식 가운데 막내로 제우스의 아버지인데, 자식 중 누군가가 자신을 몰아낼 것이라는 저주가 두려워 자식들이 태어나자마자 하나씩 삼켜버립니다. 그러나 엄마 레아와 가이아의 기지로 목숨을 건진 막내 제우스는 훗날 장성해 티탄족과의 전쟁을 승리로 이끌면서 크로노스의 배 속에 있던 형제들을 구출해 냅니다. 그에 비해 또 다른 시간의 신 카이로스는 제우스의 아들입니다. 제우스의 아버지와 자식이 각각 '시간'의 신이라니 참 독특한 설정이죠?
크로노스와 카이로스 둘 다 '시간'의 신인 것은 맞지만 의미하는 바는 다릅니다.
크로노스의 '시간'은 연속성과 관련이 있는데 이는 우리가 일상적으로 경험하는 직선적인 시간의 흐름, 즉 끊임없이 흘러가고 지나간 순간은 다시 돌아오지 않는 그런 시간을 의미합니다. 크로노스가 자식들을 삼킨 것을 두고 '과거가 미래를 삼키는 시간'으로 해석되는 경우도 있는데 과거에 얽매여 미래를 망치는 그런 경우를 빗댄 것일지도 모르겠습니다.
반면에 카이로스(Kairos)의 '시간'은 특별한 기회나 중요한 순간을 의미하며 여기서는 올바른 결정과 빠른 결단이 중요합니다. 그래서인지 신화 내용이나 옛 조각상에서 볼 수 있는 카이로스의 외모는 '기회'의 개념을 설명하듯 독특한 모습을 하고 있습니다. 그리스 시라쿠사 거리에 카이로스 동상이 있는데 거기에 새겨진 에피그램에는 아래와 같이 적혀 있다고 합니다.
"내 앞머리가 무성한 이유는 내가 나타났을 때 사람들이 나를 쉽게 붙잡을 수 있게 하기 위함이며, 내 뒷머리가 대머리인 이유는 내가 지나고 나면 다시는 나를 잡을 수 없게 하기 위함이요, 손에 들고 있는 칼과 저울은 나를 만났을 때 신중하게 바르게 판단하고 신속하게 의사 결정을 하라는 뜻이다. 등과 발에 날개가 달린 이유는 최대한 빨리 사라지기 위함이다. 나의 이름은 '기회'이다.” (출처)
위에 언급한 것처럼 두 가지 '시간'의 의미를 생각해 볼 때, 우리는 크로노스의 '연속적인 시간'과 카이로스의 '기회의 순간'을 함께 살아가고 있다고 할 수 있습니다. 늘...
|
|
|
AI는 거품이냐 아니냐의 논쟁이 있을 정도로 비즈니스 시장의 핵심 키워드 중 하나로 여겨지고 있습니다. 빅데이터, IoT, 클라우드 컴퓨팅을 위주로 한 DX(Digital Transformation)이라는 용어가 IT 업계에 화두처럼 떠올랐던 때가 있었습니다. 비즈니스 데이터와 이에 대한 분석을 통한 업무 프로세스와 신속한 의사결정, 조직 문화 혁신 등이 목표였죠. 하지만, 데이터의 수집, 정제와 분석이 생각만큼 효과적이지 않았던 것도 사실입니다. 수개월 간 프로젝트를 진행해 박수 받으며 성공적으로 시스템을 가동했는데 얼마 지나지 않아 그 분석 기법이 효과가 없어지고 다시 그런 과정을 되풀이 해야 하는 사례들도 많았습니다. 처음하는 시도라 시행착오도 있었을테지만, 그보다는 목표를 달성할 수 있을만큼의 충분한 기술적인 준비가 되지 않았었기 때문입니다.
그런 상황에서 딥러닝을 기반으로 한 AI 분석 기법들이 등장했고 이들은 이전의 방식보다는 더 높은 가능성을 보여주고 있고 일부에서는 이미 그 결실을 누리고 있습니다. AI 기술이 전 산업으로 스며들고 있는 현재는 '크로노스의 시간'인 셈입니다. 어떤 이는 1990년대 인터넷의 등장과 함께 왔던 닷컴 버블을 지금과 빗대기도 합니다. 자산시장에서 발생한 닷컴 버블로 인해 이후 경제 위기를 맞도 것은 맞지만, 당시 개발되었던 많은 기술들은 이후 곳곳에 녹아 들어 산업이 다시 발전할 수 있는 근간이 된 것도 사실입니다. 과거의 아픈 경험이 실패였다고 간주할 필요도 없고, 과거와 비슷하다고 미래까지 꼭 같은 결말이 될 것이라고 예단할 것도 아니라고 생각합니다. 경험에서 배운 것으로 다른 결말을 만들어낼 수 있기 때문입니다.
앞머리를 휘날리며 다가오는 '기회'처럼 보이는 녀석이 있습니다. 험상굿게 생긴 '위기'라는 녀석과 함께 다가오고 있습니다. 이제 막 우리 곁을 지나가려고 합니다. 혹시나 아니면? 하는 두려움과 그 곁에 있는 '위기'라는 녀석의 기에 눌려 선뜻 손을 뻗어 잡아채질 못합니다. 이런 상황은 살다보면 많이 경험하게 됩니다. 중요한 것은 얼마나 먼저 '기회'가 오고 있는지를 알아보는 것, 그리고 분명히 '기회'라고 판단할 수 있는 안목이라고 생각합니다. 그러려면 미리부터 다양한 분야에 관심을 가지고 다가오는 '기회'의 정체를 파악하려고 노력하는 모습이 있어야 할 것 같습니다. 아무쪼록 '크로노스의 시간'을 보시면 놓치지 않으시길 바랍니다. ^^ |
|
|
EU AI 분야에 반독점법 위반 조사 진행
프랑스에서 엔비디아에 대한 반독점법 위반 관련 조사를 진행될 것이라고 합니다. 미국에서는 이미 진행 중인 상태인데, EU 소속 국가로 확대되고 있는 모습입니다. 사실 엔비디아가 AI 산업에 미치는 영향의 정도를 생각하면 그럴만도 할 것 같습니다. GPU, CUDA를 통해 AI 하드웨어와 소프트웨어 생태계를 독점하다시피 하고 있기 때문입니다. 이 외에 중국 쪽 규제당국에서도 비슷한 움직임을 보이고 있다고 하네요. (기사) 모바일 시장에서도 EU의 디지털시장법(DMA)에 따른 반독점 조사가 진행될 전망입니다. MS와 OpenAI의 파트너십, 삼성전자 갤럭시 시리즈에 구글의 AI 모델 선탑재 등이 대상인데요... 이를 의식해서인지 애플은 EU 회원국 내에서 AI 기능 탑재를 보류하겠다는 입장을 이미 밝힌 바 있습니다. (기사) 자국의 AI 산업을 보호하기 위한 국가 별 보호주의가 결과적으로 소비자들에게 더 좋을지 아닐지는 의견이 분분합니다. |
|
|
AI 경쟁은 국가대항전
지난 6월 26일 '국회 AI 포럼' 창립기념식이 있었는데 이날 기조연설을 한 하정우 네이버 퓨처AI센터장은 AI 경쟁이 국가대항전의 성격을 띄고 있어서 정부의 적극적인 지원이 필요함을 역설했습니다. 실제 LLM으로 대변되는 현재의 생성형 AI 시장은 미국, 프랑스, 중국 등의 초강대국들의 각축전이 진행되고 있고 우리를 포함한 일부 나라를 제외하고는 대부분의 나라들은 이미 종속화가 진행되고 있다고 할 수 있을 것 같습니다. 우리도 사건의 지평선 근처에 있는 위태한 형국이죠. 이런 상황을 조금이라도 타개하기 위해서는 기업과 정부가 한팀이 되고 혹시나 불필요한 법안이나 규제 등이 AI 산업 발전에 걸림돌이 되지 않도록 해야 하며 가능하면 AI 요소 기술 개발 외에 산업에 적극적으로 적용해 많은 구축 사례를 만들어 내도록 지원하는 것이 필요할 것입니다. ( 기사) |
|
|
대기업들의 AI 부문 투자 및 성장 전략 제시
SK그룹이 2026년까지 AI와 반도체에 80조원을 투자한다고 밝혔습니다. HBM(고대역폭 메모리)는 SK하이닉스, AI 데이터센터는 SK브로드밴드, AI 서비스는 SK텔레콤이 각각 주도하는 방식으로 AI 밸류체인에 집중할 계획이라고 합니다. 이를 위해 나머지 사업들은 속도조절을 하고 175개가 넘는 계열사들의 효율화도 함께 진행할 것이라고 합니다. (기사, 기사) 이외에도 LGU+에서도 모든 B2B 사업 영역에 AI 기능을 추가하고 서비스를 고도화하겠다는 'All in AI' 전략을 공개했습니다. 기존 B2B 사업의 AI 전환, AI 신사업 진출, AI 인프라 매출 확대 등을 목표로 AI컨택센터, 기업 커뮤니케이션, 소상공인(SOHO), 모빌리티의 4개 분야에 대한 AI 응용 서비스에 집중한다고 하죠.(기사) |
|
|
OpenAI SORA를 이용한 최초의 상업용 광고 등장
최근 프랑스 칸에서 열린 '2024 칸 라이온스 페스티벌' (세계 최고의 크리에이티비티 페스티벌)에서 크리에이티브 에이전시인 네이티브 포린(Native Foreign)이 OpenAI의 비디오 생성 기술인 SORA를 이용해서 토이저러스의 브랜드 광고 영상을 만들어 공개했습니다. 토이저러스 창립자 찰스 라자러스와 장난감 가게의 변혁을 이끈 그의 아이디어에 대한 내용이라고 합니다. (기사) 솔직히 개인적으로는 영상의 품질을 떠나서 실제 사람이 나오는 광고와 비교해 약간은 어색한 느낌이 들었습니다. 하지만 만약 처음부터 AI가 만든 것이란 것을 모르고 봤다면 그 느낌은 덜했을 것 같긴 합니다. 어찌됐건 이 광고는 비디오 생성 AI 기술을 이용해 상업 광고에 적용한 첫 시도라는 것에 나름의 의미를 부여할 만한 것 같습니다. |
|
|
사진 : SORA를 이용해 만든 토이저러스 광고 영상 (출처) |
|
|
피그마(Figma), ‘피그마 AI’ 발표
피그마가 최근 열린 '컨피그(Config) 2024' 행사에서 새로운 UI 설계 방식과 생성형 AI 기능을 포함한 '피그마 AI'를 공개했습니다. 프롬프트를 이용한 이미지 생성, 배경제거, 프로토타이핑, 레이어 관리 등 다양한 편집 기능에 AI가 적용되었고 협업 기능도 함께 추가되어 기존 사용자들로부터 좋은 반응을 얻었습니다. 그 외에도 파워포인트나 키노트같이 사용할 수 있는 ' 피그마 슬라이드'라는 프리젠테이션 제작 툴도 함께 공개되었는데 어지간한 작업들은 거의 다른 도구 없이 피그마 내에서 다 가능한 수준까지 온 것 같습니다. ( 영상)
참고로 피그마는 UI·UX 시장에서 급성장하면서 기존 최강자인 어도비를 긴장시켜 2022년에는 어도비가 피그마 인수를 선언하게 만들었습니다. 하지만, 반독점 규제 때문에 불발되면서 결국 1.3조의 위약금을 물고 계약은 취소되었죠. 전세계 디자이너들 입장에선 인수합병으로 선택 옵션이 없어질 경우 생길 수 있는 요금 인상 위협이 없어져 다행이었고, 피그마로서는 받은 위약금으로 다른 기업을 인수할 수 있을만큼의 실탄을 확보할 수 있게 되는 장점이 있었다고 합니다. ( 기사) |
|
|
유엔, 중국 주도 AI 결의안 만장일치 채택
중국 주도로 제출된 AI 관련 결의안이 유엔 총회에서 미국을 포함한 140여 회원국의 만장일치로 채택되었습니다. AI 개발에서 국가 간 자유롭고 개방적이며 포용적이고 비차별적인 비즈니스 환경 조성을 추구해야 한다는 내용과 비군사 영역에서 모든 국가가 동등한 기회를 누려야 하고 개발도상국을 지원하기 위한 글로벌 협력을 촉구하는 내용도 담겨 있다고 합니다. 올 3월에는 AI의 안전한 사용과 관련된 미국 주도 결의안이 또 만장일치로 채택된 바도 있습니다. ( 기사) |
|
|
객체 감지나 인스턴스 분할과 같은 비전 모델은 이미지 내의 객체 위치 정보를 제공하지만 객체 간의 관계에 대한 의미적 정보가 부족하고, 이미지 캡셔닝 같은 경우는 의미적 정보는 제공되지만 위치 정보를 참조하지 않습니다. 그 결과 복합적인 작업이 필요한 경우에는 서로 다른 종류의 복수 모델을 개별적인 데이터셋을 이용해 학습하고 실행 시에도 개별적으로 구동될 수 있는 환경 구성을 하는 등의 작업이 필요하게 됩니다.
Florence-2는 마이크로소프트에서 공개한 객체감지, 이미지 캡션 생성, 시맨틱 분할, 구문 분할, 영역 제안, OCR, 이미지 그라운딩(특정 영역을 설명과 매핑) 등의 작업을 하나의 모델에서 수행할 수 있는 컴퓨터 비전 모델입니다. 이미지 인코더와 다중 모달 인코더-디코더로 구조를 가지고 있어 텍스트와 시각적 데이터를 통합하여 다양한 시각적 이해 작업을 수행할 수 있죠. 1억2천6백만 개의 이미지와 54억 개의 주석으로 구성된 데이터셋인 FLD-5B를 이용해 이미지, 영역/픽셀, 세밀한 시각-언어 정렬 등 다양한 수준의 작업을 적용하여 모델 학습을 진행했다고 합니다. 모델의 크기가 다른 모델 대비 상대적으로 작으면서도 다양한 작업에서 높은 성능을 제공하며 MIT 라이선스를 따릅니다.
|
|
|
사진: Florence-2 모델의 구조와 작동 방식 (출처) |
|
|
Tender는 텍스트 기반 2D 전신 인간 동작 생성을 위한 모델로 Holistic-Motion2D 데이터셋과 함께 공개되었습니다. 2D 동작데이터는 수집이나 데이터 처리가 3D 데이터에 비해 상대적으로 용이하기 때문에 더 확장 가능하고 다양한 형태로 제공될 수 있습니다. 2D 동작 데이터는 신체 부위의 키포인트들로 구성되는데 이것과 텍스트 설명을 결합해서 동작을 생성하면 2D 신체 부위 키포인트들의 동작 시퀀스가 생성됩니다.
Tender 프레임워크는 PA-VAE(부위 인식 변이 오토인코더)와 트랜스포머 기반 확산 모델, CAG(신뢰 인식 생성)을 갖춘 전신 부위 인식 주의 메커니즘으로 구성되어 있습니다. 사람의 행동이 기록된 비디오 클립이 있고, 신체의 키포인트 데이터와 행동에 대한 설명 텍스트 데이터가 있다고 할 때, PA-VAE는 신체 움직임을 작은 부분(팔 움직임, 다리 움직임 등)으로 나누고 모델이 처리할 수 있는 형태로 인코딩합니다. 트랜스포머 기반 확산 모델은 인코딩된 부분을 사용하여 텍스트 설명을 조건으로 동작 시퀀스를 생성하고 CAG는 신체 부위 간의 공간적 관계를 모델링해서 신체의 모든 부분의 현실적이고 일관된 움직임을 보장하는 역할을 수행합니다.
|
|
|
사진 : Holistic Motion2D 데이터셋과 생성된 2D 전신 동작 움직임 예시 (상), Tender framework (하) (출처) |
|
|
MatMul-free Language Model
|
|
|
MatMul-free Languge Model (이하 MLM)은 LLM(대규모 언어모델)에서 행렬 곱셈을 완전히 제거하면서도 성능을 유지하도록 만든 모델입니다. 대부분의 신경망의 모델 학습과 추론 과정에는 아주 많은 행렬 곱셈이 사용됩니다. 처리해야 하는 데이터의 양이나 네트워크의 복잡도 등 다양한 이유로 인해 행렬곱의 양도 달라지게 되는데, LLM은 특성 상 많은 양의 행렬곱을 필요로 합니다.
일반적으로 Dense 레이어에서 입력 벡터와 가중치 행렬의 곱으로 출력을 계산하게 되는데 가중치를 {-1, 0, +1}의 값으로 제한하게 되면 곱셈 대신 덧셈과 뺄셈으로 계산을 대체할 수 있게 됩니다. 또, Self-Attention도 입력 벡터의 상호 관계를 계산하기 위해 행렬곱을 많이 사용하게 되는데 GRU(Gate Recursive Unit)가 상태를 업데이트하는 과정에서 행렬곱을 요소 별 곱셈 (element-wise multiplication)으로 대체하는 방식으로 변경했습니다. MLM을 이용하면 행렬곱을 하지 않아 추론시에는 메모리 사용량을 10배 가량 감소시킬 수 있으며 , GPU나 FPGA와 같은 하드웨어에서 경량화된 연산을 활용하여 더 효율적으로 작동하도록 할 수 있습니다.
|
|
|
사진 : MatMul-free LM 개요 (출처) |
|
|
MediaPipe LLM Inference task for web
|
|
|
LLM Inference는 구글이 브라우저 상에서 WebGPU를 이용해 LLM을 구동할 수 있도록 만든 기술입니다. index.html, index.js 파일로 구성되어 있는데 mediapipe를 이용해 LLM을 구동시키는 방식이죠. 공개되어 있는 Github repo에는 디폴트로 gemma-2b 사전 학습 모델의 가중치 파일이 사용되는데 해당 파일은 Kaggle 계정이 있을 경우, 다운받아서 테스트 할 수 있습니다. Gemini-Nano의 사전학습모델 가중치를 Chrome에서 추출해서 HuggingFace 상에 공개해 둔 분이 있어서 거기서 가중치 파일(weight.bin)을 다운 받아 대체해서 사용해 봤는데 아무래도 nano 모델이라 질문에 대답하지 못하거나 엉뚱한 얘기를 하는 경우도 많고 한글도 지원되지 않아서 만족스럽지는 않았습니다. 하지만, WebGPU를 이용해 별도의 AI 프레임워크 없이 브라우저만으로 로컬에서 실행할 수 있으므로 나름의 응용 영역이 있을 것이라 생각됩니다.
|
|
|
사진 : Gemini-nano 사전학습모델 가중치를 이용해 진행한 Local 브라우저 상에서의 테스트 결과 |
|
|
인공지능 서비스의 배포와 운영 시 도움이 필요하신가요?
(주)소이넷은 인공지능 서비스를 제공하는 기업들 가운데 서비스 배포와 운영에서 어려움을 겪고 계신 곳에 도움을 드릴 수 있습니다.
혹시 구독자님의 회사는 다음과 같은 어려움을 겪고 계시지 않나요?
- AI 모델을 개발하고 학습 후 서비스를 위한 성능(Accuracy)은 달성했는데, 정작 최적화 엔지니어가 없어서 어플리케이션, 서비스로의 배포를 위한 실행최적화를 못하고 있어요!
- AI 서비스를 이미 제공하고 있지만, 비싼 클라우드 GPU 서버 인스턴스 사용료가 부담이 되네요. 흠... 경비를 절감할 수 있는 방안이 없을까?
- 서비스에 적합한 공개 SOTA 모델이 있지만 그대로 가져다 쓰기에는 우리 쪽 어플리케이션에 접목하기도 어렵고 운영 비용도 많이 들 것 같은데 어쩌지?
- 서비스에 사용되는 AI 모델을 통합적으로 관리, 배포, 모니터링을 하고 싶은데 그렇다고 비싸고 너무 복잡한 솔루션을 쓸 수는 없고 어쩌지?
- 비즈니스 도메인 기업이긴 한데 자체로 인공지능을 적용하기에는 기술적인 난이도도 있고... 어디 함께 공동 솔루션을 개발할 곳은 없을까?
그렇다면 언제든 아래 연락처로 문의 주세요. 함께 해결책을 고민해 드리겠습니다.
|
|
|
오늘의 뉴스레터는 여기까지 구독자님, 다음 번에도 재미나고 흥미로운 소식을 가지고
다시 찾아뵙겠습니다. |
|
|
구독해 주시면 좋은 소식, 정보로 보답하겠습니다. |
|
|
주식회사 소이넷 sales@soynet.io 경기 성남시 분당구 성남대로331번길 8 (킨스타워) 1503호
대표전화 : 031-8039-5377
|
|
|
|
|