주변에서 일어나고 있는 일로 관심을 돌려 봅니다. 안녕하세요, 구독자님.
한 주 잘 보내고 계신가요?
최근에는 뉴스를 보다 보면 격세지감을 느끼게 됩니다. 굵직한 사건, 사고들이 이렇게나 빈번하게 발생한 적이 있었던가 싶어서죠. 그래서 이번 소식에서는 그 가운데 몇 가지를 끄집어 내어 이야기를 해 보고자 합니다. 물론 굵직하다는 표현은 제 기준입니다. ^^;
우선 지난 7월 13일, 미국에서는 유력한 대통령 후보인 트럼프가 저격범에 의해 총격을 받는 사건이 있었습니다. 다행히 생명에 지장은 없다고 알려졌지만, 실시간으로 방송 중이고 많은 사람들이 운집해 있는 장소에서 그것도 민주주의의 상징이라는 미국에서 버젓이 이런 사건이 벌어져서 전 세계에 충격을 줬습니다. 사실 저는 케네디 대통령 암살, 레이건 대통령 암살 시도 정도만 예가 있을 거라 생각했는데 놀랍게도 미국에서는 이런 사건이 1835년부터 총 15차례나 있었고 그 가운데 4명의 대통령이 목숨을 잃었다고 합니다. 그 가운데 우리도 알만한 분으로는 링컨 대통령과 케네디 대통령이 있습니다. 이와 유사한 사건으로 2022년에는 일본 전 수상이었던 아베 신조 피살 사건, 올 1월 이재명 더불어민주당 대표 흉기 피습 사건이 있었죠. 트럼프 대통령 저격 사건과 이 두 사건의 공통적인 점은 선거를 앞두고 유세나 시찰 도중에 발생한 것입니다. 민주사회에서 정치적인 견해가 다르다고 상대방의 목숨을 빼앗으려는 발상을 한다는 것이 참 무섭다는 생각이 들었습니다.
또 다른 주목할 만한 뉴스로 자동차 '급발진'과 관련된 것이 많았습니다. 지난 7월 1일 서울지하철 2호선 시청역 인근 교차로에서 역주행하며 인도로 돌진한 차량이 9명의 행인들을 사망케 한 사고가 있었는데, 그 이후에도 급발진이라고 주장하는 유사 사고들이 이어지고 있기 때문입니다. (아직 수사 중이므로 해당 사건 자체에 대해서는 따로 언급하지 않겠고, 당시 피해를 입으신 분의 명복을 빕니다.)
자동차 블랙박스나 자동차에 장착된 EDR 장치 기록만으로는 차의 문제인지 운전자의 문제인지를 확실히 밝히기 어렵다는 문제의식 때문에 페달 오조작을 직접 영사으로 기록해주는 페달 블랙박스 장치나( 영상), 일본의 경우처럼 비상자동제동장치나 페달 오조작 방지장치와 같은 것을 의무적으로 장착하도록 하는 방안 등이 논의되기도 했습니다. ( 기사) 그리고, 급발진인 것을 밝히는 것이 피해자(운전자) 측의 의무로 되어 있는 현재의 법규를, 미국 등의 사례처럼 자동차 제조사가 밝히도록 변경하기 위해 '제조물 책임법 개정안'이 국회에서 발의되었습니다. 아무래도 이번 사건의 파장 크기와 여야 국회의원들이 같이 움직이는 모습으로 봐선 어느 정도 성과를 거두지 않을까 하는 생각을 해 봅니다. 게다가 향후 자율주행 서비스가 확대될 날이 머지 않았기에 그런 것을 생각하면 당연한 움직임이란 생각도 가지게 됩니다.
또 다른 소식으로 UAE 바라카 원전 건설 수주 이후, 15년 만에 체코 원전 건설 프로젝트에서 한수원이 우선협상 대상자가 되었다는 소식이 있었습니다. 국내업체의 해외 진출과 전세계에 기술력을 과시할 수 있다는 점, 그리고 이로 벌어들일 막대한 외화를 생각하면 참 대단한 성과를 거뒀다 싶습니다. 그와 함께 중국이 전 세계 풍력,태양광 발전 프로젝트의 2/3를 진행하고 있다는 소식과 시간당 100mm가 넘는 '극한 호우'를 동반한 지리한 장마가 계속 되면서 전국적으로 많은 비 피해가 발생하고 있다는 소식을 접하면서, 앞으로 기후 온난화를 늦추거나 해소할 수 있도록 원전 기술뿐만 아니라 재생에너지 분야 투자 및 개발도 가속화해 줬으면 하는 바람이 들었습니다.
제가 있는 곳은 다음 주까지 내내 비 소식이 있을 거라고 합니다. 아무쪼록 구독자님 가정에는 비 피해 없도록 유의하시기 바라며, 다음 번에도 새로운 소식을 갖고 찾아뵙겠습니다. |
|
|
OpenAI, GPT-4o mini 공개
OpenAI가 sLLM 모델인 GPT-4o mini와 이를 이용할 수 있는 개발자용 API를 공개하면서 ChatGPT 상에서 선택할 수 있는 옵셥을 추가했습니다. 기존에 선택할 수 있었던 기본 옵션인 'GPT-3.5'가 없어지고 대신 'GPT-4o mini' 가 추가된 것입니다. GPT-4o mini는 10B~20B 수준의 매개변수를 가진 것으로 추정되며 12.8만개 토큰으로 구성된 컨텍스트 창을 가지고 있다고 합니다. 작아진 덕분에 처리 속도는 훨씬 빨라졌고 성능도 유사 수준의 모델 대비 월등히 높다고 합니다.(예: MMLU에서 82%, MGSM에서 87%, HumanEval에서 87.2% 등) 가장 큰 주목받은 부분은 역시 실행 비용... 사라진 GPT-3.5 대비 60% 이상 비용을 내렸다는 것이죠... 빨라지고 성능 높아지고 비용은 낮아지고... AI 혁신의 다른 산업 도메인에도 이런 흐름을 만들어 나가지 않을까 기대됩니다. 그리고, 한편으론 점점 더 글로벌 빅테크의 종속에서 벗어나기 힘들어겠구나 하는 걱정이 커집니다. ( 기사) |
|
|
사진: GPT-4o mini 벤치마크 자료 (출처)
|
|
|
개보위, AI 개발·서비스를 위한 공개된 개인정보처리 안내서 공개
개보위(개인정보보호위원회)에서 생성형 AI 개발에 활용하는 '인터넷 상의 공개 데이터'를 안전하게 처리할 수 있는 기준에 대한 안내서를 공개했습니다. AI 서비스 개발 기업은 공개된 개인정보 수집‧활용의 법적 기준을 명확히 하고, 어떤 안전 조치를 취해야 하는지를 알 수 있게 되어 개인정보 침해 이슈 자체를 최소화할 수 있는 방안이 생기게 되었습니다. 다만... 이 가이드를 각 기업들이 얼마나 따를지는 두고 봐야 하겠죠... ( 기사) |
|
|
경기도 교육청, 2025년부터 인공지능 디지털교과서 현장 적용
경기도교육청이 2025년부터 인공지능 디지털 교과서를 현장에 단계적으로 적용하는 계획을 밝혔습니다. ( 기사) 이미 일부 학교에는 장비가 시범적으로 보급되어, 직접 제작한 온라인 교재를 활용해서 시범 사용을 하고 있는 곳도 있는 모양입니다. 아직은 정규 교과목을 위한 정형화된 콘텐츠가 준비된 것은 아니기 때문입니다. 교육부는 2028년까지 예체능을 제외한 나머지 모든 분야로 확대할 예정이라고 합니다. ( 영상)
인공지능 디지털 교과서의 현장 적용은, 한편으론 학생 별 이해 수준에 맞춰 학습이 가능하다는 이점이 있으니 서둘러 도입해야한다는 의견과 디지털 기기의 과다 사용으로 인한 학습 능력 저하 등 다양한 부작용을 고려해 도입을 유보해야 한다는 의견이 갈리는 것 같습니다. ( 기사) 둘 다 일리가 있어 판단하기가 쉽지 않아 보입니다. 하지만, 부작용만 생각한다면 새로운 시도는 불가능하리라 생각됩니다. 실제로 디지털 기기의 과다한 사용이 문제라면, 어른들도 스마트폰 사용을 줄이도록 강제해야 하지 않을까요? 그렇게 하자면 동참할 어른들이 많진 않을 테죠. 어차피 향후 가야 할 방향이라고 한다면 ' 현 시점의 최선이라 생각하는 안을 시범적으로라도 시도해 보고 문제점은 빨리 해결하며, 만약 해결이 안 되면 멈추고 다른 대안을 찾는다...' 이런 방식으로 진행하는 것이 어떨까 하는 생각을 해 봅니다. |
|
|
글로벌 빅테크, AGI에 대한 언급들 정리
OpenAI에서 AI 발전단계와 AGI 구현과 관련된 새로운 언급을 했습니다. 그 내용을 보다가 다른 글로벌 빅테크 기업의 AI 수장들이 했었던 현재 AI수준에 대한 평가와 AGI와의 거리에 대한 평가를 찾아봤습니다.
- 데미스 허사비스 (구글 딥마인드 CEO) : 현재의 인공지능의 지능은 고양이 수준, 2030년을 AGI 개발 시점으로 예상, AGI 개발을 위해 'Project Astra'를 진행 중
- 샘 앨트먼 (오픈AI CEO) : 5년 이내 AGI 구축 전망. AI 능력 수준을 5단계로 제시했는데 현재 오픈AI는 2단계 도달 직전이라고 언급. Strawberry 프로젝트(예전 Q*?) 진행 중 (기사)
- 젠슨 황 (엔비디아 CEO ) : 2023년 컨퍼런스에서 5년 이내에 인간과 같은 수준의 AGI 등장 전망
- 얀 르쿤 (메타 수석연구원) : 시기 예측 불가. 예상보다 오래 걸릴 것이라고 예상. 등장 시점에 대해서는 가장 신중한 편에 속함. JEPA라는 차세대 신경망 아키텍처 개발 중
- 다리오 아모데이 (앤스로픽 CEO) : 2~3년 이내 AGI 시기의 도래 예상
- 일론 머스크 (테슬라 & xAI CEO) : 가장 똑똑한 인간보다 더 똑똑한 AI는 2년 내에 가능할 것이라 언급. 단 일론 타임을 감안해야...
- 손정의 (소프트뱅크 회장) : 10년 내 초인공지능 (ASI) 실현될 것으로 전망
- 레이 커즈와일 (구글 수석연구원) : 2029년 컴퓨터가 인간 수준 지능에 도달, 2045년에는 인간의 두뇌가 네트워크로 연결 예상 (BCI 기술?)
|
|
|
내용 : OpenAI의 AI 발전 수준 5 단계 (출처) |
|
|
CPU 강자 Intel과 AMD, CUDA 대항 S/W 확보 위한 몸부림
AI 시장에서 엔비디아가 절대적 강자로 존재하는 이유 가운데 가장 핵심이 되는 것은 CUDA라는 병렬 컴퓨팅 소프트웨어입니다. AMD나 인텔과 같은 기존의 강자들은 AI 시대에 와서 우위에 있던 지위를 내놨어야 했는데, 최근 그들이 엔비디아 CUDA의 굴레를 벗어나기 위해, 인텔은 자사 AI 칩인 '가우디'를 이용해 네이버와 함께 AI 생태계 구축을 진행하고 있고, AMD가 'Silo AI'를 인수하기 위해 계약을 체결하는 등 타 기업을 인수하거나 협력 관계를 맺고 있다고 합니다. ( 기사) 지난 3월에는 퀄컴, 구글, 인텔의 컨소시움 구성 논의 소식도 있었습니다. ( 기사) |
|
|
메타, 유럽에서 신규 버전의 멀티모달 AI 모델 공급 않기로
메타가 앞으로 멀티모달 LlaMA 모델 출시 시, EU 지역 기업들이 사용하지 못하게 할 것이라고 밝혔습니다. 이는 EU 규제당국의 예측할 수 없는 조처들 때문이라고 합니다. 최근 EU규제당국은 'EU 지역 데이터를 이용한 AI 모델 학습 을 일시 중단'하라는 명령을 받았고 메타가 이에 대해 강경하게 대응하고 있는 셈입니다. 이와 유사한 사례로 애플도 지난 달 자사가 개발한 'Apple Intelligence'의 EU 지역 출시를 연기한다고 밝힌 바 있습니다. (기사) |
|
|
뇌의 학습 원리에 대한 새로운 연구 결과 발표
단국대 김동재 교수가 뉴욕대, 룩셈부르크대의 교수와 공동으로 진행한 연구에서, 뇌의 지각과 학습이 같은 원리로 작동한다는 것을 밝혀냈습니다. 기존 학계 통념을 뒤집은 결론이라고 하죠. 시각, 청각을 담당하는 뉴런의 경우 특정 자극에만 효율적으로 반응하도록 최적화되며(효율코딩가설), 학습을 담당하는 뉴런의 경우 가장 높은 보상이 예측되도록 선택적으로 정보를 받아들이게 되는데(강화학습) 이 둘은 서로 다른 기저로 동작한다고 알려져 있었는데, 동물 실험을 통해 도파민 뉴런 데이터를 분석하는 방식으로 해당 결론에 도달했다고 합니다. 기존의 딥러닝이 뇌의 작동 원리를 모방해서 발전해 온 것이니만큼, 이번에 발견한 이런 원리가 새로운 알고리즘 개발의 실마리가 될 수도 있겠다는 생각입니다. ( 기사) |
|
|
E5-V는 MLLM(대형 멀티모달 언어모델)을 사용해 다양한 입력 형식 (예: 텍스트, 이미지 등)을 하나의 통일된 임베딩 공간으로 변환하기 위한 프레임워크입니다. 기존 모델의 경우, 텍스트와 이미지를 결합하는데 어려움이 있거나 복잡한 텍스트의 경우, 이해하는데 한계가 있었는데 이 문제를 해결하기 위해 텍스트 쌍만을 이용한 단일 모달리티 학습으로 멀티모달 임베딩을 효율적으로 학습하는 방식을 채택했습니다.
E5-V에서는 멀티 모달 입력(텍스트, 이미지)을 하나의 임베딩 공간으로 통합하기 위해 프롬프트를 이용합니다. 달리 말하면 텍스트와 이미지를 하나의 단어로 요약하도록 프롬프트를 설계해서 텍스트와 이미지가 의미하는 것을 동일한 단어의 임베딩 공간에 매핑되도록 하는 것입니다. 이후 학습 과정에서는 비주얼 인코더를 제거할 수 있고 대신 텍스트 쌍에 대한 대조 학습(contrastive learning)만을 이용하게 되는 겁니다. 이런 방식을 채택함으로써 학습 비용을 획기적으로 줄이고(심지어 95%까지!) 학습을 위해 수집해야 하는 비싼 멀티모달 데이터 수집을 하지 않아도 된다는 잇점을 얻을 수 있게 되었습니다.
|
|
|
사진: E5-V에서 단일 모달리티 학습 (출처) |
|
|
Q-GaLore는 저순위 투영 (Low-Rank Projection) 및 양자화(Quantization) 기법을 사용해 LLM의 메모리 사용을 줄이는 기술입니다. 최대 50%까지 줄이면서도 기존의 LoRA 및 GaLore와 비교하여 유사한 성능을 낼 수 있어, 이 기술을 적용할 경우, 7B 모델을 16GB의 GPU 메모리를 가진 장비에서도 훈련시킬 수 있다고 합니다. 제한된 GPU 자원을 가진 환경에서 적용하면 효과를 거둘 수 있는 기술이라고 보면 될 것 같습니다. 저순위 투영은 처리해야 하는 큰 데이터를 더 작고 효율적인 형태로 변환하는 방법을 의미하는데 데이터에서 중요한 패턴을 추출하고, 이를 바탕으로더 필요한 정보는 유지된 작은 크기의 데이터를 만들어 사용하는 것이죠. SVD(Singular Value Decomposition) 기법을 이용해 큰 매트릭스를 작은 매트릭스들로 분해하는 방식도 이에 속합니다. 이외에 INT4 형식의 투영 행렬과 INT8 형식의 가중치를 사용하는 방식으로 추가적인 계산 속도 향상과 메모리 절약이라는 잇점을 얻고 있습니다.
|
|
|
사진 : 방식 별 데이터 타입 및 학습 흐름 비교(상), Q-GaLore의 학습 흐름(하) (출처) |
|
|
RodinHD는 단일 얼굴 사진을 가지고 고해상도 3D 아바타를 생성하는 모델입니다.
고품질의 Triplane을 생성하고, 이를 통해 더 나은 디테일과 일관성을 가진 3D 아바타를 생성해 내는 것이죠. 모델에서는 많은 수의 아바타에 대한 학습을 진행하게 되는데, 각 아바타의 Triplane을 순차적으로 학습할 때 동일한 MLP 디코더를 공유해서 쓰게 되는데 이것이 현재 학습 중인 아바타에 과도 적응을 하게 되면 이전 아바타의 세부 사항들을 잊어버리게 되며 이로 인해 디테일 손실 문제가 발생하게 됩니다. 이를 해결하기 위해 Task Replay, 즉 각 아바타를 더 자주 반복적으로 학습시키는 방식으로 디코더가 일반화된 표현을 유지토록 하고 가장 중요한 가중치 들이 학습 과정에서 크게 변하지 않도록 정규화 기법을 적용합니다.
모델의 처리 과정을 보면, Triplane Fitting과 Triplane Diffusion이라는 두 단계로 나뉩니다. Triplane Fitting은 3D 아바타의 기초 표현으로 사용되는데 소수의 아바타에 대해 Triplane과 MLP 디코더를 함께 학습한 후 디코더의 가중치를 고정한 상태로 각 아바타의 Triplane을 독립적으로 미세조정합니다. Triplane Diffusion 단계에서는 입력된 얼굴 사진을 조건으로 저해상도의 Triplane을 생성한 후 업샘플을 해서 고해상도로 변환하고 다중 스케일 특징을 U-Net의 다양한 레이어에 주입하는 방식으로 더 정밀한 3D 아바타를 생성하게 됩니다.
|
|
|
사진 : RodinHD 개요 (상), 생성 결과물 (하) (출처) |
|
|
인공지능 서비스의 배포와 운영 시 도움이 필요하신가요?
(주)소이넷은 인공지능 서비스를 제공하는 기업들 가운데 서비스 배포와 운영에서 어려움을 겪고 계신 곳에 도움을 드릴 수 있습니다.
혹시 구독자님의 회사는 다음과 같은 어려움을 겪고 계시지 않나요?
- AI 모델을 개발하고 학습 후 서비스를 위한 성능(Accuracy)은 달성했는데, 정작 최적화 엔지니어가 없어서 어플리케이션, 서비스로의 배포를 위한 실행최적화를 못하고 있어요!
- AI 서비스를 이미 제공하고 있지만, 비싼 클라우드 GPU 서버 인스턴스 사용료가 부담이 되네요. 흠... 경비를 절감할 수 있는 방안이 없을까?
- 서비스에 적합한 공개 SOTA 모델이 있지만 그대로 가져다 쓰기에는 우리 쪽 어플리케이션에 접목하기도 어렵고 운영 비용도 많이 들 것 같은데 어쩌지?
- 서비스에 사용되는 AI 모델을 통합적으로 관리, 배포, 모니터링을 하고 싶은데 그렇다고 비싸고 너무 복잡한 솔루션을 쓸 수는 없고 어쩌지?
- 비즈니스 도메인 기업이긴 한데 자체로 인공지능을 적용하기에는 기술적인 난이도도 있고... 어디 함께 공동 솔루션을 개발할 곳은 없을까?
- 무인매장에서 활용될 수 있는 무인자동판매기와 성인인증장치, 그리고 이상행동 감지 등의 솔루션 및 서비스를 공급받을 수 있는 곳은 없을까?
그렇다면 언제든 아래 연락처로 문의 주세요. 함께 해결책을 고민해 드리겠습니다.
|
|
|
오늘의 뉴스레터는 여기까지 구독자님, 다음 번에도 재미나고 흥미로운 소식을 가지고
다시 찾아뵙겠습니다. |
|
|
구독해 주시면 좋은 소식, 정보로 보답하겠습니다. |
|
|
주식회사 소이넷 sales@soynet.io 경기 성남시 분당구 성남대로331번길 8 (킨스타워) 1503호
대표전화 : 031-8039-5377
|
|
|
|
|