안정감을 주는 존재에 고마움을 표현해 보세요. 안녕하세요, 구독자님.
이번 한 주도 즐겁게 보내고 계신가요?
지난 일요일 밤에는 모처럼 비가 내렸습니다. 제가 있는 지역에는 번개도 치고 강풍도 불었는데 아침이 되니 언제 그랬냐는 듯이 다시 차분하게 가라앉아 있었습니다. 아열대 지방에 가면 스콜( squall)이라는 국지성 소나기를 만날 수 있는데 최근에는 그와 비슷한 경우를 가끔 주변에서도 볼 수 있게 된 것 같습니다. 기후 온난화가 좀 더 진행되면 그런 경향이 더 나타날 수도 있겠죠. ( 기사)
기후온난화로 인한 대기 불안정성 때문에 날씨를 예측하는 것이 예전보다 어려워졌다고 합니다. 특히 우리나라의 경우는 산과 바다로 둘러싸여 있는 지형적인 특징 때문에 수증기 흐름과 비구름의 움직임을 예측하기가 여간 까다로운 것이 아니라네요. 그러다 2023년 11월, 구글 딥마인드에서 인공지능을 이용해 날씨를 예측하는 기술인 GraphCast라는 것을 발표했었습니다. 위도, 경도를 0.25도 간격으로 세분화해서 기상예측을 하는데 단 1분 만에 10일간의 일기 예보를 정확하게 예측했죠. 당시 발표를 보면 테스트 지표 1380개의 90%에서 유럽 기상 예보센터의 예측 모델보다 좋은 성능을 보였다고 합니다. 기존 방식은 슈퍼컴퓨터를 이용한 물리 기반 시뮬레이션 이었는데 머신러닝을 이용한 새로운 접근방식이 더 효과적이었다는 얘기입니다. 하지만, 이를 개발한 딥마인드는 AI모델이 가지는 설명 불가능한 블랙박스적 특성 때문에 기존의 예측 방식을 대체하기 보다는 보완, 개선하는 쪽으로 활용해야 함을 강조했다고 합니다. ( 기사, 영상)
날씨 변화는 사람들의 행동패턴이나 정서적인 부분에도 영향을 미치는 것으로 알려져 있습니다. 기후 변화가 큰 지역이나 관련 일에 종사하는 사람들은 기후 우울증을 겪기도 한다는 보고도 있죠. ( 기사) 찾아보니 기후변화와 정신건강에 대한 연관성 연구 동향을 조사한 논문도 있었습니다. 해당 논문에서는, 이전에 나왔던 총 75개 연구결과에 대해 조사했더니, 기온 상승은 자살, 트라우마 발생과 연관이 있고, 자연재해는 PTSD와 같은 트라우마에 영향을 미치며, 대기오염은 우울증, 자살, 스트레스 등 다양한 정신건강 문제와 연관이 있었다고 합니다. 앞으로 지구촌에 불어닥칠 기후 변화의 모습들이고 이로 인해 사람들이 더 많이 겪게 될 정서, 심리적인 어려움에 대한 것이라 사람들도 미리 대비할 필요가 있을 것 같습니다. 평소 손쉽게 할 수 있는 것으로는 충분한 수면과 정기적인 운동, 명상이나 자기돌봄 훈련 등 다양한 방법이 있죠. 하지만, 사람들이 많이 찾는 방법 가운데 하나는 반려동물 같이 유대감을 줄 수 있는 존재를 주변에서 찾는 것이라고 합니다. |
|
|
얼마 전 Unitree Robotics라는 곳에서 4족/2족 보행을 하는 go2라는 로봇을 소개했습니다. 보스톤다이내믹스의 스팟 같은 4족 로봇인데, 덤블링을 하거나 물구나무 서서 이족 보행을 하는 등의 다양한 몸 동작 지원 기능, 사람이 집어 던지거나 각목 같은 것으로 타격해도 이를 견뎌내는 내구성, Lidar 등의 정밀 센서를 이용해 주변 지형을 파악하는 똑똑함까지 갖췄습니다. ( 영상) 하지만 개인적으로 가장 놀라운 것은 가격이었습니다. 스팟이 수천만원에 달하고 대륙의 실수라는 샤오미에서 만든 장난감 수준(이보다는 높지만...) 같은 유사 로봇이 240만원 정도인 것을 생각하면 이런 기능을 갖추고도 $1600 (대략 한화 220만원 선)라는 가격은 다소 파격에 가까웠기 때문입니다.
로봇을 논할 때 구매 가능한 가격은 과연 사람들의 생활 속으로 쉽게 들어올 수 있느냐하는 것과 연관됩니다. 아무리 좋은 제품이라도 너무 비싸면 그림의 떡이니까요. 예를 들어 테슬라 옵티머스봇이 사람들의 이목을 끌고 있는 것은 적용되는 기술과 기능 외에도 2만불 대의 예상 가격도 큰 몫을 차지하고 있습니다. 영화 속에서나 봐온 사람의 일을 대신해 줄 수 있을 것 같은 휴머노이드 로봇이 그 정도 가격이니 말이죠. 물론 이 가격은 전자제품으로 치면 높지만, 그런 일을 할 수 있는 사람의 인건비를 생각하면 상대적으로 저렴한 수준으로 평가되고 있습니다. 그런 것처럼 반려로봇으로 가정에 들어오기 위해서는 적정 수준의 가격대가 있을 것 같은데 go2는 그런 범주 안에 들어올 수 있는 제품이 아닐까 하는 생각이 들었던 겁니다.
ChatGPT가 개인들이 사용하면서 AI의 대중화가 급격하게 진행된 것처럼, 저렴하면서도 고성능, 고기능을 제공하는 로봇들의 등장은 본격적인 로봇 대중화의 길을 열지 않을까 하는 기대를 하게 만듭니다. |
|
|
사진 : Unitree의 go2 로봇 (출처) |
|
|
즉... 이 로봇을 보면서 최근 유행하는 인공지능 음성비서나 비전을 통한 주변 상황 이해 기술 등이 접목되면... 이제는 단순한 장난감 수준이 아니라 진짜 함께 길을 산책하며 대화할 수 있는 반려로봇들이 많이 등장할 수 있겠구나 하는 생각이 든다는 것이죠. 물론 반려로봇이 되려면 외모에서 좀 단장이 필요할 수도 있겠지만요.^^;
실제로 글로벌 시장조사기관 Research and Markets에 따르면 전 세계 반려로봇 시장은 2023년 기준 114.4억 달러 수준에서 2030년까지 연 평균 25.7% 성장률로 566.9억 달러까지 커질 것이라고 합니다. 1인 가구의 증가와 고령화 그리고 돌봄인력의 절대적 부족 등이 그 원인이라고 하죠. (기사) 비슷한 트랜드라 생각되는데 반려동물 양육인구도 전 국민의 25.4%에 달할 정로도 늘었습니다. 반대로 혼인률과 출생인구는 급격하게 줄어 그 결과, 작년에는 유아용 유모차 판매비중이 반려동물용 유모차 판매비중에 따라잡히는 현상까지 발생했습니다. 참고로 2023년 반려동물 유모차 : 유아 유모차 판매 비중은 57% : 43% 였습니다. (기사)
글이 저의 단편적인 의식의 흐름에 따라 가다보니 날씨변화 -> 심리적 불안정 -> 반려로봇의 등장 이런 식으로 얘기가 진행되어 버렸네요. 사실 심리적인 안정을 얻기 위해 가장 중요한 것은 정신적인 교류를 할 수 있는 '가족'일 것 같습니다. 이번 주말도 가족들과 즐거운 시간 보내면서 서로에게 감사하는 마음을 가져보도록 하세요. ^^ |
|
|
소이네이쳐(SoyNature), GS인증(1등급) 획득
실행 중심의 MLOps 솔루션인 소이네이쳐(SoyNature)가 GS인증(1등급)을 획득했습니다. 소이네이쳐는 소이넷이 2023년 TIPS를 통해 개발해 현재는 한국전기안전공사와 안산시, 리테일 분야 D사의 업무 운영 시스템에 도입되어 사용되고 있습니다.
저희는 현재 무인매장의 인공지능 디바이스에 적용될 수 있는 안면인식, 상품인식, 이상행동 감지 등의 인공지능 모델 및 솔루션을 개발하고 이를 실행최적화(경량화/가속화)하여 지역적으로 분산된 매장 및 기기들에 적용해 오고 있는데, 이 때 모델 별 버전관리/배포/모니터링 및 데이터 테스트 및 가공을 지원하는 소이네이쳐 솔루션이 사용하고 있습니다. 앞으로도 온프레미스, 클라우드 서버 등에서 제공되는 AI 실행최적화 외에도 무인매장이나 ICT 현장에 적용될 수 있는 엣지, 온디바이스 AI를 위한 기술 개발과 상용으로 적용할 수 있는 다양한 솔루션을 출시해 나갈 계획입니다. 계속 지켜봐 주세요. ^^ |
|
|
틱톡, 생성형 AI 기술을 적용한 디지털 아바타 솔루션 출시
숏폼 영상 플랫폼의 최강자인 틱톡이 광고 영상 제작에 사용할 수 있는 생성형 AI 기반의 광고 솔루션인 'Symphony'를 출시했다고 합니다. 제공되는 Digital Avatars와 AI 더빙 기능을 이용해 원하는 콘텐츠를 손쉽게 제작할 수 있도록 한 것입니다. 아바타의 경우, 기존 배우를 기반으로 한 Stock Avartars와 맞춤형으로 제작되는 Custom Avatars로 제공되는데 제스처, 표정, 나이, 등등 다양한 속성을 선택적으로 적용 가능하고 다양한 언어도 지원해서 틱톡에서 광고 수익 등을 거두고 있던 기존 인플루언서들이 바짝 긴장을 하고 있다고 합니다. ( 기사) 다만, 생성된 결과물이 실제 인물과 유사하긴 하지만 말투와 움직임 등 어색한 부분들도 있는 모양입니다. ( 기사) |
|
|
카카오, 카카오브레인 영업 양수도로 AI 역량 집결
카카오에서 AI 역량 결집을 위해 AI 연구/개발을 담당하던 카카오브레인의 초거대 AI 기반 언어모델과 이미지 생성모델에 대한 영업 양수도를 의결했다고 합니다. 카카오브레인의 Ko-GPT'와 'Karlo' 및 기타 경량화 언어모델 관련 기술 역량과 카카오의 서비스 부문 강점을 결합해 시너지를 내겠다는 계획이죠. 새로운 AI 서비스 방향에 맞는 재정비를 위해 기존 제공되던 Karlo AI 프로필 서비스 등은 종료키로 했고 Ko-GPT 2.0 언어모델은 자체 공개 대신 연내 AI 서비스 형태로 공개하는 것을 검토하고 있답니다. 뿐만 아니라 카카오브레인에서 AI사업을 이끌던 김일두 대표도 퇴사한다고 밝혔습니다. ( 기사, 기사) |
|
|
생성 AI 라벨의 등급제 필요 주장 제기
AI 기능을 탑재한 이미자 편집도구 등의 사용 시, 작업의 성격이나 AI기능의 사용량 등에 따라 AI 라벨 태그의 부착 여부를 결정할 수 있도록 등급제가 필요하다는 의견이 제기되고 있답니다. 즉, 사람이 작업한 사진을 포토샵에서 제공하는 AI 기능을 이용해 일부만 수정한 경우에도 'Made with AI' 등의 라벨이 붙어 원 창작자들 가운데 불만이 커지고 있다는 얘기가 있다고 합니다. ( 기사) |
|
|
엔트로픽, Claude 3.5 Sonnet 공개
LLM 모델의 최강자는 누구일까? 얼마 전까지만 해도 이견없이 GPT-4라고 할 수 있었겠지만, Gemini, Claude 등의 모델들이 출시되면서 묻는 시점에 따라 다르다는 답으로 바뀐 것 같습니다. 이번에 엔트로픽이 Claude 3.5 Sonnet을 공개했습니다. 기존 Claude-3는 Haiku, Sonnet, Opus가 있었는데 이 가운데 가운데 사이즈인 Sonnet 모델의 3.5 버전이 발표된 것입니다. 이번 공개 버전은 벤치마크 8개 중 7개, 비전 벤치마크 5개 중 4개에서 GPT-4o나 Gemini 1.5 Pro, Llama-3 400B 등을 능가하는 성능을 보여줬다고 합니다. 뿐만 아니라 ChatGPT에서 제공하던 개인화된 대화를 지원하기 위해 'Project'라는 기능도 제공합니다. X에는 Claude 3.5를 이용해 다양한 시도를 한 사례들이 올라오고 있는데 관심 있으시면 한번 둘러 보세요. ( 기사) |
|
|
사진 : Claude-3.5 Sonnet과 타 모델과의 벤치마크 비교 (출처) |
|
|
반 엔비디아 연합의 출현?
현재 AI 시장을 주도하고 있는 기업들 중에서 단연 돋보이는 곳은 엔비디아입니다. 엔비디아는 AI를 위한 GPU라는 하드웨어와 CUDA라는 소프트웨어 생태계를 모두 보유하고 있으며, 다양한 AI 관련 기술 개발의 중심지 역할도 하고 있습니다. 또한, 엔비디아는 TSMC와 SK하이닉스의 협력으로 파운드리와 HBM 메모리 제조를 관리하며, 제품이 출시되면 바로 구매하려는 대기 수요자들도 많이 확보하고 있습니다.
그러나 한 기업이 독주하게 되면, 경쟁 기업들이 어려움을 겪게 되면서 힘이 약한 기업들이 연합해 대응하려는 움직임이 생기기 마련입니다. 현재 예상되는 연합으로는 브로드컴, 시스코, MS, 삼성전자 연합이 거론되고 있습니다. (기사) 하지만 개인적으로는 엔비디아의 경쟁 우위가 약해지기까지는 아직 시간이 많이 걸릴 것이라고 생각합니다.
|
|
|
카이스트, 대형 언어모델 MoAI 공개
카이스트 연구팀에서 GPT-4V, Gemini-Pro의 비전 성능을 능가하는 MLLM(멀티모달 대형 언어모델)인 '콜라보(CoLLaVO)'와 '모아이(MoAI)'를 오픈소스로 공개했습니다. 우선 기존 모델들의 성능이 떨어지는 이유를 이미지 내의 물체들에 대한 이해능력이 떨어지기 때문이라는 것을 밝히고, 이를 해소하기 위해 CoLLaVO를에서는 배경 및 물체에 대한 정보를 MLLM에 직접 넣어주는 '크레용 프롬프트'라는 시각적 프롬프트를 새로 설계했고 이를 활용하기 위한 학습전략인 'Dual QLoRA'를 제안했습니다. MoAI는 외부 분할 (External Segmenation), 감지(detection), SGG, OCR 등 컴퓨터 비전 모델의 결과를 인간이 이해할 수 있는 언어로 변환해 MLLM에 입력으로 직접 사용하는 방식을 적용했다고 합니다. ( 기사) |
|
|
4M은 토큰화와 마스킹을 사용하여 다양한 양식으로 확장할 수 있는 기초 모델을 훈련하기 위한 프레임워크입니다. 기존의 비전 모델들이 단일 모달리티만 지원하는 것과 달리, 4M은 텍스트, 이미지, 깊이, 표면 법선, 의미적 분할 맵, 경계 상자 등 다양한 모달리티를 지원합니다. 4M은 각각의 모달리티를 작은 정보 단위인 토큰으로 변환하여 학습합니다. 이 과정에서 일부 토큰을 입력으로 사용하고 나머지 토큰을 예측하는 방식으로 진행되어 다양한 입력과 출력을 처리할 수 있게 됩니다.
4M의 아키텍처는 토큰화를 통한 모달리티 통합, 단일 트랜스포머 네트워크를 통한 모든 모달리티 학습, 그리고 랜덤화된 토큰 서브셋을 이용한 멀티모달 마스킹 모델링으로 구성되어 있습니다.
|
|
|
사진: 4M 처리 방식 (상), 지원되는 다양한 모달리티 (하) (출처) |
|
|
HumanPlus
Humanoid Shadowing and Imitation from Humans
|
|
|
HumanPlus는 인간의 동작을 모방하여 다양한 작업을 수행할 수 있는 휴머노이드 로봇 시스템으로 인간의 데이터를 이용하여 로봇이 자율적으로 동작을 학습하도록 설계되어 있습니다. 이 시스템은 인간의 움직임을 실시간으로 따라하는 저수준의 제어시스템과 동작을 학습하여 자율적으로 수행하는 고수준의 제어시스템으로 구성되어 있습니다. 이때 Humanoid Shadowing Transformer와 Humanoid Imitation Transformer가 사용되는데 각각 인간 동작을 따라하는 역할과 수집된 데이터를 이용해 로봇이 새로운 작업을 자율적으로 학습하도록 돕는 역할을 하게 됩니다. 실 사용 시에는 RGB 카메라를 사용하게 되는데 이렇게 수집된 인간의 몸과 손의 자세를 실시간 추정해서 로봇의 목표 자세로 변환함으로써 동작을 따라할 수 있게 만듭니다.
|
|
|
사진 : 모델 아키텍처 (상), RGB 카메라 기반의 쉐도잉 및 리타게팅 (하) (출처) |
|
|
Layered Image Vectorization via Semantic Simplification
|
|
|
2D 벡터 이미지를 만들어 보신 적이 있으실까요? 프로그래밍이 들어가는 기법 외에는 Adobe 사의 Illustrator나 Figma 등 다양한 그래픽 도구를 이용해서 만드는 것이 대부분일 거라 생각됩니다. 예전 기억을 돌이켜 보면 바탕에 참조 이미지를 두고, 그 위에 레이어들을 생성한 후 개별적으로 아웃라인을 따서 객체를 만들고 그것들에 색을 넣어 음영을 표현하는 방식으로 진행했었던 것 같습니다. 아마도 지금도 대부분 그래픽 작업에서는 그런 식으로 진행되지 않을까 싶네요.
Layered Image Vectorization은 이미지를 벡터 그래픽으로 변환하는 새로운 기술입니다. 원본 이미지를 점점 단순화해아 여러 단계로 나누고 각 단계를 벡터화하여 세부사항을 점차 추가해 나가는 방식인데 목적은 위에 언급한 작업 과정을 인공지능을 통해 쉽게 진행할 수 있도록 하는 것으로 이해하시면 될 것 같습니다. 해당 기술은 이미지의 주요 구조를 유지하면서 세부 사항을 줄여 나가는 단순화 과정, 단순화된 이미지에서 벡터 도형을 생성하는 벡터화 과정으로 구성되어 있으며, 이때 시각적 손실과 구조적 손실을 최소화하는 방식으로 벡터 도형의 정확도를 높이는 접근을 취하고 있습니다. 아직 코드가 공개되어 있지 않아 테스트를 못해 보지만, 벡터 이미지를 만들어내야 하는 다양한 분야에서 활용될 수 있어 보여 개인적으로는 기다려지는 기술입니다. ^^;
|
|
|
사진 : 프레임워크의 파이프라인(상), Layered vectorization 예시(하) (출처) |
|
|
인공지능 서비스의 배포와 운영 시 도움이 필요하신가요?
(주)소이넷은 인공지능 서비스를 제공하는 기업들 가운데 서비스 배포와 운영에서 어려움을 겪고 계신 곳에 도움을 드릴 수 있습니다.
혹시 구독자님의 회사는 다음과 같은 어려움을 겪고 계시지 않나요?
- AI 모델을 개발하고 학습 후 서비스를 위한 성능(Accuracy)은 달성했는데, 정작 최적화 엔지니어가 없어서 어플리케이션, 서비스로의 배포를 위한 실행최적화를 못하고 있어요!
- AI 서비스를 이미 제공하고 있지만, 비싼 클라우드 GPU 서버 인스턴스 사용료가 부담이 되네요. 흠... 경비를 절감할 수 있는 방안이 없을까?
- 서비스에 적합한 공개 SOTA 모델이 있지만 그대로 가져다 쓰기에는 우리 쪽 어플리케이션에 접목하기도 어렵고 운영 비용도 많이 들 것 같은데 어쩌지?
- 서비스에 사용되는 AI 모델을 통합적으로 관리, 배포, 모니터링을 하고 싶은데 그렇다고 비싸고 너무 복잡한 솔루션을 쓸 수는 없고 어쩌지?
- 비즈니스 도메인 기업이긴 한데 자체로 인공지능을 적용하기에는 기술적인 난이도도 있고... 어디 함께 공동 솔루션을 개발할 곳은 없을까?
그렇다면 언제든 아래 연락처로 문의 주세요. 함께 해결책을 고민해 드리겠습니다.
|
|
|
오늘의 뉴스레터는 여기까지 구독자님, 다음 번에도 재미나고 흥미로운 소식을 가지고
다시 찾아뵙겠습니다. |
|
|
구독해 주시면 좋은 소식, 정보로 보답하겠습니다. |
|
|
주식회사 소이넷 sales@soynet.io 경기 성남시 분당구 성남대로331번길 8 (킨스타워) 1503호
대표전화 : 031-8039-5377
|
|
|
|
|