초인 프로젝트와 생성형 AI의 이면을 생각합니다 안녕하세요, 구독자님.
이번 한 주도 힘차게 보내고 계신가요?
8월 14일. Disney+ 채널에서 오리지널 한국 드라마 '폭군'이 공개됐습니다. 개인적으로 재미있게 봤던 '마녀'의 박훈정 감독의 작품으로 기존 영화의 세계관을 어느 정도는 공유하고 있는 것으로 생각되는데, 그렇게 생각한 것은 '초인'이라는 소재와 분실된 프로젝트 결과물을 찾아 국가 기관 간의 충돌이 발생하는 비슷한 스토리라인을 가지고 있기 때문입니다.
작품 '폭군'은 초인을 만들어내려는 비밀 프로젝트와 그 연구 결과물을 둘러싼 국가조직 간의 치열한 싸움을 그리고 있습니다. 이 드라마는 기존 한계를 뛰어넘는 생물학적 병기를 만들어내려는 위험한 시도가 세력 간 이해관계와 인간의 본성, 개인적 욕망과 애국심 등과 함께 복잡하게 얽히는 상황을 보여 줍니다. 새로운 인종(슈퍼솔져?)를 만들어 내려는 시도는 흥미롭지만, 동시에 무섭기도 합니다. 이 드라마는 드라마의 오락적 요소를 지우고 보면, 우리가 과연 인간의 한계를 넘어서는 것이 옳은지 그 과정에서 잃어버릴지도 모를 중요한 가치는 무엇인지를 고민하게 만듭니다. 장면 장면이 다소 과하게 어둡고 칙칙하고 불편하며 폭력적이어서 이 속에서 희망을 찾아낸다는 것이 과연 가능한가 하는 생각이 들게 만들기 때문이죠.
생성형 AI의 등장 또한 우리에게 비슷한 질문을 던집니다. AI는 기존 사고방식과 생활방식을 근본적으로 변화시키고 있으며, 많은 사람들은 이 변화의 속도에 압도되고 있습니다. 과거에는 상상도 하지 못했던 일을 가능하게 하는 AI 기술은 그 자체로 인류의 한계를 확장하고 있지만, 동시에 우리는 이 기술에 의해 도태될지도 모른다는 위기감을 느끼고 있습니다. 기술 발전이 우리의 삶을 더 편리하게 만들어줄 것이라는 기대감도 크지만, 그 이면에 감춰진 불안은 쉽게 떨칠 수 없는 것이 사실입니다.
이처럼 우리는 한쪽으로 치우치거나, 극단적인 변화를 추구하는 과정에서 무언가 중요한 것을 잃어버리거나 놓치고 있는 것은 아닌지 돌아볼 필요가 있습니다. 현대 사회는 끊임없는 혁신과 변화를 요구하지만, 그 과정에서 우리가 진정으로 가치 있는 것들을 잃지 않도록 주의해야 한다는 얘기입니다. '폭군'이 그리는 초인 프로젝트나 생성형 AI의 발전 둘 다 우리에게 새로운 가능성을 열어주지만 (좋은 쪽이건 나쁜 쪽이건...), 그 가능성 뒤에는 항상 위험이 도사리고 있으니까요.
기술의 발전과 인간성의 경계에서 우리는 무엇을 지켜야 할지를 고민해 봐야 합니다. '폭군'이 그리는 초인, 그리고 AI가 그리는 새로운 세상은 모두 우리가 마주한 현실의 일면입니다. 기술의 힘은 강력하지만, 그만큼 우리의 책임도 막중합니다. 우리는 기술을 통해 무한한 가능성을 추구하면서도, 동시에 인간다운 가치와 삶의 본질을 잃지 않도록 경계해야 할 것입니다.
아무쪼록 장마 끝나고 계속 이어지고 있는 무더위에 건강 유의하시고 짬이 나면 가족들과 재미난 영화 한편 보시거나, 나무 그늘 가득한 야외로 나들이라도 하시면서 여유를 가져보시기 바랍니다.
*최근 한 기사에서 디즈니플러스의 한국 가입자 수가 급감(1년 새 434만->249만)했고, 최근 월간 활성이용자수(MAU) 또한 줄고 있다고 봤습니다. '무빙'으로 확 증가했다가 다시 확 줄어든 것이죠... 이런 디즈니플러스 입장에선 이번 공개된 작품들이 뭔가 바람몰이를 해줬으면 하는 생각도 있을 것 같습니다. 다만, 특정 OTT나 작품을 홍보하는 것은 아니니 오해 마시길...
|
|
|
xAI, Grok-2 공개
일론 머스크가 설립한 AI스타트업 xAI가 LLM인 'Grok-2'와 비전까지 지원되는 'Grok-2 mini'를 공개했습니다. Grok-2는 각종 벤치마크에서 GPT-4o, Claude-3.5, Gemini 1.5, Llama 3.1 등과 유사하거나 이를 뛰어 넘었다고 알려져 있습니다.
놀라운 점은 xAI가 2023년 7월 설립되고 그해 12월 Grok 서비스 오픈, 2024년 3월 Grok 오픈소스로 공개, 1.5 버전 출시, 4월 Grok-1.5V 공개, 그리고 8월인 지금 Grok-2가 공개된 것입니다. 한마디로 회사 설립 후 1년 남짓만에 세계 최고라는 OpenAI, Google, Antropic AI, Meta와 같은 수준의 LLM을 개발해냈다는 것으로 발전의 '속도' 측면에서는 타의 추종을 불허합니다. 그런데다 이번에 새로 오픈한 GPU 10만개의 AI클러스터를 이용한 훈련이 본격화된다고 했으므로 Grok-3을 비롯한 이후 모델들의 출시 속도 또한 엄청나게 단축되지 않을까 기대됩니다.
머스크가 X에서 워낙 자유분방한 발언과 특정 당의 대선후보를 지원하는 등 정치적인 행보를 보이는 바람에, AI규제에 대한 논란도 상당한 상황입니다. |
|
|
사진: 챗봇 아레나에서 전반적인 ELO Score 벤치마크 (출처) |
|
|
소프트뱅크, AI칩 생산 위해 업체들 컨택
소프트뱅크가 엔비디아에 대항할 AI 칩을 생산하기 위해 인텔과 협상했으나 결렬되었고, 현재는 대만의 TSMC와 협상을 진행 중이나 TSMC의 생산 용량 문제로 합의에 이르지 못한 상태라고 합니다. (기사) 소프트뱅크는 ARM의 90% 지분을 가지고 있으며 최근 그래프코어를 인수한 바 있어 이번 시도가 계획 단계를 넘어 뭔가 액션으로 넘어가고자 하는 의도가 느껴집니다. AI 칩 생산 능력을 갖춘 업체가 몇 없다보니 생산 외의 반도체 설계 관련 지원도 있어야 하는터라 추가적인 업체 물색은 계속되지 않을까 싶습니다. |
|
|
통신 3사, AI 데이터센터로 인프라 사업 강화
통신 3사(SK텔레콤, KT, LG유플러스)가 AI 데이터센터 사업 확장을 통해 인프라 수익을 크게 늘리고 있다고 합니다. SK텔레콤은 2분기 데이터센터 매출이 전년 대비 20.5% 증가하며, KT와 LG유플러스도 각각 17.1%와 15% 증가세를 보였습니다. AI 기술 수요와 데이터 활용이 증가함에 따라 이들 기업은 에너지 효율성을 높이고 글로벌 시장 진출을 추진 중입니다. (기사)
AI산업을 위한 인프라 투자는 여전히 진행 중이고 AI반도체 기업들의 실적도 나날이 좋아지고 있습니다. 이 거품이라는 의견도 많이 있지만, 전세계적으로, 아직 서비스 시장은 막 시작하려는 단계에 접어 들었을 뿐인데... 하는 의견도 있죠. 어느 쪽이 맞을지는 몰라도 통신 3사의 행보나 해외 빅테크 기업들의 행보를 보면 후자에 아직은 더 무게추를 두고 있는 것 같다는 생각입니다. |
|
|
경기도, AI사업 홍보 확대 계획
경기도가 AI 관련 사업의 확산을 지원하기 위해 AI국을 신설하고 이에 대한 홍보를 이어나가고 있지만 도민들의 관심 부족으로 어려움을 겪고 있습니다. 'AI 노인말벗서비스' 등에서는 예상을 초과한 신청률을 보이긴 했으나 전반적으로 저조한 상황이라 좀 더 홍보 강화와 사업 개선을 해 나갈 계획을 하고 있다고 합니다. (기사)
아무래도 새로운 기술과 제도의 도입이 실제 사람들에게 어떤 도움을 줄 수 있느냐, 그리고 사람들의 경험을 어떻게 개선해서 그쪽으로 끌어올 수 있느냐가 관건이 아닐까 생각합니다. |
|
|
한국교통안전공단(TS), AI 철도운행지원 개발
한국교통안전공단(TS)은 AI 기반 철도운행지원 기술을 개발하여 철도기관사의 위험 운전을 예방하고 있습니다. 이 기술은 인천교통공사와의 협력을 통해, CCTV를 활용해 철도 선로 상황을 자동으로 인식하고 실시간 경고를 제공합니다. TS는 철도운행의 효율성과 안전성을 높이기 위해 자율주행 기술과의 결합을 추진하고 있으며, 이를 통해 무인 운행이 가능한 레벨4 철도차량 개발을 목표로 하고 있습니다. (기사)
정해진 경로로 달리며, 아무래도 도로를 달리는 자동차 대비 발생할 수 있는 이상 상황이 훨씬 적을 수 밖에 없는 철도 영역에서이니, 관련된 자율주행 기술 개발이 상대적으로 더 쉽고 빠르게 구현될 수 있을거라 기대됩니다. 다들 자율주행이 기술도 기술이지만 제도 때문에 현실화되는 것은 어렵다고 합니다. 그러니 이렇게 철도와 같이 그나마 그런 허들들이 적은 영역에서만아라도 빨리 기술을 개발하고 적용해서 사람들이 생활에서 많이 체험할 수 있길 바랍니다. |
|
|
'AI Scientist'는 AI가 독립적으로 과학적 연구를 직접 수행하고 최종적으로 논문까지 작성해주는 완전 자동화 시스템입니다. 처음 연구 아이디어 생성부터 코드 작성, 실험 진행 및 오류 자동 수정, 결과 시각화, 결과 정리 및 새로운 실험 계획, 논문 작성, 그리고 이후 모의 심사를 통한 평가까지... 정말 연구자가 하는 모든 프로세스를 주도적으로 진행합니다. 이 기술을 이용해 처음부터 끝까지 작업을 수행하고 나온 결과물 논문도 함께 공개했다니, 바로 실증까지 해 버렸습니다. 게다가 이 과정에 소요되는 컴퓨팅 비용이 고작 $15 밖에 안 든다니... 놀랄 따름입니다. 다만, 현재까진 시각을 처리하는 기능이 없어 이와 관련된 제약이 있습니다. 해당 업체의 기술 개발 내역(진화 모델 병합 기술)을 보면 이 부분은 금방 해소될 것 같긴 합니다.
처음 X에서 이 기술 관련 글을 읽었을 때 흠... 이건 뭐지 했습니다. AI agent를 만들어서 처음 기술적인 아이디어를 제시하면 그걸 가지고 나머지 관련 정보들을 찾아서 연결시켜주는 뭐 그런건가 했는데, 그게 아니더군요. 그게 아니더라도 일반적으로 과학적 연구를 진행할 때, 기술자들이 초기 아이디어를 가지고 연구를 진행하다가 막히는 부분이 생기면 그 특정 작업 등에 LLM 기반의 AI를 활용하거나 하는 방식으로 진행해 왔을 것입니다. 그런데... 이제는 전체 연구 과정에서 사람이 아닌 AI가 주도하는 것이 가능한 시대가 되고 있는 겁니다. 다른 분야라면 몰라도 R&D 분야는 AI 대체가 불가능하지 싶었는데 그 생각도 깨지게 된 셈입니다.
참고로 이 기술을 개발한 일본의 Sakana AI은 구글 출신 연구진이 설립한 스타트업인데, 최근 AI Scientist 외에도 공개된 성능 좋은 오픈소스 모델들을 재결합하여 사용자가 원하는 모델을 생성할 수 있는 '진화적 모델 병합 기술(Evolutionary model merge) 기술'을 공개한 바 있습니다. 이 기술에 대해서는 별도로 따로 정리해서 공유 하겠습니다.
|
|
|
사진: AI Scientist의 과학 발견 프로세스 전반의 컨셉 설명 (출처) |
|
|
사진: AI Scientist가 전적으로 자체 생성한 논문 예시 (출처) |
|
|
VGGHeads는 3D 인간 머리 감지 및 메시 추정을 위한 대규모 합성 데이터셋과 이를 활용한 새로운 모델입니다. 기존 데이터셋은 편향, 개인 정보 보호 및 윤리적 문제로 인해 사용이 제한되고 대부분 데이터 수집 자체가 배우나 특별한 실험실 환경에서 만들어지는 경우가 많아 모델의 일반화가 어렵다는 문제가 있었습니다. VGGHeads는 이런 문제를 대규모 합성 데이터셋을 사용하고 다양한 장면과 포즈에서 적용할 수 있도록 새로운 모델 아키텍처를 도입함으로써 해결하고 있습니다.
VGGHeads 모델의 특징으로는 다음과 같은 것이 있습니다.
- 대규모 합성 데이터셋 사용
3D 인간 머리 감지 및 메시 추정을 위해 100만 개 이상의 이미지로 구성된 대규모 합성 데이터셋을 사용했습니다. 이 데이터셋은 라틴 확산 모델을 사용하여 생성되며, 다양한 장면에서의 3D 머리 메시와 얼굴 랜드마크를 포함하고 있습니다.
- 단일 단계의 다중 머리 감지 및 복원
단일 이미지에서 사진 상의 다수의 인물의 얼굴들을 동시에 감지하고 3D 메시를 복원할 수 있는 모델 아키텍처를 도입했습니다.
- 다양한 장면에 대한 일반화 가능성
다양한 포즈와 장면을 모델링할 수 있어, 실제 이미지에 대한 강력한 일반화 성능을 제공합니다.
- FLAME 모델 사용
FLAME 모델을 사용하여 3D 머리 메시를 표현하며, 이는 5023개의 정점으로 구성되어 있어 다양한 작업에 기초 표현으로 사용될 수 있고 또한 전체 머리 모양, 표정, 포즈를 포함한 종합적인 3D 표현을 제공합니다
- 안전 및 개인 정보 보호
합성된 데이터셋을 사용하여, 개인정보 보호, 윤리적 문제를 피할 수 있고 민감한 콘텐츠를 포함할 가능성을 최소화합니다.
|
|
|
사진: VGGHeads 모델 아키텍처 (출처) |
|
|
구글 딥마인드에서 인간 아마추어 수준의 성능을 달성한 탁구 로봇 에이전트를 공개 했습니다. (링크)
어? 이상하다... 예전에도 이런 로봇을 본 것 같은데? 하는 분도 있을 겁니다. 실제로 이런 상상으로 만들어진 로봇들이 제법 있기 때문입니다. 예를 들어 2014년 로봇 업체 KUKA가 광고로 만든 영상에도 이런 장면이 나옵니다. 최근에는 영상에서 사람을 휴머노이드 로봇으로 바꿔치기한 가짜 영상들도 많이 볼 수 있죠. 실제 상황을 지원하는 로봇으로 제가 아는 최고는 OMRON사의 제품(영상)였습니다. 이후로 순위가 바뀔지는 모르겠지만 말이죠.
연구진은 로봇 에이전트를 개발하기 위해, 계층 구조로 나눠진 모듈들을 사용해서 로봇이 여러 가지 탁구 기술을 배우도록 했고, 시뮬레이션에서 학습한 기술을 현실에서 바로 사용할 수 있도록 하는 방법으로 ('zero-shot sim-to-real'을 적용했다고 합니다. 결과적으로 로봇은 다양한 저수준 컨트롤러(LLC)를 통해 각각의 탁구 기술을 제어하고 고수준 컨트롤러(HLC)는 게임 상황에 따라 적절한 LLC를 선택하는데, 이 과정에서 상대방의 공의 속도, 위치, 스핀 등을 분석해 가장 적합한 기술을 실행한다고 하네요.
이번에 공개된 기술의 특징은 다음과 같습니다.
- 계층적 정책 아키텍처: 저수준 컨트롤러와 고수준 컨트롤러로 구성된 계층적 구조를 통해 다양한 탁구 기술을 효율적으로 학습하고 사용
- zero-shot sim-to-real: 현실 세계에서의 직접적인 미세 조정 없이 시뮬레이션에서 학습한 정책을 실제 로봇에 바로 적용할 수 있는 기술을 개발
- 실시간 적응: 처음 보는 상대와의 실시간 경기에서 상대의 스타일에 맞춰 전략을 수정하고 적응할 수 있는 능력 보유
|
|
|
사진 Agent의 처리 방식 개요(상), :HLC가 상황에 따라 LLC를 결정하고 처리하는 방식 설명(하) (출처) |
|
|
인공지능 서비스의 배포와 운영 시 도움이 필요하신가요?
(주)소이넷은 인공지능 서비스를 제공하는 기업들 가운데 서비스 배포와 운영에서 어려움을 겪고 계신 곳에 도움을 드릴 수 있습니다.
혹시 구독자님의 회사는 다음과 같은 어려움을 겪고 계시지 않나요?
- AI 모델을 개발하고 학습 후 서비스를 위한 성능(Accuracy)은 달성했는데, 정작 최적화 엔지니어가 없어서 어플리케이션, 서비스로의 배포를 위한 실행최적화를 못하고 있어요!
- AI 서비스를 이미 제공하고 있지만, 비싼 클라우드 GPU 서버 인스턴스 사용료가 부담이 되네요. 흠... 경비를 절감할 수 있는 방안이 없을까?
- 서비스에 적합한 공개 SOTA 모델이 있지만 그대로 가져다 쓰기에는 우리 쪽 어플리케이션에 접목하기도 어렵고 운영 비용도 많이 들 것 같은데 어쩌지?
- 서비스에 사용되는 AI 모델을 통합적으로 관리, 배포, 모니터링을 하고 싶은데 그렇다고 비싸고 너무 복잡한 솔루션을 쓸 수는 없고 어쩌지?
- 비즈니스 도메인 기업이긴 한데 자체로 인공지능을 적용하기에는 기술적인 난이도도 있고... 어디 함께 공동 솔루션을 개발할 곳은 없을까?
그렇다면 언제든 아래 연락처로 문의 주세요. 함께 해결책을 고민해 드리겠습니다.
|
|
|
오늘의 뉴스레터는 여기까지 구독자님, 다음 번에도 재미나고 흥미로운 소식을 가지고
다시 찾아뵙겠습니다. |
|
|
구독해 주시면 좋은 소식, 정보로 보답하겠습니다. |
|
|
주식회사 소이넷 sales@soynet.io 경기 성남시 분당구 성남대로331번길 8 (킨스타워) 1503호
대표전화 : 031-8039-5377
|
|
|
|
|