불투명한 시장 상황에도 위험을 극복하려는 용기
사진: 영화 '이유없는 반항'에서의 치킨런 장면 (출처)
|
|
|
안녕하세요, 구독자님.
이번 한 주도 잘 보내셨나요?
얼마 전 구글 CEO 순다 피차이는 AI 분야에서의 투자에 관한 중요한 발언을 했습니다. 그는 "과소투자 위험이 과잉투자 위험보다 크다"고 강조하며 AI 기술에 대한 추가적인 투자 계획을 밝힌 것인데요... AI에 거품이 끼었는지, 투자 대비 수익이 거의 없는 비즈니스 환경이 아닌지 등에 대한 의문 이 퍼지고 있는 상황에서 나온 언급이어서 더 주목을 끌었던 것 같습니다.
순다 피차이의 이 언급은 기술의 발전이 빠르게 진행되는 시대에서, 혁신을 위한 투자가 선택이 아닌 필수임을 시사한다고 볼 수 있습니다. 특히나 치열한 경쟁 상황에서 아직 분명한 승자가 가려져 있지 않는 상황이라면 더 그럴테죠. AI는 이미 우리의 일상에 깊숙이 자리 잡았고, 지속적인 발전을 통해 더욱 다양한 분야에서 혁신을 이끌고 있는 상황에서 우리가 AI의 잠재력을 최대한 활용하기 위해 어떤 자세로 접근해야 하는지를 다시 한번 생각하게 합니다.
영화 '이유 없는 반항'((오래된 영화라... 젊은 분들 중에는 모르는 분이 계실지도... ^^;)에는 짐 스타크(제임스 딘)와 버즈라는 인물이 절벽을 향해 자동차를 몰고 가는 '치킨런'을 하는 장면이 나오는데, 두려움을 느껴 먼저 멈춘 사람이 지게 되는 게임입니다. 영화에서 둘은 끝까지 버티다가 주인공은 차에서 뛰어내려 살고 상대였던 버즈는 옷이 손잡이에 걸리는 바람에 탈출하지 못하고 절벽에서 떨어져 죽게 됩니다.
*치킨런, 치킨게임은 비슷한 의미를 가지고 있으며, 영어 속어로 '치킨'이 '겁쟁이'를 의미하다보니 이런 이름이 붙게 된 것 같습니다.
비록 영화 속 상황은 극단적이지만, 이런 상황은 우리 주변에서 종종 볼 수 있습니다. 메모리 반도체나 전기차 , AI 시장에서 벌어지고 있는 일이 바로 그런 것이죠. 뿐만 아니라 개인적으로도 우리는 일상에서 각자만의 치킨게임을 겪고 있을지도 모릅니다. 경기자들 중 어느 한쪽이 포기하면 다른 한쪽이 이득을 보는터라 상대를 이기기 위해서는 주어진 상황에서 두려움에 맞서면서 위험을 감수해 가면서 말이죠. 이러한 상황에서 성공의 열쇠는 자신의 한계를 정확히 알고, 필요할 때 결단력 있게 행동하는 데 있습니다.
빅테크 기업들 간의 AI 분야 경쟁은 치열함 그 자체입니다. 구글, 마이크로소프트, 아마존, 메타 등 주요 기업들은 미래의 결말을 알 수 없지만, AI가 가져올 산업계의 파급력과 지형 변화를 이미 감지하고 AI 레이스에서 승자가 되기 위해 빠르게 움직이고 있습니다. 각 기업이 자신들만의 차별화된 전략과 기술력을 바탕으로 시장을 선점하려는 거죠. 순다 피차이의 AI 투자에 대한 의견은 현재 빅테크 기업들이 AI 분야에서 치킨게임을 진행할 수 밖에 없는 상황을 있는 그대로 보여준다고 할 수 있습니다. 그리고, 그 게임의 승자가 가져갈 것이 너무도 클 것이라는 것까지 암시하고 있죠. 투자되는 자금과 기술 인력의 규모 등으로 볼 때, 현실적으로 우리의 경우는 우승보다는 조금이라도 덜 뒤쳐지기 위한 노력을 기울여야 하는 상황으로 보입니다.
이런 어려움 속에서도 열심히, 묵묵히 최선을 다하고 있으신 구독자님들께 박수를 보냅니다. 지난 주에 이어 다시 한번 파이팅~ 외쳐 봅니다. ^^
|
|
|
알체라, 탈중앙화 AI로 개인 정보 보호 강화 진행
알체라는 최근 고스트패스와 협력하여 온디바이스 AI를 활용한 탈중앙화 신원증명 사업을 시작했습니다. 이 기술은 사용자가 자신의 스마트폰에서 안면 정보를 직접 관리하여 중앙 서버 해킹 위험을 줄이고 개인 정보 보호를 강화합니다. 이 방식은 최근 AI 규제법에 대응하며, 얼굴 특징점을 이용한 인증 기술로 금융 및 보안 분야에서 활용되고 있습니다. 사용자 편의성을 위해 간단한 셀피로 인증이 가능하며, 한 번의 등록으로 여러 서비스에서 통합 사용이 가능합니다. (기사) |
|
|
LG, 엑사원 3.0 오픈소스로 공개
LG AI연구원이 최신 AI 모델 '엑사원 3.0'을 오픈소스로 공개하고, 생성형 AI 서비스 '챗엑사원'의 베타 서비스를 시작했습니다. 엑사원 3.0은 성능을 56% 높이고 비용을 72% 절감한 모델입니다. '챗엑사원'은 실시간 웹 기반 질의응답, 문서 및 이미지 기반 질의응답, 코딩, 데이터베이스 관리 등 다양한 기능을 제공합니다. 한국어 성능 지표가 세계 최고 수준이며 여러 벤치마크에서 1위를 차지했다고 합니다. LG는 하반기부터 이 모델을 적용한 제품과 서비스를 출시할 예정입니다. (기사) |
|
|
셀바스AI, 온디바이스 AI TTS 서비스 시작
셀바스AI가 온디바이스 AI 기반 음성합성 솔루션 'Selvy deepTTS On-Device'를 밀리의서재에 도입하여 상용화했습니다. 이 기술은 스마트폰 내에서 딥러닝을 이용해 자연스러운 음성으로 전자책을 읽어주며, 현재 안드로이드 기기에서 사용할 수 있고, 연말까지 iOS 버전도 출시될 예정입니다. 'Selvy deepTTS On-Device'는 인터넷 연결 없이도 사용자에게 자연스러운 음성을 제공하기 위해 음성 모델을 경량화하고, 경쟁학습 방식을 도입하여 음성 합성의 정확도를 높였습니다. (기사)
|
|
|
KAIST, 자원 효율적 활용으로 적응형 AI 실현
KAIST 박종세 교수 연구팀은 기기 내장 인공지능(AI) 칩만으로 자율주행차와 로봇 등에서 적응형 AI를 구현할 수 있는 기술을 개발했습니다. 이 연구는 클라우드 원격 컴퓨팅 자원 없이도 AI 기능을 강화할 수 있는 온디바이스 신경망처리장치(NPU) 구조와 소프트웨어(SW) 시스템을 최초로 개발한 성과를 인정받아, '2024 국제 컴퓨터구조 심포지엄(ISCA 2024)'에서 최우수 연구 기록물상을 수상했습니다. 연구팀은 자율 시스템 상에서 연속 학습을 가속화하여 적응형 AI를 실현하며, 이를 위해 개발한 코드와 데이터를 오픈소스로 공개하여 온디바이스 AI 연구의 지속적인 발전을 도모하고 있습니다. 온디바이스 AI는 기기의 센서 데이터를 활용한 추론뿐만 아니라, 변화하는 환경에 맞춰 훈련 데이터를 생성하고 학습하는 연속 학습 과정을 포함합니다. (기사)
|
|
|
AI와 인간의 공생 시대, 뉴럴링크의 미래
일론 머스크는 뉴럴링크의 두 번째로 인간에게 뉴럴링크의 칩을 이식하는 임플란트 수술이 성공적으로 마무리되었다고 밝혔습니다. 렉스 프리드먼과의 팟캐스트 인터뷰를 통해 소개된 이 내용은 실은 몇 개월 전부터 예정되어 있는 것으로 보도되었던 사항입니다. 이 수술은 척수 손상을 입은 마비 환자가 대상이었고 400개의 전극을 뇌에 이식하는 방식으로 진행되었다고 합니다. ‘텔레파시’로 불리는 뉴럴링크의 칩은 뇌파을 수집할 수 있는 총 1024개의 전극을 가지며, 대뇌의 운동피질 근처에 구멍을 내고 심게 되는데 이 칩이 읽은 신호를 해석해서 기기를 조작할 수 있는 동작으로 바꿔주는 역할을 하게 됩니다.
이보다 앞선 올해 1월 29일, 첫번째 진행된 임상수술이 있었죠. 대상은 다이빙을 하다가 불의의 사로고 전신마비가 된 놀런드 아르보였는데, 그는 현재 생각만으로 태블릿이나 컴퓨터 마우스를 다루며 다양한 컴퓨터 게임을 할 수 있게 되어 그의 삶의 수준은 전보다 훨씬 향상되었다고 합니다. 전체 전극 1024개 가운데 약 10% 수준을 활용하고 있는 것으로 알려져 있죠. 중간에 일부 전극이 빠져 신호를 놓치는 문제가 발생했지만 알고리즘을 개선해 문제를 해결하기도 했었습니다.
뉴럴링크는 올해까지 총 8명에게 임플란트 수술을 진행할 예정이라고 밝혔는데 그만큼 많은 실험 데이터가 수집되므로 이 분야 기술의 급격한 진보가 예상됩니다.
|
|
|
사진: 뉴럴링크의 기기, 장비 간 상호 작동 방식 개요 (출처) |
|
|
AI 활용으로 돼지 임신 판정 기술 개발
농촌진흥청이 세계 최초로 인공지능(AI)을 이용한 돼지 임신 판정 기술을 개발했습니다. 이 기술은 비전문가도 간단한 초음파 촬영으로 돼지의 임신 여부를 95% 이상의 정확도로 판단할 수 있습니다. 20만 점의 고화질 초음파 데이터를 기반으로 AI 모델을 훈련했다고 합니다. (기사)
|
|
|
인공지능 관심도 및 영향력 증대
조사에 따르면 79%의 사람들이 인공지능(AI)에 관심을 가지고 있으며, 78%는 기술 발전을 체감하고 있습니다. 이는 특정 세대나 학력에 국한되지 않고 모든 연령대에서 인공지능에 대한 관심이 증가하고 있음을 보여줍니다. 인공지능이 '우리 사회'에 긍정적인 영향을 미친다고 믿는 사람은 66%이며, '나의 삶'에 긍정적이라고 응답한 사람도 50%입니다. 사람들은 인공지능에 대해 호기심과 기대감을 가지면서도 의심과 두려움도 함께 느끼고 있습니다. 인공지능의 발전이 인류에 이익을 줄 것이라는 기대와 사생활 침해 등의 우려가 공존하며, 문제 발생에 대한 대처가 미흡하다는 인식도 커지고 있다고 합니다. (기사) |
|
|
TAPTR(Tracking Any Point with TRansformer)은 비디오의 모든 점을 트랜스포머를 사용하여 효율적으로 추적하는 프레임워크입니다.
기존의 Optical Flow 추정 방식은 두 연속된 프레임 간의 상관 관계를 추적할 수 있도록 했지만, 장기적인 시간 정보를 처리하지 못해 추적 대상이 가려지거나 하는 경우에 이를 제대로 처리하지 못하는 문제가 있었습니다. 뿐만 아니라, 기존 방법들은 서로 다른 프레임의 추적 점들의 정보가 서로 교환되지 않기 때문에 같은 객체에 속한 점들 간에도 상관관계가 무시되는 한계가 있었습니다.
TAPTR은 이런 문제를 DETR(Detection Transformer) 모델에서 영감을 받아, 각 비디오 프레임의 각 추적점을 포지션과 콘텐츠로 나눠 쿼리로 표현하고, 이러한 쿼리를 시간 축을 따라 self-attention을 통해 정보를 교환하게 하여 장기적인 시간 정보를 처리합니다. 또한, Optical Flow 모델의 cost volume (*1) 개념을 채택하여, 더 긴 시간 정보를 제공하면서 특징 드리프트(*2) 문제를 완화합니다.
*1) 이미지의 두 점 사이의 시각적 유사성을 측정하는 매트릭스. 인접한 두 프레임 간의 움직임을 추정하는 데 사용되며 특정 위치에 있는 점과 모든 가능한 이동 위치 간의 매칭 비용을 계산하여 최적의 이동 방향을 예측할 때 사용
*2) 특징 드리프트(Feature Drift) : 시간이 지나면서 추적 대상의 위치나 모습이 변함에 따라 모델이 추적 대상을 잃어버리는 문제
|
|
|
FLUX.1은 독일 스타트업 Black Forest Labs가 발표한 이미지 생성 모델입니다. 이미지 생성 AI 가운데 잘 알려져 있는 Stable Diffusion이나 심지어 Midjourney를 능가하는 성능을 보였다고 해서 주목 받고 있습니다. 현재 버전은 이미지만 만들 수 있지만, 향후에는 비디오 생성까지 기능을 확장할 계획이라고 합니다.
근데... 독일 AI 스타트업을 소개하는 것은 처음인 것 같죠? Black Forest Labs은 Stable Diffusion을 만든 이들이 참여했다고 알려져 있습니다. 생성된 이미지의 품질이 어째 너무 좋다 싶었는데 이유가 있었네요!
이 모델은 다음의 3가지 타입으로 공개되어 있습니다.
- Flux.1 Pro : 최상위 모델로 개발사의 API로만 사용할 수 있으며 유료
- Flux.1 Dev : Pro의 경량화 버전이며 개발자에게 공개, 상업적 사용은 불가
- Flux.1 Schnell : 가장 경량화되고 빠른 모델로 Apache 2.0 라이선스로 공개되어 상업적 사용 가능
모델의 특징은 다음과 같습니다.
- 트랜스포머와 확산 기술을 결합한 하이브리드 AI 아키텍처를 사용
- 최대 120억개 매개변수
- 빠른 생성 속도, 탁월한 텍스트 렌더링, 동작이나 자세 예측, 손이나 손가락 표현의 정확도가 특히 뛰어남
- 프롬프트 이해도, 출력 퀄리티, 스타일 다양성 면에서 높은 성능을 보임
- 데모에서는 2048x2048 크기의 결과물 제공
|
|
|
사진: Flux.1 으로 생성한 이미지 예시 (출처) |
|
|
SF3D는 Stability AI가 공개한 단일 이미지에서 고품질의 3D 메쉬를 빠르고 안정적으로 생성하는 기법입니다. 이 기술이 소개된 사이트 상에는 마치 자동판매기처럼 입력된 이미지에 맞는 텍스처가 입혀진 3D 모델을 순식간에 찍어내는 기계 영상이 나오는데 이 기법을 단번에 이해할 수 있게 해 줍니다.
기존의 방식에서는 3D 메쉬 생성 시, 이미지 속의 조명과 그림자가 생성되는 3D 모델의 텍스처에 그대로 포함되는 바람에 다른 조명 환경에 놓였을 때도 기존 것이 그대로 남아 있어 부자연스러울 수 밖에 없는 문제가 있었습니다. 그리고, 고정된 버텍스 색상을 사용해 텍스처를 표현하다보니 높은 폴리곤 수로 인해 메모리 사용량이 증가하고 성능이 저하되는 문제도 있었습니다. 이 외에도 계단 현상(Marching Cubes Artifacts)과 재질 속성 부족(Lack of Material Properties)와 같은 문제도 발생했었습니다.
SF3D는 이런 문제를 해결하기 위해, 조명과 반사 속성을 분리하는 차별화된 조명 모델을 사용하고, 3D 표면을 2D 평면으로 펼쳐 텍스처를 입히는 UV Unwrapping 기법을 도입해 고해상도 텍스처를 매핑하는 방식을 채택했습니다. 또, 향상된 메쉬 추출 및 정제 기법(Mesh Extraction and Refinement)과 재질 추정(Material Estimation)등을 도입해 계단 현상을 줄이고 금속성과 거칠기를 추정해 객체의 반사 특성을 처리합니다. SF3D의 특징은 이미지가 입력되면 0.5초 만에 고해상도 텍스처가 적용된 고품질의 3D 메쉬를 생성하며 결과물의 크기도 최소화되어 타 응용 프로그램에서 쉽게 가져와 사용할 수 있습니다.
|
|
|
인공지능 서비스의 배포와 운영 시 도움이 필요하신가요?
(주)소이넷은 인공지능 서비스를 제공하는 기업들 가운데 서비스 배포와 운영에서 어려움을 겪고 계신 곳에 도움을 드릴 수 있습니다.
혹시 구독자님의 회사는 다음과 같은 어려움을 겪고 계시지 않나요?
- AI 모델을 개발하고 학습 후 서비스를 위한 성능(Accuracy)은 달성했는데, 정작 최적화 엔지니어가 없어서 어플리케이션, 서비스로의 배포를 위한 실행최적화를 못하고 있어요!
- AI 서비스를 이미 제공하고 있지만, 비싼 클라우드 GPU 서버 인스턴스 사용료가 부담이 되네요. 흠... 경비를 절감할 수 있는 방안이 없을까?
- 서비스에 적합한 공개 SOTA 모델이 있지만 그대로 가져다 쓰기에는 우리 쪽 어플리케이션에 접목하기도 어렵고 운영 비용도 많이 들 것 같은데 어쩌지?
- 서비스에 사용되는 AI 모델을 통합적으로 관리, 배포, 모니터링을 하고 싶은데 그렇다고 비싸고 너무 복잡한 솔루션을 쓸 수는 없고 어쩌지?
- 비즈니스 도메인 기업이긴 한데 자체로 인공지능을 적용하기에는 기술적인 난이도도 있고... 어디 함께 공동 솔루션을 개발할 곳은 없을까?
- 무인매장 구축이나 거기서 사용할 수 있는 제품을 보유하고 있는 곳이 필요한데 없을까?
- 안면식별 기반 본인인증, 성인인증 솔루션이나 기술을 보유한 곳을 찾고 있는데...
그렇다면 언제든 아래 연락처로 문의 주세요. 함께 해결책을 고민해 드리겠습니다.
|
|
|
오늘의 뉴스레터는 여기까지 구독자님, 다음 번에도 재미나고 흥미로운 소식을 가지고
다시 찾아뵙겠습니다. |
|
|
구독해 주시면 좋은 소식, 정보로 보답하겠습니다. |
|
|
주식회사 소이넷 sales@soynet.io 경기 성남시 분당구 성남대로331번길 8 (킨스타워) 1503호
대표전화 : 031-8039-5377
|
|
|
|
|