현실 직시와 행동의 중요성을 생각해 봅니다 안녕하세요, 구독자님.
즐겁고 보람찬 한 주 보내고 계신가요?
혹시 출퇴근에 얼마나 시간을 쓰시나요? 제 통근 시간은, 출근은 길이 막히지 않으면 2시간, 비라도 조금 오는 날은 거의 3시간 가량이고, 퇴근은 이보다는 조금 덜 걸립니다. 광역버스에서 다른 광역버스로 환승하는 방식으로 다니는데 아시다시피 수도권 근교의 교통 사정은 대중교통을 이용하더라도 특정 시간대에는 답이 없는 경우가 있기 때문이죠. 이 긴 통근 시간 동안 저는 대부분 팟케스트, 유튜브 등을 보거나 들으면서 시간을 보냅니다. 차에서 뚫어져라 뭔가를 보다보면 멀미가 나기도 해서 책은 가까이 하지 않았었는데 며칠 간은 모처럼 책을 잡았습니다. 최근 슈카월드 채널에서 우리나라 사람들 가운데 1년에 책 한 권도 안 읽는 사람의 비율이 2023년 기준으로 68%에 해당한다는 조사 결과를 소개한 적이 있었는데, 돌아보니 저도 최근에는 책 읽는 횟수와 시간이 예전 대비 많이 줄었다는 생각이 들었기 때문입니다.
제가 읽고 있는 책은 스웨덴의 젊은 환경운동가 그레타 툰베리에 대한 것입니다. 기후의 급격한 변화를 걱정하는 것은 같겠지만, 입으로만 말하고 실제 행동없이 방관하는 저와는 달리, 그녀는 어릴 때 부터 자신과 부모를 포함한 주변사람들의 생활 방식 자체를 바꿔가며 그 소신을 이어가고 있죠 . 아스퍼거 증후군이라는 자폐 스펙트럼 장애를 가지고 있어 타인과의 교류가 쉽지 않음에도 불구하고 이를 극복하고 대중 앞에 나서 기후 운동을 주도하고 있는 것을 보면 참 대단하다 싶습니다. 15세이던 2018년 말, 그레타는 매주 금요일 등교를 거부하고 스웨덴 의회 앞에서 '기후를 위한 학교 파업 (Skolstrejk För Klimatet)'을 진행한 바 있었는데 이 사건은 이후 유럽 전역을 넘어 세계적인 운동으로 확산되었고, 그 결과 국제청소년연대모임 '미래를 위한 금요일' (Fridays for Future)'이 결성되기도 했습니다. 그레타와 관련된 사항은 BBC 다큐멘터리로도 제작되었는데 제가 사용하는 OTT에서는 볼 수가 없어서 아직 보진 못했는데 아이와 함께 한번 볼 생각입니다. 유튜브에 올라온 소개영상과 유엔 연설 영상만 참고삼아 공유 드립니다.
* 그레타의 아빠 스반테는 스웨덴의 배우이자 음반제작자, 엄마 말레나는 유명 오페라 가수입니다. 딸의 생각과 활동을 지원하기 위해 실제 생활 전반을 바꿨죠. 전기차로 교체, 자전거, 기차 이용, 태양광 시설 설치, 채식주의자로 변신, 비행기 타기를 포기해 해외 공연을 포기하는 등등... 부모들도 대단한 분들이네요...
현재 지구 환경 변화는 티핑포인트로 접근하고 있다고 합니다. 우리가 살아가는 현재는 그 길 도중에 있는 터널이고 우리는 버스에 탄 승객인 셈입니다. 터널 진입 전과 진입 후에 '공사 중'이나 '벼랑'을 의미하는 표지판이 계속해서 보이고 있어 현재 속도로 혹은 가속을 할 경우 이 버스가 도달할 곳은 명확해 보이죠. 하지만, 운전기사는 아니라고... 자기가 이 길을 잘 알고 있다고 하며 계속 속도를 높입니다. 그레타의 주장은 '각자가 지금 당장 자리에서 박차고 일어나, 기사에게 당신이 틀렸고 속도를 늦추거나 멈추라고 요구해야 한다'는 것입니다. 운전기사는 각국의 정치인들, 행정 전문가 등을 의미하는데 이들이 기후재앙을 막기 위한 실질적인 행동을 하지도, 이끌어내지도 못하고 있다고 판단한 거죠. 지구 전체를 파괴할만큼 큰 혜상이 접근하고 있다는 사실을 알게 되었지만 그 현실을 받아들이려고 하지 않거나 정치적으로 이용하는데 열을 올리다가 결국 멸망에 이르게 되는 스토리를 가진 '돈룩업'이라는 영화의 한 장면을 떠올리시면 될 것 같습니다. |
|
|
제 출근길 상에도 2.5km 길이의 터널이 하나 있습니다. 몰랐었는데 유튜브 보면서 지날 때와 책을 보거나 혹은 지나는 차창 밖을 보면서 지날 때 시간에 대한 체감이 달랐습니다. 접해있는 현실 바깥으로 관심을 돌리고 수동적으로 받아들이기만 할 때 시간이 훨씬 빨리 지나간다고 느낀거죠. 분명한 이유는 모르겠습니다만... 단순히 주어진 영상을 눈과 귀로 받아들이기만 하는 것 대신 뭔가를 직시하고 그것에 대해 깊이 생각하게 되면 그 시간이 고스란히 '체감하는 시간'으로 바뀌는 것이 아닐까 하고 생각하게 됐습니다. (그게 아니면 2배속 영상보기와 1배속 책읽기 사이의 속도감 때문일 수도 있구요. ^^;)
뉴스를 보면 우리 주변에도 참 많은 일들이 일어나고 있습니다. 하지만, 그 가운데 우리가 직접 접하는 것은 몇 개 되지 않고 요사이엔 그 마저도 플랫폼 업체의 알고리즘에 따라 좌우됩니다. 모르고 넘어가는 것은 어쩔 수 없겠지만 알면서도 모르는 척 아무런 행동을 하지 않는 것은 떳떳해 보이지는 않습니다. 그레타처럼 나서서 행동을 하는 수준은 아니더라도 해당 주제에 대해 가끔씩 자기만의 의견을 가지고 주변 사람들과 그런 내용을 나누고 토의해 볼 수 있는 '열림'은 추구해야 하지 않을까 생각해 봅니다.
늘 행복하고 건강한 나날 보내세요~
|
|
|
레딧(Reddit), OpenAI에 데이터 판매 계약 체결
미국 최대 온라인 커뮤니티인 레딧에서 사용자 게시글을 OpenAI가 AI 학습을 위한 데이터로 사용할 수 있도록 하는 데이터 라이센싱 계약을 체결했다고 합니다. 파운데이션 모델을 개발하기 위해 빅테크 기업들이 수많은 데이터를 필요로 하는 것은 잘 알려진 사실입니다. 구글은 자체 검색데이터에서, 메타는 자사의 페이스북과 인스타그램 등에서, xAI의 경우 X(구 트위터)에서, 마이크로소프트는 자사 검색데이터와 전문 데이터 공급업체와의 계약을 통해서 해당 문제를 해결하고 있죠. 같은 방식으로 OpenAI는 더 많은, 질 높은, 학습 데이터를 확보하기 위해 레딧과 손을 잡은 것으로 이해할 수 있습니다. OpenAI는 GPT4의 학습을 위해 위키피디어나 github 등 무료 오프소스 플랫폼의 데이터 외에도 각종 언론사의 기사나 유튜브나 팟캐스트 등의 콘텐츠를 무단으로 사용했다고 뉴욕타임스 등으로부터 소송을 당한 바가 있었는데 이런 문제를 피해가기 위한 움직임 가운데 하나겠죠. 5/23에는 OpenAI가 뉴스코퍼레이션과 대형 콘텐츠 라이선스 계약을 체결했다는 기사가 있어습니다.
참고로 레딧은 2005년도에 설립된 기업으로 현재는 8270만명이 넘는 일일 활성사용자를 보유하고 있으며 OpenAI의 CEO인 샘 앨트만은 레딧의 7.6%의 주식을 가진 최대주주 가운데 한명이라고 합니다. ( 기사) |
|
|
마이크로소프트, 인공지능 PC 관련 전략 소개
마이크로소프트는 자사의 개발자 컨퍼런스 'Build'에서 인공지능 PC 관련 전략을 공개했습니다. 새로운 윈도우 기반의 AI PC로 'Copillot + PC'를 공개했는데 자사의 AI 서비스인 Copliot을 클라우드가 아닌 로컬 PC 디바이스에서 실행되도록, 최적화된 SLM과 PC에서 동작하는 다양한 AI 모델 그리고 이를 지원하는 AI전용 NPU (약 45TOPS 성능)를 결합한 것이라고 볼 수 있습니다. 특이한 것은 이번에 소개된 것이 ARM 아키텍처 기반을 먼저 공개했다는 것입니다. x86 아키텍처 버전이 향후에 출시될 수도 있겠지만 어째... 순위에서 밀리는 듯한... 예전 같으면 특정 AI 모델 하나를 돌리기 위해 노트북이건 PC건 빵빵한 GPU 하나를 통째로 사용해야 했지만 향후에는 다양한 AI모델을 자체 NPU를 통해서 처리할 수 있게 될 것이므로 이동성이나 작업효율, 다양한 업무로의 적용성 등이 대폭 향상될 것으로 기대됩니다. ( 기사) |
|
|
OpenAI, AGI 안전 기술 개발 부서 팀 해체
OpenAI는 AGI의 출현에 대비한 안전기술개발 조직인 'Superalignment' 팀을 해체(독립부서로 명맥은 유지)하고 팀원들을 다른 팀으로 이전 배치했다고 합니다. 이에 따라 멤버들 중 일부는 회사를 떠났는데 그 가운데는 공동으로 이 팀을 이끌던 일리야 슈츠케버와 얀 레이케가 포함되었다고 합니다. 일리야 슈츠케버는 러시아 태생의 캐나다인으로 OpenAI 사내이사였으며 지난 해 샘 앨트먼의 해고 사태의 주역이기도 했습니다. 그가 과거 Google을 떠나 OpenAI에 참여한 것이나, 지난 번 OpenAI에서 샘 앨트먼의 해고를 주도한 것이나, 이번에 OpenAI를 떠나기로 한 것은 AGI 출현을 미리 대비하기 위한 안전 기술 개발의 필요성이라는 한 가지 목표 때문인 것으로 보입니다. 첫번째 옮길 때도 구글이 AI의 안정성에 대한 대비를 하지 않고 있기 때문이라고 했었고, 두번째는 OpenAI 내부에서 AGI에 근접한 기술이 개발되었다는 루머 이후에 발생한 사건이었으며, 세번째 즉, 이번 OpenAI에서의 퇴사 또한 샘 앨트만의 CEO 복귀 이후 안전기술개발 연구를 위한 예산을 대폭 축소했기 때문이라는 얘기가 돌고 있기 때문입니다.
팀 해체와 인력 재배치의 이유에 대해서는 샘 앨트먼이 생각하는 연구 우선순위가 팀의 것과 달랐기 때문에 연구 개발을 위한 컴퓨팅 리소스의 지원도 대폭 줄어든 것이라고들 합니다. 음모론을 제기하는 일부에서는 OpenAI가 AGI에 가까운 기술을 개발했고 이에 대한 개발 속도를 높이길 원하는데, 안전기술개발조직은 이에 걸림돌이 된다고 생각해서 연구 개발을 제대로 진척시키지 않았다는 설을 얘기하기도 합니다. 이유가 어떤 것이 되었건 사건의 본질이 가까운 미래에 공개되지 않을까 예상해 봅니다. 그게 좋은 소식이건 그렇지 않은 것이건 말이죠. ( 기사) |
|
|
테슬라, 자율주행 AI학습을 위해 중국에 데이터센터 설립 추진
전기차 업계의 선두 주자인 테슬라 자율주행 기술의 확대를 위해 중국에 자체 데이터센터 설립을 추진한다고 합니다. ( 기사) 테슬라는 라이다, 레이더를 배제하고 카메라만 이용한 AI 자율주행 기술을 개발하고 있으며, 이미 도로를 주행중인 많은 차량에서 AI학습을 위한 주행데이터를 수집하고 이를 다시 학습에 반영하고 있습니다. 최근에는 FSD (Supervised) 12.6 버전을 내 놓으며 다른 자동차 업체들과의 격차를 벌리고 있죠. 아직은 북미지역 (미국, 캐나다)에만 공식 출시가 되어 있고 유럽과 중국 등에서는 출시를 위한 준비만 하고 있는 상황입니다. 중국의 경우, 자국의 데이터의 해외반출이 엄격히 통제되고 있는터라 주행데이터의 외부 전송이 불가능했었는데 최근 중국 당국에서 테슬라의 신청을 허가했다는 보도도 있었습니다. 미국으로 데이터를 옮겨서 학습한 것을 다시 중국에 반영할 것인지 아니면 중국 내 데이터센터를 이용한 학습을 진행할 것인지에 대해서는 아직 명확하게 공개된 것은 없다고 합니다.
학습을 중국 내에서 진행하기 위해서는 수많은 엔비디아의 고성능 GPU가 필요할텐데 미국 쪽의 반도체 수출 규제 때문에 실현이 어려워 보이는 것이 현실입니다. 혹... 아직은 규제 대상이 아닌 테슬라 도조 칩 기반 시스템을 중국에 세울 데이터센터에? ^^; 엉뚱한 상상이긴 하네요... 앞으로 실제 진행되는 추이를 봐야할 것 같습니다. |
|
|
MistoLine은 손으로 그린 스케치, 건축 도면, 드레스 디자인 등 다양한 유형의 라인 아트 입력을 처리할 수 있는 SDXL-ControlNet 모델입니다. (ControlNet은 조건을 추가하여 확산모델을 제어하는 신경망 구조) 이를 이용해 선명하고 생생한 고품질의 이미지(짧은 면 기준 1024px 이상)를 생성할 수 있습니다. MistoLine은 새로운 전처리 알고리즘으로 AnyLine을 사용하고, SDXL ControlNet 모델에 초점을 맞춰 재훈련되었습니다. 특징으로는 아주 디테일한 부분까지 잘 처리한다는 것입니다. 즉, 요소의 디테일이나 이미지 상의 텍스트 라벨을 정확히 추적할 수 있고, 라인 아트와 깊이 매핑을 결합하여 추적 정밀도를 더 높일 수 있습니다. 또한 복잡한 시나리오에서의 세부 복원하는 능력과 신속한 정렬, 안정성 등이 기존 모델들을 능가한다고 합니다.
|
|
|
사진: MistoLine을 적용한 결과물 예시(상), SDXL+ControlNet 의 구조 (하) (출처) |
|
|
HiDiffusion은 이미지 생성 프레임워크로 확산 기반의 이미지 생성 모델을 이용해 고해상도 이미지를 생성할 때 객체가 불필요하게 중복해서 나타나거나 생성 시간이 많이 걸리는 문제를 해결하기 위해 제안되었습니다. 기능 맵 크기를 동적으로 조절해 객체 중복 문제를 해결하기 위해 RAU-Net (Resolution-Aware U-Net)을, 고해상도 블록의 self-attention에서 발생하는 높은 연산량을 줄이기 위해 MSW-MSA (Modified Shifted Window Multi-head Self-Attention) 메커니즘을 사용했다고 합니다. Text to Image, Image to Image, Image Inpainting 등 다양한 기능을 제공하며, 특징으로는 사전 훈련된 확산모델의 해상도와 속도를 높이되 별도의 훈련없이 바로 플러그 앤 플레이 방식으로 손쉽게 사용할 수 있도록 되어 있다는 것입니다.
|
|
|
사진 : HiDiffusion 프레임워크 개요 설명 (상), 타 모델과의 생성 결과물 및 속도 비교 예시 (하) (출처) |
|
|
마이크로소프트에서 Phi-3 Vision 모델을 공개했습니다. Phi-2가 공개된 것이 작년 12월, Phi-3가 올 4월이었으니 확실히 생성형 AI와 LLM 분야는 비즈니스 기회가 확실하고 투자규모가 커서 그런지 발전 속도도 무지 빠른 것 같습니다. 예전 소식에서 말씀드린 바와 같이 Phi 모델들은 데이터 전체가 아닌 핵심적인 것만 집중적으로 학습하는 하는 방식으로 적은 데이터셋으로 높은 성능을 내도록 되어 있는데 그 컨셉은 그대로 이어진다고 합니다.
Phi-3-vision-128K-Instruct의 경우, 4.2B개의 매개변수가 있으며 내부적으로 이미지 인코더, 커넥터, 프로젝터 및 Phi-3 Mini 모델이 포함되어 있다고 합니다. 500B 크기의 비전 및 텍스트 토큰을 학습했다고 하죠. Phi-3-vision은 Phi-3 모델 가운데 최초의 멀티모달 모델인데, 텍스트 추출과 이해, 코딩, 이미지나 사진 등에 대한 일반적인 시각적 이해, 차트나 다이어그램 이해 등등 다양한 일을 수행할 수 있습니다. 참고로 MIT 라이선스를 따릅니다. (Phi-3 small, medium도 MIT로 전환되었다고 합니다)
|
|
|
사진 : Phi-3 제품군 (상), Figure 1 휴머노이드 시연 영상 스틸컷을 이용해 테스트 한 결과물 (하) |
|
|
인공지능 서비스의 배포와 운영 시 도움이 필요하신가요?
(주)소이넷은 인공지능 서비스를 제공하는 기업들 가운데 서비스 배포와 운영에서 어려움을 겪고 계신 곳에 도움을 드릴 수 있습니다.
혹시 구독자님의 회사는 다음과 같은 어려움을 겪고 계시지 않나요?
- AI 모델을 개발하고 학습 후 서비스를 위한 성능(Accuracy)은 달성했는데, 정작 최적화 엔지니어가 없어서 어플리케이션, 서비스로의 배포를 위한 실행최적화를 못하고 있어요!
- AI 서비스를 이미 제공하고 있지만, 비싼 클라우드 GPU 서버 인스턴스 사용료가 부담이 되네요. 흠... 경비를 절감할 수 있는 방안이 없을까?
- 서비스에 적합한 공개 SOTA 모델이 있지만 그대로 가져다 쓰기에는 우리 쪽 어플리케이션에 접목하기도 어렵고 운영 비용도 많이 들 것 같은데 어쩌지?
- 서비스에 사용되는 AI 모델을 통합적으로 관리, 배포, 모니터링을 하고 싶은데 그렇다고 비싸고 너무 복잡한 솔루션을 쓸 수는 없고 어쩌지?
- 비즈니스 도메인 기업이긴 한데 자체로 인공지능을 적용하기에는 기술적인 난이도도 있고... 어디 함께 공동 솔루션을 개발할 곳은 없을까?
그렇다면 언제든 아래 연락처로 문의 주세요. 함께 해결책을 고민해 드리겠습니다.
|
|
|
오늘의 뉴스레터는 여기까지 구독자님, 다음 번에도 재미나고 흥미로운 소식을 가지고
다시 찾아뵙겠습니다. |
|
|
구독해 주시면 좋은 소식, 정보로 보답하겠습니다. |
|
|
주식회사 소이넷 sales@soynet.io 경기 성남시 분당구 성남대로331번길 8 (킨스타워) 1503호
대표전화 : 031-8039-5377
|
|
|
|
|