시력과 렌즈, 그리고 인공지능 기술을 알아봅니다. 안녕하세요, 구독자님.
이번 한 주도 보람차게 보내셨나요?
날씨는 본격적으로 가을로 접어들고 있는 것 같네요.아침, 저녁과 낮의 기온차가 10도 이상 되고 연이는 비 소식도 있는터라 아직은 완연한 가을느낌은 아니지만, 밤이 되면 피부에 서늘하게 내려앉는 찬 기운이 이제 제대로 가을을 즐길 때가 거의 왔구나 하는 느낌을 가지게 합니다.
가을은 독서의 계절이라고들 합니다. 최근에는 사람들이 책보다는 유튜브 같은 영상 플랫폼을 이용하는 경향이 더 강해졌죠. 저만해도 '이사를 가면 도서관이 근처에 있어야 한다'는 희망원칙을 가지고 있었고 여전히 책을 사거나 빌려보는 것을 좋아하지만 손쉽고 빠르게 정보를 얻고 싶을 때는 역시나 다른 사람들과 같은 선택을 합니다. 책이나 인터넷 플랫폼이나 처음엔 둘 다 도구일 뿐인데 큰 차이가 있겠냐는 생각이었죠. 시간을 두고 돌아보니 보고 들은 것을 온전히 내 것으로 소화해 내는 것에서 질적인 측면은 책이, 양적인 측면은 인터넷 플랫폼이 더 나았습니다. 앞으로의 선택은 무엇이냐구요? 어쩔 수 없이 둘 다 섞어야겠죠. 한국인은 비빔밥을 좋아합니다! ^^
가을에서 독서로 이어졌는데 실제 제가 하고 싶은 얘기는 '눈'과 관련된 것입니다. 그것도 '노안' 관련된 것이죠. 사람들은 40대 중후반이 되면 대부분 노안을 겪게 됩니다. '이젠 내가 늙었구나' 라는 것을 제대로 실감하게 되는 대표적인 사건이 '갑자기 찾아온 노안'인데요... (이건 겪어본 사람들은 다 인정. 그렇지 않은 사람은 와 닿지 않을 겁니다 ^^;) 독서나 유튜브 시청도 눈이 좋아야 할텐데 노안이 오면 아무렇지도 않았던 그런 행위를 할 때조차도 이전보다 훨씬 귀찮거나 피곤해지거든요. 갑자기 눈앞에 책을 들이밀었을 때 몸을 뒤로 젖히면서 눈의 초점을 맞추려는 행동을 한다면 구독자님도 그 단계에 접어든 것이라고 볼 수 있습니다. 한번 테스트 해 보세요.
이번 소식에서는 시력과 렌즈에 관련된 내용들, 그리고 추가로 새로운 인공지능 기술을 소개해 드리겠습니다. |
|
|
노안이란?
노안은 눈에 있는 수정체의 탄력이 감소되어 가까이 있는 물체를 보는 능력에 문제가 생기는 현상을 말합니다. 잘 아시겠지만 눈에는 맨 바깥 쪽에 각막이라는 부분이 있고 그 아래에 렌즈 역할을 하는 수정체가 있습니다. 수정체를 당기고 조이는 역할을 하는 섬모체 (아래 그림에서 Suspensory ligament of lens로 표시) 등의 기관이 있는데 이 기관이 제대로 기능을 하지 못하게 되면서 발생하는 것이죠. (참고 링크) |
|
|
사진 : 사람의 눈 구조 (출처: 위키미디어) |
|
|
노안 인구가 많나요?
노안이 나이가 들면서 자연적으로 나타나는 현상이니 인구의 연령비와 같다고 보면 될 것 같습니다. 40대 중반 이후면 다 해당되겠죠. 서울대병원 국민건강지식센터에 따르면 35~39세에서는 약 30%, 40세 이상에서는 약 70% 에 달한다고 합니다. (링크) 당연히 그 나이 이후는 거의 100%라고 생각해도 되겠죠... 60세 이후가 되면 더 심해지는 경우가 없어진다고 하는데 안타깝게도 그 이유가 탄력성 자체가 아예 없어지기 때문이라네요...
노안을 해결하기 위한 기술은 어떤 것이 있나요?
노안 자체를 치료할 수 있는 뚜렷한 해결방법이 있지는 않습니다. 다만 노안으로 인한 불편함 등의 증상을 개선하기 위해, 안경렌즈를 착용하거나 수술을 하는 방법이 있습니다. 안경렌즈라고 하면 단초점(돋보기) 렌즈를 이용하거나 이중초점렌즈 또는 누진다초점렌즈(누진굴절력렌즈 혹은 연속초점렌즈라고도 함)를 말하는데 기존에 안경을 쓰던 분들은 안경 교체를 하는 불편함을 덜기 위해 누진다초점렌즈와 같은 것을 이용하는 경우들이 늘고 있습니다. 수술을 통한 방법은 레이저나 고주파를 이용한 수술, 각막인레이나 다초점인공수정체를 삽입하는 방법 등이 있다고 합니다. (링크)
이중초점, 다초점 흠... 여러 초점을 지원하는 렌즈가 쓰이나보네요.
기존에 안경을 쓰던 경우를 생각해 보죠. 근시의 경우, 멀리 있는 것을 잘 보기 위해 안경이 필요한데 노안이 없던 경우에는 그 안경 렌즈 하나로 가까운 것도 잘 보였겠죠. 그런데 노안이 생기면서부터 기존의 렌즈 초점으로는 제대로 볼 수 없는 영역이 생기게 되는 겁니다. 그러다보니 안경 렌즈에서 특정 부분의 초점을 근거리에 맞도록 하는 방식으로 접근을 하는데 그게 특정 영역만 해당 초점의 렌즈로 되느냐 아니면 점진적, 연속적으로 초점이 조정되도록 렌즈를 만드느냐에 따라 이중초점, 다초점 이렇게 달라지게 되는 것이죠. 주변에서 가까운 곳이나 책, 신문 등을 보기 위해 쓰고 있던 안경을 벗거나 콧등 위로 렌즈를 올리시는 분들이 다 노안의 불편함을 겪고 있다고 생각하시면 됩니다.
그렇다면 보는 위치에 따라서 초점이 자동으로 바뀐다면 문제가 해결되지 않을까요? 바로 그렇게 해서 나온 제품 혹은 기술들이 있습니다. 기계적으로 초점을 바꾸거나 혹은 액체렌즈 나 메타렌즈 등을 사용해서 전기적으로 초점을 조절하는 가변초점렌즈가 있는데 그 가운데 최근에 많이 소개되고 있는 것이 액체렌즈입니다.
액체렌즈란?
액체렌즈란 비닐주머니 형태의 렌즈 내부에 액상 물질을 채운 렌즈를 말합니다. 전류나 전압으로 신호를 보내 액상물질의 곡률을 변경하여 초점거리를 조절하게 됩니다. 전기신호에 따른 액상 물질의 표면 장력 변화를 이용하는 것이라고 보면 될 것 같습니다.
액체렌즈는 어떤 장점이 있나요?
액체렌즈는 기계적인 렌즈장치 대비 초점거리를 변경하기 위해 렌즈의 위치를 이동시키기 위한 기계적인 구동부가 따로 존재하지 않습니다. 그러다보니 크기가 작고 무게도 가벼우며 배터리 소모도 적고 고장 확률도 낮다는 장점이 있습니다.
액체렌즈를 이용하고 있는 영역이 또 다른 것이 있나요?
액체렌즈는 단순히 시력교정 용으로만 사용되는 것이 아닙니다. 기계적인 구동부 없이 작고 단순해야 하며 저전력으로 빠른 시간 내에 초점을 변경해야 하는 업무에 활용할 수 있습니다. 예를 들면 스마트폰 내의 카메라 모듈이나 구강 스캐너, 스마트 제조공정에서의 머신비전 용 카메라 등등이 해당되겠죠.
실제로 2021년 3월 중국의 스마트폰 제조업체 샤오미는 'Mi Mix Fold'라는 제품을 내놓으면서 폰 내부의 카메라에 액체렌즈를 적용했다고 발표했습니다. 액체렌즈 하나로 30배 망원과 3cm 접사를 지원한다고 했었죠. 제품 출시 이후 분해, 분석 기사를 찾아봤지만 검색 능력의 한계로 찾지는 못했습니다. 그리고 최근 애플이 비전프로 제품의 특허내용에 액체렌즈 관련 내용이 포함시키기도 했습니다.
현재 액체렌즈를 제공하는 업체로는 글로벌에서는 코닝, 옵토튠(스위스) 등이, 국내업체로는 LG이노텍, 삼성전기 등이 있습니다.
액체렌즈와 관련된 추가적인 내용을 알려주세요.
추가적인 엑체렌즈에 대한 사항은 아래 링크들을 확인해 보시기 바랍니다.
- 영상) Corning® Varioptic® Lenses: Electrowetting Demonstration (Corning, 2018.4)
전압변화에 따라 곡률이 변하는 것을 보여주는 영상입니다.
- 영상) Why Do Spinning Liquids Make Great Telescopes? (The Action Lab, 2022.12)
액체렌즈는 천문학 쪽에서도 사용되고 있습니다. 구경이 큰 반사경의 경우, 제작비용이 너무 과다하기 때문에 수은 등의 액체를 회전시켜 곡률을 조절하는 방식으로 천체망원경에 적용되는 사레가 있다고 합니다. 이를 'Liquid Mirror Telescope'라고 한다네요.
- 영상) Automatically refocusing reading glasses | Nitish Padmanaban | TEDxBeaconStreet (TEDx, 2020.1)
초점을 가변적으로 조절할 수 있는 렌즈와 안구의 움직임을 트래킹할 수 있는 장치를 이용한 시제품 형태의 기술을 공개했습니다. 최근 국내에서 나온 연구 성과물과도 비슷한 부분이 있습니다.
- 영상) 기술은 카툭튀를 해결할 수 있을까? 액체렌즈와 메타렌즈, 스마트폰 카메라의 미래에 대해. (Gadget Seoul, 2021.7)
액체렌즈, 메타렌즈에 대해 설명합니다.
- What is Liquid Lens Technology and How Does It Work (Beeboom, 2021.4)
|
|
|
이런 시력 교정 등의 분야에도 인공지능이 적용될만한 곳이 있을까요?
다음과 같은 분야에 활용될 수 있거나 이미 되고 있을 것 같습니다.
- 시력검사 자동화 : 검사시간 단축과 안저검사/시력검사/굴절검사 등을 자동으로 수행
- 시력 관련 질환의 조기 진단 : 망막사진 분석으로 황반변성, 녹내장, 백내장 등의 질환 조기 발견
- 시력 교정 수술의 정확도 향상 : 환자의 각막 상태 정밀 분석 후 최적 수술 방법 추천, 수술 후 발생가능한 합병증 예측하여 예방 제안
- 시력 재활에 도움 : 개인 별 시각 훈련 프로그램 적용 및 결과 분석으로 시력 재활 도움
- 자동초점 안경 제작 : 동공추적과 깊이추정 등 안경 구동 시 필요한 영상 , 포인트 정보에 대한 분석
|
|
|
추가적으로 시력, 노안과 관련해서 볼만한 내용을 알려주세요.
제가 찾아본 내용을 정리해봤습니다.
- 인간이 더 편리하도록, 착한 기술 에이블테크란? (메가IT뉴스, 2023.1)
- [스타트업] 에덴룩스 박성용 대표 "시력훈련 되는 AI 눈 운동기, 시력 잃었던 의사가 만들었습니다" (elec4, 2023.4)
- [경제] 대한민국 연구진이 또 해냈다! 이것만 끼면 시력 2.0 될 수 있다! '인버터블 마이크로 렌즈' 세계 최초 개발 성공 쾌거! (퍼펙트경제, 2021.3)
- 기사) 액체렌즈 활용한 스마트 안경 개발 성공 (메디칼옵저버, 2023.8)
국내 안과의료진, 공대 교수의 협동 연구로 이뤄진 결과물로 2D 라이다를 이용해 거리측정을 하고 그에 맞춰 전기신호로 액체렌즈의 곡률을 변화시키는 방식으로 동작합니다. 아직은 노트북과 직접 연결되어야 하고 안경 자체도 커서 상용화하긴 어려워 시제품 이전의 기술검증 단계로 생각됩니다. 고도화해서 일반 안경 수준 비슷하게라도 되면 많은 사람들의 불편을 해소할 수 있을 것으로 생각됩니다. 파이팅~!!!
- “노안 물렀거라” 스마트 안경 개발…상용화가 관건 [9시 뉴스] (KBS뉴스, 2023.8)
- 렌즈 갈아끼울 필요 없이 셀프로 도수 조절하는 새로운 안경 등장! / 14F (일사에프, 2021.1)
셀프로 도수 조절하는 새로운 안경을 개발해서 의료상황이 열악해 검안사가 부족한 아프리카의 문제를 해결하려는 시도 사례를 소개합니다.
- Adlens Hemisphere Optical (buyadlens, 2012.12)
Adlens사가 제품화를 해서 판매한 제품도 있습니다. 수동으로 초점을 조절해야 하지만 액체렌즈이고 가변 초점은 맞습니다.
- This Toxic Liquid Telescope from the 1850s Is Finally Useful (SciShow Space, 2023.1)
액체반사경을 이용한 천문학 관측용 망원경에 대한 내용을 소개합니다.
- Why Do Spinning Liquids Make Great Telescopes? (The Action Lab, 2022.12)
실제 수은 등을 이용한 액체반사경망원경의 원리를 설명합니다.
- 머신 비전용 액체 렌즈, 다양한 유형의 시스템 활용을 위한 솔루션 (Vision System)
액체렌즈는 제조산업에서의 머신비전 쪽에서도 활용될 수 있다고 합니다.
|
|
|
TokenFlow: Consistent Diffusion Features for Consistent Video Editing
|
|
|
생성AI 모델을 이용해서 주어진 prompt나 입력 이미지에서 영상을 만들어내는 모델들이 속속 소개되고 있습니다. 이미지 생성에서 이제는 비디오 영상 생성으로 발전하고 있죠. 하지만 대부분 생성되는 비디오 영상은 각 프레임 별로 이전과 이후 간의 일관성이 보존되지 않는 경우가 많고 결과적으로 중간중간 튀어 버리거나 전혀 시간이 지나면서 점점 이전과는 전혀 다른 영상으로 바뀌게 되죠.
TokenFlow는 이렇게 생성AI를 이용한 영상 편집에서의 시간적인 일관성 문제를 해결하는 기술입니다. 즉, 입력 영상을 기반으로 주어진 텍스트 프롬프트를 적용해서 비디오 영상이 만들어질 때 완전히는 아니지만 그 전의 다른 모델들 대비해서 훨씬 자연스런 영상을 얻을 수 있습니다. 게다가 별도의 추가 학습이나 미세조정이 필요치 않다는 장점도 있으며 기존의 Text2Image 방식들과 함께 이용될 수 있다고 합니다.
|
|
|
사진: TokenFlow 모델 아키텍처 (상, (출처), 데모에서 샘플영상에 프롬프트만 바꿔서 생성해 본 예시(출처) |
|
|
아시는 바와 같이 LLM(Large Language Model)은 수많은 매개변수를 가지고 있으며 대부분은 수천억~수조개 수준의 대규모의 토큰을 가진 데이터셋으로 학습시키고 있습니다. Llama 모델을 공개한 Meta의 경우, 사전학습된 모델만 공개할 뿐 이를 학습시키기 위해 사용한 데이터셋 자체는 공개하고 있지 않습니다. 다들 이를 기반모델(base model)로 해서 각자의 용도에 맞춰 파인튜닝을 하는 방식으로 활용하고 있죠.
TinyLlama는 공개한 Llama 기반의 1.1B개의 매개변수를 가지는 작은 모델로, 3조개의 토큰 데이터를 이용해서 처음부터 학습을 진행하는 프로젝트입니다. 16개의 A100-40G GPU를 이용해서 90일 이내에 사전학습을 완료하는 것을 목표로 하고 있습니다. 작은 모델이라도 많은 데이터를 가지고 충분한 학습을 돌리면 좋은 성능을 얻을 수 있을 것이라는 가정하에서죠. 학습 진행에 따른 교차 엔트로피의 현황은 이곳에서 확인 가능합니다.
4bit로 양자화된 TinyLlama는 550MB의 메모리만 차지하게 된다는데 그럴 경우, 사양이 낮은 PC나 휴대전화, 임베디드 장비 등 인터넷 연결이 없는 상태에서 실시간으로 사용할 수 있는 성능 좋은 LLM을 얻을 수 있지 않을까 싶어 내심 기대하고 있습니다. 제발 이 시도가 성공적인 결론으로 끝나길 바랍니다. ^^
|
|
|
DEVA: Tracking Anything with Decoupled Video Segmentation
|
|
|
영상분석에서 많이 사용되는 방식으로 분류, 감지, 분할, 트래킹 등등이 있는데 이 가운데 분할(segmentation)은 학습데이터를 만드는데 객체감지(detection)의 경우에 비해 많은 시간과 비용이 듭니다. 데이터 가공을 할 때 이미지마다 대상이 되는 객체의 윤곽을 따라 적게는 십수개에서 많게는 수백개의 점을 가지는 폴리곤 라벨링 작업을 해야 하기 때문이죠. 비디오 영상이 수많은 프레임을 가지고 있다는 것을 생각하면 흠... 결코 쉽고 짧은 기간에 끝낼 수 있는 작업은 아닌 셈이죠.
DEVA는 'decoupled video segmentation' 방식을 통해 이미지 분할을 비디오 데이터로 효과적으로 확장할 수 있도록 하며 이를 위해 아래와 같은 기술들을 이용하고 있습니다.
- task-specific image level segmentation : 대상 작업에 대한 이미지 수준의 모델을 의미하며 여기서는 SAM(Segment Anything Model)이 사용
- task-agnostic temporal propagation : 한번 학습이 완료되고 나면 다양한 task에 일반화될 수 있는 보편적인 시간 전파 모델
- 위의 둘을 엮기 위해 서로 다른 프레임의 분할 가설의 (반)온라인 융합 파이프라인
|
|
|
사진: DEVA 모델의 아키텍처 (상), 적용된 예시 (하) (출처) |
|
|
그 외 최근 있었던 새로운 소식을 알려 드립니다.
- 빅테크 CEO들, 미국 의회의 '정부차원의 AI 규제' 논의에 참석
마이크로소프트, 구글, 엔비디아 메타, OpenAI 등 전세계에서 가장 유명한 빅테크 기업들의 CEO들이 미국 정부 차원의 AI규제에 대한 논의을 위해 미의회 비공개 포럼에 참석했습니다. AI로 인한 가짜정보의 양산, 일자리 대체 등의 부작용을 최소화하기 위한 안전장치 마련이 목적이었습니다. AI는 위험성도 크지만 잘 활용하면 엄청난 효율성 증대를 가져올 수 있는 양날의 검인만큼 가장 앞서나가고 있는 미국에서의 사회적인 합의 결과가 어떻게 나올지 잘 지켜봐야겠습니다. (기사)
- 빅테크들의 지속적인 AI 모델 개발 소식
Llama 등으로 오픈소스로 초거대언어모델을 비롯한 다양한 모델들을 공개하고 있는 Meta가 GPT4에 필적하는 신규 모델을 개발하고 있다는 보도가 Wall Street Journal에서 나왔습니다. 또한 OpenAI의 샘 앨트만도 멀티모달을 지원하는 차기 GPT에 대해 언급한 바 있습니다. 대부분의 사람들이 그렇게 하고 있을거라 생각을 했을터라 놀랍진 않은데 그래도 어딘가 실체가 있는 정보를 기반으로 했을거라 생각되어 살짝 기대가 됩니다. 다만, Google이나 Meta 같은 빅테크기업과 그 외의 다양한 업체들의 LLM들이 계속해서 나오고 있지만 여전히 OpenAI의 기술을 넘어서지 못하고 있다는 것이 거꾸로 놀라운 일 같습니다. (기사)
|
|
|
인공지능 서비스의 배포와 운영 시 도움이 필요하신가요?
(주)소이넷은 인공지능 서비스를 제공하는 기업들 가운데 서비스 배포와 운영에서 어려움을 겪고 계신 곳에 도움을 드릴 수 있습니다.
혹시 구독자님의 회사는 다음과 같은 어려움을 겪고 계시지 않나요?
- AI 모델을 개발하고 학습 후 서비스를 위한 성능(Accuracy)은 달성했는데, 정작 최적화 엔지니어가 없어서 어플리케이션, 서비스로의 배포를 위한 실행최적화를 못하고 있어요!
- AI 서비스를 이미 제공하고 있지만, 비싼 클라우드 GPU 서버 인스턴스 사용료가 부담이 되네요. 흠... 경비를 절감할 수 있는 방안이 없을까?
- 서비스에 적합한 공개 SOTA 모델이 있지만 그대로 가져다 쓰기에는 우리 쪽 어플리케이션에 접목하기도 어렵고 운영 비용도 많이 들 것 같은데 어쩌지?
- 서비스에 사용되는 AI 모델을 통합적으로 관리, 배포, 모니터링을 하고 싶은데 그렇다고 비싸고 너무 복잡한 솔루션을 쓸 수는 없고 어쩌지?
- 비즈니스 도메인 기업이긴 한데 자체로 인공지능을 적용하기에는 기술적인 난이도도 있고... 어디 함께 공동 솔루션을 개발할 곳은 없을까?
그렇다면 언제든 아래 연락처로 문의 주세요. 함께 해결책을 고민해 드리겠습니다.
|
|
|
오늘의 뉴스레터는 여기까지 구독자님, 다음 번에도 재미나고 흥미로운 소식을 가지고
다시 찾아뵙겠습니다. |
|
|
구독해 주시면 좋은 소식, 정보로 보답하겠습니다. |
|
|
주식회사 소이넷 sales@soynet.io 경기 성남시 분당구 성남대로331번길 8 (킨스타워) 1503호
대표전화 : 031-8039-5377
|
|
|
|
|