손글씨와 인공지능에 대해 알아봅니다. 안녕하세요, 구독자님.
이번 한 주도 알차게 보내고 계신가요?
전화, 인터넷이 발달한 지금은 상당히 비효율적으로 여겨질 수도 있겠지만, 예전엔 먼곳에 있는 분들께 안부를 묻기 위해 주로 편지를 이용했습니다. 인간적인 정감이 녹아 있는 아날로그 방식이 더 좋다며 지금도 그렇게 하시는 분들도 있죠. 이런 편지를 받아 글을 읽고 있노라면 상대방이 어떤 느낌, 어떤 내용을 전달하기 위해 고민했는지가 떠오를 때가 있습니다. 특히 정성들여 쓴 손글씨 글자 하나 하나가 빛을 발할 때 더 그렇죠.
올해 4월쯤이었을 겁니다. 교보문고에 갔다가 손글씨 경진대회가 있다고 해서 추억삼아 가족들 각자의 필체로 응모해 봤었습니다. 최종적으로 82세의 김혜남 님이 수상을 하셨다고 합니다.( 링크) 저요? 아쉽게도(^^;) 등위에 들진 못했지만, 확실히 가족 모두에겐 추억이 되었습니다.
이번 소식에서는 손글씨와 관련된 것들을 조사해보고 이와 관련된 인공지능 기술도 함께 알아보겠습니다. 아... 물론 새로운 소식들도 함께 소개 드리겠습니다.
|
|
|
손글씨?
손글씨는 사람이 손으로 직접 쓴 글씨를 말합니다. 아주 예전에는 이런 단어 자체가 없었을 것 같은데 활자가 발명되면서 사람이 직접 쓰지 않고 인쇄를 통해 글을 기록하는 방식이 생기면서 이것과 구분하기 위해 등장하지 않았을까 생각합니다. 손글씨에는 단순 필기 외에도 캘리그래피, 서예 등과 같은 것들도 포함됩니다.
손글씨가 뭐 특별한가요?
사실 손글씨가 특별한 것은 없습니다. 평소에도 펜이나 연필 등을 이용해서 글씨를 써왔을테니 말입니다. 그런데 컴퓨터, 스마트폰 등의 디지털 기기가 확산되면서 직접 손으로 글을 쓰는 경우가 점차 줄어들고 있습니다. 직장 생활을 하는 분들이라면 본인의 하루 일과에서 손과 가까이 있는 것이 펜과 종이인지, 키보드나 스마트폰 자판인지를 한번 돌아보면 금방 이해가 될 것입니다. 예전엔 늘 하던 것이었는데 점차 빈도가 줄고 있는 대표적인 것이 손글씨인데 이쯤되니 사람들은 거꾸로 그런 것에 향수를 느끼는 모양입니다. 딱딱한 디지털 폰트 대신 캘리그래피나 손글씨를 더 고급스럽고 아름다운 것으로 보니 말이죠.
사람들이 손글씨를 더 좋아하나요?
꼭 그렇다고 말할 수는 없겠네요. 제가 통계적인 조사 결과가 있는지는 몰라서 말이죠. (미국에서 진행한 설문조사가 있긴 했지만 학부모를 대상으로 한 것이라 실제 글을 쓰는 사람들의 선호를 설명하긴 어려울 것 같아 제외했습니다) 하지만, 광고에서 일반 디지털 폰트 대신에 캘리그래피를 쓴다거나 잘 알려진 고딕, 명조 등의 경우보다 필기에 가까운 서체를 골라서 쓴다거나 하는 것을 보면 광고의 대상이 되는 일반 사람들이 어떤 것에 더 끌리는지를 예상해 볼 수 있을 것 같습니다. 꼭 광고가 아니더라도 늘 봐오던 서체 폰트는 심리적으로 안정감을 주기는 하겠지만 더 낫거나 멋스럽게 보이진 않을 것 같거든요. 어디까지나 제 개인적인 생각입니다...
손글씨를 쓸 경우에 얻을 수 있는 잇점은 어떤 것이 있나요?
예전에는 늘 작은 노트와 필기도구를 들고 다녔습니다. 아이디어가 떠오르면 그 자리에서 바로 기록하기 위해서였죠. 그런데 현재는 어떤가요? 핸드폰은 언제나 손에 들려져 있지만 노트와 필기도구는 가방에서 꺼내는 과정이 필요하니 어찌보면 즉시 기록할 수 있다는 잇점은 퇴색된 것 같습니다. 대신 그림이나 도표 등 형식이 정해지지 않은 것을 표현하는데 효과적인 것은 분명합니다. 혹여 필기 가능한 스마트폰도 있지 않냐고 반박하실 분이 있을지도 모르겠네요. 매체가 무엇이건 그것도 손글씨일텐데 말입니다. ^^;
연구에 따르면 뇌의 중추신경 중 약 30%가 손과 관련되어 있으며 필기를 하는 행위는 뇌의 중추신경을 자극해서 뇌 활성화에 도움된다고 합니다. 키보드 타이핑하는 것도 손을 이용하지 않냐는 반박이 있을 수 있겠지만 필기가 단순기억과 개념 이해도 측면에서 훨씬 더 높은 효과를 보인다는 것이 연구결과라네요. (링크) 저도 IT 교육 받으면서 강의 때 타이핑으로 정리를 해 본 경험이 있는데 사실 불러주는 것을 머릿속으로 이해하고 다시 그걸 정리할 시간은 절대적으로 부족했기에 들리는 것을 단순 타이핑하는 경우가 많았습니다. 필기의 경우, 요약하고 연관되는 단어 위주로 하기 때문에 이해 과정이 필수적으로 따라올 수 밖에 없을테니 확실히 더 효과가 있을 것 같긴 합니다.
손글씨와 관련된 사례를 알려주세요.
몇년 전에는 중국에서 손글씨를 대필해 주는 기계가 화제가 되기도 했습니다. 밀린 방학숙제를 로봇이 대신하도록 한건데 이 때문에 학생들이 대거 이 제품을 구입하기도 했답니다. (링크) 일본의 경우, 워낙 아날로그 문화가 대세여서인지 디지털로 타이핑된 글을 손글씨로 기록해주는 전용 기기를 만들어 내기도 했습니다. (링크)
국내에서는 최근 '미꽃체'라는 손글씨가 화제입니다.미꽃체는 인쇄된 폰트처럼 예쁜 손글씨를 쓰는 것으로 '가장 인쇄체에 가까운 글씨'라는 타이틀을 달고 있습니다. 펜으로 적히는 글자 한자한자가 마치 인쇄되는 것 같은 느낌을 가질 정도로 정밀하고 일관성있게 기록되는 것을 보면서 우와~하는 감탄을 하지 않을 수 없었습니다. 이 글씨체를 만든 최현미씨는 원래 본인의 글씨 교정을 하기 위해 노력하다가 특유의 글씨체를 만들게 되었다고 합니다. (링크)
|
|
|
손글씨 관련해서 인공지능이 어떤 분야에 활용될 수 있을까요?
대략 다음과 같은 부분에 인공지능 기술이 활용될 수 있을 것 같습니다.
- 손글씨를 디지털 폰트로 개발하는 분야
멋진 손글씨 필기를 이용해서 디지털 서체(폰트)를 만드는 곳에 활용할 수 있습니다. 아래에 관련 사례를 소개하겠습니다.
- 기록된 손글씨를 인식해서 내용을 추출하는 분야
필기 텍스트 인식(HTR) 또는 광학 문자 인식(OCR) 등의 기술이 적용됩니다. 일반적인 문서 등의 분석에서도 사용되지만 특히 의료기록물 등에 적힌 의사들의 노트 필기 등의 분석에도 활용될 수 있다고 합니다.
- 사람의 손글씨 필체를 감별하는 분야
손글씨의 패턴, 획 순서 및 압력 등과 같은 정보를 인식하는데 활용될 수 있습니다. 미술작품에서 화가의 기법을 이해하는 것과 마찬가지죠. 주로 포렌식이나 서명의 필체 확인 등에 활용될 수 있습니다.
- 손글씨로 쓴 글에서 필기 습관이나 패턴을 파악해서 개선 방안을 제시하는 분야
손글씨의 획순, 글씨체, 속도 등을 분석하고 피드백을 제공함으로써 손글씨 교정, 교육 등에 활용할 수 있습니다.
- 손글씨 필체를 분석해서 필자의 건강상태, 감정상태 등을 판별하는 분야
이런 분야는 예전부터 있던 분야로 알고 있는데 이를 인공지능으로 하는 것이 확장된 응용 영역이 아닐까 생각됩니다.
- 인간의 글쓰기 스타일을 모방한 필기 콘텐츠를 생성하는 분야
인간의 필기 스타일을 모방해서 생성형 인공지능 모델이 새로운 손글씨 혹은 캘리그래피 등을 만들어낼 수 있습니다. 단순한 따라쓰기가 아니라 예술적인 가치를 추가로 부여할 수 있겠죠.
- 인간의 글쓰기 스타일을 모방한 필기 콘텐츠를 생성하는 분야
손글씨에 인공지능이 활용된 실제 사례를 알려주세요.
개개인의 손글씨 서체를 폰트로 만드는 사례가 있습니다. 2017년인가 중국에서 zi2zi라는 GAN 기반 모델로 한자 손글씨 폰트를 만드는 것이었죠. 그 뒤 이 기술을 참조해서 다른 언어를 지원할 수 있도록 활용한 사례들이 많이 나왔습니다.
국내에서는 보이저엑스라는 스타트업에서 온글잎 폰트 제작 서비스를 제공해 오다가 지난 7월에 서비스를 종료한 바 있죠. 자신의 손글씨를 컨텐츠 제작에 활용하고 있는 크리에이터들에게 의미 있는 서비스였는데 말이죠. 당시 만들어진 것 가운데 무료폰트는 현재도 해당 사이트에 공개되어 있습니다. (링크) 네이버에서도 '한글한글 아름답게 캠페인'이라는 이벤트를 통해 109명의 사람들의 손글씨 폰트를 제작해 준 바 있습니다. (링크) 둘 다 일정 수량 이상의 개별 손글씨를 받고 인공지능을 이용해서 학습한 후 최종적으로 사용 가능한 디지털 폰트를 만든 것이죠.
이 이외에도 무료 손글씨 폰트를 구할 수 있는 곳으로 눈누( 링크) 같은 곳이 있습니다. 이곳은 무료로 사용 가능한 한글 폰트 모음 사이트인데 이 가운데 손글씨 폰트도 다수 있습니다. |
|
|
관련해서 볼만한 정보를 알려주세요.
손글씨와 관련해서 검색해 보니 다음과 같은 글과 영상이 있었습니다.
- 성적 올리려면 손으로 필기하라 (사이언스타임즈, 2014.5)
- 필기가 주는 놀라운 효과ㅣ 뇌과학, 필기, 타이핑 (사오TV, 2020.2)
- 타이핑보다 강한 손글씨…학습 효과 실험해보니 (SBS, 2019.12)
- 글씨로 호감도 높이는 방법✒️(미꽃체) (미꽃 유튜브채널, 2023.7)
- 中, 쓰기숙제 대신해주는 로봇 등장..."필체까지 똑같이" (YTN, 2019.2)
- 내 손글씨를 따라쓰는 인공지능 요정, Wrinie (1) - 이론 (Jeina, De'vLog, 2019.7)
- Neural-fonts - GAN을 활용한 한글 폰트 제작 프로젝트 (깃헙, 2017.10)
- hangul-font-dataset: 딥러닝 기반의 폰트 연구를 위한 폰트 데이터셋 (깃헙, 2020.10)
- Google Fonts + 한국어 (구글)
- Few-shot handwriting copycat AI (4글자로 손글씨 폰트 만들기) - (네이버클로바 , 2020)
|
|
|
AudioCraft는 메타에서 발표한 오디오, 음악 생성 도구입니다. 입력된 텍스트를 바탕으로 음악이나 효과음 등을 생성할 수 있죠. 얼마전에도 비슷한게 발표되지 않았었냐구요? 맞습니다. 메타가 MusicGen이라는 음악 생성 모델을 발표했었죠. 사실 AudioCraft는 이 MusicGen 외에 AudioGen(효과음, 사운드 등의 오디오 생성), Encodec(신경망 기반의 실시간 오디오 압축 코덱) 모델을 함께 포함하고 있습니다. 인공지능이 음악을 만든다는 것에 사람들이 열광하고 음악 페스티벌에서는 사람이 작곡한 것과 비교하는 블라인드 테스트를 했던 것이 엇그제 같은데 발전하는 속도가 빨라도 너~무 빠른 것 같습니다. 하지만, 한편으론 인간 음악가와 인공지능 음악가의 콜라보레이션이 어떤 식으로 발전해 나갈지 기대도 됩니다.
|
|
|
사진) AudioCraft에 포함되어 있는 AudioGen, MusicGen (출처) |
|
|
사진) 향상된 신경망 기반의 오디오코덱인 Encodec (출처) |
|
|
DWPose는 2단계 증류(distillation)을 사용하여 효과적인 전신 자세 예측을 하는 모델입니다. 일반적인 자세 예측은 신체의 일부 영역을 대상으로 하는 경우가 많습니다. 이유로는 인체의 계층구조, 신체 부위에 따라 서로 달리 적용되는 다른 스케일과 낮은 해상도, 그리고 장애물이나 어려운 자세(예:손), 머리 포즈 등에 대한 충분치 않은 데이터 등이 언급됩니다.
DWPose는 KD(Knowledge Distillation, 지식증류) 기술을 사용해서 이 문제를 해결하고 있는데 2단계 증류 아키텍처를 채택했습니다. 첫번째는 교사(teachre) 모델의 중간 레이어와 최종 Logit을 활용하여 학생(student) 모델을 학습하고, 두번째로는 머리의 정확한 위치 파악을 위해 자체 KD(지식증류)를 포함하는 방식이 적용되었다고 합니다. 기본적으로는 MMPose와 ControlNet을 기반으로 하고 있습니다.
* 위 코렙코드 링크에 나온 데모영상은 한국의 댄서 카리나의 영상을 이용하고 있길래 한국 연구자인가 했는데 중국 연구자분들이시네요. ^^; |
|
|
MetaGPT라는 좀 색다른 기술이 소개되었습니다. MetaGPT는 Multi-Agent framework 인데 그 말은 한번에 여러가지 종류의 일을 처리할 수 있다는 뜻입니다. MetaGPT는 Product Manager, Project Manger, Architect, engineer와 같이 소프트웨어 개발 회사에 있는 기술인력의 역할을 각각의 agent에게 부여해서 업무를 처리하도록 합니다.
내부 방식을 보면, OpenAI의 GPT-4 API를 이용해서, 서로 다른 역할을 수행하는 agent들을 생성하고, 그것들을 협업하게 해서 최종 결과물을 만들게 됩니다. 한줄의 요구사항(미션)만 주면 역할 별 작업들이 자동으로 처리되기 때문에 누가 어떤 역할을 해야 한다고 따로 지정할 필요도 없습니다. 그런 모습은 BabyAGI나 AutoGPT와도 비슷해 보입니다.
깃헙에 소개된 데모 영상에서는 블랙잭 게임을 만들라는 미션을 받고 이후 필요한 작업들을 스스로 진행해서 실제로 동작하는 결과물을 만드는 예시를 보여줍니다.
* 여기서의 Meta는 Facebook의 Meta를 의미하진 않습니다. 또한 MetaGPT라는 이름으로 서비스하고 있다는 다른 것( 예)들과도 직접적인 연관성이 없을 수 있습니다.
* 이 프레임워크 사용을 위해서는, 패키지를 직접 설치하거나 혹은 제공되는 Docker container를 이용하는 방식 둘 다 선택 가능합니다.
|
|
|
사진) MetaGPT를 이용해서 생성된 소프트웨어 Multi-role 스키마 예시 (출처) |
|
|
그 외 최근 있었던 새로운 소식을 알려 드립니다.
- NVIDIA의 젠슨 황 시그래프 기존 연설
CEO인 젠슨 황은 '아이폰의 순간 (iPhone moment)라고 칭할 수 있는 생성 AI의 시대가 다가오고 있다'고 언급했습니다. IT 분야에서 아이폰이 던진 충격이 어느 정도인지 잘 아실테니 그가 언급한 생성AI의 시대 또한 큰 의미로 다가 옵니다. 이미 온 1차 충격파 이후에 새로 다가올 2차 충격파를 기대해 봅니다.
|
|
|
인공지능 서비스의 배포와 운영 시 도움이 필요하신가요?
(주)소이넷은 인공지능 서비스를 제공하는 기업들 가운데 서비스 배포와 운영에서 어려움을 겪고 계신 곳에 도움을 드릴 수 있습니다.
혹시 구독자님의 회사는 다음과 같은 어려움을 겪고 계시지 않나요?
- AI 모델을 개발하고 학습 후 서비스를 위한 성능(Accuracy)은 달성했는데, 정작 최적화 엔지니어가 없어서 어플리케이션, 서비스로의 배포를 위한 실행최적화를 못하고 있어요!
- AI 서비스를 이미 제공하고 있지만, 비싼 클라우드 GPU 서버 인스턴스 사용료가 부담이 되네요. 흠... 경비를 절감할 수 있는 방안이 없을까?
- 서비스에 적합한 공개 SOTA 모델이 있지만 그대로 가져다 쓰기에는 우리 쪽 어플리케이션에 접목하기도 어렵고 운영 비용도 많이 들 것 같은데 어쩌지?
- 서비스에 사용되는 AI 모델을 통합적으로 관리, 배포, 모니터링을 하고 싶은데 그렇다고 비싸고 너무 복잡한 솔루션을 쓸 수는 없고 어쩌지?
- 비즈니스 도메인 기업이긴 한데 자체로 인공지능을 적용하기에는 기술적인 난이도도 있고... 어디 함께 공동 솔루션을 개발할 곳은 없을까?
그렇다면 언제든 아래 연락처로 문의 주세요. 함께 해결책을 고민해 드리겠습니다.
|
|
|
오늘의 뉴스레터는 여기까지 구독자님, 다음에도 또 흥미로운 소식으로
다시 찾아뵙겠습니다. |
|
|
구독해 주시면 좋은 소식, 정보로 보답하겠습니다. |
|
|
주식회사 소이넷 sales@soynet.io 경기 성남시 분당구 성남대로331번길 8 (킨스타워) 1503호
대표전화 : 031-8039-5377
|
|
|
|
|