새의 종 분류와 관련된 인공지능 기술을 알아봅니다. 안녕하세요, 구독자님.
이번 한 주도 보람차게 보내셨나요?
동해안 쪽으로 여행을 갔다가 제비를 보고 너무 반가워서 소리를 질렀던 적이 있습니다. 제가 새 중에서는 제비를 제일 좋아하거든요. (순간 전생이 흥부가 아니었을까 생각해 봅니다. ^^;) 어린 시절의 기억으론 대도시라 하더라도 집 주변에서 제비를 흔히 볼 수 있었습니다. 처마 밑에 제비가 둥지를 틀고 새끼를 키우는 모습은 참 귀엽기도 했죠. 둥지 근처에는 바닥으로 떨어진 제비 똥이며 집을 지을 때 떨어뜨린 진흙같은 것도 많았구요. 어떤 집에서는 둥지가 하나가 아니라 여럿 있기도 했습니다.
제비는 참 독특한 새 같습니다. 최근에야 반려동물로 새를 키우는 분들이 늘어나면서 앵무새같은 녀석들이 사람들과 함께 지내긴 하지만 대부분의 야생 동물들은 사람의 생활권에서 떨어진 곳에서 살아갑니다. 하지만, 제비는 그렇지 않죠. 둥지를 만들더라도 사람이 사는 집 처마 근처에서 했고 따뜻한 지방으로 날아갔다가 다시 돌아와도 그 행동들은 반복되었죠. 새끼를 키울 때 위협이 될만한 동물들(예로 뱀 등)이 사람이 사는 집에는 흔치 않았으니 안전 때문에 그랬을 것으로 생각되지만 그래도 가까이서 살면서 육아를 하는 모습들까지 스스럼없이 보여준다는 점에서는 참 기특하다 생각했었습니다.
이번 소식에서는 새의 종류 분류에 대한 내용과 새로 나온 인공지능 기술을 소개해 드리겠습니다. |
|
|
새 분류 (bird species classification) |
|
|
생물 종류를 분류는 왜 하는거죠?
생물의 특성과 생물 다양성의 이해 및 체계화, 생물의 진화계통의 이해 , 그리고 이를 바탕으로 우리가 살아가는 자연 생태계의 안정성이나 생태학적 상호작용 등에 대한 연구 등이 있을 것 같습니다. 그런 연구의 결과는 생물자원 관리, 보호, 농업이나 환경, 산업 등에 필요한 응용을 위한 기술 개발 등에 활용될 것이구요.
새의 종 분류는 어떻게 되나요?
중/고등학교 때 배운 '계-문-(아문)-강-목-과-속-종'의 생물 분류 체계가 혹시 기억나시나요? 새는 생물학적 분류체계로는 '동물계 -> 척삭동물문 -> 척추동물아문 -> 조강' 에 해당됩니다. 이 하부에는 '목-(아목)-과-속-종'의 세부 분류들이 존재합니다. 예를 들어 참새의 경우는 '참새목>참새과>참새속>참새'가 되는 것이죠.
새의 종류를 분류하는 방식에는 어떤 것이 있나요?
새의 종류를 분류하는 기술은 크게 형태학적 방법과 분자생물학적 방법이 있습니다. 전자는 외형적 특징을 기반으로, 후자는 새의 DNA를 분석하여 분류합니다. 이외에도 생리학적 분류, 행동학적 분류 방식도 있다고 합니다.
최근에는 인공지능을 이용해 이미지나 소리 등의 속성을 이용해서 분류하기도 합니다. 위에서 언급한 것 가운데 주로 형태학적인 측면을 다루는 것인데요... 수없이 많은 새 사진과 새의 울음소리를 데이터화해서 학습해서 분류하는 것입니다. 과거에는 이런 것들을 전문으로 연구하는 연구원들에 의해 동정(identification)이 이뤄졌지만 현재는 이런 기술들이 보완적인 수단으로 활용되고 있습니다. 분류학에 대한 전문적인 내용을 얘기하는 것은 아니니 이 정도로 대충 정리하겠습니다.
새와 관련된 정보는 어디에서 얻을 수 있나요?
최근에는 정말 많은 정보들이 있습니다. 각종 서적들도 많이 나와 있죠. '한국의새 생태와 문화 (지오북)', '한반도의 새: 세밀화로 보는 야생조류 540종(한길사)'와 같은 책과 '우리 새소리 백가지 (현암사)'등과 같이 실제 소리를 담은 CD와 함께 제공되는 도감류의 책들이 다수 있습니다. '백가지' 시리즈의 하나라 제목이 이렇게 되어 있긴 하지만 실제로 담겨있는 소리는 100가지는 아닙니다. 하지만 담겨있는 새 소리는 눈 감고 들어보면 너무 좋습니다. (그러고보니 두 책 다 한 분이 쓰신 거네요... PPL 의도는 없습니다 ^^;) 이외에도 위키백과에서는 새 종 분류에 따라 세부 링크를 타고 하나씩 공부할 수도 있습니다.
최근에는 유튜브가 인기를 끌면서 탐조나 새 생태를 관찰하는 유튜버들이 다수 등장했습니다. 예를 들어 새덕후 (Korean Birder)를 운영 중인 김어진씨 같은 분이죠. 개인의 지적 호기심이나 관심이라면 그 영상들을 보면서 이해를 넓혀가셔도 좋을 것 같습니다. 물론 전문적인 지식을 위해서는 별도의 공부를 하셔야겠지만요...
|
|
|
새의 종(Species)과 관련된 재미난 이야기나 기록이 있으면 알려주세요.
위키백과를 보면 '새 또는 조류는 백악기 대멸종에서 살아남은 수각류 공룡을 의미한다' 라고 되어 있습니다. 새가 공룡? 네, 현재의 연구 결과는 그런 것 같습니다. 그동안의 연구 결과는 '새와 공룡은 다른 종' → '새는 공룡과 같은 종이고 진화한 것' → '새는 대멸종에서 살아남은 공룡 그 자체'로 변천되고 있는 것 같습니다. 물론 다른 의견들도 있습니다. 상세한 내용은 다음 링크를 참고하시기 바랍니다. (링크, 링크)
그리고, 전세계에는 약 10,000여종 500억 마리 가량의 새가 있다고 합니다. 이 가운데 단일 종으로 10억마리 이상이 되는 것들로는 참새, 찌르레기, 제비, 갈매기 등이 있답니다. 종이야 발견된 것을 기반으로 할 수 있다지만, 마리 수까지 파악하는 것을 어떻게 진행하는지는 모르지만 조사가 가능하다는 것이 놀랍습니다. (기사)
예전에는 많이 보이던 새들이 최근 보기 힘들어졌어요.
그렇습니다. 인삿말에서 제 경험으로 제비 얘기를 했었지만 비단 그 종만 그런 것은 아닙니다. 기후나 자연환경 변화, 개발로 인한 서식지 파괴 등 다양한 원인으로 인해 사라지는 조류들이 계속 나타나고 있죠. 그래서 이들 중 일부는 멸종위기 야생동물로 보호하고 있습니다.
국내 조류 가운데 멸종 위기종으로 지정된 새들은 다음과 같습니다. 낯익은 새도 많이 있죠?
- 1급 : 검독수리, 고니, 넓적부리도요, 노랑부리백로, 느시, 두루미, 먹황새, 뿔제비갈매기, 저어새, 참수리, 청다리도요사촌, 크낙새, 호사비오리, 흑고니, 황새, 흰꼬리수리
- 2급 : 개리,검은머리갈매기,검은머리물떼새,검은머리촉새,검은목두루미,고대갈매기,긴꼬리딱새,긴점박이올빼미,까막딱다구리,노랑부리저어새,독수리,따오기,뜸부기,매,무당새,물수리,벌매,붉은가슴흰죽지,붉은배새매,붉은어깨도요,붉은해오라기,뿔쇠오리,뿔종다리,새매,새호리기,섬개개비,솔개,쇠검은머리쑥새,쇠제비갈매기,수리부엉이,시베리아흰두루미,알락개구리매,알락꼬리마도요,양비둘기,올빼미,재두루미,잿빛개구리매,조롱이,참매,청호반새,큰고니,큰기러기,큰덤불해오라기,큰뒷부리도요,큰말똥가리,팔색조,항라머리검독수리,흑기러기,흑두루미,흑비둘기,흰목물떼새,흰이마기러기,흰죽지수리
이들 가운데는 현재 증식, 복원사업이 진행되고 있는 경우도 있습니다. 1급에서는 두루미, 황새, 검독수리, 참수리, 흑고니, 흰꼬리수리, 2급에서는 따오기, 노랑부리저어새, 독수리, 수리부엉이, 올빼미, 재두루미, 참매, 큰고니 등이 있다네요. ( 링크)
경상남도 창녕에 가면 우포늪 근처에 우포따오기복원센터가 있습니다. 2019년 5월 인공증식한 따오기 40마리를 방사한 이후 총 270마리를 자연으로 보냈는데 이 가운데 약 39%가 살아있는 것으로 추정되며 전국 곳곳에서 발견되고 있다는 소식도 있었습니다. ( 기사) |
|
|
새의 종류를 인공지능으로 분류하는 사례를 소개해 주세요.
새 이미지를 이용한 분류
CNN, Transformer 기반 이미지 분류 기법을 이용해서 새의 종을 구분하는 사례는 많아서 대표적인 예시 일부만 소개하겠습니다.
- Image-Based Bird Species Identification Using Machine Learning | Python Final Year IEEE Project 2023 (영상)
- What Bird is That? (깃헙, 데모)
ImageNet 데이터셋에서 사전 훈련된 EffcientNetB4을 전이학습을 이용해 특징 추출 및 미세조정을 해서 만든 것으로 BIRDS 525 SPECIES- IMAGE CLASSIFICATION ㄷ데이터셋에서 97% 정확도를 제공합니다.
|
|
|
새 소리를 이용한 분류
구글의 생체음향학팀의 소개한 '새소리 구분 및 분류' 기술이 있습니다. 구글에서는 이와 관련된 기술을 논문이나 연구보고서 형태로 꾸준히 공개해 오고 있습니다. 아래 두 논문은 야생에서 여러 새의 소리가 혼합되어 있는 오디오 멜 스펙트로그램에서 각 새의 종류 별 소리를 분리해내어 종 분류를 더 정확하게 할 수 있는 기술을 설명하고 있습니다.
- Improving Bird Classification with Unsupervised Sound Separation (2022)
- Separating Birdsong in the Wild for Classification (2022)
|
|
|
사진: 혼합된 새 소리에서 각각의 새 종류 별 트랙으로 분리하는 예시 (출처) |
|
|
이외에도 소리를 분류에 사용하는 사례로는, 코넬 조류학 연구소가 중심이 되어, 주변 사운드에서 새 소리를 식별해 내는 BirdCLEF 챌린지가 있습니다. 해당 연구소는 2003년부터 ImageCLEF를 운영해왔고 2014년부터는 LifeCLEF의 세부로 BirdCLEF를 운영하며 Kaggle 챌린지를 진행하고 있습니다. ( 2023 챌린지) 뿐만 아나라 BirdNet이라는 신경망과 이를 이용한 앱을 통해 AI 기반 새 소리 인식을 할 수 있도록 하고 있습니다. ( BirdNet) 그 외에도 다음과 같은 것들이 있습니다.
- BIRD SOUND CLASSIFICATION USING DEEP LEARNING | ANN | LSTM | PYTHON (영상)
관련해서 볼만한 정보를 알려주세요.
인터넷 상에서 검색해보면 많은 내용이 있습니다. 그 가운데 일부를 올려봅니다.
- 한반도의 생물 다양성 (국립생물자원관)
- 한국의 야생 새 목록 (위키백과)
- 공룡과 새의 관계 (과신대 칼럼, 2023.5)
- 공룡이 멸종하지 않았다는 매우 과학적인 증거! (과학드림, 2019.3)
- 공룡은 새인가 파충류인가 (슈카월드, 2022.3)
- 새덕후 Korean Birder (유튜브 채널)
- “기후변화와 생물다양성, AI로 분석하고 대응한다” 최종 선정된 시민과학자와 만난 SK하이닉스 (SK하이닉스, 2023.1)
- 코넬 조류학 연구소의 BirdNET (코넬 조류학연구소,깃헙, 소개)
- Use Sound and Machine Learning to Identify Birds with a Raspberry Pi - BirdNET-Pi (Core Electronics, 2022.5) (사이트, 깃헙)
BirdNet을 라즈베리파이를 이용해서 구현한 코드와 소개 영상 등입니다.
- [미래고속도로 알아보공] AI 기반 생태통로 모니터링 시스템 (한국도로공사, 2023.2)
- 데이터셋) 200 Bird Species with 11,788 Images (Kaggle)
- 데이터셋) BIRDS 525 SPECIES- IMAGE CLASSIFICATION (Kaggle)
- Caltech UCSD Birds 200 Classification using Deep Learning with PyTorch (DEBUGGER CAFE, 2023.2)
- BirdCLEF 2023 :Identify bird calls in soundscapes (Kaggle, 2023)
- Bird by Bird using Deep Learning (미디엄, 깃헙, 2021.1)
- 지구상에 조류는 몇 마리나 살고 있을까? (동영상) (theSciencePlus. 2021.5)
|
|
|
예전 Microsoft에서 발표했던 VALL-E 모델의 비공식 오픈소스 구현체로 'VALL-E X'가 등장했습니다. 6GB VRAM의 GPU 혹은 CPU에서도 동작된다고 합니다. 텍스트 프롬프트, 오디오 파일 등을 입력으로 해서 다국어 TTS와 제로샷 음성 복제 기능을 제공합니다. 공개된 github repo에는 영어, 일본어, 중국어가 지원되며 아쉽게도 한국어는 포함되어 있지 않습니다. 영어로 테스트를 해 봤는데 흠... 제가 제 목소리도 익숙치 않고 영어 발음 자체도 유창하지 않아서인지 복제된 음성도 마음에 썩 들지는 않았습니다. 혼자 있어도 발현되는 이 놈의 영어 울렁증은 언제 고쳐질건지... T^T
|
|
|
사진: VALL-E X에서 제공하는 로컬 웹 기반 도구의 사용자 인터페이스 |
|
|
Dolma는 앨런AI연구소(Allen Institute for AI)라는 곳에서 오픈소스로 공개한 3조개의 토큰을 포함한 텍스트 데이터셋입니다. 주로 학술 출판물, 위키피디아 등의 웹 콘텐츠, 코드, 도서 및 백과사전 자료 등이 포함되어 있다고 합니다. 이번에 발표된 Llama 2 사전학습 모델이 2조 개의 토큰 데이터셋을 이용했다고 했으니 그 보다 50% 이상 더 큰 데이터셋인 셈입니다. 언어 측면에서는 영어 데이터로 한정해서 필터링을 했다고 합니다. 그리고, AI2 Impact 라이선스를 도입했는데 이는 다른 것과는 약간 다른 컨셉이니 링크에서 확인해 보시기 바랍니다.
|
|
|
사진: Dolma의 데이터셋 구성 분포 (상), LLM에 사용된 데이터셋 간의 비교 (출처) |
|
|
Comic Factory는 HuggingFace의 Trend 부분을 보다가 발견한 것입니다. 공개 Space 자체에는 설명이 없어서 뭘하는 것인지 몰랐는데, 이래저래 하다보니 주어진 텍스트 프롬프트 내용에 맞춰 코믹스 만화 컷을 만들어주는 모델이라는 것을 알게 됐습니다. Preset (나라 별 만화의 스타일?)은 일본, 미국 등 4개가 제공됩니다. 세부 설명이 없어서 결과물은 다소 엉뚱하지만 장면 자체는 그럴 듯하게 나옵니다. 아래 예시는 단군신화 내용과 신데렐라, 그리고 아이언맨, 헐크 이야기를 짧막하게 텍스트 문장 1줄로 만들어 테스트 한 결과입니다.
|
|
|
사진: Comic Factory 데모를 이용해서 만들어본 장면들 |
|
|
그 외 최근 있었던 새로운 소식을 알려 드립니다.
- 다수의 언론사, 초거대 언어모델 학습을 위한 데이터 사용 불가 방침 천명
언론사들이 작성한 수많은 기사 컨텐츠가 초거대언어모델에서 학습데이터로 활용되고 있을 것으로 예상되며 일부에서는 공공연하게 인정한 바도 있습니다. 이 때문에 본격적으로 데이터에 대한 저작권 문제가 수면 위로 떠 올랐습니다. AI는 데이터를 먹고 사는데 먹고 살 데이터를 공급해 온 쪽에서 일종의 브레이크를 건 셈입니다. 기술의 발전과 데이터 소유자 혹은 크리에이터의 권리 사이에서 연관된 기업, 기관, 국가가 어떤 타협점을 찾아갈지가 궁금해집니다. 쉬운 문제가 아니라서요. 관련 기사들을 몇 가지 나열해 봅니다.
- 허락 없이 AI 학습에 사용한 데이터...'저작권' 문제 현안 부각 (Ai타임스, 2023.7)
- "AI 학습 금지합니다"…데이터 저작권 논란 확산 (한국경제, 2023.8)
- 네이버 대표, AI 공짜학습 논란에 "뉴스사용료 논의단계 아냐" (연합뉴스, 2023.8)
* 끝으로 지난 번 글에서 segment-geospatial을 소개하면서 SAM(Segment Anything Model)을 OpenAI가 발표했다고 잘못 기재했는데 Meta로 정정합니다. |
|
|
인공지능 서비스의 배포와 운영 시 도움이 필요하신가요?
(주)소이넷은 인공지능 서비스를 제공하는 기업들 가운데 서비스 배포와 운영에서 어려움을 겪고 계신 곳에 도움을 드릴 수 있습니다.
혹시 구독자님의 회사는 다음과 같은 어려움을 겪고 계시지 않나요?
- AI 모델을 개발하고 학습 후 서비스를 위한 성능(Accuracy)은 달성했는데, 정작 최적화 엔지니어가 없어서 어플리케이션, 서비스로의 배포를 위한 실행최적화를 못하고 있어요!
- AI 서비스를 이미 제공하고 있지만, 비싼 클라우드 GPU 서버 인스턴스 사용료가 부담이 되네요. 흠... 경비를 절감할 수 있는 방안이 없을까?
- 서비스에 적합한 공개 SOTA 모델이 있지만 그대로 가져다 쓰기에는 우리 쪽 어플리케이션에 접목하기도 어렵고 운영 비용도 많이 들 것 같은데 어쩌지?
- 서비스에 사용되는 AI 모델을 통합적으로 관리, 배포, 모니터링을 하고 싶은데 그렇다고 비싸고 너무 복잡한 솔루션을 쓸 수는 없고 어쩌지?
- 비즈니스 도메인 기업이긴 한데 자체로 인공지능을 적용하기에는 기술적인 난이도도 있고... 어디 함께 공동 솔루션을 개발할 곳은 없을까?
그렇다면 언제든 아래 연락처로 문의 주세요. 함께 해결책을 고민해 드리겠습니다.
|
|
|
오늘의 뉴스레터는 여기까지 구독자님, 다음 번에도 또 흥미로운 소식을 가지고
다시 찾아뵙겠습니다. |
|
|
구독해 주시면 좋은 소식, 정보로 보답하겠습니다. |
|
|
주식회사 소이넷 sales@soynet.io 경기 성남시 분당구 성남대로331번길 8 (킨스타워) 1503호
대표전화 : 031-8039-5377
|
|
|
|
|