편집 : 2021.9.28 화 17:54
뉴스
네이버, ‘인터스피치 2021’에 AI 9개 논문 발표‘라인’ 발표 합하면 14개 달해…리더십 확보 박차
김동기 기자  |  kdk@bikorea.net
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2021.09.06  09:33:55
트위터 페이스북 미투데이 요즘 네이버 구글 msn

네이버(대표 한성숙)는 지난 8월 30일부터 9월 3일까지 진행된 음성 및 신호처리 학회 ‘인터스피치(INTERSPEECH) 2021’에서 9개의 논문을 발표했다고 6일 전했다. 

특히, 네이버 일본 관계사 ‘라인’이 발표한 논문을 합하면 총 14개에 달한다.

이와 같은 성과를 기반으로, 네이버는 글로벌 AI 리더십 확보에 적극적으로 나설 계획이다.

올해 22회를 맞은 ‘인터스피치’는 구글, 페이스북, 아마존, 알리바바 등 글로벌 기업의 음성인식 관련 최신 기술이 공유되는 자리로, ICASSP와 함께 음성 및 신호처리 학회로 인정받고 있다.

네이버와 라인은 올해 6월 개최된 ‘ICASSP 2021’에서도 14건의 논문을 발표했다.

'인터스피치 2021' 채택한 네이버 논문 리스트
1. High-fidelity Parallel WaveGAN with Multi-band Harmonic-plus-Noise Model
- 황민제, Ryuichi Yamamoto (LINE), 송은우, 김재민
- 음성 모델링 기법중 하나인 multi-band harmonic-plus-noise 모델을 Parallel WaveGAN 에 적용해 보코더의 품질과 안정성을 향상.
 
2. LiteTTS: A Decoder-free Light-weight Text-to-wave Synthesizer Based on Generative Adversarial Networks
- Kim Nguyen (연세대), 정기혁 (연세대), 엄세연 (연세대), 황민제, 송은우, 강홍구 (연세대)
- Text-to-feature 와 feature-to-wave 로 분리되어있는 TTS 파이프라인을 하나로 묶는 text-to-wave 모델을 제안.
 
3. Label Embedding for Chinese Grapheme-to-Phoneme Conversion
- 최은비 (KAIST), 김화연, 김종환, 김재민
- Chinese polyphone conversion problem을 위한 label embedding approach를 제안.
 
4. Look Who’s Talking: Active Speaker Detection in the Wild
- 김유진, 허희수, 최소연, 정수환, 권유환, 이봉진, 권영기, 정준선
- 멀티모달 Active Speaker Detection 데이터셋 제작 공개
 
5. Adapting Speaker Embeddings for Speaker Diarisation
- 권영기, 정지원, 허희수, 김유진, 이봉진, 정준선
- Speaker Diarization 성능 개선을 위한 Speaker Embedding 강화 방법 연구
 
6. Three-class Overlapped Speech Detection using a Convolutional Recurrent Neural Network
- 정지원, 허희수, 권영기, 정준선, 이봉진
- 3개 클래스+CRNN을 이용한 Overlapped Speech Detection 기법 제안
 
7. Graph Attention Networks for Anti-Spoofing
- Hemlata Tak (EURECOM), 정지원, Jose Patino (EURECOM), Massimiliano Todisco (EURECOM), Nicholas Evans (EURECOM)
- GNN을 이용한 audio spoofing detection 연구
 
8. DEMUCS-Mobile : On-device lightweight speech enhancement
- 이루카스, 지유나, 이민재, 최민석
- CNN 딥러닝 기반 잡음 제거 모델의 경량화 기법을 제안하여 모바일 on-device에서 실시간으로 동작가능한 잡음제거 모델 구현
 
9. Layer Pruning on Demand with Intermediate CTC
- 이재송, 강진구, Shinji Watanabe (CMU)
- Transformer+CTC 모델을 fine-tuning 없이 pruning하기 위한 학습 방법론

‘인터스피치 2021’에서 채택된 네이버의 연구 논문은 음성인식, 음성합성, 데이터셋 제작 등 음성 및 신호와 관련된 다양한 분야를 포괄한다.

일부 논문은 네이버의 실제 서비스에 적용되며 사용자에게 더욱 편리한 서비스 경험을 제공하고 있다.

음성 합성 품질 향상 기술 연구는 ‘클로바더빙’, ‘클로바 스마트 스피커’, ‘네이버 AiCALL’ 등 네이버 클로바에서 제공하는 다양한 음성 합성 서비스에 적용됐다.

여러 화자가 동시에 말하는 상황에서 ‘화자 분할(Speaker Diarisation)’을 위해 각 발화자의 특징을 더욱 정확하게 학습하는 기법에 대한 연구는 ‘클로바노트’ 서비스 개선 등에 활용되고 있다.

또한 네이버가 발표한 9건의 논문 중 5건은 컴퓨터 과학 및 정보 시스템 분야에서 선두주자로 꼽히는 프랑스 연구기관 유레컴(EURECOM)을 비롯해, 카네기멜론대학교, 카이스트(KAIST), 연세대학교, 라인 등 AI 기술을 이끄는 국내외 기업 및 연구 기관들과 협력 연구로 수행됐다.

네이버는 글로벌 AI 연구혁신 생태계 구축을 위한 노력이 가시적인 성과로 드러나고 있다고 덧붙였다.

이번 성과를 기반으로 네이버는 글로벌 AI R&D 생태계를 지속적으로 확장해가겠다는 계획이다. 

현재 라인과의 연계를 중심으로 한 일본을 넘어, 베트남에서는 허스트(HUST), PTIT와 공동연구센터를 설립했으며, 유럽에서는 프랑스의 네이버랩스유럽과 연구협력을 이어가고 있다.

지난 7월에는 인공신경망과 로봇공학 분야 독일의 튀빙겐대학교와 공동연구센터 설립에 합의하기도 했다.

정석근 네이버 클로바 CIC 대표는 “R&D에 대한 적극적인 투자를 바탕으로 네이버의 AI 연구혁신 생태계는 그 규모를 더욱 키워가고 있다”며 “인터스피치 2021에서 네이버와 라인, 그리고 글로벌 AI 연구진이 뛰어난 성과를 거둔 것처럼, 앞으로 네이버를 중심으로 구축될 더욱 다양한 AI R&D 생태계에서 새로운 성과가 나올 수 있을 것으로 기대한다”고 말헀다.

<김동기 기자>kdk@bikorea.net

< 저작권자 © BI KOREA 무단전재 및 재배포금지 >
김동기 기자의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 요즘 네이버 구글 msn 뒤로가기 위로가기
이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
1
2개사 입찰도 ‘유찰’ 교보증권 마이데이터 향방은…
2
[분석]‘농협은행 정보계 차세대’ RFP를 풀어보니…
3
“초개인화 고객분석 마케팅, What, Why, and How?”
4
KT엔지니어링, ‘스팀터빈 발전 설비’ 첫 성과
5
“우리에게는 글로벌 아미가 있다(?)”
6
우리은행, ‘기업승계 택스 컨설팅’ 실시
7
‘U+스마트홈 구글 패키지’, 기능·콘텐츠 강화
8
미라콤아이앤씨, ‘AWS’ 도입
9
우리 원(WON) 뱅킹, ‘우리페이’ 간편결제 도입
10
세일즈포스, ‘드림포스 2021’ 성황리 개최
회사소개기사제보광고문의불편신고개인정보취급방침청소년보호정책이메일무단수집거부
서울시 영등포구 여의대방로65길 13, 904(여의도동 유창빌딩)| Tel: 02-785-5108 | Fax 02-785-5109
이메일주소무단수집거부 | (주)비아이코리아닷넷 | 대표이사 : 김동기 | 사업자 등록번호:107-87-99085 | 개인정보관리책임자 : 김동기
등록번호 : 서울 아01269 | 등록일자 : 신고일자 2008.10.22 | 발행인:김동기 | 발행일자:2010.06.01 | 편집인 : 김동기 | 청소년보호책임자 : 김동기
Copyright © 2012 BI KOREA. All rights reserved. mail to webmaster@bikorea.net