Korean Article Bank

한국신학논문은행에 대하여

2005/05/06 (20:55) from 129.206.197.49' of 129.206.197.49' Article Number : 380
Delete Modify 정보 Access : 5825 , Lines : 53
음성인식 기술의 최근 동향
Download : 음성 인식 기술의 최신 동향.doc (36 Kbytes)



음성인식 기술의 최근 동향

1. 음성인식이란?

음성인식이란 전화, 마이크 등을 통하여 컴퓨터나 음성인식 시스템에 전달된 사람의 음성으로부터 특징을 추출하고 분석하여 미리 입력된 인식 목록에서 가장 근접한 결과를 찾아내는 기술이다.
음성인식 기술은 그 분류기준에 따라 여러가지 종류로 나뉜다. 사용자범위에 따라 화자종속인식기술, 화자독립인식기술로 나뉘며, 인식대상 어휘수에 따라 소어휘 인식기술, 대어휘인식기술 그리고 발성의 자연성에 따라 단어인식기술, 연속음성인식기술, 대화체인식기술 등으로 구분된다.



[그림 1] 음성인식 시스템의 구성도


2. 활용분야

음성인식기술은 산업 전반에 걸친 Knowledge와 Technology의 밀결합을 요하는 첨단 기술로써 컴퓨터, 휴대폰, 녹음기, 전자사전, 게임기, 장난감, 멀티미디어 가판대, 가정용 전자기기 등의 제품에 채택돼 음성을 통한 다이얼링, 정보검색, 회의록 작성, 게임, 학습, 전자제품 제어, 보안 설정 등을 가능하게 한다.


3. 국내외 기술 동향

현재 약 13억 달러 시장을 형성하고 있는 음성 소프트웨어에는 음성다이얼 휴대폰이나, 음성입력(Voice Dication) 소프트 웽어 등이 있으며, 최근에는 지능형 음성인식 및 음성언어번역 소프트웨어 개발이 적극적으로 진행되면서 PC를 비롯한 휴대폰, 양방향 TV, 자동차 등에 내장될 것으로 예상된다. 또한 다국어 음성언어 번역 소프트웨어 공동연구를 위한 국제 컨소시엄(C-Star)이 형성되어 활발한 연구가 진행되고 있다.

- 음성처리 기술의 실용화는 고립단어 인식기술의 경우 1990년대 초반에 실용화가 시작되었으며, 그 예로 90년대 초반에 미국 AT&T에서 수신자 부담 전화의 처리에 고립단어 음성인식 기술을 사용
- 1990년대 후반에 이르러 화자종속 연속음성 인식기술을 이용한 음성 타으프라이터 제품이 출시하였다. 그 예로 1997년에 미국 Dragon사의 NaturallySpeaking 이라는 제품이 출시하였다.
- 미국 DEC사의 음성합성기 DecTalk, 영국의 천재물리학자 스티븐 호킹이 사용하고 있음. 1980년대에는 4,500불이 현재 200불 수준.
- 벨기에의 Lernout & Houspie사, 음성인식기 및 음성합성기 출시. L&H 음성인식기술의 성능은 소규모 어휘를 대상으로 하는 제품에 대해서는 98% 이상, 중규모 어휘 음성인식시스템에 대해서도 95% 정도의 인식 성능을 보이고 있을 뿐 아니라,  1만 단어 이상의 대규모 어휘인식 시스템에 대해서도 90% 이상의 성능을 나타내고 있다.
- 드래곤 포인트&스피크 : 가정용 PC 시장을 겨냥해 출시된 제품으로, 연속음 인식기술을 체택해 자연스러운 딕테이션을 지원한다. IBM의 비아보이스와 함께 90% 이상의 높은 인식률을 보이고 있다.
- IBM ViaVoice : 다양한 애플리케이션에서 딕테이션을 구현한다. 문법을 고려해 문장을 받아적고, 아울러 사용자가 딕테이션한 발음을 녹음해 음성 데이터베이스를 구축한다.
- 커즈웨일 보이스패드 : 커즈웨일(Kurzweil)사는 약 16년간 음성인식기술에 몸담은 회사로, 지난 해 6월 전세계 3대 음성인식업체로 꼽히는 L&H사에 합병된 곳이다. 연속음 인식은 불가능하다. 단어 하나씩 구별해 발음하는 고립단어 인식기술에서 진보된 연결단어 인식기술로, 단어 사이에 시간적 간격을 두지 않고 말해도 인식이 가능하다.

국내에서도 1980년도에 들면서부터 본격적인 음성인식에 관한 연구가 이루어져 오고 있다. 개발된 시스템으로는 한국전자통신 연구소의 자동통역시스템, 한국통신의 증권정보안내시스템, 삼성전자의 음성구동 퍼스널 컴퓨터, 음성구동 셀룰러폰(삼성, LG), 음성메모장치(공성통신) 등이 있으며 현재 성능개선 또는 상용화 중에 있다. 또 음성에 의한 로봇제어에 관한 연구, 음성에 의한 자동항법 장치 등에 관한 연구도 활발히 진행되고 있다.
4. 음성인식 기술의 21세기 전망

최근 음성인식기술은 미국을 중심으로 구체적인 응용분야가 개척되어오고 있고 멀티모드/멀티미디어 환경속에서의 다른 미디어와 통합에 관한 여구가 진행되고 있다. 향후 이러한 멀티미디어와 결합되는 연구가 더욱 활발하게 진행될 것으로 기대된다. 이러한 멀티모드/멀티미디어 기술의 활용분야로는 각종 멀티미디어 정보기기의 입출력 인터페이스, 자동차 네비게이션 시스템 개발, 시각 장애자를 위한 서비스 시스템, 대화형 자판기, 대화형 Robot, 3차 컴퓨터시스템 개발, 제품의 검사, 멀티모드 의료서비스, 각종 멀티모달 데이터 베이스 검색, 홈쇼핑, 자동 예약/문의 시스템, 음성입출력 PC, 전자메일 시스템 개발, 멀티모드형 자동항법 장치 개발 등 그 분야는 이루 헤아릴 수 없다. 이와 같은 응용연구와 더불어 자연어 처리기술을 적극적으로 이용하는 자연발화 대화체 연속음성인식에 관한 연구가 더욱 활발하게 진행될 것으로 생각된다. 이와 더불어 각국간의 자동통역전화에 관한 연구도 가속화될 것으로 보인다.
음성인식 전반적으로서는 현재의 통계적 방법을 기반으로 실재의 대량의 음성데이터에 기초를 둔 일상 언어의 언어모델을 구축하는 것, 다수화자의 음성데이터에 기저하여 개인차의 모델을 구축하여 이에 의한 다수 화자의 음성에의 적응화 알고리즘을 개발하는 것, 여러 종류의 잡음, 왜곡에 자동적으로 적응되는 방법을 확립하는 것 등이 중요한 기술적 과제로 될 것이다.
국내적으로는 하루빨리 대규모 한국어 음성데이터베이스가 구축되어 많은 음성연구자들이 공동으로 이용하여 서로의 연구결과를 평가하고 그 결과를 공유할 수 있는 기반이 조성되어야 할 것으로 생각된다.







참고문헌

㈜한국인식기술 (http://www.hiart.co.kr/home/default.html)
L&H Korea (http://www.lhsl.co.kr/solutions/solutions.html)
HowPC (http://www.howpc.com/howpc/199808/sw/04.html)
음성인식 기술의 개요와 최근동향 (http://inmac3.snu.ac.kr/news/current/current_tech.html)


Backward Forward Post Reply List