| 기업공감원스톱서비스

기업조회

본문 바로가기 주메뉴 바로가기

HOME
홈페이지 이용안내

카카오 스토리 공유하기
트위터 공유하기
페이스북 공유하기
스크랩 하기

논문 기본정보

Utilization of Phase Information for Speech Recognition

논문 개요

기관명, 저널명, ISSN, ISBN 으로 구성된 논문 개요 표입니다.
기관명	NDSL
저널명	한국전자통신학회 논문지 = The Journal of the Korea Institute of Electronic Communication Sciences
ISSN	1975-8170,2288-2189
ISBN

논문저자 및 소속기관 정보

저자, 소속기관, 출판인, 간행물 번호, 발행연도, 초록, 원문UR, 첨부파일 순으로 구성된 논문저자 및 소속기관 정보표입니다
저자(한글)
저자(영문)
소속기관
소속기관(영문)
출판인
간행물 번호
발행연도	2015-01-01
초록	MFCC는 음성 신호 처리에서 귀중한 특징 벡터들 중 하나이다. MFCC에서 명백한 결점은 푸리에 변환의 크기를 취함에 의해 위상 정보가 손실된다는 것이다. 이 논문에서 우리는 푸리에 변환의 실수부와 허수부 크기를 따로 취급함으로써 위상 정보를 활용하는 방법을 생각한다. 퍼지 벡터 양자화와 은닉 마코브 모델을 이용한 음성인식에 이 방법을 적용함으로써, 종전 방법에 비해 음성 인식 오류율을 줄일 수 있음을 보인다. 우리는 또한 수치해석을 통하여, FFT의 실수부와 허수부 각각에서 6개의 성분을 취하여 모두 12개의 MFCC 성분을 사용하는 것이 음성인식에 최적임을 보인다.
원문URL	http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=NART&cn=JAKO201532742223649
첨부파일

추가정보

과학기술표준분류, ICT 기술분류,DDC 분류,주제어 (키워드) 순으로 구성된 추가정보표입니다
과학기술표준분류
ICT 기술분류
DDC 분류
주제어 (키워드)	복소 켑스트럼,위상 정보,음성 인식,Complex Cpstrum,Phase Information,MFCC,Speech Recognition