텍스트마이닝 기법을 활용한 기술과 산업분류 코드 연계모형 구축
| 기관명 | NDSL |
|---|---|
| 공개여부 | |
| 사업명 | |
| 과제명(한글) | |
| 과제명(영어) | |
| 과제고유번호 | |
| 보고서유형 | report |
| 발행국가 | |
| 언어 | |
| 발행년월 | 11/01/2015 |
| 과제시작년도 |
| 주관연구기관 | 동국대학교 |
|---|---|
| 연구책임자 | 이영섭 |
| 주관부처 | |
| 사업관리기관 | |
| 내용 | |
| 목차 | |
| 초록 | 한국산업분류(KSCI) 설명집에 대한 텍스트 크롤링 및 전처리 실시 - J열: 출판, 방송통신 및 정보서비스업에 대한 설명집 크롤링 및 전처리 실시 - C열: 제조업에 대한 설명집 크롤링 및 전처리 실시 형태소 분석을 위한 관련 분야 한글 사전 정리 형태소 분석기를 이용한 명사추출 실시 추출된 명사 목록을 이용하여 불용어 처리 등 텍스트 처리 기법을 활용한 정확도 향상 구축된 토픽과 새로 입력되는 설명(Query) 사이의 매칭 알고리즘 개발 - 텍스트 벡터 사이의 코사인 유사도 산출 방법 연구 - 토픽 모형 사후확률을 반영한 코사인 유사도 산출 방법 연구 C열 (제조업)에 대한 토픽 모형 구축 완료 새롭게 입력되는 산업분류 모형에 대해 토픽 모형을 활용한 유사도 매칭 방안 제안 |
| 원문URL | http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=REPORT&cn=TRKO201600000569 |
| 첨부파일 |
| 과학기술표준분류 | |
|---|---|
| ICT 기술분류 | |
| 주제어 (키워드) |