초록 |
잠재토픽모델(latent topic model)은 데이타에 내재된 특징적 패턴이나 데이타 정의 자질들 간의 상호 관련성을 확률적으로 모델링하고 자동 추출하는 모델로서 최근 텍스트 문서로부터의 의미 자질 자동 추출, 이미지를 비롯한 멀티미디어 데이타 분석, 생물정보학 분야 등에서 많이 응용되고 있다. 이러한 잠재토픽모델의 대규모 데이타에 대한 적용 시 그 효과 증대를 위한 중요한 이슈 중의 하나는 모델의 효율적 학습에 관한 것이다. 본 논문에서는 대표적 잠재토픽모델 중의 하나인 PLSA (probabilistic latent semantic analysis) 기법을 대상으로 점진적 EM 알고리즘을 활용한, 기본 EM 알고리즘 기반의 기존 학습에 대한 학습속도 증진 기법을 제안한다. 점진적 EM 알고리즘은 토픽 추론 시 전체 데이타에 대한 일괄적 E-step 대신에 일부 데이타에 대한 일련의 부분적 E-step을 수행하는 특징이 있으며 이전 데이터 일부에 대한 학습 결과를 바로 다음 데이타 학습에 반영함으로써 모델 학습의 가속화를 기대할 수 있다. 또한 이론적인 측면에서 지역해로의 수렴성이 보장되고 기존 알고리즘의 큰 수정 없이 구현이 용이하다는 장점이 있다. 논문에서는 해당 알고리즘의 기본적인 응용과 더불어 실제 적용과정 상에서의 가능한 데이터 분할법들을 제시하고 모델 학습 속도 개선 면에서의 성능을 실험적으로 비교 분석한다. 실세계 뉴스 문서 데이타에 대한 실험을 통해, 제안하는 기법이 기존 PLSA 학습 기법에 비해 유의미한 수준에서 학습 속도 증진을 달성할 수 있음을 보이며 추가적으로 모델의 병렬 학습 기법과의 조합을 통한 실험 결과를 간략히 제시한다.록 하는 데 효과적으로 활용될 것이다.0.17% 큰 값을 가진다. 유빙은 부빙의 가장자리와 가까운 지역에 위치하기 때문에 SSM/I의 넓은 IFOV 내에 비교적 높은 SIC를 가지는 부빙이 포함되어 오차를 일으킬 수 있다. 또한 유빙표면에 쌓인 수분 함량이 높은 눈의 영향으로 SSM/I NT SIC가 과대 측정되었을 것으로 사료된다.{ sim}3.0$ 으로 메밀가루 첨가로 선호도가 감소하였으며, 맛은 30% 첨가군이 3.6으로 선호도가 가장 높았다. 조직의 촉촉한 정도는 대조군 3.4, 첨가군이 $3.5{ sim}2.5$ 로 나타났으며 씹힘성과 전반적인 기호도는 유의적인 차이가 없었다.y를 확인함으로써 형질전환식물의 화분의 안정적인 수분수정이 이루어질 수 있음을 간접적으로 제시하였다.. 본 연구의 결과 무대의상의 위상이 연출의도를 추론 해 볼 수 있을 정도의 독립적 공연예술 작품으로 인정됨을 알 수 있었으며 무대의상의 위상이 변함에 따라 의상 제작가의 위상 또한 연출자의 의도대로 옷을 만드는 단순한 기술자가 아니라 고도의 지식과 경험을 요하는 만능 예술인으로서의 자질을 갖춰야하는 것으로 점점 바뀌어 가는 사실 또한 알 수 있었다. 준 레스토랑에서 식중독 예방을 위한 위생관리 활동 내용으로 실천율이 낮은 활동을 규명하고 이 활동에 대한 지속적인 모니터링과 개선활동을 전개한다면 레스토랑의 식중독 예방에 크게 도움일 될 것으로 사료된다. 또한 본 연구에서 개발된 위생교육 자료를 활용한다면, 외식업체의 전반적인 위생수준을 향상시키고 식품의 안전성을 확보하는데 크게 기여할 것으로 기대된다. 최근에 외식업계에서 발생되고 있는 식중독 사고는 이상 기후의 영 |