시설장비 설명 |
Microarray 기술로 인하여 분자생물학의 패러다임이 Hypothesis에서 시작하여 결과를 얻던 것이 data에서 결과를 도출하는 패러다임으로 변화하고 있다. 기존의 분자생물학적인 방법으로는 “one gene in one experiment” 을 토대로 하는 반면 microarray 기술은 수천 개의 gene을 동시에 분석하여 regulatory network 및 pathways를 분석 가능하게 하였다. 1. From Image to Data : Microarray 이미지 분석은 gridding segmentation and intensity extraction으로 나뉠 수 있다. 이미지 분석 도구에는 SCAN ALYZE GENEPIX QUANTARRAY R-package 등이 일반적으로 쓰이고 있다. 2. Data Preprocessing : Data 를 분석하기 전에 normalization 과 filtering 을 해야 한다. Filtering은 2배 fold 차이를 비교하여 정확하지 않은 data 특별히 차이가 나지 않는 data를 제거하는 과정이다. Normalization을 통해 서로 다른 실험 군끼리 비교할 수 있게 된다. Normalization을 함으로써 total mRNA의 loading량의 차이나 PMT setting 차이에 의한 experimental error의 영향을 제거해 준다. 3. Analysis of Comparative Experiments : 동시에 서로 다른 두 조건에서 발현량 차이를 구분하기 위해서 fold analysis 또는 t-statistic이 이용된다. 4. Analysis of Multiple conditions : 여러 개의 서로 다른 조건(예를 들면 시간)에서 실험한 결과를 가지고 gene들 간의 상호관계를 밝히기 위해서는 gene들 간의 class를 분석해야 한다. Class를 분석하는 방법에는 supervised 그리고 unsupervised machine learning method가 있는데 clustering method는 unsupervised method에 해당하는 것이다. Clustering이란 비슷한 expression profile을 갖는 것끼리 구분을 하는 것이다. Clustering을 하기 위해서는 similarity measure (distance에 반비례; Euclidean distance 정보이론 metrics) clustering criterion (Complete Linkage Single Linkage Average Linkage) Clustering algorithm (Hierarchical clustering K-mean SOM PCA 등등)의 3가지 요소가 필요하다. |