내용 |
최근 미 국립과학기술 재단은 360억원에 이르는 차세대 수퍼컴퓨터 개발 프로젝트를 위해 텍사스 주립대학교에 있는 고성능 컴퓨팅센터 (TACC, Texas Advanced Computing Center)를 선정 하였음을 발표하였다. 이는 지난 2011년 과학기술재단 지원하에 지어진 Stampede 슈퍼컴퓨터를 대체하는 시스템을 개발하는 프로젝트이다. Dell 사의 PowerEdge 서버들로 2017년-2018년 동안 여러 단계에 걸쳐 완성될 이 새로운 슈퍼컴은 약 18 Petaflop 의 연산 성능을 보일것으로 예상되며, Intel 의 새로운 chip architecture 인 Xeon Phi Knights Landing CPU를 탑재하고 또한 인텔에서 개발한 3D Xpoint 메모리와 OmniPath interconnection 기술을 차용한 최초의 시스템이 될것으로 보인다. 이는 여지껏 인텔이 고성능 컴퓨팅 분야에서 꾸준히 추진했던 SSF (Scalable Systems Framework: Intel CPU + 3D Xpoint Memory + OmniPath High Speed Interconnection)의 모든 사양을 포함한 시스템이 되는 셈이다. 현재 센터에서 가동중인 Stampede 수퍼컴은 약 9 Petaflop 정도의 성능이며, 전세계에서 만명이 넘는 사용자들이 이 시스템을 이용하고 있다. 3년이 지난 지금도 전 세계 슈퍼컴리스트인 Top500 에서 Top 10 안에 드는 고성능 컴퓨터이다. 기본 CPU-base 서버들 만으론 2 Petaflop 의 성능을, 그리고 나머지 7 Petaflop의 성능은 각 노드에 장착된 GPU 에서 얻는 구조이다. 새로운 시스템인 Stampede 2는 Xeon Knights Landing CPU 에서만 18 Petaflop의 연산성능을 구현하며, 이러한 시스템 설계상의 구조적 변화로 인해 새로운 컴퓨팅 모델이 요구될 수 도 있다. 또한, 기본적으로 MCDRAM (Multi-Channel DRAM) 설계를 기본으로 한 3D Xpoint 메모리 또한 훨씬 더 복잡한 메모리 구조로 앞으로 프로그래밍에서 메모리 사용의 옵션이 더욱 다양해질 것으로 보인다. 이 시스템과 같이 구축될 대용량 파일 시스템은 Lustre File system 이 사용될 예정이고, 기존 Stampede시스템의 Luster system 을 제공했던 DDN (Data Direct Network)이 아닌 Seagate에서 제공할 것으로 보인다. TACC 에는 이미 시험용으로 Knight Landing system 이가동되고 있으며, 여기서 얻은 경험과 노하우가 앞으로 개발될 대형 시스템에 유용하게 적용될 것이다. 또 하나 이 새로운 시스템 개발과정에서 주목할 점은 대형 모델링 시뮬레이션과 빅 데이터의 결합이다. 여지껏 빅 데이터 범주에 인터넷상의 데이터 추적이나 센서들을 이용한 정보 취합, 분석들이 대부분을 차지했지만, TACC 의 디렉터인 Dan Stanzione 는 인터뷰 에서 앞으로 대형 시뮬레이션에서 만들어 내는 데이터들과 그 정보들을 기계학습을 통해 확대 재생산, 분석 함으로써 수십, 수백번의 반복 시뮬레이션 없이 좀 더 정확하고 의미있는 데이터 분석과 예측이 가능하리라고 내다 보았다. 이는 작년 (2015년) 여름에 발표된 NSCI (National Strategic Computing Initiative) 에서 강조한 고성능 연산 (High Performance Computing) 과 데이터 분석 (Big Data Analysis) 의 통합으로 가는 비젼과 일치하는 것으로, Stampede 2 의 개발도 이와 궤적을 같이 할것으로 보인다. |