국가기상슈퍼컴퓨터센터

2018 사진전입상작, [아름다운 빛내림]

> 정보통신업무 > 국가기상슈퍼컴퓨터센터

슈퍼컴퓨터 1호기 2000년 ~ 2005년

슈퍼컴퓨터 1호기로 일본 NEC사의 SX5 벡터 시스템

기상청은 슈퍼컴퓨터 1호기로 일본 NEC사의 SX5 벡터 시스템을 도입하여 2000년부터 2005년 12월까지 주 시스템으로 운영하였다. 시스템의 최대 이론성능은 약 224GF로, 16만 7천 명이 1년간 계산할 양을 1초 만에 계산할 수 있는 성능이다. 현재는 퇴역하여 전시용 물품으로 보관되고 있다.

슈퍼컴퓨터 2호기 2005년 ~ 2012년

슈퍼컴퓨터 2호기인 미국 CRAY 사의 X1E 클러스터

슈퍼컴퓨터 2호기는 미국 크레이사의 X1E 벡터시스템으로 2005년부터 슈퍼컴퓨터 1호기의 용도를 완전히 대체하여 2010년 말까지 주 시스템으로 운영되었다. 512개의 X1E 벡터 MSP(CPU)를 갖고 있는 2대의 클러스터는 2005년에 설치되어 현업운영과 현업백업 및 연구용시스템으로 운영되었으며, 전체 CRAY X1E 시스템의 최대 이론성능은 18.5TF 이다.

이 성능은 1500만 명이 1년간 계산할 양을 1초 만에 계산할 수 있는 속도로, 이전보다 정교해진 전지구 예보모델 뿐만 아니라 앙상블 예보모델도 실시간으로 현업운영 할 수 있게 되었다.

하지만 슈퍼컴퓨터 2호기 도입 당시, 기상청 본청에는 슈퍼컴퓨터를 설치할 자체 전산실 공간이 부족하여 본청과 약 10km 떨어져 있는 IDC(Internet Data Center)에 설치되어,

DWDM으로 구성된 4Gbps의 전용회선으로 연결되어 운영되었다. 그리고 2010년에 충북 오창에 건립한 국가기상슈퍼컴퓨터센터로 이전 설치 후, 2010년 말 이후부터는 기후변화 시나리오 생산을 위한 용도로 활용되었으며, 2012년 말에 용도 폐기되어 일부 전시용 물품으로 보관되고 있다.

슈퍼컴퓨터 3호기 2010년 ~ 2016년

슈퍼컴퓨터 3호기인 미국 CRAY사의 XT5와 Baker 시스템

기상청은 기상용 슈퍼컴퓨터의 안정적인 운영을 위해 충청북도 청원군 오창과학산업단지에 국가기상슈퍼컴퓨터센터를 신축하고, 2009년부터 2010년까지 세 단계로 나누어 슈퍼컴퓨터 3호기를 설치하였다. 2010년 12월 하반기에 최종적으로 도입 완료된 기상청 슈퍼컴퓨터 3호기는 미국 CRAY사의 스칼라 계열의 XE6 시스템으로 계산성능 758TF, 공유자료저장장치 약 2.5PB, 백업저장장치 4.5PB로 구성되었다.

기상청 슈퍼컴퓨터 3호기는 수많은 컴퓨터 노드를 병렬로 연결하여 높은 확장성을 갖는 MPP(Massive Parallel Processing) 구조의 시스템이며, 현업 운영을 위한 “해온(Haeon)”과 연구 및 백업을 위한 “해담(Haedam)” 2조의 시스템으로 구성되었다.

각 시스템은 20개의 XE6 캐비닛으로 구성되어 있고, 각 캐비닛에는 최대 24 슬롯의 블레이드가 장착된다. 블레이드는 탈착이 쉽도록 컴퓨터 보드 형태로 만들어진 모듈이며, 계산용 Compute 블레이드와 I/O 등을 담당하는 Service 블레이드로 2종류가 있다. 하나의 블레이드에는 독립적 OS가 운영되는 4개의 노드가 있고, 각 노드는 2개의 12-core AMD 프로세서와 32GB 메모리가 있다. 해온 및 해담 시스템에는 각각 470개의 Compute 블레이드에 45,120개의 CPU 코어와 60TB 메모리가 설치되어 379TFlops의 이론 성능을 제공한다. 노드 간 통신에는 크레이사의 Gemini 인터커넥터 기술이 사용되며, ASIC chip 형태로 각 블레이드에 2조씩 장착되어 있다. 노드 간 공유 파일시스템으로는 2.5PB 규모의 external 방식 Lustre 병렬 파일시스템이 사용되며, 고속의 Infiniband 네트워크로 연결되어 있다. 슈퍼컴퓨터 3호기를 활용하여 영국기상청의 Unified Model에 기반한 전지구 통합모델(수평해상도 25km) 및 전지구 앙상블모델(수평해상도 40km)을 포함해 20여종의 수치예보모델을 하루 100여회 수행하였다.

슈퍼컴퓨터 4호기 2015년 ~ 현재

슈퍼컴퓨터 4호기

슈퍼컴퓨터 4호기는 초기분과 최종분으로 총 3개의 시스템으로 구성되어 있으며, 두 단계에 걸쳐 도입 설치 완료 되었다.

먼저 초기분 ‘우리’ 시스템은 2014년 12월에 도입이 완료되어, 수치모델 현업 시스템으로 2015년 6월부터 2016년 2월까지 운영하였고, 현재는 외부 공동활용 시스템으로 활용되고 있다. 최종분은 2015년 12월에 도입이 완료되어, 현업운영을 위한 ‘누리’와 연구개발 및 백업을 위한 ‘미리’ 시스템으로 구성되어 있으며 2016년 2월부터 ‘누리’ 시스템으로 수치모델 현업운영을 본격적으로 시작하였다.

슈퍼컴퓨터 4호기는 미국 CRAY사의 XC40으로 대용량 병렬 프로세서 아키텍처 기반의 시스템이다.

초기분 시스템은 3대의 캐비닛으로 구성되며, Intel Haswell 프로세서가 탑재되어 최고 이론성능은 447TFlop/s 이다. 시스템 계산노드 메모리 용량은 56TB이며, 3PiB 이상의 가용 저장 용량 및 50GB/sec이상의 I/O 대역폭을 제공하는 CRAY Sonexion 데이터 스토리지 시스템을 포함하여, 총 4개의 로그인 노드가 저장 장치를 공유하며, 계산노드와 동일한 아키텍처의 전후 처리용 노드 12개가 있다.

최종분은 물리적으로 분리된 2대의 같은 성능을 가진 시스템으로 구성된다. 각 시스템은 16개의 캐비닛으로 구성되며, Intel Haswell 프로세서가 탑재되어 최고 이론성능은 5,800TFlop/s(시스템 당 2,900TFlop/s)이다. 총 메모리 용량은 744 TB(시스템 당 372TB)이며, 13.5PiB 이상의 가용 저장 용량 및 248 GB/sec 이상의 I/O 대역폭을 제공하는 CRAY Sonexion 데이터 스토리지 시스템을 포함하여, 총 8개의 외부 로그인 노드가 각 시스템에 고르게 분산되어(시스템 당 4개) 저장장치를 공유하며, 계산노드와 동일한 아키텍처의 전후 처리용 노드 56개가 있다.

슈퍼컴퓨터 4호기 도입으로 수치모델 물리과정 및 역학과정 개선으로 보다 고해상도의 모델의 운영이 가능해졌다. 현재 영국 UM모델 기반의 고해상도 전지구모델(수평해상도 10km) 및 전지구 앙상블모델(수평해상도 32km)를 포함해 20여종의 수치예보모델이 하루 100여회 수행되고 있으며, 한국형 수치예보모델 개발을 위해 시스템 자원 일부를 활용하고 있다.

3RD Supercomputer와 2ND Supercomputer 성능을 비교한 표입니다.
구 분 슈퍼컴퓨터 1호기 슈퍼컴퓨터 2호기 슈퍼컴퓨터 3호기 슈퍼컴퓨터 4호기
시스템 기종 SX-5 Cray X1E CRAY XE6 CRAY XC40
도입완료 2000년 2005년 2010년 2015년
CPU(Core) 수 28개 1,024개 90,240개 139,392개
이론성능 224 GF 18.5 TF 758 TF 5,800 TF
메모리용량 224 GB 4 TB 120 TB 744 TB
공유저장장치 3.78 TB 88 TB 3.9 PB 15.8 PB
백업용량 14 TB 1 PB 4.5 PB