엔비디아, 세계 최초 딥 러닝 전용 슈퍼컴퓨터 공개 - SN News

leekh@semiconnet.co.kr

- 차세대 파스칼 아키텍처를 기반으로 한 ‘엔비디아 DGX-1’, 인공 지능의 다량 연산 수요에 최적화
- X86 서버 250대에 달하는 딥 러닝 처리량으로 훈련 시간을 혁신적으로 줄여
- 정교한 딥 뉴럴 네트워크 구현 가능, 빠르고 간편한 설치로 인공지능 발전을 위한 지원군 될 것

엔비디아(www.nvidia.co.kr)는 미국 캘리포니아 새너제이에서 열리고 있는 세계 최대의 GPU 개발자 컨퍼런스 ‘GTC 2016’에서 세계 최초 딥 러닝 전용 슈퍼컴퓨터인 ‘엔비디아 DGX-1(이하 DGX-1)’을 발표했다.

인공지능 작업에서 발생하는 무한한 연산 수요에 적합한 DGX-1는 딥 러닝을 위해 특별히 제작된 최초의 시스템이다. 새로운 세대의 GPU 가속기를 탑재한 턴키 시스템으로 250 대의 x86 서버를 합친 처리량을 자랑하며, 하드웨어, 딥 러닝 소프트웨어, 개발 도구들과 완벽하게 통합돼 빠르고, 쉬운 설치가 가능하다.

DGX-1의 딥 러닝 시스템은 인간처럼 배우고 인지하는 새로운 수준의 지능형 머신을 위한 GPU 가속 컴퓨팅의 성능을 제공한다. 강력한 컴퓨터 전력으로 차세대 애플리케이션을 구현함으로써 훈련 시간을 혁신적으로 줄이고, 보다 정교한 딥 뉴럴 네트워크를 가능하게 한다.

DGX-1는 엔비디아의 차세대 아키텍처인 ‘엔비디아 파스칼(Pascal) GPU 아키텍처’를 기반으로 범용 목적의 GPU인 ‘엔비디아 테슬라(Tesla) P100’을 통해 구현됐다. 또한 주요 기능의 개선을 통해 4개의 엔비디아 맥스웰(Maxwell™) 아키텍처를 기반으로 제공된 기존 솔루션보다 12배 이상의 빠른 훈련 속도를 제공한다.

성능과 활용도를 극대화하기 위한 기능도 탑재했다. ▲애플리케이션 확장성 극대화를 위한 ‘엔비디아 NVLink™ 고속 인터커넥트’, ▲혁신적인 에너지 효율을 위한 ‘16nm FinFET 제작 기술’, ▲빅 데이터 워크로드를 위한 ‘HBM2 탑재 CoWoS(Chip on Wafer on Substrate)’, ▲21 테라플롭스 이상의 최고 성능을 제공하는 새로운 반정밀도 명령(new half-precision instructions)이 대표적이다.

DGX-1은 최적화 된 딥 러닝 소프트웨어의 완벽한 세트를 제공, 빠르고 쉽게 딥 뉴럴 네트워크를 훈련시킬 수 있도록 돕는다. DGX-1 소프트웨어는 딥 뉴럴 네트워크(DNNs) 디자인과 제작을 위해 인터렉티브 시스템 ‘엔비디아 딥 러닝 GPU 트레이닝 시스템(DIGITS™)’과 GPU 가속 라이브러리의 신규 버전 ‘엔비디아 CUDA® 딥 뉴럴 네트워크 라이브러리(cuDNN) 버전5’를 포함한다. 또한 카페(Caffe), 시에노(Theano), 토치(Torch)를 포함한 다양한 딥 러닝 프레임 워크의 최적화된 버전을 포함하는 것은 물론, 추가적으로 클라우드 관리 도구와 소프트웨어 업데이트 및 컨테이너화된 애플리케이션 저장소로의 접근 권한을 제공한다. 이 외에도 DGX-1는 생산성 향상과 제작 시스템의 비가동 시간 감소를 위한 다양한 추가 지원 서비스를 지원한다.

한편 혁신적인 DGX-1의 성능을 가능하게 한 엔비디아의 파스칼 아키텍처는 인공지능 생태계의 강력한 지원을 받고 있다. 얀 레쿤(Yann LeCun) 페이스북 AI 연구 소장은 “엔비디아 GPU는 AI 프로세스를 가속화하고 있다”며, “뉴럴 네트워크가 점점 확대되는 만큼 더 크고 빠른 메모리를 탑재한, 빠른 정보 전송 속도의 GPU를 필요로 하며, 무엇보다 반정밀도 연산에 최적화된 하드웨어가 필요한데, 이를 모든 것을 만족시켜 주는 것이 파스칼”이라고 설명했다.

앤드류 응(Andrew Ng) 바이두 최고 과학자는 “AI 컴퓨터는 성능이 크기와 비례한다는 점에서 로켓과 같다”며 “파스칼의 처리량과 인터커넥트는 우리가 지금까지 보았던 그 어떤 로켓보다 큰 로켓을 만들어 낼 것” 이라고 말했다.

쉐동 황(Xuedong Huang) 마이크로소프트 수석 음성 과학자는 “마이크로소프트는 1,000개 이상의 레이어를 기반으로 한 슈퍼 딥 뉴럴 네트워크를 제공하는데, 엔비디아 테슬라 P100의 놀라운 파워는 마이크로소프트의 CNTK(Computation Network Toolkit)가 AI 혁신을 향해 나아갈 수 있도록 한다”고 밝혔다.

젠슨 황(Jen-Hsun Huang) 엔비디아 CEO이자 공동 창업자는 “인공 지능은 우리 삶에 가장 큰 영향을 미칠 혁신이며 이는 산업과 기술을 넘어 모든 것을 변화시킬 것”이라며, “강력한 딥 뉴럴 네트워크는 방대한 데이터를 기반으로 극한의 연산 성능을 필요로 한다”고 설명했다. 이어 그는 “인공지능 혁신을 위해 제작한 새로운 컴퓨팅 모델 DGX-1은 인간의 한계를 넘는 능력으로 기존에 불가능했던 문제를 해결할 것”이라며, “강력한 성능과 간편한 설치를 통해 관련 전문가들이 스스로 고성능 컴퓨팅 솔루션을 만드는데 수많은 시간을 낭비할 필요가 없게 됐다”고 덧붙였다.

DGX-1 시스템 사양은 ▲반정밀도 최고 성능에서 최대 170 테라플롭스, ▲8 개의 Tesla P100 GPU 가속기, GPU 당 16GB 메모리, ▲NVLink Hybrid Cube Mesh, ▲7TB SSD DL 캐시, ▲듀얼 10GbE, 쿼드 InfiniBand 100Gb 네트워킹, ▲3U ? 3200W며, 보다 자세한 정보는 엔비디아 홈페이지 (www.nvidia.com/page/support/dgx1-support)를 통해 확인할 수 있다. 미국 기준으로 6월부터, 다른 지역에서는 엔비디아 및 지정 SI 업체에서 2016년 3분기부터 판매 예정이다.

<월간 반도체네트워크 2016년 4월호>