편집 : 2017.12.12 화 19:28
피플/칼럼
“인공지능 혁명의 중심에 선 GPU”[기고]김광정 유클릭 엔비디아 사업팀 상무
유클릭 김광정 상무  |  kj.kim@uclick.co.kr
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2017.09.17  20:09:33
트위터 페이스북 미투데이 요즘 네이버 구글 msn
   
 

4차 산업 혁명 시대를 맞아 금융, 제조, 소매, 의료 등 업종을 가리지 않고 모두 인공지능에서 비즈니스의 미래를 찾고 있다.

최근 ‘인공지능 열풍’은 컴퓨팅 패러다임 전환에 가까운 기술 혁신을 동반하고 있다.

아울러 이 흐름은 기존 ‘CPU 기반의 대규모 클러스터 일색이던 병렬 컴퓨팅 환경’이 하나둘 ‘GPU 기반’으로 바뀌고 있음을 의미한다.

4차 산업 혁명의 가장 중요한 요소로 인공지능과 딥러닝이 부상하면서, 이를 구현하기 위한 필수 요소인 GPU의 중요성이 주목받고 있는 것이다.

◆“CPU의 시대를 뒤로하고 엔터프라이즈 환경에서 GPU가 중심에 서게 된 배경” = 기업의 차세대 서비스를 위한 핵심 기술로 GPU 기술이 자리 잡으면서 엔터프라이즈 전용 GPU 시대가 열리고 있다.

이같은 변화의 시작은 2006년 엔비디아가 ‘CUDA(Compute Unified Device Architecture)’와 ‘테슬라(Tesla) GPU’ 플랫폼을 선보인 때였다.

이후 CUDA는 다양한 계산과 분석 영역으로 개발자 커뮤니티를 넓혀 갔고, 이를 시작으로 본격적인 엔터프라이즈용 GPU 시대의 서막이 열렸다.

‘테슬라 GPU’ 플랫폼과 ‘CUDA’ 조합은 인공지능에 접근하는 더 강력하고, 새로운 길을 열고 있다.

엔비디아는 기계학습, 딥러닝, HPC 등에 대한 기업의 기대에 부응하기 위해 테슬라 GPU 플랫폼의 기술 혁신을 지속하고 있다.

가장 최근의 성과는 인공지능에 최적화된 ‘볼타(Volta)’ 아키텍처를 개발해 이를 엔터프라이즈용 GPU 플랫폼에 적용한 ‘테슬라 GV100’을 출시한 것이다. <그림1 ‘볼타(Volta) GV100 GPU를 장착한 엔비디아 테슬라 V100 SXM2 모듈’ 참조>

   
▲ 그림1 ‘볼타(Volta) GV100 GPU를 장착한 엔비디아 테슬라 V100 SXM2 모듈’

주로 게임 및 그래픽 작업 용도로 사용되는 개인용 GPU와는 다르게, 엔터프라이즈용 테슬라 GPU는 하드웨어, 소프트웨어 모든 측면에서 인공지능에 최적화돼 있다.

하드웨어 측면에서 보면, 딥러닝에 최적화된 새로운 스트리밍 멀티프로세서 아키텍처를 채용하고 있다.

이외에도 NVLink, HBM2 메모리, 통합 메모리와 주소 변환 서비스 등 일반 GPU와 완전히 다른 설계 철학을 담고 있다.

소프트웨어의 경우 CUDA9에 도입된 새로운 프로그래밍 모델을 지원한다.

◆엔터프라이즈가 요구하는 것을 알차게 갖춘 ‘엔비디아 테슬라’ =엔터프라이즈용 GPGPU(General-Purpose computing on Graphics Processing Units)와 일반 GPU의 차이를 몇 가지 짚어 보자면, 엔터프라이즈용 GPU는 더 큰 데이터 세트를 저 정확하고 빠르게 다루기 위해 64비트에 최적화돼 있다.

64비트 부동 소수점 연산 성능을 비교해 보면 수십 배의 차이가 난다.

다음으로 일반 GPU는 메모리 에러 처리를 염두에 두지 않는다. 왜냐하면, 게임이나 그래픽 작업 환경에서는 큰 문제가 되지 않기 때문이다.

하지만 복잡하고, 규모가 큰 연산을 해야 하는 테크니컬 컴퓨팅 분야에서는 작은 메모리 에러 하나가 큰 차이를 만들 수 있다.

일례로, 딥러닝 알고리즘 구동 시 GPU에서 메모리 에러가 발생하면 기계 학습 효율이 떨어지는 등 여러 문제가 발생할 수 있기 때문에, 이에 대응하기 위해 메모리 오류 탐지와 관리 기능을 제공하기 위해 ECC(Error Correcting Code) 메모리가 필요하다.

또 다른 주목할 부분은 CPU와 GPU 연결 구간의 데이터 처리 병목 구간을 최소화하여 병렬 데이터 처리 속도를 극대화한 것이다.

예를 들면, 엔비디아의 테슬라 GP100/GV100은 16GB/s 속도의 PCI-익스프레스 인터페이스뿐만 아니라, 80GB/s의 속도를 제공하는 NVLink 인터페이스를 이용할 수 있다. <그림2 ‘테슬라 V100의 새로운 기술 ’ 참조>

   
▲ 그림2 ‘테슬라 V100의 새로운 기술’

메모리 성능의 경우도 일반 GPU는 인메모리 상에서 실시간 처리를 고려하지 않았지만, 테슬라 GP100/GV100은 GPU 메모리 성능을 극대화해 연산 집약적인 작업에서도 빠른 속도를 유지할 수 있다.

GPU 간 전송 속도 역시 차이가 크다.

GP100/GV100은 여러 개의 GPU를 클러스터로 엮어 운영할 때 필요한 기능인 ‘GPU 다이렉트’라는 RDAM(Remote Direct Memory Access) 기술을 지원한다.

◆기업 전산실·데이터센터 환경에 맞는 엔터프라이즈용 GPU = 기업이 GPU 컴퓨팅을 더 복잡한 연산과 분석에 적용하는 조직이 늘면서 일반 GPU는 하드웨어 측면의 구조적인 한계를 맞이하고 있다.

대표적인 예가 ‘발열과 전원 소모량’이다.

일반적인 게임이나 그래픽 작업환경에서는 GPU가 CPU와 함께 사용돼 작동률이 여유가 있다.

하지만, 기계학습이나 딥러닝 프로그램을 구동할 때는 GPU 내의 수많은 코어가 항상 100% 동작하기 때문에 전기 소모량이 많고, 발열도 심하다.

그렇기 때문에 랙 타입 서버에 장착, 사용 시 발열 문제와 과도한 전력 사용으로 인한 이슈가 발생할 수 있다.

이는 시스템이 안정성과 가용성과 직결되기 때문에 매우 민감한 이슈라 할 수 있다.

아울러 현장의 데이터 분석가 입장에서 체감할 수 있는 한계도 있다. 바로 각종 소프트웨어의 지원 여부다.

CUDA는 계속 진화 발전하며 새로운 버전이 나오고, 써드파티(3rd Party) 소프트웨어는 이에 맞추어 개선한다.

따라서 최신 버전의 CUDA와 분석 소프트웨어 사용 여부와 기술지원 문제를 반드시 고려해야 한다.

◆코앞으로 다가온 엔터프라이즈 GPU 전성시대 = 살펴본 바와 같이, 엔터프라이즈용 GPU와 그래픽 전용 GPU는 엄연히 다르다.

그래픽 전용 GPU도 지속적인 발전을 거듭하고 있지만, 엔터프라이즈용 GPU는 아키텍처 설계 철학도 다르고 로드맵도 틀리다.

또한, 개인 사용자용 GPU는 기술 지원이나 유지보수 측면에서 기업 전산실이나 데이터센터의 운영 기준을 충족하지 못할 수도 있다.

CPU보다 GPU에 의존하는 부분이 더 큰 워크로드라면 GPU에 대한 전문적인 기술 지원도 필요하다.

이런 이유로 많은 기업이 현재 인공지능 관련 개발 및 운영 환경에 대한 미래 투자 보호 측면에서 엔터프라이즈용 GPU 도입을 서두르고 있다.

관련해 실무 부서에서는 자율 주행, 초정밀 언어·이미지·텍스트 인식, 지능형 비디오 분석, 금융 모델링, 로봇 공학, 공장 자동화 등 많은 분야에서 기존 업무를 분석해 병렬화 가능한 부분을 가려내고 있다.

때마침 엔터프라이즈용 GPU의 특징을 직접 체험할 수 있는 이벤트가 진행 중이다.

관심 있는 독자는 유클릭에서 인공지능과 딥러닝 알고리즘이 어느 정도 수준으로 성능이 높아지는지 확인할 수 있도록 ‘엔비디아 테슬라 GPU 및 DGX 스테이션(Station)’ 등을 무상으로 제공하는 분석 전문가를 위한 데모 이벤트(www.uclick.blog)에 신청하면 된다.

[상기 내용은 필자의 주관적인 의견이며 엔비디아와 유클릭의 공식 입장이 아님을 밝혀 둡니다]

<유클릭 김광정 상무>kj.kim@uclick.co.kr

< 저작권자 © BI KOREA 무단전재 및 재배포금지 >
유클릭 김광정 상무의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 요즘 네이버 구글 msn 뒤로가기 위로가기
이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
1
<초점>3개 카드사 차세대 현재 진행정도는?
2
비씨카드, FW-MCI ‘뱅크웨어글로벌’ 채택
3
KT 기가지니-스마트스터디, 사업협력
4
IBM “파워9 이어 파워10 로드맵 이미 나와”
5
SK텔레콤, ‘T 멤버십’ 12월 혜택 확대
6
“내년 복합적 보안위협 급격히 증가 전망”
7
SW 정의 서버 ‘타이달스케일’, 국내 시장 진출
8
“2018년, 사이버보안에서 AI간 대결 첫 해 될 것”
9
CJ올리브네트웍스, ‘빅데이터센터 쇼케이스’ 진행
10
LG유플러스, ‘알뜰폰 멤버십’ 출시
회사소개기사제보광고문의불편신고개인정보취급방침청소년보호정책이메일무단수집거부
서울시 영등포구 여의대방로65길 13, 904(여의도동 유창빌딩)| Tel: 02-785-5108 | Fax 02-785-5109
이메일주소무단수집거부 | (주)비아이코리아닷넷 | 대표이사 : 김동기 | 사업자 등록번호:107-87-99085 | 개인정보관리책임자 : 박시현
등록번호 : 서울 아01269 | 등록일자 : 신고일자 2008.10.22 | 발행인:김동기 | 발행일자:2010.06.01 | 편집인 : 박시현 | 청소년보호책임자 : 박시현
Copyright © 2012 BI KOREA. All rights reserved. mail to webmaster@bikorea.net