Elastic GPU

GPU 기술을 기반으로 하는 강력한 병렬 컴퓨팅 성능

Elastic GPU Service(EGS)는 딥 러닝, 비디오 프로세싱, 과학 컴퓨팅, 시각화 같은 시나리오에 이상적인 GPU 기반 컴퓨팅 서비스입니다. EGS 솔루션에 사용되는 GPU는 AMD FirePro S7150, NVIDIA Tesla M40, NVIDIA Tesla P100, NVIDIA Tesla P4, NVIDIA Tesla V100입니다.

이점

딥 러닝
온라인 딥 러닝 교육 및 추론 서비스, 이미지 인식, 콘텐츠 식별, 음성 인식
비디오 프로세싱
HD 미디어 코딩, 4K/8K HD 라이브, 화상 회의, 원본 필름 복원
과학 컴퓨팅
비디오 렌더링, 충돌 시뮬레이션, 전산 금융, 유전공학, 기후 예측
시각화
공학 설계, 비선형 편집, 원격 교육 애플리케이션

특징

  • 컴퓨팅 성능

    다양한 GPU의 매우 강력한 컴퓨팅 성능


    GA1 인스턴스

    GA1 인스턴스는 최대 4개의 AMD Fire Pro S7150 GPU, 56개의 vCPU, 160GB의 메모리를 제공할 수 있습니다. 이 인스턴스는 병렬로 작동하는 32GB의 GPU 메모리와 8192개의 코어를 포함하고, 최대 15 TFLOPS의 단정밀도 및 1 TFLOPS의 배정밀도 부동 소수점 성능을 제공합니다.


    GN4 인스턴스

    GN4 인스턴스는 최대 2개의 NVIDIA Tesla M40 GPU, 56개의 vCPU, 96GB의 메모리를 제공할 수 있습니다. 이 인스턴스는 병렬로 작동하는 24GB의 GPU 메모리와 6000개의 코어를 포함하고, 최대 14 TFLOPS의 단정밀도 부동 소수점 성능을 제공합니다.


    GN5 인스턴스

    GN5 인스턴스는 최대 8개의 NVIDIA Tesla P100 GPU, 56개의 vCPU, 480GB의 메모리, 128GB의 GPU 메모리를 제공할 수 있습니다. 이 인스턴스는 최대 74.4 TFLOPS의 단정밀도 부동 소수점 성능을 제공합니다. 그리고 딥 러닝과 기타 범용 GPU 연산 시나리오에 요구되는 대규모 병렬 부동 소수점 연산 성능을 실현하는 데 도움이 됩니다. GN5 인스턴스는 또한 최대 37.6 TFLOPS의 배정밀도 부동 소수점 성능을 제공하여 과학 컴퓨팅 같은 시나리오에서 요구되는 높은 컴퓨팅 성능도 실현합니다.


    GN5i 인스턴스

    GN5i 인스턴스는 최대 2개의 NVIDIA Tesla P4 GPU, 56개의 vCPU, 224GB의 메모리를 제공할 수 있습니다. 이 인스턴스는 16GB의 GPU 메모리를 포함하고, 최대 11 TFLOPS의 단정밀도 부동 소수점 성능과 44 TOPS INT8의 컴퓨팅 성능을 제공합니다.


    GN6 인스턴스

    GN6 인스턴스는 최대 8개의 NVIDIA Tesla V100 GPU, 88개의 vCPU, 256GB의 메모리를 제공할 수 있습니다. 이 인스턴스의 GPU 메모리는 128GB입니다. GN6 인스턴스는 텐서 코어를 사용하여 최대 1000 TFLOPS의 딥 러닝 컴퓨팅 성능과 125.6 TFLOPS의 단정밀도 부동 소수점 성능을 제공할 수 있습니다. 이 인스턴스는 범용 GPU 연산 시나리오에 요구되는 대규모 병렬 부동 소수점 연산 성능을 실현하는 데 도움이 됩니다. GN6 인스턴스는 또한 최대 62.4 TFLOPS의 배정밀도 부동 소수점 성능을 제공하여 과학 컴퓨팅 같은 시나리오에서 요구되는 높은 컴퓨팅 성능도 실현합니다.

  • 탁월한 일반 네트워크 성능

    EGS를 통해 제공되는 뛰어난 네트워크 성능으로 광범위하고 복합적인 연산 시나리오에서 컴퓨팅 및 렌더링 성능이 극대화됩니다.


    연산 노드에서 구현되는 탁월한 네트워크 성능

    Elastic GPU 인스턴스는 최대 2,000,000 PPS와 25 Gbit/s의 내부 네트워크 대역폭을 지원하여 연산 노드에 필요한 최적의 네트워크 성능을 제공합니다.


    강력한 스토리지 성능

    Elastic GPU 인스턴스에는 고속 로컬 캐시가 있으며, 울트라 클라우드 디스크 또는 SSD 클라우드 디스크를 연결할 수 있습니다. 따라서 데이터의 고가용성이 보장되고 연산 및 렌더링 성능이 극대화됩니다.

  • 여러 결제 방법

    필요에 가장 적합한 결제 방법을 선택할 수 있습니다.


    연별 결제

    인스턴스 사용 요금을 연별로 결제하여 할인 혜택을 극대화할 수 있습니다.


    월별 결제

    인스턴스 사용 요금을 월별로 결제하면 결제할 때 적절한 비용을 유지하면서 상대적으로 낮은 시간당 인스턴스 사용 가격의 이점도 누릴 수 있습니다.


    시간별 결제

    컴퓨팅 리소스가 일시적으로 필요한 경우 인스턴스 사용 요금을 시간별로 결제할 수 있습니다. 매번 최저 요금이 청구됩니다.


    스폿 인스턴스 요청

    스폿 인스턴스를 요청하고 최대 90%까지 할인을 받을 수 있습니다.

  • 고성능 NVMe 드라이브 사용(GA1 및 GN5 인스턴스의 특수 기능)

    GPU 인스턴스에서 고성능 NVM Express 드라이브 사용


    GPU 인스턴스에서 고성능 NVMe 드라이브 사용

    3개 복사본 중복 기반의 안정성이 뛰어난 클라우드 스토리지를 GA1 인스턴스에 연결할 수 있습니다. 또한 최대 1.4TB 용량의 NVMe 드라이브를 GA1 인스턴스에서 사용할 수 있습니다. 이런 NVMe 드라이브는 230,000 IOPS를 처리할 수 있지만, I/O 지연은 약 200 ¥is에 불과하고 최대 1900 Mbit/s의 읽기 대역폭과 1100 Mbit/s의 쓰기 대역폭을 제공합니다. (인스턴스 성능은 랜덤 240,000회 읽기와 IO 깊이 12를 기준으로 테스트되었습니다.)

일반적인 시나리오

  • 클라우드에서 온라인 렌더링(GA1)
  • 범용 GPU 연산(GN4)
  • 뛰어난 연산 가속(GN5)
  • 딥 러닝 추론 성능(GN5i)
클라우드에서 온라인 렌더링(GA1)

클라우드에서 온라인 렌더링

클라우드 데스크톱을 사용한 온라인 렌더링

클라우드 데스크톱을 사용해 GA1 인스턴스에 빨리 액세스하여 보다 풍부한 시각적 조정 렌더링을 경험할 수 있습니다. 원격 데스크톱 프로토콜(RDP)을 사용하여 실시간 온라인 렌더링과 그래프 편집도 실현할 수 있습니다. RDP를 사용하여 어디에서나 GA1 인스턴스에 액세스하고 여러 유형의 장치를 사용하여 렌더링 및 그래프 편집 작업을 수행할 수 있습니다. 데이터는 Alibaba Cloud Network Attached Storage(NAS) 또는 Alibaba Cloud Object Storage Service(OSS)를 사용하여 저장됩니다. 언제든지 내부 네트워크에서 데이터를 가져올 수 있으므로 데이터 보안이 보장됩니다. 회사에서는 Express Connect와 NAT 게이트웨이를 사용하여 네트워크 환경을 개선하고 비용을 절감할 수 있습니다.

GA1 인스턴스는 현재 Windows Server 2008 R2(64비트), Windows 7(64비트), CentOS 7.3(64비트), Ubuntu 16.04(64비트)만 지원합니다. Windows Server 2016과 Windows 10은 곧 지원될 예정입니다.

이점

  • 인스턴스 시각화

    GA1 인스턴스의 강력한 컴퓨팅 성능으로 어디서든지 온라인 편집을 완료할 수 있습니다.

  • 서비스 통합

    GA1 인스턴스를 Express Connect, NAT 게이트웨이, OSS, NAS 같은 서비스와 통합할 수 있습니다.

통합 및 구성

범용 GPU 연산(GN4)

범용 GPU 연산에 적합한 뛰어난 가속 성능

딥 러닝을 위한 가속 엔진 제공

GN4 인스턴스는 NVIDIA의 Maxwell M40 GPU에 기반하며 최대 14 TFLOPS의 단정밀도 부동 소수점 성능을 제공합니다. 그리고 딥 러닝과 기타 범용 GPU 연산 시나리오에 요구되는 대규모 병렬 부동 소수점 연산 성능을 실현하는 데 도움이 됩니다. GN4 인스턴스는 탄력적인 컴퓨팅 에코시스템에 완벽하게 통합되어 온라인 또는 오프라인 연산 시나리오에 이상적인 솔루션을 제공합니다. 또한 컨테이너 서비스를 워크플로에 통합하면 배포와 O&M을 간소화하고 리소스 예약 서비스를 제공할 수 있습니다.

이점

  • 탄력적인 확장

    GN4 인스턴스는 Auto Scaling 및 Server Load Balancer와 함께 작동하여 탄력적인 확장을 실현할 수 있습니다.

  • 빠른 배포

    컨테이너 서비스를 사용하면 서비스 배포, O&M, 리소스 예약 속도를 높일 수 있습니다.

뛰어난 연산 가속(GN5)

뛰어난 부동 소수점 연산 가속 성능

뛰어난 연산 가속 성능

GN5 인스턴스는 NVIDIA Tesla P100 GPU에 기반하며 최대 74.4 TFLOPS의 단정밀도 부동 소수점 성능을 제공합니다. 그리고 딥 러닝과 기타 범용 GPU 연산 시나리오에 요구되는 대규모 병렬 부동 소수점 연산 성능을 실현하는 데 도움이 됩니다. GN5 인스턴스는 또한 최대 37.6 TFLOPS의 배정밀도 부동 소수점 성능을 제공하여 과학 컴퓨팅 같은 시나리오에서 요구되는 높은 컴퓨팅 성능도 실현합니다. GN5 인스턴스는 GPUDirect P2P 기술을 지원합니다. 이 방법으로, GPU는 PCI 버스를 사용해 서로 직접 통신하여 GPU 간 통신 지연을 크게 줄일 수 있습니다. GN5 인스턴스는 탄력적인 컴퓨팅 에코시스템에 완벽하게 통합되어 온라인 또는 오프라인 연산 시나리오에 이상적인 솔루션을 제공합니다.

또한 컨테이너 서비스를 최대한 활용하면 배포와 O&M을 간소화하고 리소스 예약 서비스를 제공할 수 있습니다. Image Market에서는 NVIDIA GPU 드라이버와 배포를 간소화하는 딥 러닝 프레임워크가 탑재된 GN5 인스턴스 이미지를 제공합니다.

이점

  • 탄력적인 확장

    GN5 인스턴스는 Auto Scaling 및 Server Load Balancer와 함께 작동하여 탄력적인 확장을 실현할 수 있습니다.

  • 빠른 배포

    컨테이너 서비스를 사용하면 서비스 배포, O&M, 리소스 예약 속도를 높일 수 있습니다.

딥 러닝 추론 성능(GN5i)

뛰어난 딥 러닝 추론 성능

최적의 딥 러닝 추론 성능

GN5i 인스턴스는 NVIDIA Tesla P4 GPU에 기반하며, 최대 11 TFLOPS의 단정밀도 부동 소수점 성능과 44 TOPS INT8의 컴퓨팅 성능을 제공하여 특히 추론 등의 딥 러닝 시나리오에 적합합니다. 또한 GPU 하나는 전력을 75W만 소비하면서도 고성능 출력을 유지합니다. GN5i 인스턴스는 탄력적인 컴퓨팅 에코시스템에 완벽하게 통합되어 온라인 또는 오프라인 연산 시나리오에 이상적인 솔루션을 제공합니다. 또한 컨테이너 서비스를 최대한 활용하면 배포와 O&M을 간소화하고 리소스 예약 서비스를 제공할 수 있습니다. Image Market에서는 NVIDIA GPU 드라이버와 배포를 간소화하는 딥 러닝 프레임워크가 탑재된 GN5i 인스턴스 이미지를 제공합니다.

이점

  • 탄력적인 확장

    GN5 인스턴스는 Auto Scaling 및 Server Load Balancer와 함께 작동하여 탄력적인 확장을 실현할 수 있습니다.

  • 빠른 배포

    컨테이너 서비스를 사용하면 서비스 배포, O&M, 리소스 예약 속도를 높일 수 있습니다.