엔비디아 테슬라

Nvidia Tesla
엔비디아 테슬라
Nvidia Tesla GPU
제조원엔비디아
소개했다2007년
5월 2일; 15년 전(2007-05-02)
유형컨슈머용 그래픽 카드

Nvidia Tesla는 스트림 프로세싱 또는 범용 그래픽 처리 장치(GPGPU)를 대상으로 한 Nvidia의 제품 라인의 이름으로, 선구적인 전기 엔지니어 Nikola Tesla의 이름을 따서 명명되었습니다.제품은 G80 시리즈부터 GPU를 사용하기 시작해, 새로운 칩의 출시에 수반해 계속 되고 있다.CUDA 또는 OpenCL API를 사용하여 프로그래밍할 수 있습니다.

Nvidia Tesla 제품 라인은 AMD의 Radeon Instent 및 인텔 Xeon Phi 딥 러닝 및 GPU 카드 라인과 경쟁했습니다.

엔비디아는 2020년 5월 테슬라 브랜드를 퇴출시켰는데,[1] 이는 자동차 브랜드와 혼선이 있을 수 있기 때문인 것으로 알려졌다.새로운 GPU는 Ampere A100 [3]GPU와 마찬가지로 Nvidia Data Center [2]GPU라는 브랜드가 있습니다.

개요

Nvidia Tesla C2075

Tesla 제품은 기존 마이크로프로세서보다 훨씬 뛰어난 계산 능력을 제공하므로 고성능 컴퓨팅 [4]시장을 겨냥했습니다.2012년 현재 Nvidia Teslas는 중국 톈진있는 Summit at Oak Ridge National Laboratory와 Tianhe-1A포함하여 세계에서 가장 빠른 슈퍼컴퓨터에 전력을 공급하고 있습니다.

테슬라 카드는 페르미 기반의 Nvidia GeForce 카드보다 4배 정도 정밀도가 높은 유사한 단일 정밀 [citation needed]성능을 가지고 있습니다.Nvidia의 소비자용 GeForce 카드나 Nvidia Quadro 카드와 달리 Tesla 카드는 원래 디스플레이에 이미지를 출력할 수 없었습니다.다만, 마지막 테슬라 C클래스 제품에는 듀얼링크 DVI 포트가 [5]1개 포함되어 있었다.

Project Denver의 일환으로서 Nvidia는 GPU에 [6]ARMv8 프로세서 코어를 내장할 예정입니다.이는 32비트 Tegra 칩의 64비트 후속작입니다.

테슬라 P100은 TSMC의 16나노미터 핀펫 반도체 제조 공정을 채택2012~2016년 AMD와 엔비디아 GPU가 기존사용하던 28나노미터 공정보다 더 발전했다.P100은 또한 삼성의 HBM2 [7]메모리를 사용한다.

적용들

Tesla 제품은 주로 시뮬레이션 및 대규모 계산(특히 부동소수점 계산) 및 전문 분야 및 과학 [8]분야의 고급 이미지 생성에 사용됩니다.

2013년에는 방위산업이 테슬라 매출의 6분의 1도 차지하지 않았지만, Sumit Gupta는 지리공간 인텔리전스 [9]시장에 대한 매출 증가를 예측했다.

사양

모델 마이크로
아키텍처
시작하다 칩스 코어 클럭
(MHz)
셰이더 기억 처리능력(GFLOPS)[a] 쿠다
계산하다
능력[b]
TDP
(표준)
메모, 폼 팩터
Cuda 코어
(합계)
베이스 클럭(MHz) 최대 부스트
클럭(MHz)[c]
버스 타입 버스 폭
(비트)
크기
(GB)
시계
(MT/s)
대역폭
(GB/초)
단일 정밀도
(MAD+MUL)
단일 정밀도
(MAD 또는 FMA)
2배 정밀도
(FMA)
단위 MHz MHz W
C870 GPU 컴퓨팅[d] 모듈 테슬라 2007년 5월 2일 G80×1 600 128 1350 GDDR3 384 1.5 1600 76.8 518.4 345.6 아니요. 1.0 170.9 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
D870 데스크사이드[d] 컴퓨터 2007년 5월 2일 G80×2 600 256 1350 GDDR3 2× 384 2× 1.5 1600 2× 76.8 1036.8 691.2 아니요. 1.0 520 데스크사이드 또는 3U 랙마운트형 외장 GPU
S870 GPU 컴퓨팅[d] 서버 2007년 5월 2일 G80×4 600 512 1350 GDDR3 4× 384 4× 1.5 1600 4× 76.8 2073.6 1382.4 아니요. 1.0 1U 랙마운트형 외장 GPU, 2×PCIe(×16) 경유로 접속
C1060 GPU 컴퓨팅[e] 모듈 2009년 4월 9일 GT200×1 602 240 1296[11] GDDR3 512 4 1600 102.4 933.12 622.08 77.76 1.3 187.8 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
S1070 GPU 컴퓨팅 서버 "400 구성"[e] 2008년 6월 1일 4 × GT200 602 960 1296 GDDR3 4× 512 4× 4 1538.4 4× 98.5 3732.5 2488.3 311.0 1.3 800 1U 랙마운트형 외장 GPU, 2×PCIe (×8 또는 ×16) 경유로 접속
S1070 GPU 컴퓨팅 서버 "500 구성"[e] 1440 4147.2 2764.8 345.6
S1075 GPU 컴퓨팅[e][12] 서버 2008년 6월 1일 4 × GT200 602 960 1440 GDDR3 4× 512 4× 4 1538.4 4× 98.5 4147.2 2764.8 345.6 1.3 1U 랙마운트형 외장 GPU, 1×PCIe(×8 또는 ×16) 경유로 연결
Quadro Plex 2200 D2 비주얼 컴퓨팅[f] 시스템 GT200GL×2 648 480 1296 GDDR3 2× 512 2× 4 1600 2× 102.4 1866.2 1244.2 155.5 1.3 데스크사이드 또는 3U 랙마운트형 외장 GPU (듀얼링크 DVI 출력x 4 )
Quadro Plex 2200 S4 비주얼 컴퓨팅[f] 시스템 GT200GL×4 648 960 1296 GDDR3 4× 512 4× 4 1600 4× 102.4 3732.5 2488.3 311.0 1.3 1200 1U 랙마운트형 외장 GPU, 2×PCIe (×8 또는 ×16) 경유로 접속
C2050 GPU 컴퓨팅[13] 모듈 페르미 2011년 7월 25일 GF100×1 575 448 1150 GDDR5 384 3개[g] 3000 144 아니요. 1030.4 515.2 2.0 247 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
M2050 GPU 컴퓨팅[14] 모듈 2011년 7월 25일 3092 148.4 아니요. 225
C2070 GPU 컴퓨팅[13] 모듈 2011년 7월 25일 GF100×1 575 448 1150 GDDR5 384 6개[g] 3000 144 아니요. 1030.4 515.2 2.0 247 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
C2075 GPU 컴퓨팅[15] 모듈 2011년 7월 25일 3000 144 아니요. 225
M2070/M2070Q GPU 컴퓨팅[16] 모듈 2011년 7월 25일 3132 150.336 아니요. 225
M2090 GPU 컴퓨팅[17] 모듈 2011년 7월 25일 GF110×1 650 512 1300 GDDR5 384 6개[g] 3700 177.6 아니요. 1331.2 665.6 2.0 225 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
S2050 GPU 컴퓨팅 서버 2011년 7월 25일 GF100×4 575 1792 1150 GDDR5 4× 384 4×3[g] 3 4× 148.4 아니요. 4121.6 2060.8 2.0 900 1U 랙마운트형 외장 GPU, 2×PCIe (×8 또는 ×16) 경유로 접속
S2070 GPU 컴퓨팅 서버 4×6[g] 아니요.
K10 GPU 액셀러레이터[18] 케플러 2012년 5월 1일 GK104×2 3072 745 ? GDDR5 2× 256 2× 4 5000 2× 160 아니요. 4577 190.7 3.0 225 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
K20 GPU 액셀러레이터[19][20] 2012년 11월 12일 GK110×1 2496 706 758 GDDR5 320 5 5200 208 아니요. 3524 1175 3.5 225 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
K20X GPU 액셀러레이터[21] 2012년 11월 12일 GK110×1 2688 732 ? GDDR5 384 6 5200 250 아니요. 3935 1312 3.5 235 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
K40 GPU 액셀러레이터[22] 2013년 10월 8일 GK110B×1 2880 745 875 GDDR5 384 12개[g] 6000 288 아니요. 4291–5040 1430–1680 3.5 235 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
K80 GPU 액셀러레이터[23] 2014년 11월 17일 GK210×2 4992 560 875 GDDR5 2× 384 2× 12 5000 2× 240 아니요. 5591–8736 1864–2912 3.7 300 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
M4 GPU 액셀러레이터[24][25] 맥스웰 2015년 11월 10일 GM206×1 1024 872 1072 GDDR5 128 4 5500 88 아니요. 1786–2195 55.81–68.61 5.2 50–75 내장 PCIe GPU(하프 하이트, 싱글 슬롯)
M6 GPU 액셀러레이터[26] 2015년 8월 30일 GM204-995-A1×1 1536 722 1051 GDDR5 256 8 4600 147.2 아니요. 2218–3229 69.3–100.9 5.2 75–100 내장 MXM GPU
M10 GPU 액셀러레이터[27] GM107×4 2560 1033 ? GDDR5 4× 128 4× 8 5188 4× 83 아니요. 5289 165.3 5.2 225 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
M40 GPU 액셀러레이터[25][28] 2015년 11월 10일 GM200×1 3072 948 1114 GDDR5 384 12 또는 24 6000 288 아니요. 5825–6844 182.0–213.9 5.2 250 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
M60 GPU 액셀러레이터[29] 2015년 8월 30일 GM204-895-A1×2 4096 899 1178 GDDR5 2× 256 2× 8 5000 2× 160 아니요. 7365–9650 230.1–301.6 5.2 225–300 내장 PCIe GPU(풀 하이트, 듀얼 슬롯)
P4 GPU 액셀러레이터[30] 파스칼 2016년 9월 13일 GP104×1 2560 810 1063 GDDR5 256 8 6000 192.0 아니요. 4147–5443 129.6–170.1 6.1 50-75 PCIe 카드
P6 GPU 액셀러레이터[31][32] 2017년 3월 24일 GP104-995-A1×1 2048 1012 1506 GDDR5 256 16 3003 192.2 아니요. 6169 192.8 6.1 90 MXM 카드
P40 GPU 액셀러레이터[30] 2016년 9월 13일 GP102×1 3840 1303 1531 GDDR5 384 24 7200 345.6 아니요. 10007–11758 312.7–367.4 6.1 250 PCIe 카드
P100 GPU 액셀러레이터(메자닌)[33][34] 2016년 4월 5일 GP100-890-A1×1 3584 1328 1480 HBM2 4096 16 1430 732 아니요. 9519–10609 4760–5304 6.0 300 SXM 카드
P100 GPU 액셀러레이터(16GB 카드)[35] 2016년 6월 20일 GP100×1 1126 1303 아니요. 8071‒9340 4036‒4670 250 PCIe 카드
P100 GPU 액셀러레이터 (12 GB 카드)[35] 2016년 6월 20일 3072 12 549 아니요. 8071‒9340 4036‒4670
V100 GPU 액셀러레이터(메자닌)[36][37][38] 볼타 2017년 5월 10일 GV100-895-A1×1 5120 불명 1455 HBM2 4096 16 또는 32 1750 900 아니요. 14899 7450 7.0 300 SXM 카드
V100 GPU 액셀러레이터(PCIe 카드)[36][37][38] 2017년 6월 21일 GV100×1 불명 1370 아니요. 14028 7014 250 PCIe 카드
V100 GPU 액셀러레이터 (PCIe FHL 카드) 2018년 3월 27일 GV100×1 937 1290 16 1620 829.44 아니요. 13210 6605 250 PCIe FHL 카드
T4 GPU 액셀러레이터(PCIe 카드)[39][40] 튜링 2018년 9월 12일 TU104-895-A1×1 2560 585 1590 GDDR6 256 16 불명 320 아니요. 8100 불명 7.5 70 PCIe 카드
A2 GPU 액셀러레이터(PCIe 카드)[41] 암페어 2021년 11월 10일 GA107×1 1280 1440 1770 GDDR6 128 24 불명 600 아니요. 4531 140 8.6 40-60 PCIe 카드 (하프 하이트, 싱글 슬롯)
A10 GPU 액셀러레이터(PCIe 카드)[42] 2021년 4월 12일 GA102-890-A1×1 9216 885 1695 GDDR6 384 24 불명 600 아니요. 31240 976 8.6 150 PCIe 카드 (싱글 슬롯)
A16 GPU 액셀러레이터(PCIe 카드)[43] 2021년 4월 12일 4 × GA107 4× 1280 885 1695 GDDR6 4× 128 4× 16 불명 4× 200 아니요. 4× 4608 1084.8 8.6 250 PCIe 카드(듀얼 슬롯)
A30 GPU 액셀러레이터(PCIe 카드)[44] 2021년 4월 12일 GA100×1 3584 930 1440 HBM2 3072 24 불명 933.1 아니요. 10320 5161 8.0 165 PCIe 카드(듀얼 슬롯)
A40 GPU 액셀러레이터(PCIe 카드)[45] 2020년 10월 5일 1 × GA102 10752 1305 1740 GDDR6 384 48 불명 695.8 아니요. 37420 1168 8.6 300 PCIe 카드(듀얼 슬롯)
A100 GPU 액셀러레이터(PCIe 카드)[46][47] 2020년[48] 5월 14일 GA100-883×1AA-A1 6912 765 1410 HBM2 5120 40 또는 80 불명 1555 아니요. 19500 9700 8.0 250 PCIe 카드(듀얼 슬롯)
H100 GPU 액셀러레이터(PCIe 카드)[49] 호퍼 2022년[50] 3월 22일 GH100×1[51] 14592 1065 1650 HBM2e 5120 80 불명 2048 아니요. 48000 24000 9.0 350 PCIe 카드(듀얼 슬롯)
H100 GPU 액셀러레이터(SXM 카드) 16896 1065 1650 HBM3 5120 80 불명 3072 아니요. 60000 30000 9.0 700 SXM 카드
모델 마이크로
아키텍처
시작하다 칩스 코어 클럭
(MHz)
셰이더 기억 처리능력(GFLOPS)[a] 쿠다
계산하다
능력
TDP
(표준)
메모, 폼 팩터
Cuda 코어
(합계)
베이스 클럭(MHz) 최대 부스트
클럭(MHz)[c]
버스 타입 버스 폭
(비트)
크기
(GB)
시계
(MT/s)
대역폭
(GB/초)
단일 정밀도
(MAD+MUL)
단일 정밀도
(MAD 또는 FMA)
2배 정밀도
(FMA)

메모들

  1. ^ a b 처리 능력을 계산하려면 , Tesla(마이크로 아키텍쳐)를 참조해 주세요.#퍼포먼스, Fermi(마이크로아키텍처)#퍼포먼스, 케플러(마이크로아키텍처)# 퍼포먼스, Maxwell (마이크로 아키텍처)# 퍼포먼스 또는 Pascal (마이크로아키텍처)# 퍼포먼스수치 범위는 베이스 클럭과 최대 부스트 클럭 각각에서의 최소 처리 파워와 최대 처리 파워를 지정합니다.
  2. ^ CUDA 프로그래밍 가이드에 따른 핵심 아키텍처 버전.
  3. ^ a b GPU Boost는 기본 기능으로, 카드의 미리 정해진 전력 버젯을 유지하면서 코어 클럭 레이트를 높입니다.여러 개의 부스트 클럭을 사용할 수 있지만 다음 표에 각 [10]카드로 지원되는 최대 클럭을 나타냅니다.
  4. ^ a b c Nvidia가 지정하지 않은 사양은 GeForce 8800 GTX를 기반으로 합니다.
  5. ^ a b c d Nvidia가 지정하지 않은 사양은 GeForce GTX 280을 기반으로 합니다.
  6. ^ a b Nvidia가 지정하지 않은 사양은 Quadro FX 5800을 기반으로 합니다.
  7. ^ a b c d e f ECC를 켜면 전용 메모리의 일부가 ECC 비트에 사용되므로 사용 가능한 사용자 메모리가 12.5% 감소합니다(예를 들어, 총 4GB의 메모리는 3.5GB의 사용자 사용 가능한 메모리를 생성합니다).

「 」를 참조해 주세요.

레퍼런스

  1. ^ Casas, Alex (19 May 2020). "NVIDIA Drops Tesla Brand To Avoid Confusion With Tesla". Wccftech. Retrieved 8 July 2020.
  2. ^ "NVIDIA Supercomputing Solutions".
  3. ^ "NVIDIA A100 GPUs Power the Modern Data Center". NVIDIA. Retrieved 8 July 2020.
  4. ^ "High Performance Computing - Supercomputing with Tesla GPUs".
  5. ^ "Professional Workstation Solutions".
  6. ^ "Nvidia to Integrate ARM Processors in Tesla". 1 November 2012.
  7. ^ Walton, Mark (6 April 2016). "Nvidia unveils first Pascal graphics card, the monstrous Tesla P100". Ars Technica. Retrieved 19 June 2019.
  8. ^ Tesla Technical Brief (PDF)
  9. ^ "Nvidia chases defense, intelligence ISVs with GPUs". www.theregister.com. Retrieved 8 July 2020.
  10. ^ "Nvidia GPU Boost For Tesla" (PDF). January 2014. Retrieved 7 December 2015.
  11. ^ "Tesla C1060 Computing Processor Board" (PDF). Nvidia.com. Retrieved 11 December 2015.
  12. ^ "Difference between Tesla S1070 and S1075". 31 October 2008. Retrieved 29 January 2017. S1075 has one interface card
  13. ^ a b "Tesla C2050 and Tesla C2070 Computing Processor" (PDF). Nvidia.com. Retrieved 11 December 2015.
  14. ^ "Tesla M2050 and Tesla M2070/M2070Q Dual-Slot Computing Processor Modules" (PDF). Nvidia.com. Retrieved 11 December 2015.
  15. ^ "Tesla C2075 Computing Processor Board" (PDF). Nvidia.com. Retrieved 11 December 2015.
  16. ^ Hand, Randall (23 August 2010). "NVidia Tesla M2050 & M2070/M2070Q Specs OnlineVizWorld.com". VizWorld.com. Retrieved 11 December 2015.
  17. ^ "Tesla M2090 Dual-Slot Computing Processor Module" (PDF). Nvidia.com. Retrieved 11 December 2015.
  18. ^ "Tesla K10 GPU accelerator" (PDF). Nvidia.com. Retrieved 11 December 2015.
  19. ^ "Tesla K20 GPU active accelerator" (PDF). Nvidia.com. Retrieved 11 December 2015.
  20. ^ "Tesla K20 GPU accelerator" (PDF). Nvidia.com. Retrieved 11 December 2015.
  21. ^ "Tesla K20X GPU accelerator" (PDF). Nvidia.com. Retrieved 11 December 2015.
  22. ^ "Tesla K40 GPU accelerator" (PDF). Nvidia.com. Retrieved 11 December 2015.
  23. ^ "Tesla K80 GPU accelerator" (PDF). Images.nvidia.com. Retrieved 11 December 2015.
  24. ^ "Nvidia Announces Tesla M40 & M4 Server Cards - Data Center Machine Learning". Anandtech.com. Retrieved 11 December 2015.
  25. ^ a b "Accelerating Hyperscale Datacenter Applications with Tesla GPUs Parallel Forall". Devblogs.nvidia.com. 10 November 2015. Retrieved 11 December 2015.
  26. ^ "Tesla M6" (PDF). Images.nvidia.com. Retrieved 28 May 2016.
  27. ^ "Tesla M10" (PDF). Images.nvidia.com. Retrieved 29 October 2016.
  28. ^ "Tesla M40" (PDF). Images.nvidia.com. Retrieved 11 December 2015.
  29. ^ "Tesla M60" (PDF). Images.nvidia.com. Retrieved 27 May 2016.
  30. ^ a b Smith, Ryan (13 September 2016). "Nvidia Announces Tesla P40 & Tesla P4 - Network Inference, Big & Small". Anandtech. Retrieved 13 September 2016.
  31. ^ "Tesla P6" (PDF). www.nvidia.com. Retrieved 7 March 2019.
  32. ^ "Tesla P6 Specs". www.techpowerup.com. Retrieved 7 March 2019.
  33. ^ Smith, Ryan (5 April 2016). "Nvidia Announces Tesla P100 Accelerator - Pascal GP100 for HPC". Anandtech.com. Anandtech.com. Retrieved 5 April 2016.
  34. ^ Harris, Mark. "Inside Pascal: Nvidia's Newest Computing Platform". Retrieved 13 September 2016.
  35. ^ a b Smith, Ryan (20 June 2016). "NVidia Announces PCI Express Tesla P100". Anandtech.com. Retrieved 21 June 2016.
  36. ^ a b Smith, Ryan (10 May 2017). "The Nvidia GPU Technology Conference 2017 Keynote Live Blog". Anandtech. Retrieved 10 May 2017.
  37. ^ a b Smith, Ryan (10 May 2017). "NVIDIA Volta Unveiled: GV100 GPU and Tesla V100 Accelerator Announced". Anandtech. Retrieved 10 May 2017.
  38. ^ a b Oh, Nate (20 June 2017). "NVIDIA Formally Announces V100: Available later