Nvidia Tesla

Nvidia Tesla — бывшее семейство вычислительных систем Nvidia на основе графических процессоров с архитектурой CUDA, которые использовались для научных и технических вычислений общего назначения. Tesla не могла полностью заменить обычный универсальный процессор, но позволяла использовать вычислительный ресурс множества своих ядер для решения определённого круга ресурсоёмких задач (вести параллельную обработку данных). Примерами таких задач могут служить симуляция свёртывания молекул белка, секвенирование ДНК, моделирование погоды, анализ финансового риска и т. п.

Системы Tesla впервые появились на рынке с выходом графического чипа NVIDIA восьмого поколения — G80. Tesla строится на базе обычных графических процессоров, но, в отличие от видеоускорителей, не имеет средств вывода изображения на дисплей. Являясь своего рода сопроцессором, Tesla может использоваться для создания вычислительных систем на базе персональных компьютеров, а также в составе серверов и вычислительных кластеров.

В 2020 году Nvidia прекратила использование бренда Tesla^[1].

История

Линейка ускорителей вычислений Tesla была представлена летом 2007 года, вскоре после релиза унифицированной вычислительной архитектуры CUDA, позволяющей на Си-подобном языке программирования писать код для вычислений на графическом процессоре. Первый ускоритель Tesla C870 был основан на графическом процессоре G80, уже представленном в картах GeForce 8-й серии, и основанном на унифицированной шейдерной микроархитектуре, также носящей имя Tesla^[англ.]^[2]. Также были представлены решения с 2 картами в «настольном суперкомпьютере» и 4 картами в форм-факторе блейд-сервера формата 1U. C870 поддерживала вычисления с одинарной точностью с производительностью 518 гигафлопс^[3]. С переходом на новую микроархитектуру графических процессоров компания обновляла линейку ускорителей Tesla, причём в случае Fermi^[4], Pascal^[5], Volta^[6] и Turing ускорители Tesla становились первыми продуктами на новой архитектуре, представленными широкой публике^[7]. В 2011 году компания представила технологию Maximus, позволяющую комбинировать в рамках одной рабочей станции ускорители Tesla и профессиональные графические карты Quadro для максимально эффективного распределения вычислительных ресурсов. Для этого в рамках технологии Maximus компания представила универсальный драйвер для обеих карт, оптимизированный как для решения более стандартных задач на базе Quadro, так и для специализированных вычислений на базе Tesla^[8].

Наиболее современным на октябрь 2018 года был ускоритель вычислений Tesla T4 на микроархитектуре Turing, новшеством которого стала поддержка более широкого диапазона точности, что кратно увеличило производительность в вычислениях, не предъявляющих высоких требований к точности — например, при применении обученных моделей нейросетей. В результате Nvidia удалось достичь производительности в 8,1 терафлопса в вычислениях с одинарной точностью (FP32), 65 терафлопс в смешанных вычислениях с одинарной и половинной точностью (FP16/FP32), 130 триллионов операций в режиме INT8 и 260 триллионов в режиме INT4^[7]^[9].

По итогам 2018 года Tesla были самыми популярными ускорителями в области высокопроизводительных вычислений и использовались в 127 суперкомпьютерах, входящих в Top500 — рейтинг самых мощных устройств этого класса^[10]. Для сравнения, в рейтинге 2015 года присутствовало 66 устройств, использовавших ускорители Tesla, 26 устройств с Intel Xeon Phi на базе процессоров общего назначения и 3 суперкомпьютера с AMD FirePro^[11]. На ускорителях вычислений Tesla были основаны два самых мощных на 2018 год суперкомпьютера мира — Summit в Национальной лаборатории Окриджа и Sierra в Ливерморской национальной лаборатории Министерства энергетики США^[10]. Также вычисления на ускорителях Tesla были внедрены в суперкомпьютере Tsubame^[англ.] Токийского технологического института (29-е место на конец 2008 года)^[12]; суперкомпьютере Tiānhé-1A, спроектированном китайским Оборонным научно-техническим университетом НОАК (1-е место на октябрь 2010 года)^[13]; суперкомпьютере Titan, установленном в Национальной лаборатории Окриджа Министерства энергетики США (1-е место на ноябрь 2012 года); суперкомпьютере Cray CS-Storm (10-е место в 2014 году); суперкомпьютере Piz Daint, размещённом в Швейцарском национальном суперкомпьютерном центре (3-е место на ноябрь 2017 года)^[14]. Среди российских суперкомпьютеров, использующих вычисления на графических процессорах общего назначения на базе ускорителей Nvidia Tesla — «Ломоносов», установленный в Московском государственном университете, и «Лобачевский», расположенный в Нижегородском государственном университете^[15]^[16]. Также по ситуации на 2018 год Nvidia Tesla были в основе 22 из 25 наиболее энергоэффективных суперкомпьютеров рейтинга GREEN500^[10].

Спецификации и конфигурации

Модели Tesla 2007 года на базе GPU G80 (единственная группа карт без поддержки операций над 64-битными числами с плавающей точкой):

Tesla C870 — карта для рабочих станции (1 GPU)
Tesla D870 — приставной суперкомпьютер (2 GPU)
Tesla S870 — сервер (4 GPU)

Модели Tesla на базе GT200 (2008—2009 год):

Tesla C1060 — карта для рабочих станции (1 GPU)
Tesla S1070 — сервер (4 GPU)
Tesla S1075 — сервер (4 GPU)
Quadro Plex 2200 D2 (2 GPU)
Quadro Plex 2200 S4 (4 GPU)

Модели Tesla на базе GF100 и GF110 (2011 год):

Tesla C2050, M2050 — карта для рабочих станции (1 GPU)
Tesla C2070, C2075, M2070 — карта для рабочих станции (1 GPU)
Tesla M2090 — карта на основе GF110
Tesla S2050, S2070 — сервер (4 GPU)

На базе архитектуры Kepler предлагаются модели^[17] 2012—2014 годов:

Tesla K10 (2× GK104)
Tesla K20, K20x (1× GK110)
Tesla K40 (1× GK110B)
Tesla K80 (2× GK210)

В 2015 году были представлены модели на базе микроархитектуры Maxwell:

M4 (1× GM206)
M6 (1× GM204)
M10 (4× GM107)
M40 (1× GM200)
M60 (2× GM204)

Чипы Pascal служили основой для карт 2016—2017 годов^[18]:

P4 (1× GP104), PCIe
P6 (1× GP104), MXM
P40 (1× GP102), PCIe
P100 (1× GP100), NVLink
P100 (1× GP100, 16 или 12 ГБ ОЗУ), PCIe

В 2017 году появилась модель на базе Volta — Tesla V100, в виде PCIe и NVLink карт^[18].

В 2018 году представлена карта Tesla T4 на базе Turing^[18].

Описание	Модель	Количество GPU	Частота ядра, МГц	Шейдерные процессоры		Память					Теоретическая производительность, гигафлопс^[19]			Вычислительные способности^[20]	TDP, Вт	Примечания/формфактор
Описание	Модель	Количество GPU	Частота ядра, МГц	Количество	Частота, МГц	Пропускная способность, ГБ/с	Стандарт видеопамяти	Шина видеопамяти, бит	Объём видеопамяти, МБ	Частота (эффективная), МГц	Одинарная точность, всего (MUL+ADD+SF)	Одинарная точность, MAD (MUL+ADD)	Двойная точность, FMA	Вычислительные способности^[20]	TDP, Вт	Примечания/формфактор
Вычислительный модуль на основе GPU^[21]	C870	1	600	128	1350	76,8	GDDR3	384	1536	1600	518,4	345,6	0	1,0	170,9	АТХ видеокарта
Приставной суперкомпьютер^[21]	D870	2	600	2×128 (256)	1350	153,6	GDDR3	384	3072	1600	1036,8	691,2	0	1,0		Приставная система или в стойку
Вычислительный модуль на основе GPU^[21]	S870	4	600	4×128 (512)	1350	307,2	GDDR3	384	6144	1600	2073,6	1382,4	0	1,0		1U Rack
2-е поколение Tesla-процессоров^[22]	C1060	1	602	240	1300	102,4	GDDR3	512	4096	1600	933,12	622,08	77,76	1,3	187,8	ATX видеокарта IEEE 754-2008 FMA
2-е поколение Вычислительный модуль на основе GPU^[23]	S1070	4	602	4×240 (960)	1440	409,6	GDDR3	512	16384	1600	4147,2	2764,8	345,6	1,3		Одноюнитовая стойка IEEE 754—2008 FMA
3-е поколение Tesla-процессор^[24]	C2050	1	575	448	1150	144	GDDR5	384	3072^[25]	3000	1288	1030,4^[26]	515,2	2,0	238	Полноразмерная видеокарта IEEE 754—2008 FMA
3-е поколение Tesla-процессор^[24]	C2070	1	575	448	1150	144	GDDR5	384	6144^[25]	3000	1288	1030,4^[26]	515,2	2,0	247	Полноразмерная видеокарта IEEE 754—2008 FMA
M2050 Вычислительный модуль на основе GPU	M2050	1	575	448	1150	148,4	GDDR5	384	3072^[26]	3092	1288	1030,4^[26]	515,2	2,0	225	Вычислительный модуль IEEE 754—2008 FMA
M2070/M2070Q^[27] Вычислительный модуль на основе GPU	M2070/M2070Q	1	575	448	1150	150,336	GDDR5	384	6144^[26]	3132	1288	1030,4^[26]	515,2	2,0	225	Вычислительный модуль IEEE 754—2008 FMA
S2050 1U Вычислительная система на основе GPU	S2050	4	575	4×448 (1792)	1150	4×148,4 (593,6)	GDDR5	384	12288^[26]	3092	5152	4121,6^[26]	2060,8	2,0	900	1U Rack IEEE 754—2008 FMA

См. также

Примечания

↑ Nvidia has killed two of its iconic brands - here's why (англ.). Tech Radar. Future US, Inc. (15 октября 2020). Дата обращения: 19 апреля 2026.
↑ NVIDIA Tesla: GPU computing gets its own brand - Page 1 . Beyond3D (20 июня 2007). Дата обращения: 20 декабря 2018. Архивировано 30 ноября 2018 года.
↑ NVIDIA на пути к суперкомпьютерам. Анонс GPGPU Tesla C870, S870 и D870 . Ixbt.com (21 июня 2007). Дата обращения: 18 декабря 2018. Архивировано из оригинала 20 декабря 2018 года.
↑ Фото дня: графический акселератор NVIDIA Tesla на архитектуре Fermi . Ixbt.com (2 октября 2009). Дата обращения: 18 декабря 2018. Архивировано из оригинала 21 декабря 2018 года.
↑ Mark Walton. Nvidia unveils first Pascal graphics card, the monstrous Tesla P100 . Ars Technica (4 июня 2016). Дата обращения: 20 декабря 2018. Архивировано 29 апреля 2019 года.
↑ Rob Thubron. Nvidia unveils its first Volta GPU, the Tesla V100 . Techspot (11 мая 2017). Дата обращения: 20 декабря 2018. Архивировано 21 декабря 2018 года.
1 2 Greg Synek. Nvidia Tesla T4 GPU accelerates AI inferences without becoming power-hungry . Techspot (13 сентября 2018). Дата обращения: 20 декабря 2018. Архивировано 20 декабря 2018 года.
↑ Ryan Smith. NVIDIA’s Maximus Technology: Quadro + Tesla, Launching Today . AnandTech (14 ноября 2011). Дата обращения: 18 декабря 2018. Архивировано 17 декабря 2018 года.
↑ Константин Ходаковский. Что принесёт на рынок новая архитектура NVIDIA Turing? 3D News (14 августа 2018). Дата обращения: 18 декабря 2018. Архивировано 23 марта 2019 года.
1 2 3 Суперкомпьютеры, ускоренные графическими процессорами NVIDIA, поднимаются на новые высоты в рейтинге TOP500 . Инвест-форсайт (13 ноября 2018). Дата обращения: 18 декабря 2018. Архивировано 2 июня 2021 года.
↑ Антон Тестов. Более ста суперкомпьютеров из Top 500 используют ускорители вычислений . 3D News (19 ноября 2015). Дата обращения: 20 декабря 2018. Архивировано 20 декабря 2018 года.
↑ Ionut Arghire. First NVIDIA Tesla-Based Supercomputer in TOP500 . Softpedia News (18 ноября 2008). Дата обращения: 20 декабря 2018. Архивировано 20 декабря 2018 года.
↑ Prita Ganapati. China Beats U.S. for the World's Fastest Supercomputer Title . Wired (28 октября 2010). Дата обращения: 18 декабря 2018. Архивировано 21 августа 2020 года.
↑ Питер Сойер. Первая десятка самых быстрых суперкомпьютеров в мире . Computerworld (15 ноября 2017). Дата обращения: 20 декабря 2018. Архивировано 20 декабря 2018 года.
↑ NVIDIA ускоряет суперкомпьютер «Ломоносов» . Мир nVIDIA (16 июня 2011). Дата обращения: 18 декабря 2018. Архивировано 20 декабря 2018 года.
↑ Андрей Васильков. Новый рейтинг TOP500 суперкомпьютеров . Компьютерра (18 ноября 2014). Дата обращения: 18 декабря 2018. Архивировано 20 декабря 2018 года.
↑ Источник . Дата обращения: 14 ноября 2012. Архивировано 27 января 2013 года.
1 2 3 NVIDIA Product Overview and Technical Brief . Дата обращения: 2 апреля 2008. Архивировано 18 марта 2015 года.
↑ Nvidia Announces Tesla 20 Series . Дата обращения: 21 апреля 2010. Архивировано из оригинала 21 мая 2010 года.
↑ Какие оборудование и программное обеспечение требуются для PhysX? Дата обращения: 21 апреля 2010. Архивировано 30 марта 2010 года.
1 2 3 Нет официальных данных; предполагается, что основаны на GeForce 8800 GTX.
↑ Нет официальных данных; предполагается, что основаны на GeForce GTX 280.
↑ Difference between Tesla S1070 and S1075 . Дата обращения: 21 апреля 2010. Архивировано 26 февраля 2012 года.
1 2 Нет официальных данных; предполагается, что основаны на GeForce 400 Series.
1 2 С активированным ECC доступная для пользователя память составит 2,625 ГБ на GPU для C2050, S2050 и 5,25 ГБ на GPU для C2070.
1 2 3 4 5 6 7 8 GF100 выполняет новую соединённую инструкцию умножения-сложения FMA(D) (Fused Multiply-Add) для обоих 32-битных чисел одинарной точности с плавающей запятой и 64-битных чисел двойной точности с плавающей запятой (GT200 поддерживает инструкцию FMA только для чисел двойной точности). Разница между инструкциями FMA(D) и MAD (Multiply-Add) при выполнении операции вида A×B+C заключается в том, что FMA(D) не округляет результат произведения перед суммированием, что даёт более точный результат.
↑ NVidia Tesla M2050 & M2070/M2070Q Specs Online . Дата обращения: 31 октября 2010. Архивировано 17 августа 2020 года.

Ссылки

[1] Nvidia has killed two of its iconic brands - here's why (англ.). Tech Radar. Future US, Inc. (15 октября 2020). Дата обращения: 19 апреля 2026.

[2] NVIDIA Tesla: GPU computing gets its own brand - Page 1 . Beyond3D (20 июня 2007). Дата обращения: 20 декабря 2018. Архивировано 30 ноября 2018 года.

[3] NVIDIA на пути к суперкомпьютерам. Анонс GPGPU Tesla C870, S870 и D870 . Ixbt.com (21 июня 2007). Дата обращения: 18 декабря 2018. Архивировано из оригинала 20 декабря 2018 года.

[4] Фото дня: графический акселератор NVIDIA Tesla на архитектуре Fermi . Ixbt.com (2 октября 2009). Дата обращения: 18 декабря 2018. Архивировано из оригинала 21 декабря 2018 года.

[5] Mark Walton. Nvidia unveils first Pascal graphics card, the monstrous Tesla P100 . Ars Technica (4 июня 2016). Дата обращения: 20 декабря 2018. Архивировано 29 апреля 2019 года.

[6] Rob Thubron. Nvidia unveils its first Volta GPU, the Tesla V100 . Techspot (11 мая 2017). Дата обращения: 20 декабря 2018. Архивировано 21 декабря 2018 года.

[techspot-turing-7] 1 2 Greg Synek. Nvidia Tesla T4 GPU accelerates AI inferences without becoming power-hungry . Techspot (13 сентября 2018). Дата обращения: 20 декабря 2018. Архивировано 20 декабря 2018 года.

[8] Ryan Smith. NVIDIA’s Maximus Technology: Quadro + Tesla, Launching Today . AnandTech (14 ноября 2011). Дата обращения: 18 декабря 2018. Архивировано 17 декабря 2018 года.

[9] Константин Ходаковский. Что принесёт на рынок новая архитектура NVIDIA Turing? 3D News (14 августа 2018). Дата обращения: 18 декабря 2018. Архивировано 23 марта 2019 года.

[supercomputer.if-10] 1 2 3 Суперкомпьютеры, ускоренные графическими процессорами NVIDIA, поднимаются на новые высоты в рейтинге TOP500 . Инвест-форсайт (13 ноября 2018). Дата обращения: 18 декабря 2018. Архивировано 2 июня 2021 года.

[11] Антон Тестов. Более ста суперкомпьютеров из Top 500 используют ускорители вычислений . 3D News (19 ноября 2015). Дата обращения: 20 декабря 2018. Архивировано 20 декабря 2018 года.

[12] Ionut Arghire. First NVIDIA Tesla-Based Supercomputer in TOP500 . Softpedia News (18 ноября 2008). Дата обращения: 20 декабря 2018. Архивировано 20 декабря 2018 года.

[13] Prita Ganapati. China Beats U.S. for the World's Fastest Supercomputer Title . Wired (28 октября 2010). Дата обращения: 18 декабря 2018. Архивировано 21 августа 2020 года.

[14] Питер Сойер. Первая десятка самых быстрых суперкомпьютеров в мире . Computerworld (15 ноября 2017). Дата обращения: 20 декабря 2018. Архивировано 20 декабря 2018 года.

[15] NVIDIA ускоряет суперкомпьютер «Ломоносов» . Мир nVIDIA (16 июня 2011). Дата обращения: 18 декабря 2018. Архивировано 20 декабря 2018 года.

[16] Андрей Васильков. Новый рейтинг TOP500 суперкомпьютеров . Компьютерра (18 ноября 2014). Дата обращения: 18 декабря 2018. Архивировано 20 декабря 2018 года.

[17] Источник . Дата обращения: 14 ноября 2012. Архивировано 27 января 2013 года.

[автоссылка1-18] 1 2 3 NVIDIA Product Overview and Technical Brief . Дата обращения: 2 апреля 2008. Архивировано 18 марта 2015 года.

[19] Nvidia Announces Tesla 20 Series . Дата обращения: 21 апреля 2010. Архивировано из оригинала 21 мая 2010 года.

[20] Какие оборудование и программное обеспечение требуются для PhysX? Дата обращения: 21 апреля 2010. Архивировано 30 марта 2010 года.

[gtx-21] 1 2 3 Нет официальных данных; предполагается, что основаны на GeForce 8800 GTX.

[22] Нет официальных данных; предполагается, что основаны на GeForce GTX 280.

[23] Difference between Tesla S1070 and S1075 . Дата обращения: 21 апреля 2010. Архивировано 26 февраля 2012 года.

[four-24] 1 2 Нет официальных данных; предполагается, что основаны на GeForce 400 Series.

[ReferenceA-25] 1 2 С активированным ECC доступная для пользователя память составит 2,625 ГБ на GPU для C2050, S2050 и 5,25 ГБ на GPU для C2070.

[fmad-26] 1 2 3 4 5 6 7 8 GF100 выполняет новую соединённую инструкцию умножения-сложения FMA(D) (Fused Multiply-Add) для обоих 32-битных чисел одинарной точности с плавающей запятой и 64-битных чисел двойной точности с плавающей запятой (GT200 поддерживает инструкцию FMA только для чисел двойной точности). Разница между инструкциями FMA(D) и MAD (Multiply-Add) при выполнении операции вида A×B+C заключается в том, что FMA(D) не округляет результат произведения перед суммированием, что даёт более точный результат.

[27] NVidia Tesla M2050 & M2070/M2070Q Specs Online . Дата обращения: 31 октября 2010. Архивировано 17 августа 2020 года.

[1]