Äú¿ÉÒÔ¾èÖú£¬Ö§³ÖÎÒÃǵĹ«ÒæÊÂÒµ¡£

1Ôª 10Ôª 50Ôª





ÈÏÖ¤Â룺  ÑéÖ¤Âë,¿´²»Çå³þ?Çëµã»÷Ë¢ÐÂÑéÖ¤Âë ±ØÌî



  ÇóÖª ÎÄÕ ÎÄ¿â Lib ÊÓÆµ iPerson ¿Î³Ì ÈÏÖ¤ ×Éѯ ¹¤¾ß ½²×ù Model Center   Code  
»áÔ±   
   
 
     
   
 ¶©ÔÄ
  ¾èÖú
Ñ¡ÔñGPU·þÎñÆ÷µÄÎå´ó»ù±¾Ô­Ôò
 
×÷Õߣºzhangbijun1230
  3030  次浏览      28
 2020-2-12 
 
±à¼­ÍƼö:
±¾ÎĽéÉܲ»Í¬ÀàÐÍAI·þÎñÆ÷Ö®±È½Ï·ÖÎö£¬Ñ¡ÔñGPU·þÎñÆ÷µÄ»ù±¾Ô­Ôò£¬AI³¬¼¶¼ÆËã»úDGXϵͳÏê½â£¬NGCÔÆÆ½Ì¨Ê¹Ó÷½·¨ºÍ¼ÛÖµµÈÏ£Íû¶ÔÄúÓÐËù°ïÖú
±¾ÎÄÀ´×ÔÓÚcsdnÓÉ»ðÁú¹ûÈí¼þDelores±à¼­ÍƼö¡£

Ñ¡ÔñGPU·þÎñÆ÷µÄÎå´ó»ù±¾Ô­Ôò

´ÓÐÔÄÜ¡¢¿É±à³ÌÐÔ¡¢Áé»îÐԵȷ½Ãæ¶ÔCPU¡¢GPU¡¢FPGA¡¢ASICµÈ²»Í¬ÀàÐ͵ķþÎñÆ÷½øÐÐÁËϵͳµÄ±È½Ï·ÖÎö£¬²¢¸ø³öÁËÎåÌõÑ¡ÔñGPU·þÎñÆ÷µÄ»ù±¾Ô­Ôò£º

1.¿¼ÂÇÒµÎñÓ¦ÓÃÏÈÑ¡ÔñGPUÐͺÅ

2.¿¼ÂÇ·þÎñÆ÷µÄʹÓó¡¾°¼°ÊýÁ¿£¨±ßÔµ/ÖÐÐÄ£©

3.¿¼Âǿͻ§×ÔÉíµÄÄ¿±êʹÓÃÈËȺ¼°ITÔËάÄÜÁ¦

4.¿¼ÂÇ·þÎñÆ÷ÅäÌ×Èí¼þµÄ¼ÛÖµÒÔ¼°·þÎñµÄ¼ÛÖµ

5.¿¼ÂÇÕûÌåGPU¼¯ÈºÏµÍ³µÄ³ÉÊì¶È¼°¹¤³ÌЧÂÊ

NVIDIA ¸ß¼¶ÏµÍ³¼Ü¹¹Ê¦Ò׳ÉÔò´Ó¼ÆËãÐÔÄÜ¡¢»¥Áª»¥Í¨¡¢¿ÉÀ©Õ¹ÐÔ¡¢ÊÊÓó¡¾°µÈ·½ÃæÏµÍ³½²½âÁËDGX-1¡¢DGX-2¡¢DGX StationÒÔ¼°ÈçºÎÀûÓÃVNIDIA NGC¸ßЧµÄʹÓÃDGXϵͳ¡£

²»Í¬ÀàÐÍAI·þÎñÆ÷Ö®±È½Ï·ÖÎö

Ê×ÏÈ¿´Ï²»Í¬ÀàÐÍAI·þÎñÆ÷µÄ±È½Ï£¬Í¨¹ýÉÏÃæÕâÕŶþάͼÖÐÎÒÃÇ¿ÉÒÔ¶Ô²»Í¬¼Ü¹¹µÄ·þÎñÆ÷½øÐмòµ¥µÄ±È½Ï¡£´Ó×óÉÏ·½µ½ÓÒϽÇÒÀ´ÎÊÇCPU¡¢GPU¡¢FPGA¡¢TPU¡¢ASIC£¬´ÓºáÖáÀ´¿´£¬Ô½ÍùÓÒÐÔÄÜ£¨Performance£©Ô½ºÃ¡£×ÝÖáProgrammability/FlexibilityÊÇÖ¸·þÎñÆ÷µÄ¿É±à³ÌÐÔºÍÁé»îÐÔ£¬ ASICµÄÐÔÄÜ×îºÃ£¬ÒòΪËüÊǽ«Ëã·¨¹Ì»¯ÔÚоƬÉÏ£¬Ëã·¨ÊDZȽϹ̶¨µÄ£¬ËùÒÔËüµÄÐÔÄÜ×îºÃµÄ£¬µ«ÊÇËüµÄ±à³ÌÐÔºÍÁé»îÐÔ¾ÍÏà¶Ô±È½ÏÈõ¡£¶øCPUµÄÁé»îÐԺͱà³ÌÐÔ×îºÃ£¬µ«ÐÔÄÜ×îÈõ¡£×ܵÄÀ´Ëµ£¬GPUµÄÁé»îÐÔ±ÈCPUÈõ£¬µ«ËüµÄÐÔÄܸüºÃ¡£ÍùÏÂÒÀ´ÎÊÇFPGA¡¢TPUÒÔ¼°ASIC¡£ÔÚʵ¼ÊÑ¡ÔñʱÐèÒª¿¼Âǵ½¹¦ºÄ¡¢³É±¾¡¢ÐÔÄÜ¡¢ÊµÊ±ÐԵȸ÷·½ÃæÒòËØ£¬ÓÈÆäÊÇһЩ¾ßÓÐרÓÃÄ¿µÄµÄ´¦ÀíÆ÷£¬Èç¹ûËã·¨ÒѾ­¹Ì»¯²¢ÇҺܼòµ¥£¬¿ÉÒÔ¿¼ÂÇASIC£¬ÒòΪASICÐÔÄܺÃÇÒ¹¦ºÄµÍ¡£Èç¹ûÊÇÔÚѵÁ·»òÕßͨÓÃÇé¿öÏ£¬GPUÔòÊǸüºÃµÄÑ¡Ôñ¡£

Ñ¡ÔñGPU·þÎñÆ÷µÄ»ù±¾Ô­Ôò

ÔÚ½éÉÜÑ¡ÔñGPU·þÎñÆ÷µÄ»ù±¾Ô­Ôò֮ǰ£¬ÏÈÀ´¸ú´ó¼Ò½éÉÜϳ£¼ûµÄGPUºÍGPU·þÎñÆ÷¡£

³£¼ûµÄGPU£¬°´×ÜÏß½Ó¿ÚÀàÐÍ£¬¿ÉÒÔ·ÖΪNV-Link½Ó¿Ú¡¢´«Í³×ÜÏß½Ó¿ÚÒÔ¼°´«Í³PCI-e×ÜÏßÈýÖÖ¡£

NV-Link½Ó¿ÚÀàÐ͵ÄGPUµäÐÍ´ú±íÊÇNVIDIA V100£¬²ÉÓà SXM2½Ó¿Ú¡£ÔÚDGX-2ÉÏÓÐSXM3µÄ½Ó¿Ú¡£NV-Link×ÜÏß±ê×¼µÄGPU·þÎñÆ÷¿ÉÒÔ·ÖΪÁ½À࣬һÀàÊÇNVIDIA¹«Ë¾Éè¼ÆµÄDGX³¬¼¶¼ÆËã»ú£¬ÁíÒ»ÀàÊǺÏ×÷»ï°éÉè¼ÆµÄNV-Link½Ó¿ÚµÄ·þÎñÆ÷¡£DGX³¬¼¶¼ÆËã»ú²»½ö½öÌṩӲ¼þ£¬»¹ÓÐÏà¹ØµÄÈí¼þºÍ·þÎñ¡£

´«Í³×ÜÏß½Ó¿ÚµÄGPU£¬Ä¿Ç°Ö÷Á÷µÄÓÐÕ⼸¿î²úÆ·£¬±ÈÈç PCI-e½Ó¿ÚµÄV100¡¢ P40£¨P¿ªÍ·Ö¸µÄÊÇÉÏÒ»´úPASCAL¼Ü¹¹£©ºÍP4£¬ÒÔ¼°×îеÄͼÁé¼Ü¹¹T4µÈ¡£ÆäÖбȽϱ¡ºÍÖ»Õ¼Ò»¸ö²ÛλµÄP4ºÍT4£¬Í¨³£ÓÃÓÚInference£¬Ä¿Ç°Ò²ÒѾ­ÓгÉÊìµÄÄ£ÐͽøÐÐÍÆÀíºÍʶ±ð¡£

´«Í³PCI-e×ÜÏßµÄGPU·þÎñÆ÷Ò²·ÖΪÁ½À࣬һÀàÊÇOEM·þÎñÆ÷£¬±ÈÈçÊï¹â¡¢À˳±¡¢»ªÎªµÈÆäËû¹ú¼ÊÆ·ÅÆ£»ÁíÒ»ÀàÊÇ·ÇOEMµÄ·þÎñÆ÷£¬Ò²°üÀ¨ºÜ¶àÖÖÀࡣѡÔñ·þÎñÆ÷ʱ³ýÁË·ÖÀ࣬»¹Òª¿¼ÂÇÐÔÄÜÖ¸±ê£¬±ÈÈ羫¶È¡¢ÏÔ´æÀàÐÍ¡¢ÏÔ´æÈÝÁ¿ÒÔ¼°¹¦ºÄµÈ£¬Í¬Ê±Ò²»áÓÐһЩ·þÎñÆ÷ÊÇÐèҪˮÀä¡¢½µÔë»òÕß¶Ôζȡ¢Òƶ¯ÐԵȵȷ½ÃæÓÐÌØÊâµÄÒªÇ󣬾ÍÐèÒªÌØÊâµÄ·þÎñÆ÷¡£

Ñ¡ÔñGPU·þÎñÆ÷ʱÊ×ÏÈÒª¿¼ÂÇÒµÎñÐèÇóÀ´Ñ¡ÔñÊʺϵÄGPUÐͺš£ÔÚHPC¸ßÐÔÄܼÆËãÖл¹ÐèÒª¸ù¾Ý¾«¶ÈÀ´Ñ¡Ôñ£¬±ÈÈçÓеĸßÐÔÄܼÆËãÐèҪ˫¾«¶È£¬ÕâʱÈç¹ûʹÓÃP40»òÕßP4¾Í²»ºÏÊÊ£¬Ö»ÄÜʹÓÃV100»òÕßP100£»Í¬Ê±Ò²»á¶ÔÏÔ´æÈÝÁ¿ÓÐÒªÇ󣬱ÈÈçʯÓÍ»òʯ»¯¿±Ì½ÀàµÄ¼ÆËãÓ¦ÓöÔÏÔ´æÒªÇó±È½Ï¸ß£»»¹ÓÐЩ¶Ô×ÜÏß±ê×¼ÓÐÒªÇó£¬Òò´ËÑ¡ÔñGPUÐͺÅÒªÏÈ¿´ÒµÎñÐèÇó¡£

GPU·þÎñÆ÷È˹¤ÖÇÄÜÁìÓòµÄÓ¦ÓÃÒ²±È½Ï¶à¡£ÔÚ½Ìѧ³¡¾°ÖУ¬¶ÔGPUÐéÄ⻯µÄÒªÇó±È½Ï¸ß¡£¸ù¾Ý¿ÎÌÃÈËÊý£¬Ò»¸öÀÏʦ¿ÉÄÜÐèÒª½«GPU·þÎñÆ÷ÐéÄâ³ö30ÉõÖÁ60¸öÐéÄâGPU£¬Òò´ËÅúÁ¿Training¶ÔGPUÒªÇó±È½Ï¸ß£¬Í¨³£ÓÃV100×öGPUµÄѵÁ·¡£Ä£ÐÍѵÁ·ÍêÖ®ºóÐèÒª½øÐÐÍÆÀí£¬Òò´ËÍÆÀíÒ»°ã»áʹÓÃP4»òÕßT4£¬ÉÙ²¿·ÖÇé¿öÒ²»áÓÃV100¡£

µ±GPUÐͺÅÑ¡¶¨ºó£¬ÔÙ¿¼ÂÇÓÃʲôÑùGPUµÄ·þÎñÆ÷¡£ÕâʱÎÒÃÇÐèÒª¿¼ÂÇÒÔϼ¸ÖÖÇé¿ö£º

µÚÒ»¡¢ ÔÚ±ßÔµ·þÎñÆ÷ÉÏÐèÒª¸ù¾ÝÁ¿À´Ñ¡ÔñT4»òÕßP4µÈÏàÓ¦µÄ·þÎñÆ÷£¬Í¬Ê±Ò²Òª¿¼ÂÇ·þÎñÆ÷µÄʹÓó¡¾°£¬±ÈÈç»ð³µÕ¾¿¨¿Ú¡¢»ú³¡¿¨¿Ú»òÕß¹«°²¿¨¿ÚµÈ£»ÔÚÖÐÐĶË×öInferenceʱ¿ÉÄÜÐèÒªV100µÄ·þÎñÆ÷£¬ÐèÒª¿¼ÂÇÍÌÍÂÁ¿ÒÔ¼°Ê¹Óó¡¾°¡¢ÊýÁ¿µÈ¡£

µÚ¶þ¡¢ ÐèÒª¿¼Âǿͻ§±¾ÉíʹÓÃÈËȺºÍITÔËάÄÜÁ¦£¬¶ÔÓÚBATÕâÀà´ó¹«Ë¾À´Ëµ£¬ËûÃÇ×Ô¼ºµÄÔËÓªÄÜÁ¦±È½ÏÇ¿£¬Õâʱ»áÑ¡ÔñͨÓõÄPCI-e·þÎñÆ÷£»¶ø¶ÔÓÚһЩITÔËάÄÜÁ¦²»ÄÇôǿµÄ¿Í»§£¬ËûÃǸü¹Ø×¢Êý×ÖÒÔ¼°Êý¾Ý±ê×¢µÈ£¬ÎÒÃdzÆÕâÀàÈËΪÊý¾Ý¿ÆÑ§¼Ò£¬Ñ¡ÔñGPU·þÎñÆ÷µÄ±ê×¼Ò²»áÓÐËù²»Í¬¡£

µÚÈý¡¢ ÐèÒª¿¼ÂÇÅäÌ×Èí¼þºÍ·þÎñµÄ¼ÛÖµ¡£

µÚËÄ¡¢ Òª¿¼ÂÇÕûÌåGPU¼¯ÈºÏµÍ³µÄ³ÉÊì³Ì¶ÈÒÔ¼°¹¤³ÌЧÂÊ£¬±ÈÈçÏñDGXÕâÖÖGPUÒ»Ì廯µÄ³¬¼¶¼ÆËã»ú£¬ËüÓзdz£³ÉÊìµÄ´Óµ×¶ËµÄ²Ù×÷ϵͳÇý¶¯Dockerµ½ÆäËû²¿·Ö¶¼Êǹ̶¨ÇÒÓÅ»¯¹ýµÄ£¬ÕâʱЧÂʾͱȽϸߡ£

AI³¬¼¶¼ÆËã»úDGXϵͳÏê½â

ĿǰDGX²úÆ·Ö÷Òª°üº¬DGX¹¤×÷Õ¾£¨DGX Station£©¡¢DGX-1·þÎñÆ÷ÒÔ¼°½ñÄê¸Õ·¢²¼µÄDGX-2·þÎñÆ÷Èý¿î²úÆ·¡£ËüÃǶ¼ÊÇNVIDIAÍÆ³öµÄÈíÓ²Ò»Ìå»ú²úÆ·£¬Ö÷Òª°üÀ¨²Ù×÷ϵͳ¡¢Ïà¹ØÈí¼þÒÔ¼°ÅäÌ×µÄÓ²¼þ¡£ÒÔÍùÎÒÃÇÂò·þÎñÆ÷»ò¹¤×÷վʱ£¬Í¨³£ÐèÒª×Ô¼ºÔÚ·þÎñÆ÷Öа²×°²Ù×÷ϵͳ²¢²¿ÊðÓ¦ÓÃÈí¼þ£¬¶øÔÚDGXÒ»Ìå»úÉϾͲ»ÐèÒªÕâ¸ö¹ý³ÌÁË£¬ËùÓеÄÈí¼þ³ö³§Ê±¾ÍÒѾ­Íê³ÉÁ˰²×°ÅäÖ㬿ª»ú¾Í¿ÉÒÔʹÓ㬷dz£ÊʺϿª·¢ÈËÔ±×öÉî¶Èѧϰ»ò¸ßÐÔÄܼÆËãµÄÓ¦Óá£

ÔÚ½éÉÜDGX³¬¼¶¼ÆËã»ú֮ǰ£¬ÏÈÁ˽âһϳ¬¼¶¼ÆËã»úµÄ¼ÆËãºËÐÄV100 GPU¡£ÔÚDGXÖÐʹÓõÄÊÇNVLink GPU£¬°üº¬5120¸öCUDAºËÐÄ£¬640¸öTensorCore£¬Ë«¾«¶ÈµÄ¼ÆËãÄÜÁ¦žX?? ´ïµ½7.8ÍòÒڴΣ¬Éî¶ÈѧϰµÄ¼ÆËãÄÜÁ¦´ïµ½125ÍòÒڴΡ£GPUÖ®¼ä¿ÉÒÔͨ¹ýNVLink½øÐл¥Ïà·ÃÎÊ£¬´ø¿í¿ÉÒÔ´ïµ½300GB/s¡£¶øPCI-eµÄGPUÖ»ÄÜͨ¹ýPCI-e×ÜÏß½øÐÐGPUÖ®¼äµÄ»¥Ïà·ÃÎÊ£¬´ø¿íΪ32GB¡£Òò´ËÏà±È½Ï¶øÑÔ£¬NVLink°æV100ÊÇĿǰÐÔÄÜ×îÇ¿µÄGPU¡£

ÓëÉÏÒ»´úGPUÏà±È£¬V100 GPU²ÉÓÃ×îеÄVolta¼Ü¹¹£¬²ÉÓÃSMÁ÷¶à´¦ÀíÆ÷¼Ü¹¹£¬Ê×´ÎÒý½øÁËTensor Core¼ÆËãºËÐÄ£¬ÕâÒ²ÊÇÒÔǰPascal¼Ü¹¹ËùûÓе쬴ó´óÔöÇ¿ÁËGPUµÄÉî¶Èѧϰ¼ÆËãÐÔÄÜ¡£V100²ÉÓÃÁËÐÂÒ»´úµÄNVLink 2.0¼¼Êõ£¬Ë«Ïò×Ü´ø¿í¿ÉÒÔ´ïµ½300GB/s£¬²¢ÇÒ²ÉÓÃÁËеÄHBM2ÏԴ棬¿ÉÒÔ´ïµ½900GB/sµÄIO´ø¿í¡£V100ÒýÈëÁËеÄMPS¶à½ø³Ì·þÎñ¼¼Êõ£¬ÒÔÌá¸ßGPUµÄÀûÓÃÂÊ£¬»¹¸Ä½øÁËSMITµÄ¼ÆËãÄ£ÐÍ¡£

Tensor CoreÊÇV100·Ç³£ÖØÒªµÄÌØÐÔ£¬Ö§³Ö»ìºÏ¾«¶È¼ÆË㣬ÈçÉÏͼËùʾµÄD=A*B+ CµÄ»ìºÏ¾ØÕó³Ë¼Ó¼ÆËã¡£ÔÚ¾ØÕóÖУ¬¾ØÕóAºÍ¾ØÕóBÒªÇóÊǰ뾫¶ÈµÄFP16ÀàÐÍ£¬¶ø¼Ó·¨¾ØÕóC¿ÉÒÔÊǰ뾫¶ÈFP16»òÕßÊǵ¥¾«¶ÈFP32ÀàÐÍ£¬×ó±ßµÄ¼ÆËã½á¹ûÒ²¿ÉÒÔÊÇFP16»òFP32ÀàÐÍ¡£

DGX-1·þÎñÆ÷Ö÷ÒªÓÃÓÚÊý¾ÝÖÐÐĵÄÉî¶Èѧϰ»òÕ߸ßÐÔÄܼÆËãÓ¦Óã¬Õû»úµÄ¼ÆËã·åÖµ¿ÉÒÔ´ïµ½1000ÍòÒڴΡ£ÎÒÃǶ¼ÖªµÀ£¬ÉîÛÚ³¬ËãÖÐÐĵļÆËãÄÜÁ¦´óÔ¼ÊÇ1200ÍòÒڴΣ¬Ò²¾ÍÊÇһ̨DGX-1µÄ¼ÆËãÄÜÁ¦ºÍÒ»¸ö³¬ËãÖÐÐĵļÆËãÄÜÁ¦Ï൱£¬Ö®ËùÒÔ˵ÊʺÏÓÚÊý¾ÝÖÐÐÄ£¬ÊÇÒòΪDGX-1·þÎñÆ÷ÐèÒª°²×°ÔÚ»ú¹ñÖУ¬¹¦ºÄ´ïµ½3200Íߣ¬ÔëÒôÒ²±È½Ï´ó£¬Òò´ËÖ»ÄÜ·ÅÔÚÊý¾ÝÖÐÐĵĻú·¿¡£

DGX-1ÅäÖÃÁË8¿é×îеÄNVLink V100 GPU£¬Ã¿¿éGPUÊÇ32GBÏԴ棬ÅäÖÃÁË´óÈÝÁ¿µÄÄڴ棬һ¹²ÊÇ512GB£¬¿ÉÒÔ½«´óÁ¿µÄÊý¾Ý¶ÁÈëÄÚ´æ¡£ÅäÖÃÁË7TBµÄSSD×÷Ϊ±¾µØ»º´æ£¬SSDÅäÖõÄÊÇRAID 0ģʽ£¬½ö½ö×÷Ϊ±¾µØµÄ»º´æ£¬¿ÉÒÔʵÏÖ¸ßËÙ´æ´¢µÄIOÐÔÄÜ¡£ÁíÍ⣬DGX-1ÅäÖÃÁË4¸ö100GbµÄÍø¿¨£¬²¢ÇÒ¿ÉÒÔÑ¡ÔñInfiniBand»òÒÔÌ«ÍøÄ£Ê½£¬ÊÇΪÁËÅäÖÃGPU¼¯ÈºÔ¤ÁôµÄÍøÂç½Ó¿Ú£¬¿ÉÒÔ×÷Ϊ½Úµã¼äͨѶµÄ¼ÆËãÍøÂç»ò´æ´¢ÍøÂç¡£

DGX-1·þÎñÆ÷µÄÄÚ²¿ÍøÂçÍØÆÓ¼Ü¹¹ÖÐÓÐ8¸öGPU·þÎñÆ÷£¬Õâ8¸öGPU»¥Áª³ÉÒ»¸öÁ¢·½ÌåµÄÍØÆÓ¼Ü¹¹£¬Ã¿Ò»¸ö¶¥µãÊÇÒ»¿éGPU¡£ÁíÍ⣬´ÓͼÖпÉÒÔ¿´µ½»¹ÓÐNVLink¡¢PCI-E¡¢QPI ÈýÖÖ»¥ÁªÍ¨µÀ£¬ÂÌÉ«µÄ´ÖÏßÌõ´ú±íNVLink£¬×ÏÉ«µÄϸÏßÌõ´ú±íPCI-E×ÜÏߣ¬ºÚÉ«µÄÏßÌõ´ú±íQPIÏß¡£ÔÚ×öGPU²¢ÐмÆËãʱ£¬GPUÖ®¼äµÄͨÐÅ¿ÉÒÔÑ¡ÔñÁ½ÖÖ·½°¸£º

µÚÒ»¡¢ GPUͨ¹ýPCI-E×ÜÏß½øÐÐͨÐÅ£¬ÕâÖÖͨѶµÄ·½Ð§ÂʱȽϵ͵ġ£

µÚ¶þ¡¢ ͨ¹ýNVLinkʵÏÖGPUÖ®¼äÖ±½ÓͨÐÅ£¬ºÜÏÔÈ»ÕâÖÖ·½Ê½µÄͨѶЧÂÊ»áºÜ¸ß¡£

½ÓÏÂÀ´Îª´ó¼Ò½éÉÜÏÂDGX-1·þÎñÆ÷ÖÐGPUµÄ¼ÆËãËٶȺÍÀ©Õ¹ÐÔ¡£Í¼ÖÐÖù״ͼ±íʾ¼ÆËãËÙ¶È£¬ÇúÏß´ú±íÀ©Õ¹ÐÔ£¬»ÒÉ«µÄÖù״ͼ±íʾPCIeµÄGPU¼ÆËãÐÔÄÜ£¬ÂÌÉ«µÄÖù״ͼ±íʾNVLink GPUµÄÐÔÄÜ¡£ÉÏͼչʾµÄÊý¾ÝÊÇÒÔÉñ¾­ÍøÂç·­ÒëѵÁ·ÎªÀý£¬´Ó¼ÆËãËٶȵĽǶȿ´£¬ÓëPCIeµÄGPU¿¨Ïà±È£¬GPUÔ½¶à£¬NVLink GPUËٶȵÄÓÅÊÆÔ½Ã÷ÏÔ£¬8¿éNVLink GPUÓÐ20%µÄÐÔÄÜÌáÉý¡£´ÓÀ©Õ¹ÐԵĽǶȿ´£¬8¿éNVLink GPUµÄ¼ÓËÙ±ÈPCIe GPU¸ß20%×óÓÒ¡£´ÓͼÖпÉÒÔ¿´³ö£¬8¿éDGX-1µÄ·þÎñÆ÷ºÍÆÕͨµÄPCIe GPU·þÎñÆ÷Ïà±È»¹ÊÇÓбȽϴóµÄÐÔÄÜÓÅÊÆ£¬ÓÈÆäÊÇÔÚÉî¶Èѧϰ¿ò¼Ü»òÄ£ÐÍËã·¨²»Ö§³Ö¼¯Èº¼ÆËãµÄʱºò£¬Ê¹ÓÃDGX-1·þÎñÆ÷»áÓбȽϴóµÄÓÅÊÆ¡£

NVIDIA DGX STATIONÊÇÒ»¸ö·Ç³£Ç¿´óµÄ¹¤×÷Õ¾£¬¿ÉÒÔ´ïµ½480ÍòÒڴεļÆËãÄÜÁ¦£¬²ÉÓÃÁË×îеÄ32GB V100 GPU¡£ÁíÒ»¸öÌØµãÊdz¬¾²ÒôÉè¼Æ£¬ÒòΪ²ÉÓõÄÊÇË®Àäģʽ¶ø²»ÊÇͨ³£²ÉÓõķçÉÈÀäÈ´·½Ê½£¬Òò´Ë²»ÐèÒª»ú·¿£¬Ôڰ칫ÊÒ»·¾³Ò²¿ÉÒÔʹÓã¬ÊÇÌØ±ðΪÑз¢ÈËÔ±Éè¼ÆµÄ¸öÈ˳¬¼¶¼ÆËã»ú¡£

ÉÏͼչʾÁËDGX¹¤×÷Õ¾µÄÏêϸÅäÖ㬰üÀ¨GPUÄÚ´æ¡¢SSDÏêϸµÄÅäÖÃÇé¿öµÈ¡£¿ÉÒÔ¿´µ½£¬ËüµÄÅäÖû¹ÊǷdz£¸ßµÄ£¬ÍêÈ«Âú×㿪·¢Ñо¿ÈËÔ±×öÉî¶ÈѧϰºÍ¸ßÐÔÄܼÆËãµÄÐèÇó¡£

×îз¢²¼µÄDGX-2·þÎñÆ÷µÄ¼ÆËãÄÜÁ¦ÊÇ2000ÍòÒڴΣ¬ÊÇĿǰÊÀ½çÉÏÐÔÄÜ×îÇ¿µÄÉî¶Èѧϰµ¥»úϵͳ¡£

DGX-2µÄÄÚ²¿¼Ü¹¹ÓëDGX-1Ïà±È£¬ÔÚÅäÖÃÓбȽϴóµÄÌáÉý£¬ÆäÖаüÀ¨2¸öGPUÖ÷°å£¬Ã¿¸öÖ÷°å°üÀ¨8¿é32GB V100 GPUºÍ6¸öNVSwitch£¬²ÉÓÃÈ«ÏßËÙ»¥ÁªµÄ·½Ê½£¬ÈÎÒâÁ½¿éGPUÖ®¼äͨÐÅ×Ü´ø¿í¿ÉÒÔ´ïµ½300GBÿÃ룬ϵͳÅäÖÃ×îеÄIntel Xeon CPU£¬ÅäÖÃ1.5TBµÄÖ÷»úÄڴ棬8¸ö100GbµÄÍø¿¨£¬¿ÉÒÔÖ§³ÖInfiniBandºÍÒÔÌ«ÍøÄ£Ê½»¥ÏàÇл»¡£Õâ8¸öÍø¿¨Ö÷ÒªÓÃÓÚ×ö¼ÆËãÍøÂ磬ÁíÍ⻹ÅäÖÃÁ½¸ö100GbµÄÍøÂç½Ó¿Ú×÷Ϊ´æ´¢ÍøÂ磬Ҳ¿ÉÒÔÖ§³ÖInfiniBandºÍÒÔÌ«ÍøµÄÇл»Ä£Ê½¡£DGX-2ÅäÖÃ30TB NVME SSDs£¬ºÍDGX-1Ò»Ñù£¬Ò²ÊÇ×÷Ϊ±¾µØ»º´æÊ¹Óá£

´ÓÕâÕÅͼÎÒÃÇ¿ÉÒÔ¿´µ½DGX-2µÄÄÚ²¿½á¹¹£¬°üÀ¨GPUÖ÷°åÒÔ¼°ÆäËûÅäÖá£ÏÈÀ´¿´ÏÂDGX-2ÖÐGPU»¥ÁªµÄÍøÂçÍØÆÓ½á¹¹£¬DGX-2ÓÐÁ½¸öGPUÖ÷°å£¬Ã¿¸öÖ÷°å°üº¬8¿éGPU£¬6¸öNVSwitch£¬ÕâÊÇÒòΪÿ¸öGPUÓÐÁù¸öNVLinkͨµÀ£¬Ã¿¸öͨµÀÁ¬½ÓÒ»¸öNVSwitch¡£¶ÔÓÚNVSwitch£¬ÎÒÃÇ¿ÉÒÔ°ÑËüÀí½â³É18¶Ë¿ÚµÄNVLink½»»»»ú£¬ÒòΪÿ¸öNVSwitchºÍ°Ë¸öGPUÏàÁ¬£¬Ò»¸öGPUÖ÷°åÉÏËùÓÐNVSwitchͨ¹ý±³°åºÍÁíÍâÒ»¸öÖ÷°åÉϵÄGPU»¥Áª£¬ÕâÑù¾ÍÄÜʵÏÖËùÓÐGPU¶¼´ïµ½È«»¥Áª×´Ì¬£¬ÈÎÒâÁ½¸öGPUÖ®¼äµÄ´ø¿í¶¼¿ÉÒÔ´ïµ½300GB/s¡£Ã¿¸öNVSwitchºÍ8¸öGPUÏàÁ¬£¬ÓÐ8¸öGPU NVLink½ÓÈ룬Ȼºó»áÓÐ8¸ö¶Ë¿ÚÁ¬³öµ½±³°åÉÏ£¬Òò´ËÒ»¹²Õ¼ÓÃÁË16¸ö¶Ë¿Ú£¬»¹ÓÐÁ½¸ö¶Ë¿ÚÊ£Óà¡£

һ̨DGX-2·þÎñÆ÷ºÍÁ½Ì¨DGX-1·þÎñÆ÷Ïà±È£¬ÔÚÏàͬÊýÁ¿GPU¿¨µÄÇé¿öÏ£¬ÔÚ¸ßÐÔÄܼÆËãÉî¶ÈѧϰӦÓÃÖУ¬ DGX-2·þÎñÆ÷Ïà½ÏDGX-1»áÓÐÁ½±¶ÒÔÉϵÄÐÔÄܼÓËÙ£¬Ö®ËùÒÔÄܳ¬¹ýÁ½±¶£¬ÊÇÒòΪGPUÊýÁ¿Ôö¼ÓÁ½±¶£¬¶øÐÔÄܳ¬¹ýÁ½±¶ÊÇÒòΪDGX-2 GPUÖ®¼äµÄͨѶЧÂʱÈDGX-1Òª¸ß£¬Òò´ËËüµÄ²¢ÐÐЧÂÊ»á¸ü¸ß¡£

NGCÔÆÆ½Ì¨Ê¹Ó÷½·¨ºÍ¼ÛÖµ

DGX¹¤×÷Õ¾ºÍ·þÎñÆ÷¶¼ÊÇÈíÓ²Ò»ÌåµÄ¼ÆËãÆ½Ì¨£¬Òò´ËDGX²»½ö½öÊÇһ̨Ӳ¼þÉ豸£¬»¹ÊÇÒ»Ì×ÍêÕûµÄÉî¶ÈѧϰºÍ¸ßÐÔÄܼÆËãÆ½Ì¨¡£DGXϵͳԤװÁËNVIDIAÓÅ»¯µÄ²Ù×÷ϵͳ¡¢Driver¡¢SDKÒÔ¼°NVIDIA DockerÒýÇæ£¬Ò²Ô¤×°Á˸÷ÖÖÉî¶Èѧϰ¿ò¼ÜºÍ¸ßÐÔÄܼÆËãµÄÓ¦ÓÃÈí¼þ£¬²¢ÇÒËùÓеÄÓ¦ÓÃÈí¼þ¶¼»á¶¨ÆÚ¸üУ¬Ò»°ãÿ¸öÔ¶¼»á¸üÐÂÒ»´Î£¬ÕâЩ¸üж¼»á·¢²¼ÔÚNGCÔÆÆ½Ì¨ÉÏ¡£ÕâÀïËù˵µÄÓ¦Óö¼ÊÇÒÔDockerÈÝÆ÷¾µÏñµÄ·½Ê½Ìṩ¡£DockerÈÝÆ÷ÊÇÒ»¸ö·Ç³£ÓÐÓõŤ¾ß£¬¸úÐéÄâ»úÓкܶàÏàËÆµÄµØ·½£¬µ«ÊÇÈÝÆ÷ÊÇÒ»¸öЧÂʸü¸ß¸ü·½±ãµÄ¹¤¾ß¡£

NGCÔÆÆ½Ì¨ÉÏËùÌṩµÄ×ÊÔ´£¬°üÀ¨Éî¶ÈѧϰµÄ¿ò¼ÜÒÔ¼°¸ßÐÔÄܼÆËã×ÊÔ´£¬ÕâЩÈí¼þ¶¼ÊÇÒÔÈÝÆ÷¾µÏñµÄ·½Ê½Ìṩ¡£±ÈÈçһЩ¸ãAIÑо¿µÄÑо¿Ô±»òÕßÊý¾Ý¿ÆÑ§¼Ò¾­³£»áÔÚÍøÕ¾»òÕßÂÛÎÄÉÏ¿´µ½Ò»Ð©ÐµÄÄ£ÐÍ£¬²¢ÇÒÏëÒªÑéÖ¤Ò»ÏÂЧ¹û¡£µ«ÕâЩģÐÍÐèÒªµÄһЩ¿ò¼Ü²»Ò»¶¨ÊÇÏÖÔÚÒѾ­ÔÚÓõ쬻òÕß°æ±¾Ò²²»Ò»¶¨ÓС£Èç¹ûÒªÏÂÔØÒ»¸ö×îеİ汾µÄ¿ò¼Ü£¬±ÈÈçCaffe¿ò¼ÜÀ´½øÐвâÊÔ£¬×Ô¼ºÊÖ¶¯È¥°²×°ÕâЩÈí¼þ»á·Ç³£Âé·³£¬ÐèÒª°²×°cuDNN¡¢OpenCV¡¢PythonµÈÕâЩÈí¼þ£¬ÁíÍ⻹¿ÉÄÜ»á´æÔÚһЩ°æ±¾µÄ³åÍ»£¬¿ÉÄÜÔÚÈí¼þ²¿ÊðÉϾͻáÀË·ÑÒ»Á½ÌìÉõÖÁÒ»ÖܵÄʱ¼ä¡£¶øÈç¹ûÎÒÃÇ¿ÉÒÔ´ÓNGCÉÏÈ¥ÏÂÔØÒ»¸öCaffe°æ±¾£¬¾Í¿ÉÒÔÖ±½Ó°ÑÎÒÃǵÄÄ£Ð͵¼Èë½øÈ¥ÔËÐУ¬Õâ¶ÔÓÚÎÒÃÇÑéÖ¤ºÍ²âÊÔ»·¾³µÄÈí¼þ¶¼ÊǷdz£ÓÐÓõ쬵±È»£¬¶ÔÓÚÉú²ú»·¾³£¬Ò²¿ÉÒÔ×Ô¼ºÈ¥²¿ÊðÈí¼þ¡£

½ÓÏÂÀ´½éÉÜÒ»ÏÂNGC×ÊÔ´µÄʹÓÃÁ÷³Ì¡£Ê×ÏÈ£¬Ãâ·Ñ×¢²á²¢µÇ¼NGCƽ̨£¨ngc.nvidia.com£©£¬µÇ¼ºóÐèÒª»ñÈ¡Õ˺źÍÃÜÂ룬µã»÷ÓÒÉϽÇGet API Key½øÈëÒ»¸öеÄÒ³Ãæ¡£ÔÚÕâ¸öÒ³ÃæÉϵã»÷ÓÒÉϽǵÄGenerate API key£¬Õâʱºò»áµ¯³öÒ»¸öҪȷÈϵÄÐÅÏ¢£¬ÎÒÃǵã»÷Confirm¾Í¿ÉÒÔÉú³Éͼ4ËùʾµÄÕ˺źÍÃÜÂë¡£»ñµÃÕ˺źÍÃÜÂëºó£¬¾Í¿ÉÒÔÔÚDGXϵͳÖнøÐеǼ¡£

ͼ5ÊÇÒ»¸ö·¶Àý£¬ÊäÈëÓû§ÃûºÍÃÜÂ룬ÐèҪעÒâµÄÊÇ£¬ÊäÈëÃÜÂëʱ²»Òª¼ÓÈë¿Õ¸ñ£¬ÏÔʾµÇ¼³É¹¦ºó£¬¾Í¿ÉÒÔÊäÈëÎÒÃÇÐèÒªÏÂÔØÓ¦ÓÃÈí¼þµÄһЩÏÂÔØÃüÁÊäÈë ¡°docker pull nvcr.io/nvidia/caffe:18.09-py3¡±ÃüÁÕâЩӦÓõÄÏÂÔØ¶¼·Ç³£¼òµ¥£¬°´ÕÕÕâÕÅͼÖеIJÙ×÷²½Öè¾Í¿ÉÒÔÍê³ÉÏÂÔØ£¬Ê¹ÓÃÒ²·Ç³£·½±ã¡£

DGXϵͳ¿ìËÙÉÏÊÖµÄ×î¼Ñ¹¥ÂÔ

ÄÇôÈçºÎÓúÃDGXÏµÍ³ÄØ£¿Ê×ÏÈÒªÓúÃV100µÄ»ìºÏ¾«¶È¼ÆËãÐÔÄÜ£¬ÔÚÇ°ÃæÎÒÃÇÒѾ­½éÉÜÁËTensor Core£¬¿ÉÒÔÖ§³Ö»ìºÏ¾«¶ÈµÄ¼ÆË㣬Ҳ¾ÍÊÇÉÏͼ×óÉϽǵĻìºÏ¾«¶È¾ØÕóµÄ³Ë¼Ó¼ÆËã¡£ÓкܶàÓû§·´Ó³£¬ËûÃÇÂòÁËDGX-1ºó·¢ÏÖºÍÏàͬÊýÁ¿GPU P100Ïà±È£¬ÐÔÄÜҲûÓÐÌØ±ð´óµÄÌáÉý¡£ºóÀ´·¢ÏÖËûÃÇÓõÄÊǵ¥¾«¶È×öѵÁ·£¬Ò²¾ÍÊǽ«P100ÉÏÔËÐеĴúÂëÖ±½ÓÄõ½DGX-1ÉÏÔËÐУ¬¶ø²¢Ã»ÓÐ×öÐ޸ģ¬ÕâÑùÒ»À´»¹Êǵ¥¾«¶ÈµÄѵÁ·£¬²¢²»»á×Ô¶¯Ê¹ÓûìºÏ¾«¶È¡£

ΪÁËÓúÃV100µÄ»ìºÏ¾«¶È¼ÆËãÐÔÄÜ£¬ÎÒÃÇÐèÒªÔÚÔ´´úÂëÉÏ×öһЩСµÄÐ޸ġ£±ÈÈçÔÚ×öѵÁ·Ê±£¬ÐèÒª°ÑÓÐÐ©È¨ÖØ¸±±¾¡¢ÌݶȻòÕß¼¤»îÖµµÈ±äÁ¿¸ÄΪ°ë¾«¶ÈFP16£¬¿ÉÒÔÌá¸ßËüµÄ¼ÆËãËÙ¶È£¬»¹¿ÉÒÔ¼õСÄÚ´æµÄÕ¼Óá£ÔÚ¸üÐÂÈ¨ÖØÊ±£¬ÎÒÃǰÑËüÇ¿ÖÆ×ª»¯ÎªFP32µÄµ¥¾«¶È£¬¿ÉÒÔ±£Ö¤ÑµÁ·Ä£Ð͵ľ«¶È²»»áϽµ£¬Òò´ËÔÚ²ÉÓÃÁËһЩСµÄÐ޸ĺó£¬ÔÙÈ¥×öһЩѵÁ·µÄ¼ÆËã²Å»á»ñµÃ±È½Ï¸ßµÄ¼ÆËãËÙ¶È¡£

Ëõ¶ÌÊý¾Ý¶ÁдµÄʱ¼äÒ²ÊÇÌá¸ß¼ÆËãËٶȱȽÏÖØÒªµÄÒ»µã¡£ÔÚѵÁ·Ê±¶¼ÐèÒª´ÓÍøÂçÎļþϵͳ¶ÁдÊý¾Ý£¬Í¨³£ÑÓʱ»á±È½Ï´ó£¬Òò´ËDGX-1»áÅäÖÃÎļþϵͳµÄ»º´æ¹¦ÄÜ£¬½«Êý¾Ý»º´æµ½ÏµÍ³µÄ±¾µØ£¬¶øÕâÒ»µã²»ÐèÒªÓû§¿¼ÂÇ£¬ÏµÍ³»á×Ô¶¯ÅäÖúᣵ±È»ÓÐЩÓû§»á×Ô¼º°ÑÊý¾Ý¿½±´µ½±¾µØ£¬ÕâÒ²ÊÇÒ»¸ö²»´íµÄ°ì·¨¡£ÁíÍ⣬ÓÉÓÚ±¾µØSSDÅäÖÃΪRAID 0£¬ËüµÄ¿É¿¿ÐԱȽϵͣ¬Òò´Ë²»½¨Òé½«ÖØÒªÊý¾Ý³¤ÆÚ´æ·ÅÔÚ»º´æÀïÃæ£¬Õ⽫»áºÜ²»°²È«¡£

ÔڴGPU¼¯ÈºµÄʱºò£¬ÍøÂç²»Ò»¶¨ÊÇInfiniBandÀàÐÍ£¬¾­³£»áÓöµ½40GbµÄÒÔÌ«Íø£¬ÕâʱÎÒÃÇ¿ÉÒÔ½«DGX-1µÄÍøÂç½Ó¿ÚÇл»ÎªÒÔÌ«ÍøÄ£Ê½£¬ÕâÑù¾Í¿ÉÒÔ½ÓÈëµ½40GbµÄÒÔÌ«ÍøÂç»·¾³ÖС£

³ä·ÖÀûÓÃNVLINKÍøÂçͨÐŵŦÄÜÒ²ÊÇÓúÃDGXÒ»¸öºÜÖØÒªµÄµã¡£Èç¹ûʹÓÃÆÕͨµÄMPIģʽ½øÐÐͨÐÅ£¬GPUÖ®¼ä²ÉÓÃPCIe£¬ËüµÄͨÐÅЧÂÊ»á±È½ÏµÍ¡£ÎªÁ˲ÉÓÃNVLinkͨÐÅ£¬ÎÒÃÇ¿ÉÒÔʹÓÃNCCL¿â£¬ÔÚHorovodÈí¼þÖм¯³ÉÁËNVIDIA NCCL¿â£¬ËüÊÇÒ»¸ö²ÉÓõÄÈçÓÒ±ßÕâÕÅͼµÄËã·¨£¬Õâ¸öËã·¨ÊǰٶÈ×îÏÈÌá³öÀ´µÄ¡£

´Ó×ó±ßͼÉÏÎÒÃÇ¿ÉÒÔ¿´µ½ÆÕͨµÄTensorFlow²¢ÐкÍHorovodÏà±È£¬GPU¿¨Ô½¶àÐÔÄܲî¾àÔ½Ã÷ÏÔ£¬Òò´ËÎÒÃǽ¨Ò飬ÔÚ×ö¶àGPU²¢ÐлòÕß¶à½Úµã²¢ÐÐʱ£¬Ê¹ÓÃNCCL¿â×÷ΪͨѶ·½Ê½¡£ÁíÍ⣬ÎÒÃÇÔÚNGCƽ̨ÉÏÌṩµÄÉî¶Èѧϰ¿ò¼ÜµÄ×ÊÔ´ÖÐÒ²ÒѾ­¼¯³ÉÁËNCCL¿â£¬Òò´Ë½¨Òé´ó¼Ò¾¡Á¿Ê¹ÓÃNGCÖеÄÉî¶Èѧϰ¿ò¼Ü×ÊÔ´¡£

NVIDIA DGX·þÎñÆ÷ºÍ¹¤×÷Õ¾ÊÇÈíÓ²Ò»ÌåµÄ²úÆ·£¬¶øÇÒÈí¼þºÍÓ²¼þ¶¼³ö×ÔNVIDIA£¬¿ÉÒÔ¸øÓû§Ìṩһ¸ö¸ßÐÔÄÜ¡¢¸ß¿É¿¿µÄϵͳ£¬ÌṩÍêÉÆµÄÈí¼þºÍÓ²¼þ·þÎñ£¬°üÀ¨¹ÊÕÏ´¦Àí¡¢ÐÔÄܵ÷ÓÅ¡¢Ó¦ÓÃÒÆÖ²µÈ¡£NVIDIAÓÐÇ¿´óµÄAIר¼ÒÍŶӣ¬Ò²¿ÉÒÔ¿ìËÙ½â¾ö´ó¼ÒÔÚʹÓùý³ÌÖеÄÎÊÌ⣬ÌṩһЩAIËã·¨µÈ²ãÃæµÄÖ§³Ö¡£Õâ¶Ô´ó¼Ò½Úʡʱ¼ä¡¢¿ìËÙµü´ú¡¢Ëõ¶Ì²úÆ·Ñз¢ÖÜÆÚÒ²ÊǷdz£ÓаïÖúµÄ£¬ÕâÒ²ÊÇNVIDIA·þÎñµÄÓÅÊÆ¡£

DGXϵͳ¸÷ÐÐÒµÓ¦Óð¸Àý

DGXÔÚ»¥ÁªÍøÐÐÒµµÄÓ¦Ó㬱ÈÈçÃÀ¹úÉç½»ÍøÂ繫˾Facebook£¬È¥Äê²É¹ºÁ˼¸°Ų̀DGX-1ÓÃÓÚDeep TextºÍͼÏñʶ±ðµÈ¡£ÎÒÃÇÒ²ÖªµÀ£¬Facebook¿ÉÒÔʶ±ðºÜ¶àÓû§µÄÕþÖÎÇãÏòµÈ·½ÃæµÄÐÅÏ¢£¬Í¬Ê±ËûÃÇÒ²ÓкܴóµÄÄÜÁ¦È¥×ö¸ü¶à¸÷ÖÖ¸÷ÑùµÄ·ÖÎö¡£

DGXÔÚÖǻ۳ÇÊÐÁìÓòµÄÓ¦Óã¬ÖйúµÚһ̨DGX-1ÊǺ£¿µÍþÊÓËù²É¹ºµÄ£¬º£¿µÍþÊÓÊÇÈ«ÊÀ½ç×î´óµÄ¼à¿ØÉ豸³§ÉÌ£¬ËûÃÇʹÓÃDGXѵÁ·Éñ¾­ÍøÂ磬µ«ÔÚʶ±ðʱ»áÓõ½ÁíÍâµÄ±ßÔµ·þÎñÆ÷£¬Í¬Ê±»¹²»ÊÇͨÓõÄPCIe¿¨£¬¶øÊÇÓÃTegra X2£¬¶à¸öTegra X2¼¯³Éµ½Ò»¿é¿¨ÖУ¬²¢²åÔÚÒ»¸ö±È½ÏСµÄǰ¶Ë±ßÔµ·þÎñÆ÷ÉÏ¡£

DGXÔÚ³õ´´¹«Ë¾µÄÓ¦Óã¬Face++ÔÚʹÓôóÁ¿µÄDGXºÍ´«Í³µÄPCIe·þÎñÆ÷½áºÏÓ¦ÓÃÓÚÔÚÖÇÄÜ¼à¿ØÁìÓò¡£ÉÌÌÀ¿Æ¼¼²ÉÓÃDGXÓÃÓÚÈËÁ³Ê¶±ð¡¢³µÁ¾Ê¶±ðµÈ¡£ÉÌÌÀ¿Æ¼¼ÔÚµÚÒ»ÅúDGX²úÉúʱ¾ÍºÍNVIDIAÓкÏ×÷ÁË¡£ÁíÍ⻹ÓйúÄڷdz£ÖøÃûµÄÊÖ»ú³§ÉÌ£¬ËûÃÇÒ²²ÉÓÃDGXÓÃÓÚÊý¾Ý·ÖÎö»òÓïÒôʶ±ðµÈ¡£

DGXÔÚ½ÌÓý¿ÆÑÐÐÐÒµµÄÓ¦Óã¬ÒÔÀä¶³µç¾µÎªÀý£¬Ê¹ÓÃRelion GPU°æ£¬¿ÉÒÔ°ïËûÃÇËõ¶Ì·ÖÎö¼ÆËãµÄʱ¼äºÍ³É±¾¡£¶ø¹úÍâÓõÄ×î¶àµÄÊÇÃÀ¹úµÄÏðÊ÷Áë¹ú¼ÒʵÑéÊÒ£¬ËüºÍIBM¹«Ë¾ºÏ×÷ʹÓÃDGX´òÔìÁ˳¬¼¶¼ÆËã»úSummit£¬×ܹ²ÓÐ4608¸ö½Úµã£¬ËüµÄ¼ÆËãÐÔÄܱÈÉñÍþ¡¤Ì«ºþÖ®¹â»¹¸ßÒ»±¶£¬ÆäÖÐNVIDIA V100µÄÐÔÄÜÕ¼¾ÝÁË95%µÄ¼ÆËãÁ¦¡£

DGXÔÚÖÆÔìÒµµÄÓ¦Óã¬Ö÷ÒªÓÃÔÚһЩƷÖÊ¿ØÖÆ£¬±ÈÈçÔ­À´ÓÐ150¶àÃû¼ì²éÔ±ÓÃÑÛ¾¦È¥¿´ÄÇЩ²úÆ·µÄÆ·ÖÊ£¬Òª¼ì²é20-30·ÖÖÓ£¬Èç¹ûʹÓÃDGX DeepLearningµÄ·½Ê½À´È¡´úÈËÀ´×öʶ±ð£¬¿ÉÒÔÔÚ4·ÖÖÓÄÚÍê³É150È˽ӽü°ë¸öСʱµÄ¹¤×÷¡£ÈËÓÐʱºòÊÇ»áÆ£À͵쬶ÔÑÛ¾¦É˺¦Ò²ºÜ´ó¡£ÁíÒ»·½Ã棬ÔÚ»úÆ÷ÈËÉϲ»½öÊÇDGXµÄÓ¦Óã¬DGXÖ÷Òª¸ºÔðѵÁ·£¬ÑµÁ·ºÃµÄÄ£ÐÍ»áÓõ½»úÆ÷ÈËÉÏ¡£ÁíÍ⻹ÓйúÄÚÎïÁ÷²úÒµµÄС³µµÈÔÚÊÒÍâ×öʶ±ð¶¼»áÓõ½DGX¡£

DGXÔÚÒ½ÁÆÐÐÒµµÄÓ¦Óã¬Ó¦ÓÃ×î¶àÊÇҽѧӰÏñʶ±ð¡£ÈçÉÏͼËùʾ£¬»ÆÑÕÉ«ÊÇÈËÀàÓо­ÑéµÄҽʦ¸ø³öµÄÕï¶Ï£¬Ç³ÑÕÉ«ÊÇ»úÆ÷½øÐÐÁËѵÁ·ºóµÃµ½Õï¶Ï¡£±ÈÈçÉϺ£³¤Õ÷Ò½Ôº£¬ÓеÄÒ½ÉúÒ»ÌìÒª¿´Ò»°Ù¶à¸ö²¡ÈË£¬½«½ü200ÕÅÆ¬×Ó£¬Í¬Ê±ÓÐµÄ·ÎÆ¬CTÊÇ32Ïß»òÕß64Ïß¡£ÔÚÅŲéʱ£¬Ò½ÉúÐèÒª´Ó·ÎµÄµ×¶Ëµ½¶¥¶Ë½øÐÐÅŲ顣ÓÈÆäÈ˵½ÏÂÎçµÄʱ¼ä£¬Æ£ÀͶȸ÷¸ö·½Ãæ¶¼»áÊܵ½±È½Ï´óµÄÓ°Ï죬ͬʱ׼ȷÂÊÒ²»áÊܵ½Ò»Ð©Ó°Ïì¡£ÔÚÓÐÁË»úÆ÷Õï¶Ïºó£¬²»½ö¿ÉÒÔ½µµÍҽѧӰÏñʦµÄ¹¤×÷Á¿£¬¶ÔÒ½ÉúÒ²Óкܴó°ïÖú¡£ÁíÍ⣬»úÆ÷¿ÉѧϰµÄÖÖÀà¸ü¶à£¬Ñ§Ï°Ð§Âʸü¸ß£¬Òò´ËÕï¶Ï½á¹ûÒ²»á¸ü¾«×¼¡£

DGXÔÚ°©Ö¢Ñо¿·½ÃæµÄÓ¦Ó㬱ÈÈçÃÀ¹úÄÜÔ´²¿ÏÂÊôµÄ¹ú¼Ò°©Ö¢Ñо¿ÖÐÐÄÓÐÒ»¸ö°©Ö¢µÇÔ¼ƻ®µÄÏîÄ¿£¬²ÉÓÃÁË124̨DGX-1£¬Ö÷Òª½øÐмÓËÙ°©Ö¢ÖÎÁÆ·½°¸µÄÑо¿¡¢Ô¤²âÒ©ÎïÖÎÁÆÐ§¹ûºÍ·ÖÎö²¡È˶ÔÒ©ÎïµÄЧ¹ûµÈ¡£

DGXÔÚ½ðÈÚÐÐÒµµÄÓ¦Óã¬Ä¿Ç°¼¸¸öÖ÷ÒªµÄÒøÐлòÕß´ó±£ÏÕ¹«Ë¾¶¼ÔÚʹÓÃGPU·þÎñÆ÷£¬ÉÙ²¿·ÖÒѾ­¿ªÊ¼Ê¹ÓÃDGX¡£Ö÷ÒªÓÃÓÚ¿ìËÙ´¦ÀíÊý¾Ý£¬ÒÔÔö¼Ó¶ÔËðʧµÄÆÀ¹À׼ȷÂÊ¡£

NVIDIAÔÚÆû³µ×Ô¶¯¼ÝÊ»·½ÃæÓкܶàµÄÓ¦Óã¬ÎÒÃǹ«Ë¾Ò²ÓÐ×Ô¼ºµÄDGX¼¯Èº£¬×ܹ²ÓÐ660̨DGX-1£¬ÆäÖÐ160̨ÓÃÓÚ×Ô¶¯¼ÝÊ»ÁìÓò¡£ÀûÓÃÕâ¸ö¼¯ÈºÎÒÃÇ¿ÉÒÔ×öºÜ¶àµÄѵÁ·£¬±ÈÈç³µÁ¾Ê¶±ð¡¢ÈËԱʶ±ð¡¢½»Í¨Ê¶±ðÒÔ¼°Ä£Äâ¡£×Ô´Ó³öÏÖ¹ýһЩ×Ô¶¯¼Ýʻʹʺó£¬NVIDIA¾Í²»ÔÙ½øÐÐʵ¼Ê·¿öµÄ²âÊÔ£¬¶øÊǷŵ½Ä£Äâ»·¾³Ï½øÐвâÊÔ£¬ÔÚÄ£ÄâÇé¿öϵÄѧϰЧÂÊÒ²»á¸ü¸ß¡£

DGXÔÚµçÐÅÐÐÒµµÄÓ¦Óã¬Ö÷ÒªÓÃÓÚÒÆ¶¯±ßÔµ¼ÆËã¡£±ßÔµ¼ÆËãÖ÷ÒªÊÇÔÚÎí¶Ë£¬Ä¿µÄÊÇÔÚÎí¶Ë¡¢±ßÔµ¶Ë¿ÉÒÔÓÐÏà¹ØµÄInference GPU·þÎñÆ÷¡£ËùÓÐÎïÁªÍøµÄÉ豸±ÈÈçºìÂ̵ơ¢Ì½Í·¡¢ÎÞÈË»ú¡¢VRÍ·¿øµÈ¶¼¿ÉÒÔͨ¹ý5G½øÐÐʶ±ð¡£»»¾ä»°Ëµ£¬²»ÔÙÐèÒªIOTÉ豸ÉϵÄǶÈëʽGPU£¬ÒòΪ5G»áÊ¹ÍøÂç³É±¾±äµÃºÜµÍ£¬ÍêÈ«¿ÉÒÔÀûÓñßÔµ·þÎñÆ÷ÖеÄGPUÀ´×öInference£¬´Ó¶ø»ñÈ¡¸üºÃµÄ½á¹û¡£

 
   
3030 ´Îä¯ÀÀ       28
 
Ïà¹ØÎÄÕÂ

ÔÆ¼ÆËãµÄ¼Ü¹¹
¶ÔÔÆ¼ÆËã·þÎñÄ£ÐÍ
ÔÆ¼ÆËãºËÐļ¼ÊõÆÊÎö
Á˽âÔÆ¼ÆËãµÄ©¶´
 
Ïà¹ØÎĵµ

ÔÆ¼ÆËã¼ò½é
ÔÆ¼ÆËã¼ò½éÓëÔÆ°²È«
ÏÂÒ»´úÍøÂç¼ÆËã--ÔÆ¼ÆËã
ÈídzÎöÔÆ¼ÆËã
 
Ïà¹Ø¿Î³Ì

ÔÆ¼ÆËãÔ­ÀíÓëÓ¦ÓÃ
ÔÆ¼ÆËãÓ¦ÓÃÓ뿪·¢
CMMIÌåϵÓëʵ¼ù
»ùÓÚCMMI±ê×¼µÄÈí¼þÖÊÁ¿±£Ö¤