Äú¿ÉÒÔ¾èÖú£¬Ö§³ÖÎÒÃǵĹ«ÒæÊÂÒµ¡£

1Ôª 10Ôª 50Ôª





ÈÏÖ¤Â룺  ÑéÖ¤Âë,¿´²»Çå³þ?Çëµã»÷Ë¢ÐÂÑéÖ¤Âë ±ØÌî



  ÇóÖª ÎÄÕ ÎÄ¿â Lib ÊÓÆµ iPerson ¿Î³Ì ÈÏÖ¤ ×Éѯ ¹¤¾ß ½²×ù Model Center   Code  
»áÔ±   
   
 
     
   
 ¶©ÔÄ
  ¾èÖú
Я³ÌAIÍÆÀíÐÔÄܵÄ×Ô¶¯»¯ÓÅ»¯Êµ¼ù
 
×÷ÕߣºÐ¯³Ì¼¼Êõ
  1635  次浏览      28
 2021-9-8
 
±à¼­ÍƼö:
±¾ÎÄÖ÷Òª½éÉÜAutoMLµÄ·¢Õ¹Ö÷Òª¼¯ÖÐÔÚËĸöϸ·Ö·½Ïò£¬AutoMLµÄÓ¦ÓÃÏÖ×´£¬AutoMLÔÚÈ˹¤ÖÇÄÜ·þÎñÔÆÆ½Ì¨µÄÓ¦Óù滮£¬Ï£Íû¶ÔÄúµÄѧϰÓÐËù°ïÖú¡£
±¾ÎÄÀ´×ÔÓÚ΢ÐŹ«ÖںţºÎÒÃǵĿªÐÄ£¬ÓÉ»ðÁú¹ûÈí¼þAlice±à¼­¡¢ÍƼö¡£

Ò»¡¢±³¾°

½üÄêÀ´£¬È˹¤ÖÇÄÜÖð½¥ÔÚ°²·À£¬½ÌÓý£¬Ò½ÁƺÍÂÃÓεȹ¤ÒµºÍÉú»î³¡¾°ÖÐÂ䵨¿ª»¨¡£ÔÚЯ³ÌÂÃÓÎÒµÎñÉÏ£¬AI¼¼ÊõͬÑù¹ã·º¸²¸ÇÁ˶à¸öÂÃÓβúÆ·ºÍÂÃÓηþÎñÁìÓò£¬Ð¯³Ì¶È¼ÙAIÑз¢¸ù¾ÝÂÃÓεÄÌØ¶¨³¡¾°ºÍÒµÎñÐèÇ󣬽«×ÔÈ»ÓïÑÔ´¦Àí£¬»úÆ÷·­Ò룬¼ÆËã»úÊÓ¾õ£¬ËÑË÷ÅÅÐòµÈÖ÷Á÷AI¼¼Êõ³É¹¦Ó¦ÓÃÓÚÂÃÓζȼٵĶà¸öÒµÎñÏߣ¬ÀýÈç×ÔÓÉÐУ¬¸úÍÅÓΣ¬Ç©Ö¤£¬ÍæÀÖºÍ×â³µµÈ¡£

´Ó¼¼Êõ½Ç¶È£¬ÎªÁËÊÊÓ¦²»Í¬µÄÒµÎñ³¡¾°ÐèÇó£¬Éæ¼°µ½¶àÖÖAI¼¼Êõ£¬°üÀ¨´«Í³»úÆ÷ѧϰ£¬¾í»ýÉñ¾­ÍøÂ磬TransformerµÈÉî¶ÈѧϰģÐͽṹ£¬ÒÔ¼°ÖªÊ¶Í¼Æ×ºÍͼÉñ¾­ÍøÂçµÈ¼¼ÊõÁìÓò¡£Í¬Ê±£¬ÎªÁ˳ä·ÖÍÚ¾òAI¼¼ÊõµÄÓÅÊÆ£¬Ä£ÐÍÉè¼Æ¸´ÔÓ¶ÈÈÕ½¥ÌáÉý£¬°üÀ¨Ä£ÐÍÉî¶È£¬¿í¶ÈÒÔ¼°½á¹¹¸´ÔӶȵȸ÷¸öά¶È£¬¼ÆËãÁ¿µÄÔö´óʹµÃAIÍÆÀíÐÔÄÜÆ¿¾±ÈÕÒæÍ¹ÏÔ£¬ÓÈÆäÊÇʵʱÐÔµÄÒµÎñÐèÇó¶ÔÍÆÀíËÙ¶ÈÒªÇó¸ü¸ß¡£ÎªÁË×·Çó×î¼ÑÍÆÀíÐÔÄÜ£¬ÍùÍùÐèÒªÊÖ¶¯½øÐÐÖð¸öÓÅ»¯£¬Éæ¼°µÄ¿ª·¢£¬²¿ÊðºÍ¹µÍ¨³É±¾¶¼ºÜ¸ß¡£Ö÷ÒªÎÊÌ⼯ÖÐÔÚ£º

1.Ä£ÐͽṹÖÖÀà¶à£¬ÐÔÄÜÆ¿¾±²îÒì½Ï´ó£¬ÊÊÓõÄÓÅ»¯·½·¨¸÷Óв»Í¬£¬ÊÖ¶¯ÓÅ»¯³É±¾¸ß£»

2. ÓÅ»¯·½·¨Öڶ࣬×ÔÉ϶øÏ£¬Éæ¼°¶àÖÖÄ£ÐÍѹËõ·½Ê½£¬ÏµÍ³¼¶£¬ÔËÐÐʱÓÅ»¯µÈ£¬ÊÖ¶¯ÓÅ»¯Ãż÷¸ß£»

3.Öð¸öÊÖ¶¯ÓÅ»¯£¬¿ÉÍÆ¹ãÐԲ¼¼Êõ¸²¸ÇÃæÓÐÏÞ£»

4.Ó²¼þƽ̨µÄ²îÒ죬ÐèÒªÕë¶ÔÐÔµ÷ÓÅ£¬µ¼ÖÂÓÅ»¯µÄÈËÁ¦³É±¾ºÍ²¿Êð³É±¾¶¼ºÜ¸ß£»

5.ÐÂÄ£Ð͵ķ¢²¼ºÍµü´ú£¬ÐèÒªÓ¦ÓÃÓÅ»¯·½·¨£¬Éæ¼°½Ï¸ßµÄ¹µÍ¨ºÍ½ÓÈë³É±¾£¬Í¬Ê±´øÀ´ÁËÐÔÄܵIJ»Îȶ¨ÐÔ£»

6.Ä£ÐÍѹËõ¼¼Êõ¶Ô²»Í¬Ä£Ð͵ÄÓÅ»¯Ð§¹ûÓÐËù²îÒ죬¿ÉÄÜÐèÒª½øÐÐÄ£Ð͵ÄÔÙѵÁ·£¬ÑµÁ·ºÍÊý¾Ý×¼±¸Á÷³Ì½Ï³¤£¬Ð§ÂʵÍÏ¡£

Òò´Ë£¬ÎªÁ˽µµÍÓÅ»¯£¬²¿ÊðºÍµü´ú³É±¾£¬Ìá¸ß¹¤×÷ЧÂÊ£¬²¢±£Ö¤ÐÔÄÜÎȶ¨£¬ÎÒÃdz¢ÊԴģÐÍ×Ô¶¯»¯ÓÅ»¯Æ½Ì¨£¬Ö¼ÔÚΪË㷨ģÐÍÌṩ¸üÈ«ÃæÒ×Óã¬Îȶ¨ÐÔ¸üºÃ£¬Ê¹ÓúÍά»¤³É±¾¸üµÍµÄÓÅ»¯½â¾ö·½°¸¡£

¶þ¡¢ÓÅ»¯Æ½Ì¨µÄÖ÷Òª¿ò¼Ü

´ÓÐÔÄÜÓÅ»¯·½·¨Â۵ĽǶȣ¬ÎÞÂÛÊÇ×Ô¶¯ÓÅ»¯»¹ÊÇÊÖ¶¯ÓÅ»¯£¬Ö÷Òª¹Ø×¢ÒÔÏÂÁ½´ó·½Ïò£º

1.½µµÍËã·¨¸´ÔÓ¶È£º¿Éͨ¹ýµ÷Õû»ò¼ò»¯Ä£Ðͽṹ£¬»òÕß±£³Ö½á¹¹²»±ä£¬¸Ä½øË㷨ʵÏÖЧÂÊ£»

2.³ä·Ö·¢»ÓÈíÓ²¼þÐÔÄÜ£ºÄ£ÐͽṹºÍËã·¨²»±ä£¬ÓÅ»¯Èí¼þÖ´ÐÐЧÂÊ£¬Ê¹ÓÃÓ²¼þÓÅÊÆÌØÕ÷£¬×î´ó»¯Ó²¼þÖ´ÐÐЧÂÊ¡£

Î§ÈÆÕâÁ½´óÓÅ»¯·½ÏòÒÔ¼°È˹¤ÖÇÄܵÄÖ÷Á÷¼¼Êõ·½Ïò£¬ÓÅ»¯Æ½Ì¨µÄÕûÌå¼Ü¹¹²ã×Ô϶øÉÏ¿ÉÒÔ»®·ÖΪ£º

1.Ó²¼þƽ̨ºÍ²Ù×÷ϵͳ²ã£¬°üº¬x86¼Ü¹¹µÄCPU£¬GPU£¬ARM£¬FPGAµÈ¶àÖÖÆ½Ì¨£¬²Ù×÷ϵͳÖ÷ÒªÊÇLinux OS£»

2.ÒýÇæ¿ò¼Ü²ã£¬Ö÷ÒªÊÇTensorflow£¬PytorchµÈÈ˹¤ÖÇÄÜÖ÷Á÷¿ò¼Ü£»

3.ÍÆÀíÓÅ»¯²ã£¬Ö÷ÒªÊÇÓÉÎÒÃǽáºÏÒµÎñ³¡¾°ºÍʵ¼ÊÐèÇó½øÐÐ×ÔÖ÷Ñз¢µÄÓÅ»¯¼¼Êõ£¬°üº¬¸ßÐÔÄÜËã×ӿ⣬ͼÓÅ»¯ºÍÐ޸Ť¾ßÒÔ¼°Á¿»¯ÕôÁóµÈÄ£ÐÍѹËõÄ£¿é£»

4.Ë㷨ģÐÍ£º°üº¬Òµ½ç³£ÓÃÄ£ÐÍ£¬ÀýÈçÒÔ¾í»ýΪÖ÷Òª½á¹¹µÄCVÄ£ÐÍ£¬Resnet£¬GoogleNet£¬YOLOµÈ£»ÒÔTransformerΪÖ÷Òª½á¹¹µÄNLPÄ£ÐÍBert£¬AlbertµÈ£»

5.Ó¦Óó¡¾°£ºÖ÷ÒªÌåÏÖÔÚÂÃÓγ¡¾°ÖеÄʵ¼ÊÓ¦Óã¬ÀýÈçÖÇÄܿͷþƽ̨£¬»úÆ÷·­Ò룬ËÑË÷ÅÅÐòµÈÓ¦Óá£

ͼ1 Ä£ÐÍÆ½Ì¨µÄ¿ò¼Ü×é³É

Èý¡¢×Ô¶¯»¯ÓÅ»¯Á÷³Ì

ÓÅ»¯Æ½Ì¨µÄ´î½¨Äܹ»ÏµÍ³ÓÐЧµØ½«ÓÅ»¯¼¼ÊõÕûºÏÆðÀ´£¬²¢¿ìËÙÓ¦ÓÃÓÚʵ¼ÊÐèÇ󣬵«ÊÇÈç¹û²»ÊµÏÖ×Ô¶¯»¯ÓÅ»¯£¬ÓÅ»¯Ð§ÂʱȽϵͣ¬²¿ÊðºÍµü´ú³É±¾£¬¹µÍ¨ºÍ½ÓÈë³É±¾¸ß¡£Òò´ËÎÒÃǽ¨Á¢ÁË×Ô¶¯»¯ÓÅ»¯Á÷³Ì£¬½«ËùÖ§³ÖµÄÓÅ»¯¼¼Êõº­¸ÇÔÚÄÚ£¬½áºÏÄ£ÐÍѵÁ·Æ½Ì¨£¬Êý¾Ý±êעƽ̨£¬´ÓÄ£ÐÍÉè¼Æ£¬Ä£ÐÍѵÁ·µ½Ä£ÐÍÍÆÀíÓÅ»¯£¬Ä£ÐͲ¿ÊðÈ«Á´Â·£¬ÊµÏÖÁã½éÈëÎÞ¸ÐÖªµÄÓÅ»¯Ð§¹û£¬´ó´óÌáÉý¹¤×÷ЧÂÊÒÔ¼°ÕûÌåÓÅ»¯Ð§¹ûµÄÎȶ¨ÐÔ¡£

ͼ2ËùʾΪÊý¾Ýƽ̨£¬Ä£ÐÍѵÁ·Æ½Ì¨£¬Ä£ÐÍÓÅ»¯ºÍ²¿ÊðµÄ´ó¸ÅÁ÷³Ì¡£¾ßÌåÓÐÄÄЩÓÅ»¯ÊֶΣ¬ÈçºÎ½øÐÐ×Ô¶¯»¯ÊµÏÖµÄÁ÷³Ìϸ½ÚÈçͼ3Ëùʾ¡£

ͼ2 Ä£ÐÍ×Ô¶¯»¯ÓÅ»¯ÊµÏÖ¿ò¼Ü

ͼ3 ×Ô¶¯ÓÅ»¯ÊµÏֵĻù±¾Á÷³Ì

ËÄ¡¢¹¦ÄÜÄ£¿é

×Ô¶¯»¯ÓÅ»¯Æ½Ì¨µÄÖ÷Òª¹¦ÄÜÄ£¿é·ÖËIJ¿·Ö£º

1.¸ßÐÔÄÜËã×ӿ⣬°üÀ¨Ëã×ÓÖØÐ´£¬Ëã×Ӻϲ¢µÈ¶à¸öÓÅ»¯£¬Ö§³Öattention£¬softmax£¬Layer normµÈ¶à¸ö³£ÓÃËã×Ó£»

2.¼ÆËãͼÓÅ»¯£¬Ö÷Òª½øÐмÆËãͼËÑË÷£¬ÐÞ¸ÄÌæ»»Ä£ÐÍͼ½á¹¹£¬ºÏ²¢Éú³ÉеÄÄ£ÐÍÎļþ½øÐÐÍÆÀí²¿Êð£»Í¬Ê±°üº¬³£ÓõÄͼÓÅ»¯ºÍÐ޸Ť¾ß£»

3.Ä£ÐÍѹËõÄ£¿é£¬°üÀ¨Ä£Ð;²Ì¬ºÍ¶¯Ì¬Á¿»¯£¬Ä£ÐͼôÖ¦ºÍÕôÁóµÈ£»

4.Ä£ÐͲ¿ÊðÓÅ»¯£¬Ö÷ÒªÌṩ²¿ÊðµÄÓÅ»¯·½°¸£¬°üÀ¨²¿ÊðÉè¼Æ£¬ÔËÐÐʱ»·¾³ÅäÖõȡ£

ͼ4 Ä£ÐÍÓÅ»¯Æ½Ì¨»ù±¾Ä£¿é

4.1 ¸ßÐÔÄÜËã×Ó¿â

¸ÃÄ£¿éÖ÷ҪʵÏÖÁ˳£ÓõÄËã×ÓÒÔ¼°¼¤»îº¯Êý£¬°üº¬»ù´¡Ëã×Ó£¬ÀýÈç¾í»ý£¬È«Á¬½Ó²ã£¬batch norm£¬softmaxµÈµÈÒÔ¼°ºÏ²¢ºóµÄ¾­µäµÄÄ£Ðͽṹ£¬ÀýÈçtransformer encoder£¬decoderµÈ£¬»ùÓÚtensorflowʵÏÖ£¬²ÉÓÃc++ʵÏÖ£¬Ö§³ÖCPUºÍGPUƽ̨µÄÓÅ»¯¡£

¾ßÌåµÄÓÅ»¯·½·¨º­¸ÇÁË£º

1.Ëã·¨¸Ä½ø£¬ÀýÈç¾í»ýËã·¨µÄʵÏÖ£¬½«im2colºÍwinograd¾í»ýÏà½áºÏ£¬Õë¶Ô²»Í¬¾í»ýºË´óС×ÔÊÊӦʹÓÃ×î¼ÑËã·¨£¬ÊµÏÖ×î¿ìµÄËÙ¶È£»

2.ÄÚ´æÖع¹£¬ÒÔBERTÄ£ÐÍΪÀý£¬×îºËÐÄÒ²ÊÇ×îºÄʱµÄ¼ÆËãÄ£¿éÖ®Ò»¾ÍÊǶàÍ·×Ô×¢ÒâÁ¦»úÖÆmulti-head self-attention£¬°üº¬ÁË´óÁ¿µÄ¾ØÕó³Ë·¨¼ÆË㣬¸ù¾ÝËã·¨Ô­Àí£¬°üÀ¨query²ã£¬key²ãºÍvalue²ãµÄ»ñÈ¡£¬queryºÍkeyµã³ËµÈµÈ£¬¸üÖØÒªµÄÊǵ±Ç°µÄtensorflowË㷨ʵÏÖ°üº¬ÁË´óÁ¿µÄÐÐÁб任²Ù×÷£¨transpose£©£¬transpose´øÀ´´óÁ¿µÄÄÚ´æ·ÃÎÊ¿ªÏú£¬ÕâЩÎÊÌâ¿ÉÒÔͨ¹ýÄÚ´æÖع¹À´±ÜÃâ¡£

ͬʱºÜ¶à¾ØÕó³Ë·¨ÊµÏÖ¿ÉÒÔͨ¹ýÅúÁ¿¾ØÕó³Ë·¨µ÷ÓÃÌáÉý¼ÆËãЧÂÊ£¬´Ó¶ø´øÀ´ÔËÐÐËٶȵÄÌáÉý¡£ÈçÏÂͼ5Ëùʾ£¬self-attention»úÖÆÔ­Ê¼ÊµÏÖÁ÷³Ì°üº¬ÁËÈý´ÎÈßÓàµÄtranspose²Ù×÷£¬T£¨a£©±íʾÕÅÁ¿aµÄtransposeÐÎʽ¡£Í¨¹ý¶ÔÄÚ´æÖع¹¿ÉÒÔ±ÜÃâÕâÈý´Îtranspose²Ù×÷¡£Èçͼ6Ëùʾ£¬ÓÅ»¯ºóµÄ¼ÆËãÁ÷³Ì²»°üº¬transpose¡£

ͼ5 Self-attentionԭʼʵÏÖÁ÷³Ì

ͼ6 self-attentionÓÅ»¯ºóʵÏÖÁ÷³Ì

¶þÕ߶Աȣ¬¿ÉÒÔÃ÷ÏÔ¿´³ö£¬ÓÅ»¯ºó¼õÉÙÁË4´Îtranspose²Ù×÷£¬Ò²¾ÍÊǼõÉÙÁËÄÚ´æ·ÃÎʵĿªÏú£¬Í¬Ê±¶ÔÓÚ¾ØÕó³Ë·¨£¬µ÷ÓÃÅúÁ¿¾ØÕó³Ë·¨Ìæ´úµ¥¸ö¾ØÕó³Ë·¨²Ù×÷£¬Ð§Âʸü¸ß¡£

1.IntrinsicÖ¸ÁÓÅ»¯£¬ÀýÈçÔÚCPUƽ̨ʹÓúÏÊʵÄÏòÁ¿»¯Ö¸ÁîAVX512ÒÔ¼°×¨ÃÅÕë¶ÔAIµÄVNNIÖ¸ÁîµÈ£»

2.Ëã×ÓÈںϣ¬ÒÔtransformerΪÀý£¬Ã¿Ò»²ã°üº¬´óÁ¿µÄÁãÉ¢Ëã×Ó£¬°üÀ¨self-Attention£¬GELU¼¤»îº¯Êý£¬¹éÒ»»¯Layer NormalizationËã×ӵȶà¸öÁãÉ¢Ëã×Ó£¬ÎªÁ˼õÉÙÊý¾Ý·ÃÎÊ¿ªÏú£¬½«¶à¸öËã×Ó½øÐÐÈںϣ¬ÊµÏÖеÄGPU kernel¡£Í¨¹ýËã×Ӻϲ¢£¬Ëã×ÓÊýÁ¿¼õÉÙÔ¼90%£¬Ä£ÐÍÉæ¼°ÄÚ´æ°áÒÆµÄ²Ù×÷È¥³ýÂÊ100%£¬90%µÄʱ¼ä¼¯ÖÐÔÚºËÐļÆËãµÄkernel launcher¡£Èçͼ7Ëùʾ¡£

ͼ7 Ëã×ÓÈںϾÙÀý

4.2 Ä£ÐÍѹËõ

Ä£ÐÍѹËõÊÇÌáÉýÍÆÀíÐÔÄܵÄÁíÒ»¸öÓÐЧÊֶΣ¬Ö÷ÒªÊÇÖ¸ÔÚËã·¨²ãÃæÉϵÄÄ£ÐÍÓÅ»¯£¬±£Ö¤¾«¶ÈµÄǰÌáÏ£¬Í¨¹ýºÏÀíµÄ½µµÍÄ£Ðͽṹ»òÕß²ÎÊýÁ¿£¬´Ó¶øÊµÏÖ¼õÉÙÕû¸öÄ£ÐͼÆËãÁ¿µÄÄ¿µÄ¡£

Ä£ÐÍѹËõµÄÖ÷Òª×÷ÓÃÓУº

1.¼ò»¯Ä£Ðͽṹ£¬½µµÍ¼ÆË㸴ÔÓ¶È£¬ÌáÉýÍÆÀíËÙ¶È

2.¼õÉÙÄ£ÐͲÎÊýºÍÄ£Ðͳߴ磬½µµÍ¶ÔÄÚ´æµÄÕ¼Óá£

ºê¹ÛÉÏÀ´½²£¬µ±Ç°µÄÓÅ»¯Æ½Ì¨Ö§³ÖµÄÄ£ÐÍѹËõ·½·¨ÓÐÄ£ÐÍÕôÁó£¬Ä£ÐͼôÖ¦£¬µÍ¾«¶ÈÁ¿»¯µÈ¡£

4.2.1 Ä£ÐÍÕôÁó

Ä£ÐÍÕôÁó²ÉÓõÄÊÇÇ¨ÒÆÑ§Ï°£¬Í¨¹ýÔ¤ÏÈѵÁ·ºÃµÄ¸´ÔÓÄ£ÐÍ£¨Teacher model£©µÄÊä³ö×÷Ϊ¼à¶½ÐźÅȥѵÁ·ÁíÍâÒ»¸ö¼òµ¥µÄѧÉúÍøÂ磨Student Model£©£¬´Ó¶øÊµÏÖ¶ÔÄ£Ð͵ļò»¯£¬¼õÉÙÄ£ÐͲÎÊý¡£Ä£ÐÍÕôÁóÆÕ±éÐÔºÜÇ¿£¬¿ÉÓÐЧÌáÉýСģÐÍ׼ȷÂÊ£¬µ«Êǵ÷²ÎÏà¶ÔÀ§ÄÑ£¬Ö÷ÒªµÄºËÐĵÄÎÊÌâ°üÀ¨£¬ÈçºÎÑ¡ÔñÌØÕ÷²ãÈçºÎÉè¼ÆËðʧº¯Êý£¬Ñ§ÉúÄ£Ð͵ÄÉè¼ÆºÍÊý¾Ý¼¯µÄÑ¡ÔñµÈµÈ¡£Í¼8ÊÇÎÒÃÇѹËõ¿ò¼ÜÖÐʵÏֵĶÔTransformerµÄdecoderÄ£Ð͵ÄÕôÁóʵÏÖ¡£

ͼ8 TransformerÄ£ÐÍÕôÁó

×ÜËðʧº¯Êý¹¹³É£º

ÆäÖЦÁºÍ¦Â·Ö±ð±íʾÏàÓ¦µÄËðÊ§ÖµÈ¨ÖØÏµÊý£¬¦Á¡Ê(0,1]£¬¦Â¡ÊR£¬LsoftÊÇ TeacherÍøÂçµÄÊä³öÓëStudentÍøÂçÄ£ÐÍÊä³öµÄËðʧֵ£¬Lhard - ѵÁ·Êý¾ÝÓïÁÏÕæÊµ±êÇ©ÓëStudentÍøÂçÄ£ÐÍÊä³öµÄËðʧֵ£¬LAT_FMT - TeacherºÍStudentÍøÂçÄ£Ð͵ÄDecoder µÄÖмäÊä³öÄÚÈÝËðʧֵ£¬²ÉÓÃÖð¼¶·Ö²ãÕôÁóµÄ·½·¨£¬×îÖÕÍÆÀíËٶȼÓËٱȴﵽ2±¶£¬¾«¶ÈËðʧBLEUÖµÔڿɽÓÊÜ·¶Î§ÄÚ£¨4%£©¡£

4.2.2 µÍ¾«¶ÈÁ¿»¯

µÍ¾«¶ÈÁ¿»¯¸ü¶àÊÇ´Ó¼ÆËã»úÓ²¼þµÄÉè¼Æ½Ç¶È£¬ÐÞ¸ÄÊý¾ÝÀàÐÍ£¬½µµÍÊý¾Ý¾«¶È£¬´Ó¶ø½øÐмÓËÙ£¬ÒÀÀµÓÚÓ²¼þʵÏÖ¡£Á¿»¯µÄ·½Ê½Ò²°üº¬¶àÖÖ£¬ÑµÁ·ºóÁ¿»¯£¨PTQ post training quantization£©£¬ÑµÁ·Ê±Á¿»¯£¨QAT£¬quantization aware traning£©µÈ¡£

ĿǰÎÒÃÇÓÅ»¯Æ½Ì¨Ö§³Öfloat16ºÍint8£¬ÆäÖÐint8Á¿»¯Ö»Ö§³ÖPTQ·½Ê½£¬Ò»°ãÇé¿öÏ£¬ÎªÁ˱£Ö¤Ä£Ð;«¶È£¬²ÉÓÃint8Á¿»¯ÐèÒª¶ÔÁ¿»¯ºóµÄÄ£ÐÍУ׼£¬Ð£×¼·½Ê½ÊµÏÖÒÀÀµÓÚ¸´ÔÓµÄÊýѧËã·¨£¬Ä¿Ç°½Ï³£ÓõÄÊÇKLÉ¢¶È£¬¶ÔÓÚCVÄ£ÐÍ£¬¾«¶ÈËðʧ¿É½ÓÊÜ¡£¶ÔÓÚ»ùÓÚTransformerµÄNLPÄ£ÐÍ£¬¾«¶ÈËðʧ½Ï´ó£¬ÎÒÃÇĿǰֻ֧³ÖGPUƽ̨µÄfloat16ʵÏÖ¡£Ïà±ÈÓÚfloat32£¬´æ´¢¿Õ¼äºÍ´ø¿í¼õ°ë£¬¾«¶È¼¸ºõÎÞËðʧ£¬ÍÌÍÂÌáÉý¿É´ï3±¶¡£

4.2.3 Ä£ÐͼôÖ¦

¼ôÖ¦µÄÖ÷Ҫ˼ÏëÊǽ«È¨ÖؾØÕóÖÐÏà¶Ô¡°²»ÖØÒª¡±µÄȨֵÌÞ³ý£¬È»ºóÔÙ¶ÔÍøÂç½øÐÐ΢µ÷£»·½·¨¼òµ¥£¬Ñ¹ËõЧ¹û¿É¿Ø£¬µ«ÊÇÔÚ¼ôÖ¦Á£¶ÈºÍ·½·¨Ñ¡ÔñÐèÒªÈÏΪ¶¨Ò广Ôò£¬¶øÇҷǽṹ»¯µÄ¼ô֦Ч¹ûÐèÒªÒÀÀµÓÚÓ²¼þƽ̨ʵÏÖ¡£Ä£ÐͼôÖ¦ÔÚ¼ÆËã»úÊÓ¾õÁìÓò¹ã·ºÊ¹Ó㬲¢È¡µÃÁ˲»´íµÄЧ¹û¡£

ͼ9¾ÙÀýʵÏÖÁËÒ»ÖÖµäÐ͵Ľṹ»¯¼ôÖ¦µÄ·½·¨[4]¡£ÎÒÃÇÕë¶ÔCVÄ£ÐÍ£¬ÔÚԭʼģÐÍÖмÓÈëbatch_normal²ã£¬¶Ôbatch_normalµÄ²Î¿¼ÂÛÎÄ2£ºChannelPruning for Accelerating Very Deep Neural NetworksÂÛÎÄÖÐÌá³öÀûÓÃchannel½øÐмôÖ¦£¬ÊµÑéÈçÏ£ºÔÚ³¬·Ö±æÂʵÄʵÑéÖУ¬¿¼ÂÇÔÚԭʼģÐÍÖмÓÈëbatch_normal²ã£¬È»ºó¶Ôbatch_nomalµÄ¦ÁÖµ×öÕýÔò»¯£¬×îºóÀûÓøÃÖµ×÷ΪÒÀ¾Ý½øÐмôÖ¦£¬¶ÔѵÁ·ºÃµÄÄ£ÐÍÖеÄbatch_normal²ãµÄ²ÎÊý¦Á½øÐзÖÎö£¬Õë¶Ô²»Í¬µÄ¾í»ýÄ£ÐÍÓ¦ÓÃͬÑùµÄ·½Ê½£¬·¢ÏÖÓÐЩģÐÍÓнüÒ»°ëµÄ²ÎÊýÔÚ1e-5ÊýÁ¿¼¶£¬´ËÍâͬһ²ãÖеķֲ¼·½²î¼«Ð¡£¬¾Ý´Ë¶ÔÄ£ÐͽøÐÐͨµÀ¼¶±ðµÄ¼ôÖ¦²¢½øÐÐfine tuneѵÁ·£¬¼ô֦Ч¹ûÃ÷ÏÔ£¬Ä£ÐÍ´óС¼õÉÙµ½Ô­À´µÄ1/4£¬¾«¶È²»±äµÄǰÌáÏ£¬¼ÓËٱȿɴï4±¶¡£¶ø¶ÔÓÚyolov3Ä£ÐÍ£¬´ó²¿·Ö²ÎÊý²îÒì²»´ó£¨MAP½µµÍ2%£©£¬¿É¼ôµôµÄÓÐÏÞ£¬ËùÒÔΪÁ˱£³Ö¾«¶È£¬²ÎÊýÁ¿¼õ°ë£¬¼ÓËÙ±È1.5x×óÓÒ¡£

ͼ9 Ä£Ðͼô֦ʵÀý

4.3 ½Ó¿ÚÉè¼Æ

Ä£ÐÍÓÅ»¯Æ½Ì¨²ÉÓü´²å¼´ÓõÄÄ£¿é»¯Éè¼Æ£¬¿ÉÎÞ·ì¶Ô½ÓÄ£ÐÍѵÁ·Æ½Ì¨£¬Ä£ÐÍ·¢²¼Æ½Ì¨µÈ¡£

1.ѵÁ·Æ½Ì¨µÄµ÷Óúͷ´À¡£ºÎÞ·ì¶Ô½ÓѵÁ·Æ½Ì¨£¬python½Ó¿Úµ÷ÓûòÕßweb·þÎñ½Ó¿Ú£»Èç¹ûÐèÒªÖØÐÂѵÁ·£¬ÏòѵÁ·Æ½Ì¨ÉêÇë½Ó¿Ú£»

2. ÓÅ»¯½á¹ûµÄ½Ó¿ÚÌṩ£ºÖ§³Ö*.pb¸ñʽµÄÄ£ÐÍÊä³ö£»

¾ßÌåʹÓ÷½Ê½Èçͼ10ºÍͼ11Ëùʾ¡£

ͼ10 ¸ßÐÔÄÜËã×Ó¿âµÄµ÷ÓÃ

ͼ11¸ø³öÁËÄ£ÐÍѹËõÄ£¿éµÄµ÷Ó÷½Ê½¡£

ͼ11 Ä£ÐÍѹËõÄ£¿éµ÷ÓÃ

Îå¡¢ÓÅ»¯³É¹û

ÒÔʵ¼ÊÓ¦ÓûúÆ÷·­ÒëµÄTransformerÄ£ÐÍΪÀý£¬Ëù²âÊÔÆ½Ì¨ÎªCPU: Intel(R) Xeon(R) Silver 4210CPU @ 2.20GHz; GPU£ºNvidia T4£¬ÒԹ̶¨ËãÀýµÄƽ¾ùÏìÓ¦ÑÓ³ÙΪ²âÊÔÊý¾Ý£¬ÓÅ»¯ºóºÍÓÅ»¯Ç°µÄ¼ÓËÙ±ÈÈçÏÂͼ12Ëùʾ¡£

ÆäÖУ¬Ô­Ê¼ÐÔÄÜ»ùÓÚtensorflow1.14Ϊ²âÊÔ»ù×¼£¬ÔÚGPUƽ̨¿ò¼Ü²ãÓÅ»¯ºÍ±àÒëÔËÐÐʱµÈ¶à²ãÓÅ»¯ÊµÏÖ£¬Í¼13ÊÇTransformer·­ÒëÄ£ÐÍ»ùÓÚT4ƽ̨ʹÓÃÄ£ÐÍѹËõºÍ¸ßÐÔÄÜËã×Ó¿âÓÅ»¯Ö®ºóµÄ¶Ô±È½á¹û£¬Í¼Öиø³öµÄÊÇtoken³¤¶ÈΪ64£¬²»Í¬batch´óСʱµÄÑÓ³ÙºÍÍÌÍÂÌáÉý±ÈÀý£¬Êµ¼ÊÖÐtokenÔ½´ó£¬float16µÄÓÅÊÆÔ½Ã÷ÏÔ¡£

ͼ12

ͼ13

»ùÓÚCPUÓ²¼þƽ̨£¬Õë¶ÔCVºÍNLPÄ£ÐÍ£¨ÀýÈçyolov3£¬bertºÍalbertµÈ£©£¬Ò²È¡µÃÁ˲»´íµÄÓÅ»¯Ð§¹û£¬ÑÓ³Ù¼ÓËÙ±È×î¸ß´ïµ½5±¶ÒÔÉÏ¡£

Áù¡¢Î´À´Õ¹Íû

AIÓÅ»¯µÄDZÁ¦ºÍÐèÇóºÜ´ó£¬ÒòΪAIÀíÂÛºÍÄ£Ð͵ÄÈÕÒæÍêÉÆ£¬Ó¦Óó¡¾°¶ÔÄ£Ð;«¶ÈµÈÍÆÀí·þÎñÖÊÁ¿µÄ¸ü¸ßÒªÇ󣬱ØÈ»Ê¹µÃÄ£ÐͽṹºÍ¼ÆË㸴ÔÓ¶ÈÔ½À´Ô½¸ß£¬¶ÔÍÆÀí·þÎñµÄÐÔÄÜÐèÇóÖ»»áÓÐÔöÎÞ¼õ¡£´Ó³É±¾ºÍЧÂʶà¸ö½Ç¶È¿¼ÂÇ£¬×Ô¶¯ÓÅ»¯ÊDZØÈ»Ç÷ÊÆ£¬²¢ÇÒÒµ½çÒ²¶¼Â½Ðø¿ªÕ¹ÁËÏà¹ØÑо¿£¬È¡µÃÁËһЩ½øÕ¹¡£

ÒÀ¾É´ÓÁ½·½ÃæÀ´¿´£¬Í¬ÑùÊÇ»ùÓÚ×Ô¶¯»¯ÓÅ»¯Õâ¸ö´ó·½Ïò£¬Ëã×ÓÓÅ»¯µÈϵͳ¼¶ÓÅ»¯×îÖÕ¶¼»áͨ¹ýtvmµÈAI±àÒëÆ÷ʵÏÖ£¬¶øÄ£ÐÍѹËõÔò²àÖØÓÚʹÓÃAutoMLµÄ˼Ï룬»ùÓÚµ±Ç°Æ½Ì¨ºÍʵ¼ÊÐèÇó£¬Í¨¹ý½á¹¹ËÑË÷ÕÒµ½·ûºÏÒªÇóµÄ×î¼ò»¯µÄÍøÂç¡£µ±È»£¬µ±Ç°µÄÕôÁ󣬼ôÖ¦µÈ´«Í³Ñ¹Ëõ·½·¨Ò²¿ÉÒÔ¸úAutoMLµÄ˼ÏëÏà½áºÏ£¬Í¬ÑùÄܹ»¸ßЧµØÊµÏÖѹËõЧ¹û¡£

Òò´Ë£¬ÎÒÃǵÄ×Ô¶¯»¯ÓÅ»¯Æ½Ì¨Ò²ÕýÊÇ»ùÓÚ×Ô¶¯»¯ÓÅ»¯µÄ˼·£¬×ۺϿ¼ÂÇÒµÎñ³¡¾°ÐèÇ󣬲ο¼Òµ½ç¸üÏȽøµÄÓÅ»¯¼¼Êõ£¬ÎªÂÃÓγ¡¾°µÄAIÄ£ÐÍ´øÀ´¸ü¼Ó¸ßЧµÄÓÅ»¯·½°¸£¬Íƶ¯AI¼¼ÊõÔÚÂÃÓÎÒµÎñ¸üºÃÂ䵨¡£

   
1635 ´Îä¯ÀÀ       28
Ïà¹ØÎÄÕÂ

»ùÓÚͼ¾í»ýÍøÂçµÄͼÉî¶Èѧϰ
×Ô¶¯¼ÝÊ»ÖеÄ3DÄ¿±ê¼ì²â
¹¤Òµ»úÆ÷ÈË¿ØÖÆÏµÍ³¼Ü¹¹½éÉÜ
ÏîĿʵս£ºÈçºÎ¹¹½¨ÖªÊ¶Í¼Æ×
 
Ïà¹ØÎĵµ

5GÈ˹¤ÖÇÄÜÎïÁªÍøµÄµäÐÍÓ¦ÓÃ
Éî¶ÈѧϰÔÚ×Ô¶¯¼ÝÊ»ÖеÄÓ¦ÓÃ
ͼÉñ¾­ÍøÂçÔÚ½»²æÑ§¿ÆÁìÓòµÄÓ¦ÓÃÑо¿
ÎÞÈË»úϵͳԭÀí
Ïà¹Ø¿Î³Ì

È˹¤ÖÇÄÜ¡¢»úÆ÷ѧϰ&TensorFlow
»úÆ÷ÈËÈí¼þ¿ª·¢¼¼Êõ
È˹¤ÖÇÄÜ£¬»úÆ÷ѧϰºÍÉî¶Èѧϰ
ͼÏñ´¦ÀíËã·¨·½·¨Óëʵ¼ù
×îл¼Æ»®
DeepSeek´óÄ£ÐÍÓ¦Óÿª·¢ 6-12[ÏÃÃÅ]
È˹¤ÖÇÄÜ.»úÆ÷ѧϰTensorFlow 6-22[Ö±²¥]
»ùÓÚ UML ºÍEA½øÐзÖÎöÉè¼Æ 6-30[±±¾©]
ǶÈëʽÈí¼þ¼Ü¹¹-¸ß¼¶Êµ¼ù 7-9[±±¾©]
Óû§ÌåÑé¡¢Ò×ÓÃÐÔ²âÊÔÓëÆÀ¹À 7-25[Î÷°²]
ͼÊý¾Ý¿âÓë֪ʶͼÆ× 8-23[±±¾©]
 
×îÐÂÎÄÕÂ
¶àÄ¿±ê¸ú×Ù£ºAI²úÆ·¾­ÀíÐèÒªÁ˽âµÄCVͨʶ
Éî¶Èѧϰ¼Ü¹¹
¾í»ýÉñ¾­ÍøÂç֮ǰÏò´«²¥Ëã·¨
´Ó0µ½1´î½¨AIÖÐ̨
¹¤Òµ»úÆ÷ÈË¿ØÖÆÏµÍ³¼Ü¹¹½éÉÜ
×îпγÌ
È˹¤ÖÇÄÜ£¬»úÆ÷ѧϰºÍÉî¶Èѧϰ
È˹¤ÖÇÄÜÓë»úÆ÷ѧϰӦÓÃʵս
È˹¤ÖÇÄÜ-ͼÏñ´¦ÀíºÍʶ±ð
È˹¤ÖÇÄÜ¡¢»úÆ÷ѧϰ& TensorFlow+Keras¿ò¼Üʵ¼ù
È˹¤ÖÇÄÜ+Python£«´óÊý¾Ý
³É¹¦°¸Àý
ij×ÛºÏÐÔ¿ÆÑлú¹¹ È˹¤ÖÇÄÜÓë»úÆ÷ѧϰӦÓÃ
Ä³ÒøÐÐ È˹¤ÖÇÄÜ+Python+´óÊý¾Ý
±±¾© È˹¤ÖÇÄÜ¡¢»úÆ÷ѧϰ& TensorFlow¿ò¼Üʵ¼ù
ijÁìÏÈÊý×ÖµØÍ¼ÌṩÉÌ PythonÊý¾Ý·ÖÎöÓë»úÆ÷ѧϰ
ÖйúÒÆ¶¯ È˹¤ÖÇÄÜ¡¢»úÆ÷ѧϰºÍÉî¶Èѧϰ