Äú¿ÉÒÔ¾èÖú£¬Ö§³ÖÎÒÃǵĹ«ÒæÊÂÒµ¡£

1Ôª 10Ôª 50Ôª





ÈÏÖ¤Â룺  ÑéÖ¤Âë,¿´²»Çå³þ?Çëµã»÷Ë¢ÐÂÑéÖ¤Âë ±ØÌî



  ÇóÖª ÎÄÕ ÎÄ¿â Lib ÊÓÆµ iPerson ¿Î³Ì ÈÏÖ¤ ×Éѯ ¹¤¾ß ½²×ù Model Center   Code  
»áÔ±   
   
 
     
   
 ¶©ÔÄ
  ¾èÖú
Spark¼¼ÊõÔÚ¾©¶«ÖÇÄܹ©Ó¦Á´Ô¤²âµÄÓ¦ÓÃ
 
À´Ô´£º InfoQ ·¢²¼ÓÚ£º2017-9-8
  2175  次浏览      28
 

1. ±³¾°

ǰ¶Îʱ¼ä¾©¶«¹«¿ªÁËÃæÏòµÚ¶þ¸öÊ®¶þÄêµÄÕ½ÂԹ滮£¬±íʾ¾©¶«½«È«Ãæ×ßÏò¼¼Êõ»¯£¬´óÁ¦·¢Õ¹È˹¤ÖÇÄܺͻúÆ÷ÈË×Ô¶¯»¯¼¼Êõ£¬½«¹ýÈ¥´«Í³·½Ê½¹¹ÖþµÄÓÅÊÆÈ«ÃæÉý¼¶¡£¾©¶«YÊÂÒµ²¿Ë³ÊƳÉÁ¢£¬¸ÃÊÂÒµ²¿½«ÒÔ·þÎñ·ºÁãÊÛΪºËÐÄ£¬×ÅÖØÖÇÄܹ©Ó¦ÄÜÁ¦µÄ´òÔ죬ºËÐÄʹÃüÊÇÀûÓÃÈ˹¤ÖÇÄܼ¼ÊõÀ´Çý¶¯ÁãÊÛ¸ïС£

1.1 ¾©¶«µÄ¹©Ó¦Á´

¾©¶«Ò»Ö±ÖÂÁ¦ÓÚͨ¹ý»¥ÁªÍøµçÉ̽¨Á¢ÐèÇó²àÓ빩¸ø²àµÄ¾«×¼¡¢¸ßЧƥÅ䣬¹©Ó¦Á´¹ÜÀíÊÇÁãÊÛÁªµ÷ÖеĺËÐÄÄÜÁ¦£¬ÊÇÁãÊÛÆ½Ì¨ÄÜÁ¦µÄ¹Ø¼üÌåÏÖ£¬Ò²Êǹ©Ó¦ÉÌÓ뾩¶«½ôÃܺÏ×÷µÄŦ´ø£¬¸üÊÇδÀ´¾©¶«ÖÇÄÜ»¯ÉÌÒµÌå²¼¾ÖÖеĺËÐÄ»·½Ú¡£

Ŀǰ¾©¶«ÔÚÈ«¹ú·¶Î§ÄÚµÄÔËÓª256¸ö´óÐͲֿ⣬°´¹¦Äܿɻ®·ÖΪRDC¡¢FDC¡¢´ó¼þÖÐÐIJ֡¢´ó¼þÎÀÐDz֡¢Í¼Êé²ÖºÍ³ÇÊвֵȵȡ£RDC£¨Regional Distribution Center£©¼´ÇøÓò·Ö·¢ÖÐÐÄ£¬¿ÉÀí½âΪһ¼¶²Ö¿â£¬Ïò¹©»õÉ̲ɹºµÄÉÌÆ·»áÓÅÏÈËÍÍùÕâÀһ°ãÉèÖÃÔÚÖÐÐijÇÊУ¬¸²¸Ç·¶Î§´ó¡£FDC£¨Forward Distribution Center£©¼´ÇøÓòÔËתÖÐÐÄ£¬¿ÉÀí½âΪ¶þ¼¶²Ö¿â£¬¸²¸ÇһЩÖС¢Ð¡ÐͳÇÊм°±ßÔ¶µØÇø£¬Í¨³£»á¸ù¾ÝÐèÇó½«ÉÌÆ·´ÓRDCµ÷Åä¹ýÀ´¡£

½áºÏÈ˹¤ÖÇÄÜ¡¢´óÊý¾ÝµÈ¼¼Êõ£¬¾©¶«Ê×ÏÈ´Ó¹©»õÉÌÄÇÀïºÏÀí²É¹º¶¨Á¿µÄÉÌÆ·µ½RDC£¬ÔÙ¸ù¾Ýʵ¼ÊÐèÇóµ÷Åäµ½FDC£¬È»ºóÔËÍùÀë¿Í»§×î½üµÄÅäËÍÕ¾£¬×îºó¿ìµÝÔ±½«ÉÌÆ·´øµ½¿Í»§ÊÖÖС£ÕâÖ»ÊǾ©¶«¹©Ó¦Á´ÌåϵÖÐÒ»¸öÆÕͨµÄ³¡¾°£¬µ«ÕýÒòΪÓÐÕâÑùµÄÌåϵ£¬Ê¹µÃ¾©¶«¶ÔÓû§µÄÏìÓ¦ËÙ¶È´ó´óÌá¸ß£¬Óû§ÌåÑé´ó´óÌáÉý¡£

1.2 ¾©¶«¹©Ó¦Á´ÓÅ»¯

Óû§ÌåÑéÌáÉýµÄͬʱҲ°éËæ×Å´óÁ¿×ʽðµÄͶÈëºÍ³É±¾µÄÌá¸ß£¬³É±¾±ØÐëµÃµ½¿ØÖÆ£¬Õû¸öÌåϵ²ÅÄÜ·¢»Ó³ö×î´óµÄ¼ÛÖµ£¬ÓÚÊǶԹ©Ó¦Á´µÄÓÅ»¯¾ÍÏÔµÃÖÁ¹ØÖØÒªÁË¡£

¾©¶«×Ô´ò½¨Á¢¹©Ó¦Á¬ÌåϵµÄÄÇÒ»ÌìÆð£¬¾Í²»¶ÏµØ½øÐиĽøºÍÓÅ»¯£¬²¢ÇÒŬÁ¦ÉîÈëµ½¹©Ó¦Á´µÄÿһ¸ö»·½Ú¡£ÓÅ»¯ÆäʵÊÇÒ»ÃÅÔ˳ïѧÎÊÌ⣬Ð迼ÂÇÔÚ¸÷ÖÖ¾ö²ßÄ¿±êÖ®¼äÈçºÎƽºâÒÔ´ïµ½×î´óÊÕÒæ£¬ÔÚÕâ¸ö¹ý³ÌÖÐÐèÒª¿¼ÂǺܶàÎÊÌ⣬°ÑÕâЩ¿¼ÂÇÇå³þ£¬ÎÊÌâ¾ÍÈÝÒ×½â¾öÁË¡£¾Ù¼¸¸ö¼òµ¥µÄÀý×Ó£º

  • ÉÌÆ·²¹»õ£º¿¼ÂÇÔÚʲôʱ¼ä£¬¸øÄĸöRDC²É¹ºÊ²Ã´ÉÌÆ·£¬²É¹ºÁ¿ÊǶàÉÙ£¿
  • ÉÌÆ·µ÷²¦£º¿¼ÂÇÔÚʲôʱ¼ä£¬¸øÄĸöFDCµ÷ÅäʲôÉÌÆ·£¬µ÷ÅäÁ¿ÊǶàÉÙ£¿
  • ²Ö´¢ÔËÓª£ºÔÚ´ó´ÙÀ´ÁÙÖ®¼Ê£¬²Ö¿âºÍÅäËÍÕ¾ÒªÔöÅä¶àÉÙÈËÊÖ¡¢¶àÉÙÁ¾»õ³µ£¿

ËäÈ»¿´ÉÏÈ¥ÕâЩÎÊÌâ¶¼ºÜÈÝÒ׻ش𣬵«×ÐϸÏëÏëÈ´ÓÖºÜÄѸø³ö´ð°¸£¬Ô­Òò¾ÍÔÚÓÚÏëÒª×öµ½¾«È·²»ÊÇÄÇôÈÝÒ×µÄÊÂÇ飬¾ÍÄò¹»õÀ´Ëµ£¬²¹µÄÌ«¶à»áÔö¼Ó¿â´æ³É±¾£¬²¹µÄÌ«ÉÙ»áÔö¼Óȱ»õ³É±¾£¬Ö»ÓкÏÀíµÄ²¹»õÁ¿²ÅÄÜ×öµ½³É±¾×îµÍ¡£

1.3 Ô¤²â¼¼ÊõÔÚ¾©¶«¹©Ó¦Á´µÄ×÷ÓÃ

½èÖú»úÆ÷ѧϰ¡¢´óÊý¾ÝµÈÏà¹Ø¼¼Êõ£¬¾©¶«Ôںܶ๩ӦÁ´ÓÅ»¯ÎÊÌâÉ϶¼ÒѾ­ÊµÏÖϵͳ»¯£¬ÓÉϵͳ×Ô¶¯¸ø³öÓÅ»¯½¨Ò飬²¢ÓëÉú²úϵͳÏàÁ¬½Ó£¬ÊµÏÖÈ«Á÷³Ì×Ô¶¯»¯¡£ÔÚÕâÀïÓÐÒ»Ïî¼¼ÊõÆð×ÅÖÁ¹ØÖØÒªµÄµÍ²ãÖ§³Å×÷ÓÃ--Ô¤²â¼¼Êõ¡£¾Ý´ÖÂÔ¹ÀË㣬1%µÄÔ¤²â׼ȷ¶ÈµÄÌáÉý¿ÉÒÔ½ÚÔ¼Êý±¶µÄÔËÓª³É±¾¡£

ÔõÑùÀí½âÔ¤²âÔÚ¹©Ó¦Á´ÓÅ»¯ÖеÄ×÷ÓÃÄØÄÃÉÌÆ·²¹»õ¾ÙÀý£¬Ò»¼Ò¹«Ë¾ÎªÁ˱£Ö¤¿â·¿²»È±»õ£¬¿ÉÄÜ»áÆµ·±µÄ´Ó¹©»õÉÌÄÇÀï²¹³ä´óÁ¿ÉÌÆ·£¬ÕâÑù×öËäÈ»²»»áȱ»õ£¬µ«¿ÉÄÜ»áÔì³É¸ü¶àÂô²»³öÈ¥µÄÉÌÆ·»ýѹÔÚ²Ö¿âÖУ¬´Ó¶øÊ¹ÉÌÆ·µÄÖÜתÂʽµµÍ£¬¿â´æ³É±¾Ôö¼Ó¡£·´Ö®£¬Õâ¼Ò¹«Ë¾ÓпÉÄÜΪÁË×·ÇóÁã¿â´æ¶ø²¹ºÜÉÙµÄÉÌÆ·£¬µ«Õâ¾Í¿ÉÄܳöÏÖÑÏÖØµÄȱ»õÎÊÌ⣬´Ó¶øÊ¹ÏÖ»õÂʽµµÍ£¬ÑÏÖØÓ°ÏìÓû§ÌåÑ飬ȱ»õ³É±¾Ôö¼Ó¡£ÓÚÊÇÎÊÌâ¾ÍÀ´ÁË£¬Òª²¹¶àÉÙÉÌÆ·²ÅºÏÊÊ£¬Ê²Ã´Ê±¼ä²¹»õ£¬Õâ¾ÍÐèҪȨºâ¿¼ÂÇÁË£¬×îÖÕÄ¿µÄÊÇҪʹ¿â´æ³É±¾ºÍȱ»õ³É±¾´ïµ½Ò»¸öƽºâ¡£

¿¼ÂÇһϼ«¶ËÇé¿ö£¬µÈ¿â´æ½µµ½ÁãʱÔÙÈ¥²¹»õ£¬Õâʱ¹©»õÉ̽ӵ½²¹»õ֪ͨºó½«»õÎïÔËÍù²Ö¿â¡£µ«ÊÇÕâô×öÓиöÎÊÌ⣬ÒòΪÔËË͹ý³ÌÐèҪʱ¼ä£¬Õâ¶Îʱ¼ä¿â·¿¾Íȱ»õÁË¡£ÄÇÔõô°ìÄØ¾ÍÊÇÀûÓÃÔ¤²â¼¼Êõ¡£ÀûÓÃÔ¤²âÎÒÃÇ¿ÉÒÔ¼ÆËã³öδÀ´ÉÌÆ·ÔÚ;µÄÕâ¶Îʱ¼äÀïÏúÁ¿´ó¸ÅÊǶàÉÙ£¬È»ºóÎÒÃÇÈòֿⱣ֤Õâ¸öÁ¿£¬µÍÓÚÕâ¸öÁ¿¾Í¸ø¹©»õÉÌÏ´ﲹ»õ֪ͨ£¬ÓÚÊÇÎÊÌâµÃÒÔ½â¾ö¡£×ܶøÑÔÖ®£¬Ô¤²â¼¼ÊõÔÚÕâÀï·¢»ÓÁËÖØÒªµÄ×÷Ó㬳ÉΪ¹Ø¼üµÄÒ»¸ö»·¡£

2. ¾©¶«Ô¤²âϵͳ

2.1 Ô¤²âϵͳ½éÉÜ

Ô¤²âϵͳÔÚÕû¸ö¹©Ó¦Á´ÌåϵÖд¦ÔÚ×îµ×²ã²¢ÇÒÆðµ½Ò»¸öÖ§³ÅµÄ×÷Óã¬Ö§³ÖÉϲãµÄ¶à¸ö¾ö²ßÓÅ»¯ÏµÍ³£¬¶øÕâЩ¾ö²ßÓÅ»¯ÏµÍ³ÀûÓþ«×¼µÄÔ¤²âÊý¾Ý½áºÏÔ˳ïѧ¼¼ÊõµÃ³ö×îÓŵľö²ß£¬²¢½«½á¹ûÌṩ¸ø¸üÉϲãµÄÒµÎñÖ´ÐÐϵͳ»òÊÇÒµÎñ·½Ö±½ÓʹÓá£

Ŀǰ£¬Ô¤²âϵͳÖ÷ÒªÖ§³ÖÈý´óÒµÎñ£ºÏúÁ¿Ô¤²â¡¢µ¥Á¿Ô¤²âºÍGMVÔ¤²â¡£ÆäÖÐÏúÁ¿Ô¤²âÖ÷ÒªÖ§³ÖÉÌÆ·²¹»õ¡¢ÉÌÆ·µ÷²¦£»µ¥Á¿Ô¤²âÖ÷ÒªÖ§³Ö²Ö¿â¡¢Õ¾µãµÄÔËÓª¹ÜÀí£»GMVÔ¤²âÖ÷ÒªÖ§³ÖÏúÊÛ²¿Ãżƻ®µÄ¶¨ÖÆ¡£

ÏúÁ¿Ô¤²â°´ÕÕ²»Í¬Î¬¶ÈÓÖ¿ÉÒÔ·ÖΪRDC²É¹ºÔ¤²â¡¢FDCµ÷²¦Ô¤²â¡¢³ÇÊвֵ÷²¦Ô¤²â¡¢´ó½¨²Ö²¹»õÔ¤²â¡¢È«Çò¹ºÏúÁ¿Ô¤²âºÍͼÊé´ÙÏúÔ¤²âµÈ£»µ¥Á¿Ô¤²âÓÖ¿É·ÖΪ¿â·¿µ¥Á¿Ô¤²â¡¢ÅäËÍÖÐÐĵ¥Á¿Ô¤²âºÍÅäËÍÕ¾µ¥Á¿Ô¤²âµÈ£¨ÔÚÕâÀï¡°µ¥Á¿¡±²¢·ÇÖ¸Óû§Ëù϶©µ¥µÄÁ¿£¬¶øÊǽ«¶©µ¥²ðµ¥ºóÁ÷תµ½²Ö¿âÖеĵ¥Á¿¡£ÀýÈçÒ»¸öÓû§µÄ¶©µ¥ÖаüÀ¨3¼þÎïÆ·£¬ÆäÖÐÁ½¸ö´ó¼þÆ·ºÍÒ»¸öС¼þÆ·£¬ÔÚ¾©¶«µÄ¹©Ó¦Á´»·½ÚÖпÉÄܻὫÆäÖÐÁ½¸ö´ó¼þÆ·×é³ÉÒ»¸öµ¥Í¶·Åµ½´ó¼þ²ÖÖУ¬¶ø½«ÄǸöС¼þµ¥¶ÀÒ»¸öµ¥Í¶·Åµ½Ð¡¼þ²ÖÖУ¬µ¥Á¿Ö¸µÄÊDz𵥺óµÄÁ¿£©£»GMVÔ¤²âÖ§³Öµ½ÉÌÆ·Á£¶È¡£

2.2 Ô¤²âϵͳ¼Ü¹¹

ÕûÌå¼Ü¹¹´ÓÉÏÖÁÏÂÒÀ´ÎÊÇ£ºÊý¾ÝÔ´ÊäÈë²ã¡¢»ù´¡Êý¾Ý¼Ó¹¤²ã¡¢ºËÐÄÒµÎñ²ã¡¢Êý¾ÝÊä³ö²ãºÍÏÂÓÎϵͳ¡£Ê×ÏÈ´ÓÍⲿÊý¾ÝÔ´»ñÈ¡ÎÒÃÇËùÐèµÄÒµÎñÊý¾Ý£¬È»ºó¶Ô»ù´¡Êý¾Ý½øÐмӹ¤ÇåÏ´£¬ÔÙͨ¹ýʱ¼äÐòÁС¢»úÆ÷ѧϰµÈÈ˹¤ÖÇÄܼ¼Êõ¶ÔÊý¾Ý½øÐд¦Àí·ÖÎö£¬×îºó¼ÆËã³öÔ¤²â½á¹û²¢Í¨¹ý¶àÖÖ;¾¶ÍÆË͸øÏÂÓÎϵͳʹÓá£

  • Êý¾ÝÔ´ÊäÈë²ã£º¾©¶«Êý¾Ý²Ö¿âÖд洢×ÅÎÒÃÇÐèÒªµÄ´ó²¿·ÖÒµÎñÊý¾Ý£¬ÀýÈç¶©µ¥ÐÅÏ¢¡¢ÉÌÆ·ÐÅÏ¢¡¢¿â´æÐÅÏ¢µÈµÈ¡£¶ø¶ÔÓÚ´ÙÏú¼Æ»®Êý¾ÝÔò´ó²¿·ÖÀ´×ÔÓÚ²ÉÏúÈËԱͨ¹ýWebϵͳ¼ÈëµÄÐÅÏ¢¡£³ý´ËÖ®Í⻹ÓÐһС²¿·ÖÊý¾Ýͨ¹ýÎı¾ÐÎʽֱ½ÓÉÏ´«µ½HDFSÖС£
  • »ù´¡Êý¾Ý¼Ó¹¤²ã£ºÔÚÕâÒ»²ãÖ÷Ҫͨ¹ýHive¶Ô»ù´¡Êý¾Ý½øÐÐһЩ¼Ó¹¤ÇåÏ´£¬È¥µô²»ÐèÒªµÄ×ֶΣ¬¹ýÂ˲»ÐèÒªµÄά¶È²¢ÇåÏ´ÓÐÎÊÌâµÄÊý¾Ý¡£
  • ºËÐÄÒµÎñ²ã£ºÕâ²ãÊÇϵͳµÄµÄºËÐIJ¿·Ö£¬ºáÏò¿´ÓÖ¿É·ÖΪÈý²ã£ºÌØÕ÷¹¹½¨¡¢Ô¤²âËã·¨ºÍÔ¤²â½á¹û¼Ó¹¤¡£×ÝÏò¿´ÊÇÓɶàÌõÒµÎñÏß×é³É£¬±Ë´ËÖ®¼ä²»·¢ÉúÈκν»¼¯¡£

    • ÌØÕ÷¹¹½¨£º½«Ö®Ç°ÇåÏ´¹ýµÄ»ù´¡Êý¾Ýͨ¹ý½üÒ»²½µÄ´¦Àíת»¯³É±ê×¼¸ñʽµÄÌØÕ÷Êý¾Ý£¬Ìṩ¸øºóÐøË㷨ģÐÍʹÓá£
    • ºËÐÄËã·¨£ºÀûÓÃʱ¼äÐòÁзÖÎö¡¢»úÆ÷ѧϰµÈÈ˹¤ÖÇÄܼ¼Êõ½øÐÐÏúÁ¿¡¢µ¥Á¿µÄÔ¤²â£¬ÊÇÔ¤²âϵͳÖÐ×îΪºËÐĵIJ¿·Ö¡£
    • Ô¤²â½á¹û¼Ó¹¤£ºÔ¤²â½á¹û¿ÉÄÜÔÚ¸ñʽºÍÒ»Ð©ÌØÊâÐÔÒªÇóÉϲ»ÄÜÂú×ãÏÂÓÎϵͳ£¬ËùÒÔ»¹ÐèÒª¸ù¾Ýʵ¼ÊÇé¿ö¶ÔÆä½øÐмӹ¤´¦Àí£¬±ÈÈçÔö¼Ó±ê×¼²î¡¢´ÙÏú±êʶµÈ¶îÍâÐÅÏ¢¡£
  • Ô¤²â½á¹ûÊä³ö²ã£º½«×îÖÕÔ¤²â½á¹ûͬ²½»Ø¾©¶«Êý¾Ý²Ö¿â¡¢MySql¡¢HBase»òÖÆ×÷³ÉJSF½Ó¿Ú¹©ÆäËûϵͳԶ³Ìµ÷Óá£
  • ÏÂÓÎϵͳ£º°üÀ¨ÏÂÓÎÈÎÎñÁ÷³Ì¡¢ÏÂÓÎWebϵͳºÍÆäËûϵͳ¡£

3. Ô¤²âϵͳºËÐĽéÉÜ

3.1 Ô¤²âϵͳºËÐIJ㼼ÊõÑ¡ÐÍ

Ô¤²âϵͳºËÐIJ㼼ÊõÖ÷Òª·ÖΪËIJ㣺»ù´¡²ã¡¢¿ò¼Ü²ã¡¢¹¤¾ß²ãºÍËã·¨²ã

»ù´¡²ã£º

HDFSÓÃÀ´×öÊý¾Ý´æ´¢£¬YarnÓÃÀ´×ö×ÊÔ´µ÷¶È£¬BDP£¨Big Data Platform£©ÊǾ©¶«×Ô¼ºÑз¢µÄ´óÊý¾Ýƽ̨£¬ÎÒÃÇÖ÷ÒªÓÃËüÀ´×öÈÎÎñµ÷¶È¡£

¿ò¼Ü²ã£º

ÒÔSpark RDD¡¢Spark SQL¡¢HiveΪÖ÷£¬ MapReduce³ÌÐòռһС²¿·Ö£¬ÊÇÔ­ÏÈÒÅÁôÏÂÀ´µÄ£¬Ä¿Ç°ÕýÖð²½Ìæ»»³ÉSpark RDD¡£ Ñ¡ÔñSpark³ýÁ˶ÔÐÔÄܵĿ¼ÂÇÍ⣬»¹¿¼ÂÇÁËSpark³ÌÐò¿ª·¢µÄ¸ßЧÂÊ¡¢¶àÓïÑÔÌØÐÔÒÔ¼°¶Ô»úÆ÷ѧϰËã·¨µÄÖ§³Ö¡£ÔÚSpark¿ª·¢ÓïÑÔÉÏÎÒÃÇÑ¡ÔñÁËPython£¬Ô­ÒòÓÐÒÔÏÂÈýµã£º

  • PythonÓкܶ಻´íµÄ»úÆ÷ѧϰËã·¨°ü¿ÉÒÔʹÓã¬±ÈÆðSparkµÄMLlib£¬Ëã·¨µÄ׼ȷ¶È¸ü¸ß¡£ÎÒÃÇÓÃGBDT×ö¹ý¶Ô±È£¬·¢ÏÖxgboost±ÈMLlibÀïÃæÌṩµÄÌáÉýÊ÷Ä£ÐÍÔ¤²â׼ȷ¶È¸ß³ö´ó¸Å5%~10%¡£ËäȻֱ½ÓʹÓÃSpark×Ô´øµÄ»úÆ÷ѧϰ¿ò¼Ü»á½ÚÊ¡ÎÒÃǵĿª·¢³É±¾£¬µ«Ô¤²â׼ȷ¶È¶ÔÓÚÎÒÃÇÀ´ËµÖÁ¹ØÖØÒª£¬Ã¿ÌáÉý1%µÄ׼ȷ¶È£¬¾Í¿ÉÄÜ»á´øÀ´³É±¾µÄ³É±¶½µµÍ¡£
  • ÎÒÃǵÄÍŶÓÖаüÀ¨¿ª·¢¹¤³ÌʦºÍËã·¨¹¤³Ìʦ£¬¶ÔÓÚËã·¨¹¤³Ìʦ¶øÑÔËûÃǸüÉó¤Ê¹ÓÃPython½øÐÐÊý¾Ý·ÖÎö£¬Ê¹ÓÃJava»òScala»áÓв»Ð¡µÄѧϰ³É±¾¡£
  • ¶Ô±ÈÆäËûÓïÑÔ£¬ÎÒÃÇ·¢ÏÖʹÓÃPythonµÄ¿ª·¢Ð§ÂÊÊÇ×î¸ßµÄ£¬²¢ÇÒ¶ÔÓÚÒ»¸öÐÂÈË£¬Ñ§Ï°Python±ÈѧϰÆäËûÓïÑÔ¸ü¼ÓÈÝÒס£

¹¤¾ß²ã£º

Ò»·½ÃæÎÒÃÇ»á½áºÏ×ÔÉíÒµÎñÓÐÕë¶ÔÐԵĿª·¢Ò»Ð©Ëã·¨£¬ÁíÒ»·½ÃæÎÒÃÇ»áÖ±½ÓʹÓÃÒµ½ç±È½Ï³ÉÊìµÄËã·¨ºÍÄ£ÐÍ£¬ÕâЩËã·¨¶¼·â×°ÔÚµÚÈý·½Python°üÖС£ÎÒÃDZȽϳ£ÓõİüÓÐxgboost¡¢numpy¡¢pandas¡¢sklearn¡¢scipyºÍhyperoptµÈ¡£

Xgboost£ºËüÊÇGradient Boosting MachineµÄÒ»¸öC++ʵÏÖ£¬xgboost×î´óµÄÌØµãÔÚÓÚ£¬ËüÄܹ»×Ô¶¯ÀûÓÃCPUµÄ¶àÏ߳̽øÐв¢ÐУ¬Í¬Ê±ÔÚËã·¨ÉϼÓÒԸĽøÌá¸ßÁ˾«¶È¡£

numpy£ºÊÇPythonµÄÒ»ÖÖ¿ªÔ´µÄÊýÖµ¼ÆËãÀ©Õ¹¡£ÕâÖÖ¹¤¾ß¿ÉÓÃÀ´´æ´¢ºÍ´¦Àí´óÐ;ØÕ󣬱ÈPython×ÔÉíµÄǶÌ×Áбí½á¹¹Òª¸ßЧµÄ¶à£¨¸Ã½á¹¹Ò²¿ÉÒÔÓÃÀ´±íʾ¾ØÕ󣩡£

pandas£ºÊÇ»ùÓÚNumPy µÄÒ»ÖÖ¹¤¾ß£¬¸Ã¹¤¾ßÊÇΪÁ˽â¾öÊý¾Ý·ÖÎöÈÎÎñ¶ø´´½¨µÄ¡£Pandas ÄÉÈëÁË´óÁ¿¿âºÍһЩ±ê×¼µÄÊý¾ÝÄ£ÐÍ£¬ÌṩÁ˸ßЧµØ²Ù×÷´óÐÍÊý¾Ý¼¯ËùÐèµÄ¹¤¾ß¡£

sklearn£ºÊÇPythonÖØÒªµÄ»úÆ÷ѧϰ¿â£¬Ö§³Ö°üÀ¨·ÖÀà¡¢»Ø¹é¡¢½µÎ¬ºÍ¾ÛÀàËÄ´ó»úÆ÷ѧϰËã·¨¡£»¹°üº¬ÁËÌØÕ÷ÌáÈ¡¡¢Êý¾Ý´¦ÀíºÍÄ£ÐÍÆÀ¹ÀÈý´óÄ£¿é¡£

scipy£ºÊÇÔÚNumPy¿âµÄ»ù´¡ÉÏÔö¼ÓÁËÖÚ¶àµÄÊýѧ¡¢¿ÆÑ§ÒÔ¼°¹¤³Ì¼ÆËãÖг£ÓõĿ⺯Êý¡£ÀýÈçÏßÐÔ´úÊý¡¢³£Î¢·Ö·½³ÌÊýÖµÇó½â¡¢ÐźŴ¦Àí¡¢Í¼Ïñ´¦ÀíºÍÏ¡Êè¾ØÕóµÈµÈ¡£

Ëã·¨²ã£º

ÎÒÃÇÓõ½µÄË㷨ģÐͷdz£¶à£¬Ô­ÒòÊǾ©¶«µÄÉÌÆ·Æ·ÀàÆëÈ«¡¢ÒµÎñ¸´ÔÓ£¬ÐèÒª¸ù¾Ý²»Í¬µÄÇé¿ö²ÉÓò»Í¬µÄË㷨ģÐÍ¡£ÎÒÃÇÓÐÒ»¸ö¶ÀÁ¢µÄϵͳÀ´ÎªË㷨ģÐÍÓëÉÌÆ·Ö®¼ä½¨Á¢Æ¥Åä¹ØÏµ£¬ÓÐЩ±È½Ï¸´ÔÓµÄÔ¤²âÒµÎñ»¹ÐèҪʹÓöà¸öÄ£ÐÍ¡£ÎÒÃÇʹÓõÄËã·¨×ÜÌåÉÏ¿ÉÒÔ·ÖΪÈýÀࣺʱ¼äÐòÁС¢»úÆ÷ѧϰºÍ½áºÏÒµÎñ¿ª·¢µÄһЩ¶ÀÓеÄËã·¨¡£

1. »úÆ÷ѧϰËã·¨Ö÷Òª°üÀ¨GBDT¡¢LASSOºÍRNN £º

GBDT£ºÊÇÒ»ÖÖµü´úµÄ¾ö²ßÊ÷Ëã·¨£¬¸ÃËã·¨Óɶà¿Ã¾ö²ßÊ÷×é³É£¬ËùÓÐÊ÷µÄ½áÂÛÀÛ¼ÓÆðÀ´×ö×îÖմ𰸡£ÎÒÃÇÓÃËüÀ´Ô¤²â¸ßÏúÁ¿£¬µ«ÀúÊ·¹æÂɲ»Ã÷ÏÔµÄÉÌÆ·¡£

RNN£ºÕâÖÖÍøÂçµÄÄÚ²¿×´Ì¬¿ÉÒÔչʾ¶¯Ì¬Ê±ÐòÐÐΪ¡£²»Í¬ÓÚǰÀ¡Éñ¾­ÍøÂçµÄÊÇ£¬RNN¿ÉÒÔÀûÓÃËüÄÚ²¿µÄ¼ÇÒäÀ´´¦ÀíÈÎÒâʱÐòµÄÊäÈëÐòÁУ¬ÕâÈÃËü¿ÉÒÔ¸üÈÝÒ×´¦ÀíÈçʱÐòÔ¤²â¡¢ÓïÒôʶ±ðµÈ¡£

LASSO£º¸Ã·½·¨ÊÇÒ»ÖÖѹËõ¹À¼Æ¡£Ëüͨ¹ý¹¹ÔìÒ»¸ö·£º¯ÊýµÃµ½Ò»¸ö½ÏΪ¾«Á¶µÄÄ£ÐÍ£¬Ê¹µÃËüѹËõһЩϵÊý£¬Í¬Ê±É趨һЩϵÊýΪÁã¡£Òò´Ë±£ÁôÁË×Ó¼¯ÊÕËõµÄÓŵ㣬ÊÇÒ»ÖÖ´¦Àí¾ßÓи´¹²ÏßÐÔÊý¾ÝµÄÓÐÆ«¹À¼Æ¡£ÓÃÀ´Ô¤²âµÍÏúÁ¿£¬ÀúÊ·Êý¾ÝƽÎȵÄÉÌÆ·Ð§¹û½ÏºÃ¡£

2. ʱ¼äÐòÁÐÖ÷Òª°üÀ¨ARIMAºÍHolt winters £º

ARIMA£ºÈ«³ÆÎª×Իعé»ý·Ö»¬¶¯Æ½¾ùÄ£ÐÍ£¬ÓÚ70Äê´ú³õÌá³öµÄÒ»¸öÖøÃûʱ¼äÐòÁÐÔ¤²â·½·¨£¬ÎÒÃÇÓÃËüÀ´Ö÷ÒªÔ¤²âÀàËÆ¿â·¿µ¥Á¿ÕâÖÖÆ½ÎȵÄÐòÁС£

Holt winters£ºÓÖ³ÆÈý´ÎÖ¸Êýƽ»¬Ëã·¨£¬Ò²ÊÇÒ»¸ö¾­µäµÄʱ¼äÐòÁÐËã·¨£¬ÎÒÃÇÓÃËüÀ´Ô¤²â¼¾½ÚÐÔºÍÇ÷ÊÆ¶¼ºÜÃ÷ÏÔµÄÉÌÆ·¡£

3. ½áºÏÒµÎñ¿ª·¢µÄ¶ÀÓÐËã·¨°üÀ¨WMAStockDT¡¢SimilarityModelºÍNewProductµÈ£º

WMAStockDT£º¿â´æ¾ö²ßÊ÷Ä£ÐÍ£¬ÓÃÀ´Ô¤²âÊÜ¿â´æ×´Ì¬Ó°Ïì½Ï´óµÄÉÌÆ·¡£

SimilarityModel£ºÏàËÆÆ·Ä£ÐÍ£¬Ê¹ÓÃÖ¸¶¨µÄͬÀàÆ·Êý¾ÝÀ´Ô¤²âijÉÌÆ·Î´À´ÏúÁ¿¡£

NewProduct£ºÐÂÆ·Ä£ÐÍ£¬¹ËÃû˼Òå¾ÍÊÇÓÃÀ´Ô¤²âÐÂÆ·µÄÏúÁ¿¡£

3.2 Ô¤²âϵͳºËÐÄÁ÷³Ì

Ô¤²âºËÐÄÁ÷³ÌÖ÷Òª°üÀ¨Á½ÀࣺÒÔ»úÆ÷ѧϰË㷨ΪÖ÷µÄÁ÷³ÌºÍÒÔʱ¼äÐòÁзÖÎöΪÖ÷µÄÁ÷³Ì¡£

1. ÒÔ»úÆ÷ѧϰË㷨ΪÖ÷µÄÁ÷³ÌÈçÏ£º

ÌØÕ÷¹¹½¨£ºÍ¨¹ýÊý¾Ý·ÖÎö¡¢Ä£ÐÍÊÔÑéÈ·¶¨Ö÷ÒªÌØÕ÷£¬Í¨¹ýһϵÁÐÈÎÎñÉú³É±ê×¼¸ñʽµÄÌØÕ÷Êý¾Ý¡£

Ä£ÐÍÑ¡Ôñ£º²»Í¬µÄÉÌÆ·Óв»Í¬µÄÌØÐÔ£¬ËùÒÔÊ×ÏÈ»á¸ù¾ÝÉÌÆ·µÄÏúÁ¿¸ßµÍ¡¢ÐÂÆ·¾ÉÆ·¡¢¼Ù½ÚÈÕÃô¸ÐÐÔµÈÒòËØ·ÖÅ䲻ͬµÄË㷨ģÐÍ¡£

ÌØÕ÷Ñ¡Ôñ£º¶ÔÒ»ÅúÌØÕ÷½øÐÐɸѡ¹ýÂ˲»ÐèÒªµÄÌØÕ÷£¬²»Í¬ÀàÐ͵ÄÉÌÆ·ÌØÕ÷²»Í¬¡£

Ñù±¾·ÖÇø£º¶ÔѵÁ·Êý¾Ý½øÐзÖ×飬·Ö³É¶à×éÑù±¾£¬ÕæÕýѵÁ·Ê±Õë¶Ôÿ×éÑù±¾Éú³ÉÒ»¸öÄ£ÐÍÎļþ¡£Ò»°ãÊÇͬÀàÐÍÉÌÆ·±»·Ö³ÉÒ»×飬±ÈÈç°´Æ·Ààά¶È·Ö×飬ÕâÑù×öÊÇ¿¼ÂDz¢Ðл¯ÒÔ¼°Ä£Ð͵Ä׼ȷÐÔ¡£

Ä£ÐͲÎÊý£ºÑ¡Ôñ×îÓŵÄÄ£ÐͲÎÊý£¬ºÏÊʵIJÎÊý½«Ìá¸ßÄ£Ð͵Ä׼ȷ¶È£¬ÒòΪÐèÒª¶Ô²»Í¬µÄ²ÎÊý×éºÏ·Ö±ð½øÐÐÄ£ÐÍѵÁ·ºÍÔ¤²â£¬ËùÒÔÕâÒ»²½ÊǷdz£ºÄ·Ñ×ÊÔ´¡£

Ä£ÐÍѵÁ·£º´ýÌØÕ÷¡¢Ä£ÐÍ¡¢Ñù±¾¶¼È·¶¨ºÃºó¾Í¿ÉÒÔ½øÐÐÄ£ÐÍѵÁ·£¬ÑµÁ·ÍùÍù»áºÄ·ÑºÜ³¤Ê±¼ä£¬ÑµÁ·ºó»áÉú³ÉÄ£ÐÍÎļþ£¬´æ´¢ÔÚHDFSÖС£

Ä£ÐÍÔ¤²â£º¶ÁȡģÐÍÎļþ½øÐÐÔ¤²âÖ´ÐС£

¶àÄ£ÐÍÔñÓÅ£ºÎªÁËÌá¸ßÔ¤²â׼ȷ¶È£¬ÎÒÃÇ¿ÉÄÜ»áʹÓöà¸öË㷨ģÐÍ£¬µ±Ã¿¸öÄ£Ð͵ÄÔ¤²â½á¹ûÊä³öºóϵͳ»áͨ¹ýһЩ¹æÔòÀ´Ñ¡ÔñÒ»¸ö×îÓŵÄÔ¤²â½á¹û¡£

Ô¤²âÖµÒì³£À¹½Ø£ºÎÒÃÇ·¢ÏÖÔ½ÊǸ´ÔÓÇÒ²»Ò×½âÊ͵ÄËã·¨Ô½ÈÝÒ׳öÏÖ¼«¸ö±ðÔ¤²âÖµÒ쳣ƫ¸ßµÄÇé¿ö£¬ÕâÖÖÔ¤²âÆ«¸ßÎÞ·¨½áºÏÀúÊ·Êý¾Ý½øÐнâÊÍ£¬Òò´ËÎÒÃÇ»áͨ¹ýһЩ¹æÔò½«ÕâЩÒì³£ÖµÀ¹½ØÏÂÀ´£¬²¢ÇÒÓÃÒ»¸ö¸ü¼Ó±£ÊصÄÊýÖµ´úÌæ¡£

Ä£ÐÍÆÀ¼Û£º¼ÆËãÔ¤²â׼ȷ¶È£¬ÎÒÃÇͨ³£ÓÃʹÓÃmapdÀ´×÷ΪÆÀ¼ÛÖ¸±ê¡£

Îó²î·ÖÎö£ºÍ¨¹ý·ÖÎöÔ¤²â׼ȷ¶ÈµÃ³öÒ»¸öÎó²îÔÚ²»Í¬Î¬¶ÈÉϵķֲ¼£¬ÒÔ±ã¸øËã·¨ÓÅ»¯Ìṩ²Î¿¼ÒÀ¾Ý¡£

2. ÒÔʱ¼äÐòÁзÖÎöΪÖ÷µÄÔ¤²âÁ÷³ÌÈçÏ£º

Éú³ÉÀúʷʱÐò£º½«ÀúÊ·ÏúÁ¿¡¢¼Û¸ñ¡¢¿â´æµÈÊý¾Ý°´Õչ涨¸ñʽÉú³ÉʱÐòÊý¾Ý¡£

½Ú¼ÙÈÕÒò×Ó£º¼ÆËã½Ú¼ÙÈÕÓëÏúÁ¿Ö®¼äµÄ¹ØÏµ£¬ÓÃÀ´Æ½»¬½Ú¼ÙÈÕ¶ÔÏúÁ¿Ó°Ïì¡£

ÖÜÈÕÒò×Ó£º¼ÆËãÖÜÒ»µ½ÖÜÈÕÕâ7ÌìÓëÏúÁ¿µÄ¹ØÏµ£¬ÓÃÀ´Æ½»¬ÖÜÈÕ¶ÔÏúÁ¿µÄÓ°Ïì¡£

´ÙÏúÒò×Ó£º¼ÆËã´ÙÏúÓëÏúÁ¿Ö®¼äµÄ¹ØÏµ£¬ÓÃÀ´Æ½»¬´ÙÏú¶ÔÏúÁ¿µÄÓ°Ïì¡£

Òò×ÓÆ½»¬£ºÀúÊ·ÏúÁ¿ÊDz»Îȶ¨µÄ£¬»áÊܵ½½Ú¼ÙÈÕ¡¢´ÙÏúµÈÓ°Ï죬ÔÚÕâÖÖÇé¿öϽøÐÐÔ¤²âÓкܴóÄѶȣ¬ËùÒÔÐèÒªÀûÓÃ֮ǰ¼ÆËãµÄ¸÷ÀàÒò×Ó¶ÔÀúÊ·Êý¾Ý½øÐÐÆ½»¬´¦Àí¡£

ʱÐòÔ¤²â£ºÔÚÒ»¸öÏà¶ÔƽÎȵÄÏúÁ¿Êý¾ÝÉÏͨ¹ýËã·¨½øÐÐÔ¤²â¡£

Òò×Óµþ¼Ó£º½áºÏδÀ´½Ú¼ÙÈÕ¡¢´ÙÏú¼Æ»®µÈÒòËØ¶ÔÔ¤²â½á¹û½øÐе÷Õû¡£

3.3 SparkÔÚÔ¤²âºËÐIJãµÄÓ¦ÓÃ

ÎÒÃÇʹÓÃSpark SQLºÍSpark RDDÏà½áºÏµÄ·½Ê½À´±àд³ÌÐò£¬¶ÔÓÚÒ»°ãµÄÊý¾Ý´¦Àí£¬ÎÒÃÇʹÓÃSparkµÄ·½Ê½ÓëÆäËûÎÞÒ죬µ«ÊǶÔÓÚÄ£ÐÍѵÁ·¡¢Ô¤²âÕâЩÐèÒªµ÷ÓÃËã·¨½Ó¿ÚµÄÂß¼­¾ÍÐèÒª¿¼ÂÇһϲ¢Ðл¯µÄÎÊÌâÁË¡£ÎÒÃÇÆ½¾ùÒ»¸öѵÁ·ÈÎÎñÔÚÒ»Ìì´¦ÀíµÄÊý¾ÝÁ¿´óÔ¼ÔÚ500G×óÓÒ£¬ËäÈ»Êý¾Ý¹æÄ£²»ÊÇÌØ±ðµÄÅӴ󣬵«ÊÇPythonËã·¨°üÌṩµÄËã·¨¶¼Êǵ¥½ø³ÌÖ´ÐС£ÎÒÃǼÆËã¹ý£¬Èç¹ûʹÓÃһ̨»úÆ÷ѵÁ·È«²¿Æ·ÀàÊý¾ÝÐèÒªÒ»¸öÐÇÆÚµÄʱ¼ä£¬ÕâÊÇÎÞ·¨½ÓÊյģ¬ËùÒÔÎÒÃÇÐèÒª½èÖúSparkÕâÖÖ·Ö²¼Ê½²¢ÐмÆËã¿ò¼ÜÀ´½«¼ÆËã·Ö̯µ½¶à¸ö½ÚµãÉÏʵÏÖ²¢Ðл¯´¦Àí¡£

ÎÒÃÇʵÏֵķ½·¨ºÜ¼òµ¥£¬Ê×ÏÈÐèÒªÔÚ¼¯ÈºµÄÿ¸ö½ÚµãÉϰ²×°ËùÐèµÄÈ«²¿Python°ü£¬È»ºóÔÚ±àдSpark³ÌÐòʱ¿¼ÂÇͨ¹ýijÖÖ¹æÔò½«Êý¾Ý·ÖÇø£¬±ÈÈç°´Æ·Ààά¶È£¬Í¨¹ýgroupByKey²Ù×÷½«Êý¾ÝÖØÐ·ÖÇø£¬Ã¿Ò»¸ö·ÖÇøÊÇÒ»¸öÑù±¾¼¯ºÏ²¢½øÐжÀÁ¢µÄѵÁ·£¬ÒÔ´Ë´ïµ½²¢Ðл¯¡£Á÷³ÌÈçÏÂͼËùʾ£º

αÂëÈçÏ£º

repartitionBy·½·¨¼´ÉèÖÃÒ»¸öÖØ·ÖÇøµÄÂß¼­·µ»Ø(K,V)½á¹¹RDD£¬train·½·¨ÊÇѵÁ·Êý¾Ý£¬ÔÚtrain·½·¨ÀïÃæ»áµ÷ÓÃPythonËã·¨°ü½Ó¿Ú¡£saveAsPickleFileÊÇSpark Python¶ÀÓеÄÒ»¸öAction²Ù×÷£¬Ö§³Ö½«RDD±£´æ³ÉÐòÁл¯ºóµÄsequnceFile¸ñʽµÄÎļþ£¬ÔÚÐòÁл¯¹ý³ÌÖлáÒÔ10¸öÒ»ÅúµÄ·½Ê½½øÐд¦Àí£¬±£´æÄ£ÐÍÎļþ·Ç³£Êʺϡ£

ËäȻԭÀí¼òµ¥£¬µ«´æÔÚ×ÅÒ»¸öÄѵ㣬¼´ÒÔʲôÑùµÄ¹æÔò½øÐзÖÇø£¬keyÓ¦¸ÃÈçºÎÉèÖá£ÎªÁ˽â¾öÕâ¸öÎÊÌâÎÒÃÇÐèÒª¿¼ÂǼ¸¸ö·½Ã棬µÚÒ»¾ÍÊÇÄÄЩÊý¾ÝÓ¦¸Ã±»¾ÛºÏµ½Ò»Æð½øÐÐѵÁ·£¬µÚ¶þ¾ÍÊÇÈçºÎ±ÜÃâÊý¾ÝÇãб¡£

Õë¶ÔµÚÒ»¸öÎÊÌâÎÒÃÇ×öÁËÈçϼ¸µã¿¼ÂÇ£º

  • ±»·ÖÔÚÒ»¸ö·ÖÇøµÄÊý¾ÝÒªÓÐÒ»¶¨µÄÏàËÆÐÔ£¬ÕâÑùѵÁ·µÄЧ¹û²Å»á¸üºÃ£¬±ÈÈç°´Æ·Àà·ÖÇø¾ÍÊǸöµäÐÍÀý×Ó¡£
  • ·ÖÎöÉÌÆ·µÄÌØÐÔ£¬¸ù¾ÝÌØÐԵIJ»Í¬Ñ¡Ôñ²»Í¬µÄÄ£ÐÍ£¬ÀýÈç¸ßÏúÉÌÆ·ºÍµÍÏúÉÌÆ·µÄÔ¤²âÄ£ÐÍÊDz»Ò»ÑùµÄ£¬¼´Ê¹ÊÇͬһģÐÍʹÓõÄÌØÕ÷Ò²¿ÉÄܲ»Í¬£¬±ÈÈç¶Ô´ÙÏúÃô¸ÐµÄÉÌÆ·¾ÍÐèÒª¸ü¶àÓë´ÙÏúÏà¹ØÌØÕ÷£¬ÏàͬģÐÍÏàÍ¬ÌØÕ÷µÄÉÌÆ·Ó¦ÇãÏòÓÚ·ÖÔÚÒ»¸ö·ÖÇøÖС£

Õë¶ÔµÚ¶þ¸öÎÊÌâÎÒÃDzÉÓÃÁËÈçϵķ½Ê½½â¾ö£º

  • ¶ÔÓÚÊý¾ÝÁ¿¹ý´óµÄ·ÖÇø½øÐÐËæ»ú³éÑùѡȡ¡£
  • ¶ÔÓÚÊý¾ÝÁ¿¹ý´óµÄ·ÖÇø»¹¿ÉÒÔ×ö¶þ´Î²ð·Ö£¬±ÈÈçͼÊéС˵Õâ¸öÆ·ÀàÊý¾ÝÁ¿Ã÷ÏÔ´óÓÚÆäËûÆ·À࣬ÓÚÊǾͿÉÒÔ·ÖÎöС˵ƷÀàϵÄ×ÓÆ·ÀàÊý¾ÝÁ¿·Ö²¼Çé¿ö£¬²¢½«×ÓÆ·ÀàºÏ²¢³ÉÐµļ¸¸ö·ÖÇø¡£
  • ¶ÔÓÚÊý¾ÝÁ¿¹ýСÕâÖÖÇé¿öÔòÐèÒª¿¼ÂǽøÐм¸¸ö·ÖÇøÊý¾ÝµÄºÏ²¢´¦Àí¡£

×ÜÖ®¶ÔÓÚºóÁ½ÖÖ´¦Àí·½Ê½¿ÉÒÔµ¥¶Àͨ¹ýÒ»¸öSparkÈÎÎñ¶¨ÆÚÔËÐУ¬²¢½«ÕâÖÖ·ÖÇø¹æÔò±£´æ¡£

4. ½áºÏͼ½âSparkÊé½øÐÐÓ¦ÓÃÓëÓÅ»¯

¡¶Í¼½âSpark£ººËÐļ¼ÊõÓë°¸Àýʵս¡·Ò»ÊéÒÔSpark2.0°æ±¾Îª»ù´¡½øÐбàд£¬ÏµÍ³½éÉÜÁËSparkºËÐļ°ÆäÉú̬Ȧ×é¼þ¼¼Êõ¡£ÆäÄÚÈݰüÀ¨SparkÉú̬Ȧ¡¢ÊµÕ½»·¾³´î½¨ºÍ±à³ÌÄ£Ð͵ȣ¬Öصã½éÉÜÁË×÷Òµµ÷¶È¡¢ÈÝ´íÖ´ÐС¢¼à¿Ø¹ÜÀí¡¢´æ´¢¹ÜÀíÒÔ¼°ÔËÐмܹ¹£¬Í¬Ê±»¹½éÉÜÁËSparkÉú̬ȦÏà¹Ø×é¼þ£¬°üÀ¨ÁËSpark SQLµÄ¼´Ï¯²éѯ¡¢Spark StreamingµÄʵʱÁ÷´¦Àí¡¢MLlibµÄ»úÆ÷ѧϰ¡¢GraphXµÄͼ´¦ÀíºÍAlluxioµÄ·Ö²¼Ê½ÄÚ´æÎļþϵͳµÈ¡£ÏÂÃæ½éÉܾ©¶«Ô¤²âϵͳÈçºÎ½øÐÐ×ÊÔ´µ÷¶È£¬²¢ÃèÊöÈçºÎʹÓÃSpark´æ´¢Ïà¹ØÖªÊ¶½øÐÐϵͳÓÅ»¯¡£

4.1 ½áºÏϵͳÖеÄÓ¦ÓÃ

ÔÚͼ½âSparkÊéµÄµÚÁùÕÂÃèÊöÁËSparkÔËÐмܹ¹£¬½éÉÜÁËSpark¼¯Èº×ÊÔ´µ÷¶ÈÒ»°ã·ÖΪ´ÖÁ£¶Èµ÷¶ÈºÍϸÁ£¶Èµ÷¶ÈÁ½ÖÖģʽ¡£´ÖÁ£¶È°üÀ¨Á˶ÀÁ¢ÔËÐÐģʽºÍMesos´ÖÁ£¶ÈÔËÐÐģʽ£¬ÔÚÕâÖÖÇé¿öÏÂÒÔÕû¸ö»úÆ÷×÷Ϊ·ÖÅäµ¥ÔªÖ´ÐÐ×÷Òµ£¬¸ÃģʽÓŵãÊÇÓÉÓÚ×ÊÔ´³¤ÆÚ³ÖÓмõÉÙÁË×ÊÔ´µ÷¶ÈµÄʱ¼ä¿ªÏú£¬È±µãÊǸÃģʽÖÐÎÞ·¨¸ÐÖª×ÊԴʹÓõı仯£¬Ò×Ôì³Éϵͳ×ÊÔ´µÄÏÐÖ㬴ӶøÔì³ÉÁË×ÊÔ´ÀË·Ñ¡£¶øÏ¸Á£¶È°üÀ¨ÁËYarnÔËÐÐģʽºÍMesosϸÁ£¶ÈÔËÐÐģʽ,¸ÃģʽµÄÓŵãÊÇϵͳ×ÊÔ´Äܹ»µÃµ½³ä·ÖÀûÓã¬È±µãÊǸÃģʽÖÐÿ¸öÈÎÎñ¶¼ÐèÒª´Ó¹ÜÀíÆ÷»ñÈ¡×ÊÔ´£¬µ÷¶ÈÑӳٽϴ󡢿ªÏú½Ï´ó¡£

ÓÉÓÚ¾©¶«Spark¼¯ÈºÊôÓÚ»ù´¡Æ½Ì¨£¬ÔÚ¹«Ë¾ÄÚ²¿¹²ÏíÕâЩ×ÊÔ´£¬ËùÒÔ¼¯Èº²ÉÓõÄÊÇYarnÔËÐÐģʽ£¬ÔÚÕâÖÖģʽÏ¿ÉÒÔ¸ù¾Ý²»Í¬ÏµÍ³ËùÐèÒªµÄ×ÊÔ´½øÐÐÁé»îµÄ¹ÜÀí¡£ÔÚYARN-ClusterģʽÖУ¬µ±Óû§ÏòYARN¼¯ÈºÖÐÌá½»Ò»¸öÓ¦ÓóÌÐòºó£¬YARN¼¯Èº½«·ÖÁ½¸ö½×¶ÎÔËÐиÃÓ¦ÓóÌÐò£ºµÚÒ»¸ö½×¶ÎÊǰÑSparkµÄSparkContext×÷ΪApplication MasterÔÚYARN¼¯ÈºÖÐÏÈÆô¶¯£»µÚ¶þ¸ö½×¶ÎÊÇÓÉApplication Master´´½¨Ó¦ÓóÌÐò£¬È»ºóΪËüÏòResource ManagerÉêÇë×ÊÔ´£¬²¢Æô¶¯ExecutorÀ´ÔËÐÐÈÎÎñ¼¯£¬Í¬Ê±¼à¿ØËüµÄÕû¸öÔËÐйý³Ì£¬Ö±µ½ÔËÐÐÍê³É¡£ÏÂͼΪYarn-ClusterÔËÐÐģʽִÐйý³Ì£º

4.2 ½áºÏϵͳµÄÓÅ»¯

ÎÒÃǶ¼ÖªµÀ´óÊý¾Ý´¦ÀíµÄÆ¿¾±ÔÚIO¡£ÎÒÃǽèÖúSpark¿ÉÒ԰ѵü´ú¹ý³ÌÖеÄÊý¾Ý·ÅÔÚÄÚ´æÖУ¬Ïà±ÈMapReduceдµ½´ÅÅÌËÙ¶ÈÌá¸ß½üÁ½¸öÊýÁ¿¼¶£»ÁíÍâ¶ÔÓÚÊý¾Ý´¦Àí¹ý³Ì¾¡¿ÉÄܱÜÃâShuffle£¬Èç¹û²»ÄܱÜÃâÔòShuffleǰ¾¡¿ÉÄܹýÂËÊý¾Ý£¬¼õÉÙShuffleÊý¾ÝÁ¿£»×îºó£¬¾ÍÊÇʹÓøßЧµÄÐòÁл¯ºÍѹËõËã·¨¡£ÔÚ¾©¶«Ô¤²âϵͳÖ÷Òª¾ÍÊÇÎ§ÈÆÕâЩ»·½ÚÕ¹¿ªÓÅ»¯£¬Ïà¹ØSpark´æ´¢Ô­Àí֪ʶ¿ÉÒԲμûͼ½âSparkÊéµÚÎåÕµÄÏêϸÃèÊö¡£

ÓÉÓÚ×ÊÔ´ÏÞÖÆ£¬·ÖÅä¸øÔ¤²âϵͳµÄSpark¼¯Èº¹æÄ£²¢²»ÊǺܴó,ÔÚÓÐÏÞµÄ×ÊÔ´ÏÂÔËÐÐSparkÓ¦ÓóÌÐòȷʵÊÇÒ»¸ö¿¼Ñ飬ÒòΪÔÚÕâÖÖÇé¿öϾ­³£»á³öÏÖÖîÈç³ÌÐò¼ÆËãʱ¼äÌ«³¤¡¢ÕÒ²»µ½ExecutorµÈ´íÎó¡£ÎÒÃÇͨ¹ýµ÷Õû²ÎÊý¡¢ÐÞ¸ÄÉè¼ÆºÍÐ޸ijÌÐòÂß¼­Èý¸ö·½Ãæ½øÐÐÓÅ»¯£º

4.2.1 ²ÎÊýµ÷Õû

  • ¼õÉÙnum-executors£¬µ÷´óexecutor-memory£¬ÕâÑùµÄÄ¿µÄÊÇÏ£ÍûExecutorÓÐ×ã¹»µÄÄÚ´æ¿ÉÒÔʹÓá£
  • ²é¿´ÈÕÖ¾·¢ÏÖûÓÐ×ã¹»µÄ¿Õ¼ä´æ´¢¹ã²¥±äÁ¿£¬·ÖÎöÊÇÓÉÓÚCacheµ½ÄÚ´æÀïµÄÊý¾ÝÌ«¶àºÄ¾¡ÁËÄڴ棬ÓÚÊÇÎÒÃǽ«CacheµÄ¼¶±ðÊʵ±µ÷³ÉMEMORY_ONLY_SERºÍDISK_ONLY¡£
  • Õë¶ÔijЩÈÎÎñ¹Ø±ÕÁËÍÆ²â»úÖÆ£¬ÒòΪÓÐЩÈÎÎñ»á³öÏÖÔÝʱÎÞ·¨½â¾öµÄÊý¾ÝÇãбÎÊÌ⣬²¢·Ç½Úµã³öÏÖÎÊÌâ¡£
  • µ÷ÕûÄÚ´æ·ÖÅ䣬¶ÔÓÚÒ»¸öShuffleºÜ¶àµÄÈÎÎñ£¬ÎÒÃǾͰÑCacheµÄÄÚ´æ·ÖÅä±ÈÀýµ÷µÍ£¬Í¬Ê±µ÷¸ßShuffleµÄÄÚ´æ±ÈÀý¡£

4.2.2 ÐÞ¸ÄÉè¼Æ

²ÎÊýµÄµ÷ÕûËäÈ»ÈÝÒ××ö£¬µ«ÍùÍùЧ¹û²»ºÃ£¬ÕâʱºòÐèÒª¿¼ÂÇ´ÓÉè¼ÆµÄ½Ç¶ÈÈ¥ÓÅ»¯£º

  • Ô­ÏÈÔÚѵÁ·Êý¾Ý֮ǰ»áÏȶÁÈ¡ÀúÊ·µÄ¼¸¸öÔÂÉõÖÁ¼¸ÄêµÄÊý¾Ý£¬¶ÔÕâЩÊý¾Ý½øÐкϲ¢¡¢×ª»»µÈһϵÁи´ÔӵĴ¦Àí£¬×îÖÕÉú³ÉÌØÕ÷Êý¾Ý¡£ÓÉÓÚÊý¾ÝÁ¿ÅÓ´ó£¬ÈÎÎñÓÐʱ»á±¨´í¡£¾­¹ýµ÷Õûºóµ±ÌìÖ»´¦Àíµ±ÌìÊý¾Ý£¬²¢½«½á¹û±£´æµ½µ±ÈÕ·ÖÇøÏ£¬ÑµÁ·Ê±°´ÌìÊýÐèÒª¶ÁÈ¡¶à¸ö·ÖÇøµÄÊý¾Ý×öunion²Ù×÷¼´¿É¡£
  • ½«¡°Ä£ÐÍѵÁ·¡±´ÓÿÌìÖ´Ðе÷Õûµ½Ã¿ÖÜÖ´ÐУ¬½«¡°Ä£ÐͲÎÊýѡȡ¡±´ÓÿÖÜÖ´Ðе÷Õûµ½Ã¿ÔÂÖ´ÐС£ÒòΪÕâÁ½¸öÈÎÎñ¶¼Ê®·ÖÏûºÄ×ÊÔ´£¬²¢ÇÒÊôÓÚ²»ÐèҪƵ·±ÔËÐУ¬Õâô×öËäȻ׼ȷ¶È»áÂÔ΢½µµÍ£¬µ«¶¼ÔڿɽÓÊÜ·¶Î§ÄÚ¡£
  • ͨ¹ý²ð·ÖÈÎÎñÒ²¿ÉÒԺܺõĽâ¾ö×ÊÔ´²»¹»ÓõÄÎÊÌâ¡£¿ÉÒÔºáÏò²ð·Ö£¬±ÈÈçÔ­ÏÈÊǽ«100¸öÆ·ÀàÊý¾Ý·ÅÔÚÒ»¸öÈÎÎñÖнøÐÐѵÁ·£¬µ÷Õûºó¸Ä³Éÿ10¸öÆ·ÀàÌá½»Ò»´ÎSpark×÷Òµ½øÐÐѵÁ·¡£ÕâÑùËäÈ»ÕûÌåÖ´ÐÐʱ¼ä±ä³¤£¬µ«ÊDZÜÃâÁ˳ÌÐòÒì³£Í˳ö£¬±£Ö¤ÈÎÎñ¿ÉÒÔÖ´Ðгɹ¦¡£³ýÁ˺áÏò»¹¿ÉÒÔ×ÝÏò²ð·Ö£¬¼´½«Ò»¸ö°üº¬10¸öStageµÄSparkÈÎÎñ²ð·Ö³ÉÁ½¸öÈÎÎñ£¬Ã¿¸öÈÎÎñ°üº¬5¸öStage£¬ÖмäÊý¾Ý±£´æµ½HDFSÖС£

4.2.3 Ð޸ijÌÐòÂß¼­

ΪÁ˽øÒ»²½Ìá¸ß³ÌÐòµÄÔËÐÐЧÂÊ£¬Í¨¹ýÐ޸ijÌÐòµÄÂß¼­À´Ìá¸ßÐÔÄÜ£¬Ö÷ÒªÊÇÔÚÈçÏ·½Ãæ½øÐÐÁ˸Ľø£º±ÜÃâ¹ý¶àµÄShuffle¡¢¼õÉÙShuffleʱÐèÒª´«ÊäµÄÊý¾ÝºÍ´¦ÀíÊý¾ÝÇãбÎÊÌâµÈ¡£

1. ±ÜÃâ¹ý¶àµÄShuffle

SparkÌṩÁ˷ḻµÄת»»²Ù×÷£¬¿ÉÒÔʹÎÒÃÇÍê³É¸÷ÀิÔÓµÄÊý¾Ý´¦Àí¹¤×÷£¬µ«ÊÇÒ²ÕýÒòΪÈç´ËÎÒÃÇÔÚдSpark³ÌÐòµÄʱºò¿ÉÄÜ»áÓöµ½Ò»¸öÏÝÚ壬ÄǾÍÊÇΪÁËʹ´úÂë±äµÄ¼ò½à¹ý·ÖÒÀÀµRDDµÄת»»²Ù×÷£¬Ê¹±¾À´½öÐèÒ»´ÎShuffleµÄ¹ý³Ì±äΪÁËÖ´Ðжà´Î¡£ÎÒÃǾÍÔø¾­·¸¹ýÕâÑùÒ»¸ö´íÎó,±¾À´¿ÉÒÔͨ¹ýÒ»´ÎgroupByKeyÍê³ÉµÄ²Ù×÷ȴʹÓÃÁËÁ½»Ø¡£ÒµÎñÂß¼­ÊÇÕâÑùµÄ£ºÎÒÃÇÓÐÈýÕűí·Ö±ðÊÇÏúÁ¿£¨s£©¡¢¼Û¸ñ£¨p£©¡¢¿â´æ£¨v£©£¬Ã¿ÕűíÓÐ3¸ö×ֶΣºÉÌÆ·id£¨sku_id£©¡¢Æ·Ààid£¨category£©ºÍÀúʷʱÐòÊý¾Ý£¨data£©£¬ÏÖÔÚÐèÒª°´sku_id½«s¡¢p¡¢vÊý¾ÝºÏ²¢£¬È»ºóÔÙ°´categoryÔٺϲ¢Ò»´Î£¬×îÖÕµÄÊý¾Ý¸ñʽÊÇ£º[category£¬[[sku_id, s , p, v], [sku_id, s , p, v], [¡­]£¬[¡­]]]¡£Ò»¿ªÊ¼ÎÒÃÇÏȰ´ÕÕsku_id + category×÷Ϊkey½øÐÐÒ»´ÎgroupByKey£¬½«Êý¾Ý¸ñʽת»»³É[sku_id, category , [s£¬p, v]]£¬È»ºó°´category×÷ΪkeyÔÙgroupByKeyÒ»´Î¡£ºóÀ´ÎÒÃÇÐÞ¸ÄΪ°´ÕÕcategory×÷ΪkeyÖ»½øÐÐÒ»´ÎgroupByKey£¬ÒòΪһ¸ösku_idÖ»»áÊôÓÚÒ»¸öcategory£¬ËùÒÔºóÐøµÄmapת»»ÀïÃæÖ»ÐèҪдһЩ´úÂ뽫Ïàͬsku_idµÄs¡¢p¡¢vÊý¾Ýgroupµ½Ò»Æð¾Í¿ÉÒÔÁË¡£Á½´ÎgroupByKeyµÄÇé¿ö£º

Ð޸ĺó±äΪһ´ÎgroupByKeyµÄÇé¿ö£º

¶à±íjoinʱ£¬Èç¹ûkeyÖµÏàͬ£¬Ôò¿ÉÒÔʹÓÃunion + groupByKey + flatMapValuesÐÎʽ½øÐС£±ÈÈ磺ÐèÒª½«ÏúÁ¿¡¢¿â´æ¡¢¼Û¸ñ¡¢´ÙÏú¼Æ»®ºÍÉÌÆ·ÐÅϢͨ¹ýÉÌÆ·±àÂëÁ¬½Óµ½Ò»Æð£¬Ò»¿ªÊ¼Ê¹ÓõÄÊÇjoinת»»²Ù×÷£¬½«¼¸¸öRDD±Ë´ËjoinÔÚÒ»Æð¡£ºóÀ´·¢ÏÖÕâÑù×öÔËÐÐËٶȷdz£Âý£¬ÓÚÊÇ»»³Éunion+groypByKey+flatMapValueÐÎʽ£¬ÕâÑù×öÖ»Ðè½øÐÐÒ»´ÎShuffle£¬ÕâÑùÐ޸ĺóÔËÐÐËٶȱÈÒÔǰ¿ì¶àÁË¡£ÊµÀý´úÂëÈçÏ£º

Èç¹ûÁ½¸öRDDÐèÒªÔÚgroupByKeyºó½øÐÐjoin²Ù×÷£¬¿ÉÒÔʹÓÃcogroupת»»²Ù×÷´úÌæ¡£±ÈÈ磬 ½«ÀúÊ·ÏúÁ¿Êý¾Ý°´Æ·Àà½øÐкϲ¢£¬È»ºóÔÙÓëÄ£ÐÍÎļþ½øÐÐjoin²Ù×÷£¬Á÷³ÌÈçÏ£º

ʹÓÃcogroupºó£¬¾­¹ýÒ»´ÎShuffle¾Í¿ÉÍê³ÉÁËÁ½²½²Ù×÷£¬ÐÔÄÜ´ó·ùÌáÉý¡£

2. ¼õÉÙShuffleʱ´«ÊäµÄÊý¾ÝÁ¿

  • ÔÚShuffle²Ù×÷ǰ¾¡Á¿½«²»ÐèÒªµÄÊý¾Ý¹ýÂ˵ô¡£
  • ʹÓÃcomebineyeByKey¿ÉÒÔ¸ßЧÂʵÄʵÏÖÈκθ´ÔӵľۺÏÂß¼­¡£

comebineyeByKeyÊôÓÚ¾ÛºÏÀà²Ù×÷£¬ÓÉÓÚËüÖ§³Ömap¶ËµÄ¾ÛºÏËùÒÔ±ÈgroupByKeyÐÔÄܺã¬ÓÖÓÉÓÚËüµÄmap¶ËÓëreduce¶Ë¿ÉÒÔÉèÖóɲ»Ò»ÑùµÄÂß¼­£¬ËùÒÔËüÖ§³ÖµÄ³¡¾°±ÈreduceByKey¶à£¬ËüµÄ¶¨ÒåÈçÏ£º

reduceByKeyºÍgroupByKeyÄÚ²¿Êµ¼ÊÊǵ÷ÓÃÁËcomebineyeByKey£¬

ÎÒÃÇ֮ǰÓкܶิÔÓµÄÎÞ·¨ÓÃreduceByKeyÀ´ÊµÏֵľۺÏÂß¼­¶¼Í¨¹ýgroupByKeyÀ´Íê³ÉµÄ£¬ºóÀ´È«²¿Ì滻ΪcomebineyeByKeyºóÐÔÄÜÌáÉýÁ˲»ÉÙ¡£

3. ´¦ÀíÊý¾ÝÇãб

ÓÐЩʱºò¾­¹ýһϵÁÐת»»²Ù×÷Ö®ºóÊý¾Ý±äµÃÊ®·ÖÇãб£¬ÔÚÕâÑùÇé¿öϺóÐøµÄRDD¼ÆËãЧÂÊ»á·Ç³£µÄÔã¸â£¬ÑÏÖØÊ±³ÌÐò±¨´í¡£Óöµ½ÕâÖÖÇé¿öͨ³£»áʹÓÃrepartitionÕâ¸öת»»²Ù×÷¶ÔRDD½øÐÐÖØÐ·ÖÇø£¬ÖØÐ·ÖÇøºóÊý¾Ý»á¾ùÔÈ·Ö²¼ÔÚ²»Í¬µÄ·ÖÇøÖУ¬±ÜÃâÁËÊý¾ÝÇãб¡£Èç¹ûÊǼõÉÙ·ÖÇøÊ¹ÓÃcoalesceÒ²¿ÉÒԴﵽЧ¹û£¬µ«±ÈÆðrepartition²»×ãµÄÊÇ·ÖÅä²»ÊÇÄÇô¾ùÔÈ¡£

5.С½á

ËäÈ»¾©¶«µÄÔ¤²âϵͳÒѾ­Îȶ¨ÔËÐÐÁ˺ܳ¤Ò»¶Îʱ¼ä£¬µ«ÊÇÎÒÃÇÒ²¿´µ½ÏµÍ³±¾Éí»¹´æÔÚןܶà´ý¸Ä½øµÄµØ·½£¬½ÓÏÂÀ´ÎÒÃÇ»áÔÚÔ¤²â׼ȷ¶ÈµÄÌá¸ß¡¢ÏµÍ³ÐÔÄܵÄÓÅ»¯¡¢¶àÒµÎñÖ§³ÖµÄ±ã½ÝÐÔÉϽøÐиĽø¡£Î´À´£¬Ëæ×Å´óÊý¾Ý¡¢È˹¤ÖÇÄܼ¼ÊõÔÚ¾©¶«¹©Ó¦Á´¹ÜÀíÖеÄʹÓÃÔ½À´Ô½¶à£¬Ô¤²âϵͳҲ½«·¢»Ó³ö¸ü´ó×÷Ó㬶ÔÓÚ¾©¶«Ô¤²âϵͳµÄÑз¢¹¤×÷Ò²½«ÊdzäÂú×ÅÌôÕ½ÓëÀÖȤ¡£

´ðÒÉ»·½Ú

Q1£ºÓÃhiveÇåÏ´ÍêÒÔºóµÄÊý¾Ý»¹´æÔÚhiveÖÐÂð£¿ÄÇԭʼÊý¾Ý»¹±£ÁôÂ𣿻òÕß˵±£Áô¶à¾Ã£¿Ð»Ð»ÀÏʦ£¡

ÑԽ£ºÇåÏ´ºóÊý¾Ý»¹»á´æ»Øhive£¬Ô­Ê¼Êý¾Ý²»»áɾ£¬µ«ÔÚÇåϴת»»¹ý³ÌÖпÉÄÜ»áÖ´Ðжà¸öhive½Å±¾£¬»á²úÉúºÜ¶àÖмäÊý¾Ý£¬ÕâЩÖмäÊý¾ÝÖ»»á±£ÁôÒ»¶Îʱ¼ä£¬È»ºó×Ô¶¯É¾³ý£¨Êǰ´Ê±¼ä½øÐзÖÇøµÄ£©¡£

Q2£º¼¸ÖÖϸ»¯µÄ³¡¾°£¬Èçpromotion£¬fast sale£¬ÉÌÆ·skuµÄ»­ÏñÊÇ·ñÓУ¿

ÑԽ£º¶ÔÓÚ´ÙÏúÕâÖÖÇé¿ö»áÒýÈëÀúÊ·´ÙÏúÏúÁ¿×÷ÎªÌØÕ÷£¬Ô¤²âʱҲ»á½áºÏ´ÙÏú¼Æ»®£¬´ÙÏú¼Æ»®¶¼ÊÇÌáǰ¼È뵽ϵͳÖе쬳ý´Ë»¹ÐèÒª·ÖÎö¼Û¸ñ¡¢PVÔÚÉÌÆ·ÉϵÄÃô¸Ð³ÉµÄ¡£¶ÔÓÚ¿ìÏûÆ·ÐèÒª½áºÏÉÌÆ·µÄÉúÃüÖÜÆÚÈ¥×ö¡£

Q3£º°´¼Ü¹¹¿´£¬ÄÇÖÖ½»»¥Ì½Ë÷ÐÔµÄÇëÇó£¬ÀàËÆÓÚÒÔǰsqlÇëÇóÈ¥²Ö¿âÀÌÒ»ÏÂÊý¾Ý¿´¿´µÄÇé¿ö£¬ÊÇÓÃsparksqlÀ´Ö§³ÅÂð£¿Ò»°ãÏìӦʱ¼ä´ó¸ÅÈçºÎ£¿

¹ù¾°Õ°£º¶Ô£¬ÀëÏßÊý¾ÝÊÇͨ¹ýSparkSQL½øÐвéѯ£¬ÏìӦʱ¼äÒÀÀµÓÚ¼¯ÈºµÄ¹æÄ£¡¢²éѯµÄÊý¾ÝÁ¿¼°SQLµÄ¸´Ôӳ̶ȣ¬ ÔÚÔ¤²âϵͳʹÓõÄÊý¾Ý´ó¸Å500GB£¬ÉÙµÄ2·ÖÖÓ×óÓÒ£¬×î¶à²»³¬¹ý20·ÖÖÓ¡£

Q4£ºÇëÎÊÈçºÎÑ¡ÔñÄ£ÐÍ ÊDz»Í¬Æ·ÀàÓв»Í¬Ä£ÐÍÂð

ÑԽ£º²»ÍêÈ«ÊǸù¾ÝÆ·Àà·ÖÄ£ÐÍ£¬»¹Òª¿¼ÂÇÊÇ·ñ¸ßÏúÁ¿Æ·¡¢ÊÇ·ñ³¤Î²Æ·¡¢ÊÇ·ñÐÂÆ·¡¢ÊÇ·ñÊǼ¾½ÚÐԱȽÏÃ÷ÏÔµÄÉÌÆ·µÈ¡£

Q5£º½Ú¼ÙÈÕÒò×ÓÔõôÁ¿»¯£¿

ÑԽ£ºÊ×ÏÈÒª½øÐÐÆ½»¬£¬¾¡Á¿°ÑÆäËû¸ÉÈÅÒòËØÈ¥µô£¬ÔÙ¼ÆËã½Ú¼ÙÈÕÆÚ¼äÓëǰºóÒ»¶Îʱ¼ä¾ùÖµ¶Ô±È£¬Òª×¢Ò⿼ÂÇÑôÀúºÍÅ©Àú£¬»¹ÓÐÈç¹ûÐÂÆ·»¹»á¸ù¾ÝͬƷÀà»òÍ¬Æ·ÅÆ½øÐÐÌæ´ú¡£

 

   
2175 ´Îä¯ÀÀ       28
Ïà¹ØÎÄÕÂ

»ùÓÚEAµÄÊý¾Ý¿â½¨Ä£
Êý¾ÝÁ÷½¨Ä££¨EAÖ¸ÄÏ£©
¡°Êý¾Ýºþ¡±£º¸ÅÄî¡¢ÌØÕ÷¡¢¼Ü¹¹Óë°¸Àý
ÔÚÏßÉ̳ÇÊý¾Ý¿âϵͳÉè¼Æ ˼·+Ч¹û
 
Ïà¹ØÎĵµ

GreenplumÊý¾Ý¿â»ù´¡Åàѵ
MySQL5.1ÐÔÄÜÓÅ»¯·½°¸
ijµçÉÌÊý¾ÝÖÐ̨¼Ü¹¹Êµ¼ù
MySQL¸ßÀ©Õ¹¼Ü¹¹Éè¼Æ
Ïà¹Ø¿Î³Ì

Êý¾ÝÖÎÀí¡¢Êý¾Ý¼Ü¹¹¼°Êý¾Ý±ê×¼
MongoDBʵս¿Î³Ì
²¢·¢¡¢´óÈÝÁ¿¡¢¸ßÐÔÄÜÊý¾Ý¿âÉè¼ÆÓëÓÅ»¯
PostgreSQLÊý¾Ý¿âʵսÅàѵ