Äú¿ÉÒÔ¾èÖú£¬Ö§³ÖÎÒÃǵĹ«ÒæÊÂÒµ¡£

1Ôª 10Ôª 50Ôª





ÈÏÖ¤Â룺  ÑéÖ¤Âë,¿´²»Çå³þ?Çëµã»÷Ë¢ÐÂÑéÖ¤Âë ±ØÌî



  ÇóÖª ÎÄÕ ÎÄ¿â Lib ÊÓÆµ iPerson ¿Î³Ì ÈÏÖ¤ ×Éѯ ¹¤¾ß ½²×ù Modeler   Code  
»áÔ±   
 
   
 
 
     
   
 ¶©ÔÄ
  ¾èÖú
»Æ½à£ºIntel SparkÓ¦ÓÃÓÅ»¯ºÍʵ¼ù¾­Ñé
 
×÷Õߣº»Æ½à À´Ô´£ºCSDN ·¢²¼ÓÚ 2016-4-15
  2687  次浏览      27
 

ÕªÒª£º»Æ½à¾ÍSparkµÄÄÚ´æ¹ÜÀí¡¢IOÌáÉýºÍ¼ÆËãÓÅ»¯3¸ö·½Ãæ½øÐÐÁËÏêϸ½²½â¡£»Æ½à±íʾ£¬¶Ô±ÈMapReduce£¬SparkÉó¤ÓÚ¸´ÔӵĻúÆ÷ѧºÍͼµÄ¼ÆËã¡¢Á÷´¦ÀíµÈ¶àÖÖÒµÎñ³¡¾°¡£

¡¾±àÕß°´¡¿¸É»õÂúÂúµÄ2015 OpenStack¼¼Êõ´ó»á¡¢2015 Spark¼¼Êõ·å»á¡¢2015 Container¼¼Êõ·å»áÒÔʵÁ¦Ó®µÃËùÓйÛÖÚµÄÈϿɡ£ÔÚSpark·å»áÉÏ£¬Ó¢Ìضû´óÊý¾Ý¼¼ÊõÖÐÐÄÑз¢¾­Àí»Æ½à¾ÍSparkµÄÄÚ´æ¹ÜÀí¡¢IOÌáÉýºÍ¼ÆËãÓÅ»¯3¸ö·½Ãæ½øÐÐÁËÏêϸ½²½â£¬ÒÔÏÂΪÑݽ²¸ÅÊö¡£

ÏÂΪÑݽ²¸ÅÊö

ÎÒÀ´×ÔIntel´óÊý¾Ý¼¼ÊõÖÐÐÄ£¬Õû¸ö¼¼ÊõÖÐÐÄÔÚÖйú¡¢ÃÀ¹ú¡¢Ó¡¶È¶¼ÓÐÏàÓ¦µÄ¿ª·¢ÈËÔ±£¬ÍŶÓÖÂÁ¦ÓÚ´óÊý¾Ý¶¥¼âÏîÄ¿µÄÑо¿£¬Ö÷Òª°üÀ¨Spark¡¢Hadoop¡¢Hive£¬ÓÐ20¶àλApacheµÄCommitters¡£ÍŶӵÄÖ÷Òª¹±Ï×¼¯ÖÐÓÚSpark£¬ÔÚSpark½øÈëApacheʱ¾Í¿ªÊ¼ºÏ×÷£¬×ö³öÁ˹¦ÄÜ¡¢ÐÔÄÜ¡¢Ò×ÓÃÐԵȷ½ÃæµÄһЩ¹±Ïס£Ä¿Ç°ÎÒÃÇÔÚÕû¸öSpark¿ªÔ´ÉçÇø¶¼ÊÇÃûÁÐǰéµÄ¡£

´Ó×ÔÉí½Ç¶ÈÀ´½²£¬ÍŶӺÜÔç֮ǰ¾ÍÉæ¼°µ½Á˶ÔÓÚHadoop MapReduceµÄһЩ¹¤×÷£¬ÔÚÕâ¸ö¹ý³ÌÖÐÎÒÃÇ·¢ÏÖ£¬MapReduceÌìÉú´æÔÚÒ»¶¨µÄÐÔÄÜȱÏÝ¡£ÎÞÂÛÊÇÈκÎÒ»¸ö³É¹¦µÄ´óÊý¾Ý¿ò¼Ü»¹ÊÇÆ½Ì¨£¬Ö»ÓÐ×ß½øÕæÊµ¹¤ÒµÐÔÓû§²ÅÄܵõ½ºÜºÃµÄЧ¹ûºÍ·´À¡¡£ÎÒÃǸú¹úÄÚ¶¥¼âµÄ»¥ÁªÍø¹«Ë¾ºÏ×÷£¬Ê¹ÓÃSparkÒÔ¼°SparkÈí¼þ¿ª·¢ÕæÊµµÄ´óÊý¾ÝÓ¦Óã¬ÔÚÕâ¸ö¹ý³ÌÖÐÊÕ»ñÁ˺ܶྭÑ飬ҲϣÍû°ÑÕâЩ¾­Ñé·ÖÏí¸øºÏ×÷»ï°éºÍÉçÇø°®ºÃÕß¡£

Ó¦Ó÷ÖÀà

ºÜ¶àÈ˻ᷢ³öÕâÑùµÄÒÉÎÊ£¬Sparkµ½µ×ÊÊÓÃÓÚÄÄЩ³¡¾°£¿ÎÒÃÇÔÚÄÄЩ³¡¾°ÊʺÏʹÓÃSpark £¬»òÕßÎÒÃÇÓ¦¸ÃÊ×Ñ¡Spark£¿´ÓÎÒÃǺÏ×÷»ï°éÀ´½²£¬¿ÉÒÔ·ÖΪÒÔÏÂÈýÀàÓ¦Óá£

¸´ÔӵĻúÆ÷ѧºÍͼµÄ¼ÆËã¡£±ÈÈçÎÒÃǺͺܶàºÏ×÷»ï°é×öÁËһЩÉç½»ÍøÂçµÄ·ÖÎö£¬È»ºóͨ¹ý·ÖÏí¸øÅóÓÑ´ÓÖзÖÎö³öÓû§µÄϲºÃ£¬»òÕßͨ¹ý¸üÔ¶ÅóÓѵĹØÏµ»ñµÃһЩÐÅÏ¢¡£ÓÖ±ÈÈç˵Community Detection£¬¼´ÉçÇøÍÚ¾ò»òÕßÉçÇø·¢ÏÖ£¬ÕâÒ²ÊÇÒ»Àà¡£Õⲿ·ÖÓû§´ó²¿·ÖÌåÏÖÔÚ¶Ô¿ª·¢·½Ê½³ÖÓбȽϿª·ÅµÄ̬¶È£¬ÒòΪËûÔ­À´ÔÚHadoop²¢Ã»ÓÐѰÇ󵽱ȽϺõĽâ¾ö·½°¸£¬ËùÒÔÖ±½ÓÑ¡ÔñÓÃSparkµÄ¸÷ÖÖAPI»òÕß²Ù×÷Ô­Ó↑·¢Ò»Ð©Ëã·¨µÄÓ¦Óá£

Complex¡¢Interactive¡¢OLAP/BIµÈ¡£Ä¿Ç°£¬»ù±¾ÉÏ70%»òÕß80%µÄÏîÄ¿¶¼ÊÇ»ùÓÚMapReduce£¬ËùÒÔÇ¨ÒÆÆðÀ´±È½Ï·½±ã¡£Õⲿ·ÖÓû§ÔÚÓ¦ÓòãÉÏÖ»Ðè×öºÜСµÄ¸Ä¶¯£¬»òÕßÉõÖÁÎÞÐè¸Ä¶¯£¬ÍùÍù¿ÉÒÔ·¢ÏÖÐÔÄÜÁ½±¶»òÕßÎåÁù±¶µÄÌáÉý£¨¾ßÌåÇé¿öÈ¡¾öÓ¦Óð¸Àý±¾Éí£©£¬ËùÒÔËûÃǺÜÔ¸ÒâÇ¨ÒÆµ½SparkÉÏÀ´¡£

Stream Processing¡£×÷Ϊһ¸ö±È½ÏÍêÕûµÄÏÂÒ»´ú´óÊý¾Ý´¦ÀíÆ½Ì¨£¬Spark²»½öÌṩÁËÇ°ÃæÁ½ÖÖÓ¦Óù¦ÄÜ£¬Ò²ÌṩÁËÁ÷´¦Àí¡£

¾­Ñé·ÖÏí

´ÓÕâЩӦÓÃÀïÎÒÃǵõ½ºÜ¶à¾­Ñ飬ÏÂÃæºÍ´ó¼Ò·ÖÏíһϡ£

SparkÐÔÄÜ£¬Õâ¸öÊý¾ÝÊÇ»ùÓÚÐí¶àÕæÊµÓ¦Óûù´¡£¬¶Ô±ÈÁËSparkµÄÔ­ÐÍ¿ª·¢ºÍÔ­ÏÈHadoopËùÅܵÄÐÔÄÜ£¬ÌáÉý»ù±¾ÉÏ´ïµ½5~6±¶£¬ÓеÄÉõÖÁÄÜ´ïµ½°Ù±¶ÐÔÄÜÌáÉý¡£Í¬Ê±£¬ÓÐһЩӦÓÃÔÚSparkÊÇ¿ÉÒÔʵÏֵ썻òÕßÖÁÉÙ¿ÉÒÔ¿ª·¢£©£¬µ«ÔÚMapReduceÕâ¸öƽ̨ÉÏûÓа취ʵÏÖ»òÕßÖ´ÐС£ËùÒÔ¶ÔÕⲿ·ÖµÄÓû§À´Ëµ£¬Õⲿ·ÖÐÔÄÜ»òÕß¹¦ÄÜÓÅÊÆ²î±ð¸ü´ó¡£ÕâÒ²ÊÇ´ó¼ÒÓÃSparkµÄÔ­Òò¡£

³ý´ËÖ®Í⣬»¹ÓÐÒ»°ëµÄÈËÊÇÒòΪSparkµÄÒ×ÓÃÐÔºÍSpark¹«¹²Æ½Ì¨Ìṩ¸÷ÖÖÀàÐÍ´óÊý¾ÝµÄÓ¦ÓÃËù´øÀ´µÄÓŵ㡣¾ÍÏñÉÏÎÄÌáµ½µÄÕâÈýÖÖÀàÐÍÔÚSpark²¿Êð»·¾³É϶¼¿ÉÒÔ´ïµ½Ò»¶¨µÄÐèÇó¡£Í¬Ê±£¬Spark»¹ÌṩÁ˷dz£¶àµÄÓïÑÔ£¬ÒÔ¼°±È½Ï·á¸»µÄ¼òµ¥Ëã×Ó¡£ÀýÈçÏÖÔÚÎÒÃÇÒ²ÔÚ¸úÉçÇøÒ»ÆðºÏ×÷£¬½«ÎªSparkÌṩRÓïÑÔ½Ó¿Ú¡£µ±ÏÂÏîÄ¿ÒѾ­ºÏ²¢µ½ÁËSparkµÄÖ÷¸É°æ±¾¡£

ËùÒÔ´ÓÕâÁ½·½ÃæÀ´Ëµ£¬ºÜ¶àÈ˶¼·Ç³£»¶Ó­Spark¡£ËäÈ»Spark·Ç³£ÃÀºÃ£¬µ«¾ÍÕæµÄûÓÐÎÊÌâÁËÂð£¿ÎÒÃÇ·¢ÏÖSpark»¹ÐèÒª¸ü¼ÓÍêÉÆ£¬ÐèÒª¸ü¶àÈ˵űÏ׺ÍŬÁ¦¡£ÎÒÃÇÒ²·¢ÏÖÔÚ±ÈÈç¿É¿¿ÐÔ¡¢Ò×ÓÃÐԵȷ½Ã滹Ðè¸ü¶àÍêÉÆ¡£ËùÒÔ±¾ÎÄÖ÷ÒªµÄÄÚÈݾÍÊÇÏ£Íû´Ó¸÷¸ö·½ÃæÍ¨¹ý°¸Àý˵Ã÷ÔõÑùÌáÉýSparkµÄÓ¦ÓÃÌåÑé¡£

°¸Àý·ÖÎö

֮ǰµÄ×ܽá¿ÉÄܺܳéÏó£¬Ï£Íûͨ¹ýÏÂÃæµÄ°¸ÀýÄܹ»´øÀ´¸ü¾ßÏóµÄÈÏʶ£¬Á˽âÔõÑùͨ¹ýÕâÈý¸ö·½Ãæ¹¹½¨¸ü¼ÓƽºâµÄϵͳ£¬»ñµÃ¸ü¼ÓÓÅÒìµÄÐÔÄÜ¡£

¹ÜÀíÄÚ´æ

Ò»Ìáµ½Spark£¬Ê×ÏÈÏëÆðµÄ¾ÍÊÇSparkµÄÓÅÊÆÔÚÓÚÄÚ´æ¼ÆË㣬ËùÒÔµÚÒ»Ìõ¾ÍÊÇÔõÑù¹ÜÀíÄڴ棬ʹÄÚ´æ¸ü¼Ó¸ßЧ¡£

µ±ÓëºÜ¶àºÏ×÷»ï°éºÏ×÷ʱ£¬ÎÒÃÇ·¢ÏÖͼ¼ÆË㳡¾°´Ù½øÁËSparkµÄ»ð±¬£ºÔÚͼ¼ÆËãÀï×î´óµÄÌØÐÔÊǵü´úʽ¼ÆË㣬¶øSparkÄܹ»°Ñ¼ÆËã³öÀ´µÄ½á¹û»º´æÔÚÄڴ棬֮ºóµü´ú¿ÉÒÔÖ±½Ó¶ÁÈ¡ÄÚ´æÊý¾Ý£¬´Ó¶øÏÔÖøµØÌáÉýÁËÐÔÄÜ¡£Ò²¾ÍÊÇ˵µü´úÓëµü´úµÄÒÀÀµ¹ØÏµÊǷdz£½ôÃܵ쬵«ÓÐʱǰһÂÖµü´ú²úÉúµÄÊý¾ÝÔÚºóÒ»ÂÖµü´úʱ¾Í²»ÔÙ±»Ê¹ÓÃÁË¡£

ͼ1 ³ÌÐòÓÅ»¯Ç°µÄ»º´æ¶Ô±È

Èçͼ1Ëùʾ£¬ÕâÕűí¸ñÊÇÕæÊµÓ¦ÓõÄÀý×Ó£¬µÚÒ»ÁÐÊÇËüµÄµü´úÂÖÊý£¬µÚ¶þÁÐÊÇÐèÒª»º´æµÄRDD£¬µÚÈýÁÐÊÇÀۼƱ»»º´æµÄRDD¡£´ó¼ÒÖªµÀºÜ¶à´ó¹æÄ£¼ÆËãÍùÍù¶¼ÊÇǧÂÖµü´ú£¬µ«Ö»µ½µÚÈýÂÖµü´ú¾ÍÐèÒªÕâô´óµÄÄÚ´æ¿Õ¼äÁË¡£ÄÇô£¬ÊDz»ÊDZíʾSparkÓ¦ÓþÍÐèÒªÕâô´óµÄÄÚ´æ¿Õ¼äÄØ£¿ÊÂʵÏÔÈ»²»ÊÇÕâÑù¡£

ÔÚ´úÂëÀï×öÁËÒ»¸öÓÅ»¯£¬½á¹û·¢ÏÖÄÚ´æ¿Õ¼ä½ÚÊ¡ÁË50%£¬Õâ¾ÍÒâζ×ÅÄã¿ÉÒÔ½ÚÊ¡³ö50%ÄÚ´æ¿Õ¼ä¸øÆäËûÓ¦Ó᣸üйýµÄ½á¹ûÈçͼ2Ëùʾ¡£¸üÐÂÕâ¸öÓ¦Óú󣬴ﵽµÄÊýÖµºÍÔ¤ÆÚµÄÊýÖµÊÇÒ»ÑùµÄ¡£Õâ¸ö¹±ÏׯäʵÒѾ­±»Ó¦ÓÃÁË£¬Ï£ÍûÒý·¢´ó¼ÒÔÚÓû§²ã¶ÔSparkµÄ˼¿¼£¬ÒòΪSparkÌṩÁË×¢È뻺´æºÍÊÍ·Å»º´æµÄ½Ó¿Ú£¬ËùÒÔÔÚ×Ðϸ¿ª·¢´úÂëµÄͬʱ£¬Ò²Ï£Íû×¢Òâµ½ÔÚ²»Ê¹Óûº´æµÄÇé¿öÏ£¬Ö÷¶¯È¥ÊÍ·ÅһЩÄÚ´æ¿Õ¼ä£¬ÕâÑùÒâζ×Å¿ÉÒÔÌÚ³ö¸ü¶àµÄ¿Õ¼ä¸ø¼ÆËã¡£

ͼ2 ³ÌÐòÓÅ»¯ºóµÄ»º´æ¶Ô±È

µÚ¶þ¸ö¸üÍÆ¼öÔÚ´óÊý¾ÝÁ¿ÏÂʹÓã¬ÓÐһЩӦÓó¡¾°Ï£ÍûʹÓõ½ÄÚ´æ´æ´¢¿Õ¼ä£¬Ö÷Ҫͨ¹ýTachyonÀ´½øÐд洢¡£Èçͼ3Ëùʾ£¬ÕâÊǸø¿Í»§×öµÄÒ»¸öÕæÊµµÄ°¸Àý£¬ËüÊÇÒ»¸öÁ÷ʽ´¦Àí£¬ÊǺó¶ËÌṩSQL²éѯÄÚ´æÊý¾Ý±í¸ñ£¬¿ÉÒÔ˵ÊÇÒ»¸ö·Ç³£ÍêÕûµÄ´¦Àí¿ò¼Ü¡£ÔÚÕâ¸ö¹ý³Ìµ±ÖУ¬Spark-streamingµÄÒ»¸öÓ¦ÓúÍSpark SQLµÄÒ»¸öÓ¦Óö¼ÊÇÔÚͬһ¸öÓ¦Óýø³ÌÄÚ£¬Á½¸öÄ£¿éͬʱ·þÎñʵʱ´¦Àí¿ò¼Ü¡£

µ«¶ÔÓÚÕæÕýµÄService²¢²»Êʺϣ¬ËùÒÔÈçͼ4Ëùʾ²ÉÓÃÁËTachyon RawTables·½Ê½£¬°ÑSpark Streaming·ÅÔÚÁËÄÚ´ætablesÖУ¬ÎÒÃÇͨ¹ýSpark SQL½ø³ÌÒ²¿ÉÒÔ·ÃÎÊÄÚ´æÊý¾Ý´ïµ½¼´Ê±ÏìÓ¦µÄÄ¿µÄ¡£Í¬Ê±£¬Ê¹µÃ½ø³ÌºÍ½ø³Ì¸÷×Ô¹¤×÷ʱ¸ü¼ÓÎȶ¨£¬ÕâÒ²ÊÇËüÔÚÎÒÃÇÕæÊµ°¸ÀýÖеÄÒ»¸öʹÓá£

³ýÁËÎȶ¨ÐԺ͹¦ÄÜÐÔ¿¼ÂÇ£¬ÔÚʵ¼Ê°¸ÀýÖл¹Ê¹ÓÃÁËTachyonÀ´ÌáÉýÄÚ´æ¼ÆËãЧÂÊ¡£µü´úʽͼ¼ÆËãÐèÒª»º´æÒ»Ð©Ç°Âֵĵü´ú½á¹ûÒÔ·½±ãºóÂÖʹÓá£ÍùÍùÔÚÕæÊµ»·¾³Ï£¬ÓÐһЩ·Ç³£´óµÄͼÊý¾ÝÊǺÜÄѱ»È«²¿»º´æÔÚÄÚ´æ¿Õ¼ä£¬ËùÒÔÔÚÕâ¸ö¹ý³Ìµ±ÖУ¬ÄÚ´æ¾­³£³öÏÖÒì³££¬»òÕßÊdzöÏÖ³¤Ê±¼äµÄGC£¬ÓÖ»òÕßÕâ¸ö¹ý³Ì¼ÙËÀ»òÕßûÓÐÏìÓ¦¡£ËùÓÐÊý¾Ý´æÔÚTachyonµÄ²ã¼¶»º´æÀïÃæ¡£ÔÚÕâÀïÒýÈëÒ»¸ö´æ´¢²ã¼¶»¯¸ÅÄÓû§Ö»ÒªÅäÖöàÉÙ´ÅÅÌ£¬ÓжàÉÙHD£¬¶àÉÙÄÚ´æ¿Õ¼ä£¬¾Í¿ÉÒÔÊ×ÏÈ·ÅÈëÄڴ棬ÄÚ´æ²»¹»¾Í·ÅÈ뻺´æ£¬Ö®ºó»áÓиü´ó¿Õ¼äÈ¥·ÖÎöÕâ¸öÊý¾Ý¡£Í¨¹ýÕâÑùµÄʵÏÖ£¬´ó´ó¼õÉÙÁËGC¿ªÏú£¬Ìá¸ßÁË×îºóµÄÖ´ÐÐЧÂÊ¡£

ÌáÉýI/O

µÚ¶þµãÊÇI/O¡£Ê×ÏÈÌáµ½µÄÒ»¸öÊDZ¾µØ»¯£¬ÔںܶàÓ¦Óó¡¾°Ï£¬Å¼¶û»áÓÐÕâÑùµÄÇé¿ö£¬¾ÍÊÇSparkµÄÓ¦Óñ¾µØ»¯²¢Ã»Óд«Í³µÄMapReduceÄÇôºÃ£¬¾¿Æä¸ù±¾ÊÇSparkÔڵȴýеÄExecutor×¢²á¡£µ±ExecutorûÓÐÈ«²¿×¢²áÉÏÀ´£¬ÏµÍ³¾Í»á·ÖÅäÏàÓ¦µÄÈÎÎñ£¬ÈÎÎñ·ÖÅäµ½½Úµã£¬µ«²¢²»Ò»¶¨ÊÇÊý¾Ý´æ´¢½Úµã£¬´Ó¶øÔì³É·Ç³£Ôã¸âµÄºó¹û¡£µ±Ò»¸ö×÷ÒµÔËÐÐÒÔºó£¬Èçͼ5Ëùʾ£¬ÕâËÄÕÅͼÊÇÒ»¸öÍøÂçµÄÀûÓÃÂÊ£¬Ò»¶¨ÒªÒýÈëÍøÂçµÄ´ø¿í¡£

ÔÚÕâÒ»½×¶Î»¹ÊÇÄܹ»ÈÌÊܵģ¬ÒòΪ²¢Ã»ÓÐÕ¼ÂúÍøÂç´ø¿í¡£µ±È»¿ÉÄܶÔÓÚÆ½Ì¨·þÎñµÄÌṩÕß»òÕßά»¤ÕßÀ´ËµÈ´ÒѾ­ÊÇÀË·ÑÁË×ÊÔ´¡£¸üÑÏÖØµÄÎÊÌâÊÇÔÚµÚ¶þ¸ö½×¶Î£¬ËüÔì³ÉÁËÕû¸öÓ¦ÓõÄÊý¾Ý¼¯ÖÐÔÚ²¿·Ö½Úµã¡£µ±ÆäËû½Úµã´ÓÕâЩ½ÚµãShuffleÊý¾Ýʱ£¬ÍøÂç´ø¿í¾Í»á²úÉú100%ÀûÓõÄÇé¿ö¡£ÔÚÒÔÏÂÁ½¸ö·½ÃæÌá³ö¸Ä½ø£¬µÚÒ»¸öÊǼÓÈëÁ½¸ö¿Éµ÷²ÎÊý£¬Õâ¸öÓÅ»¯ºÜÖ±¹Û£¬¿ÉÒÔÑ¡ÔñµÈ´ý80%»òÕß90%¶¼×¢²áÒÔºóÀ´·ÖÅäÈÎÎñ¡£»¹ÓÐÒ»ÖÖ·½Ê½ÊǵȲ»ÆðµÄ£¬Õâ¸öʱºòÑ¡ÔñµÈ´ý¶àÉÙʱ¼ä£¬ÔÚÕâÖÖÇé¿öϼÓÁËһЩÓÅ»¯¡£ÓÅ»¯ºóµÄ½á¹ûÈçͼ6Ëùʾ£¬Í¬Ñù»¹ÊÇËÄÕÅͼ£¬Ò»¿ªÊ¼µÄÍøÂç´ø¿í¶¼·Ç³£ºÃ£¬ÌرðÊÇÔÚ×îºóÒ»¸ö½×¶ÎÄǸöÍøÂçÆ¿¾±±»È¡ÏûÁË£¬ËùÓÐϵͳ×îºóµÄÐÔÄÜ´ïµ½1.75±¶ÌáÉý¡£ÕâÊǵÚÒ»¸öÍøÂçµÄÓÅ»¯¡£

µÚ¶þ¸öÊÇÉæ¼°µ½´ÅÅÌ¡¢I/OÓÅ»¯µÄÍøÂç¡£ÎÒÃÇÓкܶàºÏ×÷»ï°éÔç¾ÍÓÐÁËHadoop¼¯Èº£¬ËùÒԴ󲿷ÖSparkÊDz¿ÊðÔÚYARNÉÏÃæ¡£±ÈÈçÔÚYARNµÄͬһ̨ÎïÀí½ÚµãÉÏNodeManagerÉÏ»áÓÐÈô¸É¸öContainer·þÎñÓÚͬһ¸öSparkÓ¦Óá£ÔÚSparkÆô¶¯Ê±¾ÍÐèÒª°ÑÕâЩ°ü·Ö·¢µ½¸÷¸ö½ÚµãÉÏ£¬Èç¹û´«Ë͵½Í¬Ò»¸öÎïÀí½ÚµãÉÏ£¬¾ÍÊÇÀË·ÑÁËÆ½Ì¨µÄ×ÊÔ´¡£ÏÂÃæÕâ¸öʵÀýÊÇ´ÅÅ̺ÍÍøÂçÍÌÍÂÁ¿£¬Èçͼ7Ëùʾ£¬ºìÉ«²¿·Ö¾ÍÊÇÓ¦ÓÃÆô¶¯Ê±¼ä£¬´ó¸ÅÊÇÊ®ÃëÖÓ£¬´ÅÅ̺ÍÍøÂçûÓдﵽƿ¾±£¬È´ÒòΪ·¢ËͶËÍøÂçµÄÆ¿¾±Ôì³ÉÕû¸öÆô¶¯ºÄʱ½Ï³¤¡£

ÔÚÕâ¸ö¹ý³Ìµ±ÖÐ×öÒ»¸öÓÅ»¯¡£ÓÅ»¯ºóµÄ½á¹ûÈçͼ8Ëùʾ£¬Ó¦ÓÃÆô¶¯Ê±¼ä²»µ½Ò»ÃëÖÓ£¬Ö»Ðè°ëÃëÖӾͿÉÒÔÍê³ÉÕû¸öÆô¶¯¹ý³ÌÍê³É£¬ËùÒÔÌáÉýÁËÊ®±¶¡£ÌرðÊǶÌ×÷Òµ£¬±¾ÉíÊÇÒ»ÃëÖÓʱ¼ä£¬µ«Æô¶¯ÓÃÁËÊ®ÃëÖӾͲ»ÊǺܺÏÀíÁË¡£

»¹ÓÐÒ»¸öʵÀýÒ²ÊǹØÓÚ´ÅÅ̵ġ£ÏÖÔںܶàÓû§¶¼»áÖ÷¶¯È¥»º´æÒ»¸öRDD£¬µ«ÕâÀï»á´æÔÚÒ»¸öÎÊÌ⣺ÄÚ´æÎÞ·¨»º´æËùÓÐÊý¾Ý£¬ÍùÍùÓû§»áÑ¡Ôñ±£ÊصĻº´æ·½Ê½£¬¼´ÄÚ´æºÍ´ÅÅÌ»ìºÏ´æ´¢£¬µ±ÄÚ´æ·Å²»ÏÂʱ£¬Òç³öµ½´ÅÅÌÖС£Èçͼ9ËùʾÊÇÒ»¸öÓ¦ÓÃʵÀý£¬Í¼Æ¬·Ö±ðÏÔʾCPUÀûÓÃÂʺʹÅÅ̵Ĵø¿í£¬Õâ¸ö´ÅÅ̵Ä×î¸ß·åÖµÊÇ100MB/s£¬ÔÚÕâ¸öÓ°ÏìÏ£¬CPUµÄÀûÓÃÂʷdz£µÍ£¬´Ó¶øµ¼ÖÂÕû¸öStageµÄʱ¼ä·Ç³£³¤¡£ÎÊÌâÊÇÓû§ÒѾ­ÅäÖÃÁ˶àÕÅ´ÅÅÌ£¬ËûÃǵĴø¿íȴûÓеõ½³ä·ÖÀûÓã¬Õâ¸ö¹ý³ÌÖдæÔÚÒ»¸öдͬ²½µÄÎÊÌâ¡£

ÓÅ»¯Ö®ºóµÄ½á¹ûÈçͼ10Ëùʾ¡£ÓÅ»¯Ö®ºó£¬Ê×ÏÈ´ÅÅÌ´ø¿íÌá¸ßÁË£¬Ò²¾ÍÊÇ´ÅÅÌ·åÖµÊÇ800MB/s£¬¼«´óÌá¸ßÁËЧÂÊ¡£Í¨¹ýÕâÑùµÄÓÅ»¯£¬Õû¸öRDDµÄCacheÓÐ3±¶ÌáÉý¡£

×îºóÒ»µã£¬¶ÔÓÚIntelÀ´ËµÏ£Íû¿´µ½µÄÊÇCPUÓÅ»¯£¬ÔÚ¿¼ÂÇÈçºÎÓÅ»¯¼ÆËãµÄͬʱ£¬Ò²Ï£ÍûÄܹ»ÓÅ»¯Õû¸öÈí¼þÕ»À´Ìṩ·þÎñ£¬Äܹ»³ä·ÖÀûÓÃÆ½ºâµÄÒ»¸öϵͳ¡£µÚÒ»¸öÀý×ÓºÍMapReduce Shuffle»ù±¾Ô­ÀíÐÔÊÇ´óͬСÒìµÄ¡£¶ÔSQL²éѯÀ´Ëµ£¬·Ç³£ÒÀÀµÓÚSort²Ù×÷¡£ÔÚ1.2°æ±¾ÀïÒýÈë»ùÓÚÅÅÐòµÄShuffle Write£¬½â¾öÁËһЩ¿ÉÀ©Õ¹ÐÔÎÊÌâ¡£ÔÚ³ä·ÖÀûÓÃ֮ǰµÄ½á¹ûµÄ»ù´¡ÉÏ×öÁËShuffle Read£¬µÃµ½ÁË×îºóµÄ½á¹û¡£Õâ¸ö¹¤×÷ÊÇÎÒÃǺÍClouderaµÄ¹¤³ÌʦһÆðÍê³ÉµÄ£¬ÎÒÃÇÔÚÄÚ´æÖнøÐÐÅÅÐò£¬È»ºó°ÑÕâЩÅÅÐò½á¹û¾¡¿ÉÄÜ¶àµØÔÚÄÚ´æÖкϲ¢£¬Èç¹ûÄÚ´æ²»¹»ÔòÒç³ö£¬×îºó·µ»ØÒ»¸öÖ±½ÓÅÅÐòµÄÊý¾Ý£¬ÕâÑù¾Í²»ÓÃÀË·Ñ×ÊÔ´ÖØÐ¼ÆËã¡£Èçͼ11Ëùʾ£¬·Ö±ðÊÇ´ó¡¢Ð¡¹æÄ£Êý¾Ý²âÊÔ½á¹û£¬¿ÉÒÔ¿´³ö£¬Í¨¹ýÕâ¸öÓÅ»¯£¬Reduce½×¶ÎÐÔÄÜ»áÌá¸ßÁ½±¶¡£

ÓÐÁËÕâ¸ö¹¦ÄÜ£¬Óû§¿ÉÒԵõ½MapReduce StyleµÄShuffle½á¹û£»Í¬Ê±£¬ÅäºÏÎÒÃÇ×î½üÌá½»µÄSort Merge Join£¬ÄÚ²âµÄ²éѯÐÔÄÜÌá¸ßÁË20%¡£

µÚ¶þ¸öÊǹØÓÚһЩ·Ç³£¸´ÔӵĻúÆ÷ѧËã·¨£¬±ÈÈç˵һЩͼµÄ¼ÆË㣬¶¼»áÓõ½Ò»Ð©´úÊýÔËËãµÄÖ§³Ö£¬¼´Óõ½Ò»Ð©¾ØÕó¼ÆË㣬ÕâÊÇÔڱȽϳ£¼ûµÄ³¡¾°¡£ËùÒÔÎÒÃÇÓÃÁËÒ»¸öIntel MKL£¬³ä·ÖÀûÓÃÁËÖ¸Áî¼¶ÓÅ»¯£¬ÔÚÐÔÄÜ·½ÃæµÃµ½Á˺ܴóµÄÌáÉý£¬Õâ¸öÒ²ÊÇÒ»¸öÕæÊµÓû§µÄ°¸Àý£¬¿ÉÒÔ´ïµ½2~4±¶ÐÔÄÜÌáÉý¡£Õⲿ·ÖÓ¦ÓôúÂëûÓпªÔ´£¬ÒòΪÐèÒªÓû§ÔÚÓ¦Óòã×ÔÐпª·¢£¬ÆäÓà¸Ä½øÓÅ»¯ÄÚÈݶ¼¿ÉÒÔÔÚ¿ªÔ´ÉçÇøÉÏ¿´µ½¡£

¹¤¾ß·ÖÏí

µÚÒ»¸öÊÇÅÜMapReduceÓû§·Ç³£ÊìϤµÄÒ»¸ö»ù×¼ÐÔ²âÊÔHiBench¡£ÎÒÃÇÍØÕ¹µ½ÁËSparkÉÏ¡£Ä¿Ç°Ìṩ¸÷ÖÖAPI£¨Scala¡¢Python¼°Java£©ÊµÏÖ£¬Ö§³ÖMR1£¨Standalone£©ºÍYARN¡£½«À´Ò²Ï£Íû¿ª·ÅStreamingµÄ»ù×¼ÐÔ²âÊÔ¡£×÷Ϊ´óÊý¾ÝµÄ»ù×¼ÐÔ²âÊÔ£¬Ï£Íû¿ÉÒÔ¸øÓû§Ò»¸öÖ±¹ÛÉϵĺâÁ¿±ê×¼£¬±È½Ï´úÂë¸Ä¶¯»òÕß°æ±¾¸Ä¶¯´øÀ´µÄÇø±ð¡£

µÚ¶þÊÇÎÒÃÇ×Ô¼º¿ª·¢µÄÐÔÄÜ·ÖÎö¹¤¾ß¡£¸Ã¹¤¾ßÊÇ»ùÓÚÒ»¸ö·Ç³£ÇáÁ¿¼¶µÄÎÞÇÖÈëʽʵÏÖ¡£Ëü¿ÉÒÔ°ïÖúÓû§²é¿´Spark·Ö½×¶ÎµÄÔËÐÐÇé¿ö£¬°üÀ¨ÏµÍ³µÄʹÓÃÇé¿ö¡£×îºóÎÒÃÇÌṩÁËWebÕ¹Ê¾Ò³Ãæ£¬·½±ã¹¤×÷ÈËÔ±¼ì²â»òÕß·ÖÎö½á¹û¡£ÒÔÉÏËùÓеݸÀý·ÖÎö¶¼ÊÇ»ùÓڸù¤¾ßÌṩµÄÐÅÏ¢µÃµ½µÄ¡£

µ±Ç°¹¤×÷ģʽ

×îºóÌáµ½ÏÖÔڵŤ×÷ģʽ£¬Ö÷Òª»¹ÊÇÔÚ¿ªÔ´ÉçÇøÉϵĿª·¢ÉÏ£¬Ò²»á´ÓÁ½¸öÇþµÀÀ´·¢ÏÖÎÊÌâºÍ½â¾ö¡£µÚÒ»£¬ºÍ¹ã·ººÏ×÷»ï°é·¢ÏÖÏÖÔÚÏßÉÏËùÓÐSparkµÄÎÊÌâ¡£µÚ¶þ£¬½ÓÏÂÀ´»áÖ÷ÒªÕë¶ÔSpark Core¡¢SQL×öһЩ¼æÈÝ·½ÃæµÄ¹¤×÷¡£Streaming×öµÄÊÇHA£¬»¹ÓÐRµÄÖ§³Ö£¬ÎÒÃÇÏÖÔÚÒ²½ô¸ú×ÅSpark RµÄ²½·¥ÔÚ×ö¸ü¶à¹±Ïס£

¼ò¶øÑÔÖ®£¬Ê×ÏÈSparkÔÚÕû¸öÉú̬Ȧ»òÕß´óÊý¾ÝÉÏÃæÆðµ½µÄ×÷ÓÃÊDz»ÈݺöÊӵģ¬ÕâÒ²ÊÇSpark¹±Ï×ÈËÔ±·Ç³£Ïë¿´µ½µÄ¡£µÚ¶þÊÇÏ£ÍûSpark¿ÉÒÔ×öµÃ¸üºÃ¸üÍêÉÆ£¬Èøü¶àÈËȥʹÓÃËü¡£ÖÁÓÚÈçºÎ×öµ½£¬Ê×ÏÈÏ£ÍûÄÜÃ÷°×Ó¦Ó㬻òÕßSparkÓ¦Óá¢Sparkƽ̨£¬±ÈÈç˵ÓÃһЩ¹¤¾ß£¬»òÕß˵ÓÃһЩÉú²ú»·¾³µÄʵ¼ù¡£µÚÈýÊÇÔõÑùÊʺÏSpark£¬Ã»Óзdz£Ã÷È·µÄMemoryºÍ¶à´ó¹æÄ£¼¯Èº£¬¿ÉÒԿ϶¨µÄÒ»µã¾ÍÊÇ×î¸ßЧµØ³ä·ÖÀûÓÃÁËÍøÂç¡¢´ÅÅÌ¡¢CPU¡£×îºóÏ£ÍûÓиü¶àµÄÓ¦ÓÃÕß¿ÉÒÔ¼°Ê±·´À¡Ê¹ÓÃÇé¿ö»òÕßÓöµ½µÄ¸÷ÖÖÎÊÌ⣬ÕâÊÇ´ó¼Ò¶ÔÓÚSpark×î´óµÄ¹±Ïס£

   
2687 ´Îä¯ÀÀ       27
Ïà¹ØÎÄÕÂ

»ùÓÚEAµÄÊý¾Ý¿â½¨Ä£
Êý¾ÝÁ÷½¨Ä££¨EAÖ¸ÄÏ£©
¡°Êý¾Ýºþ¡±£º¸ÅÄî¡¢ÌØÕ÷¡¢¼Ü¹¹Óë°¸Àý
ÔÚÏßÉ̳ÇÊý¾Ý¿âϵͳÉè¼Æ ˼·+Ч¹û
 
Ïà¹ØÎĵµ

GreenplumÊý¾Ý¿â»ù´¡Åàѵ
MySQL5.1ÐÔÄÜÓÅ»¯·½°¸
ijµçÉÌÊý¾ÝÖÐ̨¼Ü¹¹Êµ¼ù
MySQL¸ßÀ©Õ¹¼Ü¹¹Éè¼Æ
Ïà¹Ø¿Î³Ì

Êý¾ÝÖÎÀí¡¢Êý¾Ý¼Ü¹¹¼°Êý¾Ý±ê×¼
MongoDBʵս¿Î³Ì
²¢·¢¡¢´óÈÝÁ¿¡¢¸ßÐÔÄÜÊý¾Ý¿âÉè¼ÆÓëÓÅ»¯
PostgreSQLÊý¾Ý¿âʵսÅàѵ
×îл¼Æ»®
DeepSeekÔÚÈí¼þ²âÊÔÓ¦ÓÃʵ¼ù 4-12[ÔÚÏß]
DeepSeek´óÄ£ÐÍÓ¦Óÿª·¢Êµ¼ù 4-19[ÔÚÏß]
UAF¼Ü¹¹ÌåϵÓëʵ¼ù 4-11[±±¾©]
AIÖÇÄÜ»¯Èí¼þ²âÊÔ·½·¨Óëʵ¼ù 5-23[ÉϺ£]
»ùÓÚ UML ºÍEA½øÐзÖÎöÉè¼Æ 4-26[±±¾©]
ÒµÎñ¼Ü¹¹Éè¼ÆÓ뽨ģ 4-18[±±¾©]

MySQLË÷Òý±³ºóµÄÊý¾Ý½á¹¹
MySQLÐÔÄܵ÷ÓÅÓë¼Ü¹¹Éè¼Æ
SQL ServerÊý¾Ý¿â±¸·ÝÓë»Ö¸´
ÈÃÊý¾Ý¿â·ÉÆðÀ´ 10´óDB2ÓÅ»¯
oracleµÄÁÙʱ±í¿Õ¼äдÂú´ÅÅÌ
Êý¾Ý¿âµÄ¿çƽ̨Éè¼Æ

²¢·¢¡¢´óÈÝÁ¿¡¢¸ßÐÔÄÜÊý¾Ý¿â
¸ß¼¶Êý¾Ý¿â¼Ü¹¹Éè¼ÆÊ¦
HadoopÔ­ÀíÓëʵ¼ù
Oracle Êý¾Ý²Ö¿â
Êý¾Ý²Ö¿âºÍÊý¾ÝÍÚ¾ò
OracleÊý¾Ý¿â¿ª·¢Óë¹ÜÀí

GE Çø¿éÁ´¼¼ÊõÓëʵÏÖÅàѵ
º½Ìì¿Æ¹¤Ä³×Ó¹«Ë¾ Nodejs¸ß¼¶Ó¦Óÿª·¢
ÖÐÊ¢Òæ»ª ׿Խ¹ÜÀíÕß±ØÐë¾ß±¸µÄÎåÏîÄÜÁ¦
ijÐÅÏ¢¼¼Êõ¹«Ë¾ PythonÅàѵ
ij²©²ÊITϵͳ³§ÉÌ Ò×ÓÃÐÔ²âÊÔÓëÆÀ¹À
ÖйúÓÊ´¢ÒøÐÐ ²âÊÔ³ÉÊì¶ÈÄ£Ðͼ¯³É(TMMI)
ÖÐÎïÔº ²úÆ·¾­ÀíÓë²úÆ·¹ÜÀí