Äú¿ÉÒÔ¾èÖú£¬Ö§³ÖÎÒÃǵĹ«ÒæÊÂÒµ¡£

1Ôª 10Ôª 50Ôª





ÈÏÖ¤Â룺  ÑéÖ¤Âë,¿´²»Çå³þ?Çëµã»÷Ë¢ÐÂÑéÖ¤Âë ±ØÌî



  ÇóÖª ÎÄÕ ÎÄ¿â Lib ÊÓÆµ iPerson ¿Î³Ì ÈÏÖ¤ ×Éѯ ¹¤¾ß ½²×ù Modeler   Code  
»áÔ±   
 
   
 
 
     
   
 ¶©ÔÄ
  ¾èÖú
ÈçºÎ¹¹½¨×îÓÅ»¯µÄHadoop¼¯Èº
 
×÷ÕߣºMladen ANTUNOVIC À´Ô´£ºTechTargetÉÌÎñÖÇÄÜ ·¢²¼ÓÚ£º2015-1-5
  2528  次浏览      27
 

ÐòÑÔ

Êý¾Ý¿âºÍÎļþÖд¢´æµÄÊý¾ÝÁ¿Ã¿Ìì¶¼ÔÚÔö³¤£¬Òò´ËÎÒÃÇÐèÒª¹¹½¨Äܹ»´¢´æ´óÁ¿Êý¾Ý(¡°´óÊý¾Ý¡±)£¬²¢ÇÒÁ®¼Û¡¢¿Éά»¤¡¢¿ÉÉìËõµÄ»·¾³¡£´«Í³µÄ¹ØÏµÊý¾Ý¿â(RDBMS)ϵͳÔÚµ±Ç°µÄÐèÇóϳɱ¾¹ý¸ß²¢ÇÒ²»¿ÉÉìËõ£¬Òò´Ë¿ª·¢¡¢Ê¹ÓÃÄܹ»Âú×ãÐèÇóµÄм¼ÊõÕýºÏʱÒË¡£

ÔÚÕâЩ·½ÏòÖУ¬ÔƼÆËãÊÇÆäÖÐÒ»ÏîÁìÏȵļ¼Êõ¡£ÔƼÆËãÓÐÐí¶à²»Í¬µÄʵÏÖ£¬ÎÒÃÇÑ¡ÔñµÄÊÇHadoop£¬ÕâÊÇÒ»¸öÓµÓÐApacheÐí¿É¡¢»ùÓÚGoogle Map ReduceµÄ¿ò¼Ü¡£

ÔÚ±¾ÎÄÖУ¬ÎÒ½«³¢ÊÔ˵Ã÷ÈçºÎ¹¹½¨Ò»¸ö¿ÉÉìËõµÄHadoop¼¯Èº£¬ÒÔ´æ´¢¡¢Ë÷Òý¡¢¼ìË÷ºÍά»¤ÀíÂÛÉÏÎÞÏÞÈÝÁ¿µÄÊý¾Ý¡£

±¾ÎĽ«Öð²½½éÉÜÕâЩ²¿·ÖµÄ°²×°ºÍÅäÖãº

1.ÍøÂçÌåϵ½á¹¹

2.²Ù×÷ϵͳ

3.Ó²¼þÒªÇó

4.HadoopÈí¼þ°²×°/ÉèÖÃ

ÍøÂç¼Ü¹¹

¸ù¾ÝÎÒÃÇĿǰÄܹ»Äõ½µÄÎĵµ£¬¿ÉÒÔÈÏÎªÔÆÄڵĽڵãÔ½ÔÚÎïÀíÉϽӽü£¬Ô½ÄÜ»ñµÃ¸üºÃµÄÐÔÄÜ¡£¸ù¾Ý¾­Ñé£¬ÍøÂçÑÓʱԽС£¬ÐÔÄÜÔ½ºÃ¡£

ΪÁ˼õÉÙ±³¾°Á÷Á¿£¬ÎÒÃÇΪÕâ¸öÔÆ´´½¨ÁËÒ»¸öÐéÄâרÓÃÍø¡£ÁíÍ⣬»¹ÎªÓ¦Ó÷þÎñÆ÷ÃÇ´´½¨ÁËÒ»¸ö×ÓÍø£¬×÷Ϊ·ÃÎÊÔÆµÄÈë¿Úµã¡£

Õâ¸öÐéÄâרÓÃÍøµÄÔ¤¼ÆÊ±ÑÓ´óÔ¼ÊÇ1-2ºÁÃë¡£ÕâÑùÒ»À´£¬ÎïÀíÁÙ½üÐԾͲ»ÔÙÊÇÒ»¸öÎÊÌ⣬ÎÒÃÇÓ¦¸Ãͨ¹ý»·¾³²âÊÔÀ´ÑéÖ¤ÕâÒ»µã¡£

½¨ÒéµÄÍøÂç¼Ü¹¹£º

1.רÓÃTOR(Top of Rack)½»»»»ú

2.ʹÓÃרÓúËÐĽ»»»µ¶Æ¬»ò½»»»»ú

3.È·±£Ó¦Ó÷þÎñÆ÷¡°¿¿½ü¡±Hadoop

4.¿¼ÂÇʹÓÃÒÔÌ«Íø°ó¶¨

 

²Ù×÷ϵͳ

ÎÒÃÇÑ¡ÔñLinux×÷Ϊ²Ù×÷ϵͳ¡£LinuxÓÐÐí¶à²»Í¬µÄ·¢Ðа棬°üÀ¨Ubuntu¡¢RedHatºÍCentOSµÈ£¬ÎÞÂÛÑ¡ÔñÄÄÒ»¸ö¶¼¿ÉÒÔ¡£»ùÓÚÖ§³ÖºÍÐí¿É·ÑÓõĿ¼ÂÇ£¬ÎÒÃÇ×îÖÕÑ¡ÔñÁËCentOS 5.7¡£×îºÃÊǶ¨ÖÆÒ»¸öCentOSµÄÓ³Ïñ£¬°ÑÄÇЩÐèÒªµÄÈí¼þ¶¼Ô¤×°½øÈ¥£¬ÕâÑùËùÓеĻúÆ÷¿ÉÒÔ°üº¬ÏàͬµÄÈí¼þºÍ¹¤¾ß£¬ÕâÊÇÒ»¸öºÜºÃµÄ×ö·¨¡£

¸ù¾ÝClouderaµÄ½¨Ò飬OS²ãÓ¦¸Ã²ÉÓÃÒÔÏÂÉèÖãº

Îļþϵͳ

1.Ext3Îļþϵͳ

2.È¡Ïûatime

3.²»ÒªÊ¹ÓÃÂß¼­¾í¹ÜÀí

ÀûÓÃalternativesÀ´¹ÜÀíÁ´½Ó

ʹÓÃÅäÖùÜÀíϵͳ(Yum¡¢Permission¡¢sudoersµÈ)

¼õÉÙÄں˽»»»

³·ÏúÒ»°ãÓû§·ÃÎÊÕâÐ©ÔÆ¼ÆËã»úµÄȨÏÞ

²»ÒªÊ¹ÓÃÐéÄ⻯

ÖÁÉÙÐèÒªÒÔÏÂLinuxÃüÁ

/etc/alternatives

ln¡¢chmod¡¢chown¡¢chgrp¡¢mount¡¢umount¡¢kill¡¢rm¡¢yum¡¢mkdir

Ó²¼þÒªÇó

ÓÉÓÚHadoop¼¯ÈºÖÐÖ»ÓÐÁ½ÖÖ½Úµã(Namenode/JobtrackerºÍDatanode/Tasktracker)£¬Òò´Ë¼¯ÈºÄÚµÄÓ²¼þÅäÖò»Òª³¬¹ýÁ½ÖÖ»òÈýÖÖ¡£

 

ͼ2 - Hadoop¼¯Èº·þÎñÆ÷½ÇÉ«

Ó²¼þ½¨Ò飺

Namenode/Jobtracker£º1Gb/sÒÔÌ«Íø¿Úx2¡¢16GBÄÚ´æ¡¢4¸öCPU¡¢100GB´ÅÅÌ

Datanode£º1Gb/sÒÔÌ«Íø¿Úx2¡¢8GBÄÚ´æ¡¢4¸öCPU¡¢¶à¸ö´ÅÅÌ£¬×ÜÈÝÁ¿500GBÒÔÉÏ

ʵ¼ÊµÄÓ²¼þÅäÖÿÉÒÔÓëÎÒÃǽ¨ÒéµÄÅäÖò»Í¬£¬ÕâÈ¡¾öÓÚÄãÃÇÐèÒª´æ´¢ºÍ´¦ÀíµÄÊý¾ÝÁ¿¡£µ«ÎÒÃÇÇ¿ÁÒ½¨Òé²»ÒªÔÚ¼¯ÈºÖлìÓò»Í¬µÄÓ²¼þÅäÖã¬ÒÔÃâÄÇЩ½ÏÈõµÄ»úÆ÷³ÉΪϵͳµÄÆ¿¾±¡£

HadoopµÄ»ú¼Ü¸ÐÖª

HadoopÓÐÒ»¸ö¡°»ú¼Ü¸ÐÖª¡±ÌØÐÔ¡£¹ÜÀíÔ±¿ÉÒÔÊÖ¹¤¶¨Òåÿ¸öslaveÊý¾Ý½ÚµãµÄ»ú¼ÜºÅ¡£ÎªÊ²Ã´Òª×öÕâôÂé·³µÄÊÂÇé?ÓÐÁ½¸öÔ­Òò£º·ÀÖ¹Êý¾Ý¶ªÊ§ºÍÌá¸ßÍøÂçÐÔÄÜ¡£

 

ͼ3 - Hadoop¼¯ÈºµÄ»ú¼Ü¸ÐÖª

ΪÁË·ÀÖ¹Êý¾Ý¶ªÊ§£¬Hadoop»á½«Ã¿¸öÊý¾Ý¿é¸´ÖƵ½¶à¸ö»úÆ÷ÉÏ¡£ÏëÏóһϣ¬Èç¹ûij¸öÊý¾Ý¿éµÄËùÓп½±´¶¼ÔÚͬһ¸ö»ú¼ÜµÄ²»Í¬»úÆ÷ÉÏ£¬¶øÕâ¸ö»ú¼Ü¸ÕºÃ·¢Éú¹ÊÕÏÁË(½»»»»ú»µÁË£¬»òÕßµçÔ´µôÁË)£¬ÕâµÃÓж౯¾ç?ΪÁË·ÀÖ¹³öÏÖÕâÖÖÇé¿ö£¬±ØÐëÒªÓÐÒ»¸öÈËÀ´¼ÇסËùÓÐÊý¾Ý½ÚµãÔÚÍøÂçÖеÄλÖ㬲¢ÇÒÓÃÕâЩ֪ʶÀ´È·¶¨¡ª¡ª°ÑÊý¾ÝµÄËùÓп½±´ÃÇ·ÅÔÚÄÄЩ½ÚµãÉϲÅÊÇ×îÃ÷Öǵġ£Õâ¸ö¡°ÈË¡±¾ÍÊÇName Node¡£

ÁíÍ⻹ÓÐÒ»¸ö¼ÙÉ裬¼´Ïà±È²»Í¬»ú¼Ü¼äµÄ»úÆ÷£¬Í¬Ò»¸ö»ú¼ÜµÄ»úÆ÷Ö®¼äÓÐןü´óµÄ´ø¿íºÍ¸üСµÄÑÓʱ¡£ÕâÊÇÒòΪ£¬»ú¼Ü½»»»»úµÄÉÏÐдø¿íÒ»°ã¶¼Ð¡ÓÚÏÂÐдø¿í¡£¶øÇÒ£¬»ú¼ÜÄÚµÄÑÓʱһ°ãҲСÓÚ¿ç»ú¼ÜµÄÑÓʱ(µ«Ò²²»¾ø¶Ô)¡£

»ú¼Ü¸ÐÖªµÄȱµãÔòÊÇ£¬ÎÒÃÇÐèÒªÊÖ¹¤ÎªÃ¿¸öÊý¾Ý½ÚµãÉèÖûú¼ÜºÅ£¬»¹Òª²»¶ÏµØ¸üÐÂÕâЩÐÅÏ¢£¬±£Ö¤ËüÃÇÊÇÕýÈ·µÄ¡£ÒªÊÇ»ú¼Ü½»»»»úÃÇÄܹ»×Ô¶¯ÏòNamenodeÌṩ±¾»ú¼ÜµÄÊý¾Ý½ÚµãÁÐ±í£¬ÄǾÍÌ«°ôÁË¡£

HadoopÈí¼þµÄ°²×°ºÍÅäÖÃ

Hadoop¼¯ÈºÓжàÖÖ¹¹½¨·½Ê½£º

1.ÊÖ¹¤ÏÂÔØtarÎļþ²¢¸´ÖƵ½¼¯ÈºÖÐ

2.ÀûÓÃYum²Ö¿â

3.ÀûÓÃPuppetµÈ×Ô¶¯»¯²¿Ê𹤾ß

ÎÒÃDz»½¨Òé²ÉÓÃÊÖ¹¤·½Ê½£¬ÄÇÖ»ÊʺϺÜСµÄ¼¯Èº(4½ÚµãÒÔÏÂ)£¬¶øÇÒ»á´øÀ´ºÜ¶àά»¤ºÍÅÅÕÏÉϵÄÎÊÌ⣬ÒòΪËùÓеıä¸ü¶¼ÐèÒªÓÃscp»òsshµÄ·½Ê½ÊÖ¹¤Ó¦Óõ½ËùÓеĽڵãÉÏÈ¥¡£

´ÓÒÔÏ·½ÃæÀ´¿´£¬ÀûÓÃPuppetµÈ²¿Ê𹤾ßÊÇ×î¼ÑµÄÑ¡Ôñ£º

1.°²×°

2.ÅäÖÃ

3.ά»¤

4.À©Õ¹ÐÔ

5.¼à¿Ø

6.ÅÅÕÏ

PuppetÊÇUnix/LinuxϵÄÒ»¸ö×Ô¶¯»¯¹ÜÀíÒýÇæ£¬ËüÄÜ»ùÓÚÒ»¸ö¼¯ÖÐʽµÄÅäÖÃÖ´ÐÐÔö¼ÓÓû§¡¢°²×°Èí¼þ°ü¡¢¸üзþÎñÆ÷ÅäÖõȹÜÀíÈÎÎñ¡£ÎÒÃǽ«Ö÷Òª½²½âÈçºÎÀûÓÃYumºÍPuppetÀ´°²×°Hadoop¡£

ÀûÓÃYum/Puppet´î½¨Hadoop¼¯Èº

ÒªÀûÓÃPuppet´î½¨Hadoop¼¯Èº£¬Ê×ÏÈÒª·ûºÏÒÔÏÂǰÖÃÌõ¼þ£º

1.°üº¬ËùÓбØÐèHadoopÈí¼þµÄÖÐÑë²Ö¿â

2.ÓÃÓÚHadoop²¿ÊðµÄPuppet×°ÔØµ¥(manifest)

3.ÓÃÓÚHadoopÅäÖùÜÀíµÄPuppet×°ÔØµ¥

4.ÓÃÓÚ¼¯ÈºÎ¬»¤µÄ¿ò¼Ü(Ö÷ÒªÊÇsh»òksh½Å±¾)£¬ÒÔÖ§³Ö¼¯ÈºµÄstart/stop/restart

5.ÀûÓÃpuppet¹¹½¨Õû¸ö·þÎñÆ÷(°üÀ¨²Ù×÷ϵͳºÍÆäËüÈí¼þ)

×¢£ºÈç¹ûÒªÓÃYumÀ´°²×°Hadoop¼¯Èº£¬ÔòËùÓзþÎñÆ÷Ó¦¸ÃÔ¤Ïȹ¹½¨Íê³É£¬°üÀ¨²Ù×÷ϵͳºÍÆäËüÈí¼þ¶¼Ó¦°²×°Íê±Ï£¬yum²Ö¿âÒ²Ó¦ÔÚËùÓнڵãÉÏÉèÖÃÍê±Ï¡£

¹¹½¨Datanode/Tasktracker

Èç¹ûÓÃYum°²×°Datanode/Tasktracker£¬ÐèÔÚËùÓÐÊý¾Ý½ÚµãÉÏÖ´ÐÐÒÔÏÂÃüÁ

yum install hadoop-0.20-datanode ¨Cy 
¡¡¡¡yum install hadoop-0.20-tasktracker ¨Cy

»»³ÉPuppetµÄ»°£¬ÔòÊÇ£º

class setup_datanode { 
¡¡¡¡if ($is_datanode == true) {
¡¡¡¡make_dfs_data_dir { $hadoop_disks: }
¡¡¡¡make_mapred_local_dir { $hadoop_disks: }
¡¡¡¡fix_hadoop_parent_dir_perm { $hadoop_disks: }
¡¡¡¡}
¡¡¡¡# fix hadoop parent dir permissions
¡¡¡¡define fix_hadoop_parent_dir_perm() {
¡¡¡¡¡­
¡¡¡¡}
¡¡¡¡# make dfs data dir
¡¡¡¡define make_dfs_data_dir() {
¡¡¡¡¡­
¡¡¡¡}
¡¡¡¡# make mapred local and system dir
¡¡¡¡define make_mapred_local_dir() {
¡¡¡¡¡­
¡¡¡¡}
¡¡¡¡} # setup_datanode

¹¹½¨Namenode(¼°¸¨ÖúNamenode)

Èç¹ûÓÃYum°²×°Namenode£¬ÐèÔÚËùÓÐÊý¾Ý½ÚµãÉÏÖ´ÐÐÒÔÏÂÃüÁ

yum install hadoop-0.20-namenode ¨Cy 
¡¡¡¡yum install hadoop-0.20-secondarynamenode ¨Cy

»»³ÉPuppetµÄ»°£¬ÔòÊÇ£º

class setup_namenode { 
¡¡¡¡if ($is_namenode == true or $is_standby_namenode == true) {
¡¡¡¡...
¡¡¡¡}
¡¡¡¡exec {"namenode-dfs-perm":
¡¡¡¡...
¡¡¡¡}
¡¡¡¡exec { "make ${nfs_namenode_dir}/dfs/name":
¡¡¡¡...
¡¡¡¡}
¡¡¡¡exec { "chgrp ${nfs_namenode_dir}/dfs/name":
¡¡¡¡...
¡¡¡¡}
¡¡¡¡if ($standby_namenode_host != "") {
¡¡¡¡...
¡¡¡¡}
¡¡¡¡exec { "own $nfs_standby_namenode_dir":
¡¡¡¡...
¡¡¡¡}
¡¡¡¡}
¡¡¡¡# /standby_namenode_hadoop
¡¡¡¡if ($standby_namenode_host != "") {
¡¡¡¡...
¡¡¡¡}
¡¡¡¡exec { "own $standby_namenode_hadoop_dir":
¡¡¡¡...
¡¡¡¡}
¡¡¡¡}
¡¡¡¡}
¡¡¡¡}
¡¡¡¡class setup_secondary_namenode {
¡¡¡¡if ($is_secondarynamenode == true) {
¡¡¡¡...
¡¡¡¡}
¡¡¡¡....
¡¡¡¡}
¡¡¡¡exec {"namenode-dfs-perm":
¡¡¡¡...
¡¡¡¡}
¡¡¡¡}
¡¡¡¡}

¹¹½¨JobTracker

Èç¹ûÓÃYum°²×°Jobtracker£¬ÐèÔÚËùÓÐÊý¾Ý½ÚµãÉÏÖ´ÐÐÒÔÏÂÃüÁ

yum install hadoop-0.20-jobtracker ¨Cy

»»³ÉPuppetµÄ»°£¬ÔòÊÇʹÓÃÓë¹¹½¨NamenodeÏàͬµÄ×°ÔØµ¥£¬Î¨Ò»µÄÇø±ðÔÚÓÚ£¬ÔÚJobtracker»úÆ÷ÉÏ£¬»áÆô¶¯Jobtracker¡ª¡ª¼´½«¸Ã»úÆ÷ÉϵÄis_jobtrackerÉèÖÃΪtrue¡£

   
2528 ´Îä¯ÀÀ       27
Ïà¹ØÎÄÕÂ

»ùÓÚEAµÄÊý¾Ý¿â½¨Ä£
Êý¾ÝÁ÷½¨Ä££¨EAÖ¸ÄÏ£©
¡°Êý¾Ýºþ¡±£º¸ÅÄî¡¢ÌØÕ÷¡¢¼Ü¹¹Óë°¸Àý
ÔÚÏßÉ̳ÇÊý¾Ý¿âϵͳÉè¼Æ ˼·+Ч¹û
 
Ïà¹ØÎĵµ

GreenplumÊý¾Ý¿â»ù´¡Åàѵ
MySQL5.1ÐÔÄÜÓÅ»¯·½°¸
ijµçÉÌÊý¾ÝÖÐ̨¼Ü¹¹Êµ¼ù
MySQL¸ßÀ©Õ¹¼Ü¹¹Éè¼Æ
Ïà¹Ø¿Î³Ì

Êý¾ÝÖÎÀí¡¢Êý¾Ý¼Ü¹¹¼°Êý¾Ý±ê×¼
MongoDBʵս¿Î³Ì
²¢·¢¡¢´óÈÝÁ¿¡¢¸ßÐÔÄÜÊý¾Ý¿âÉè¼ÆÓëÓÅ»¯
PostgreSQLÊý¾Ý¿âʵսÅàѵ
×îл¼Æ»®
DeepSeek´óÄ£ÐÍÓ¦Óÿª·¢ 6-12[ÏÃÃÅ]
È˹¤ÖÇÄÜ.»úÆ÷ѧϰTensorFlow 6-22[Ö±²¥]
»ùÓÚ UML ºÍEA½øÐзÖÎöÉè¼Æ 6-30[±±¾©]
ǶÈëʽÈí¼þ¼Ü¹¹-¸ß¼¶Êµ¼ù 7-9[±±¾©]
Óû§ÌåÑé¡¢Ò×ÓÃÐÔ²âÊÔÓëÆÀ¹À 7-25[Î÷°²]
ͼÊý¾Ý¿âÓë֪ʶͼÆ× 8-23[±±¾©]

MySQLË÷Òý±³ºóµÄÊý¾Ý½á¹¹
MySQLÐÔÄܵ÷ÓÅÓë¼Ü¹¹Éè¼Æ
SQL ServerÊý¾Ý¿â±¸·ÝÓë»Ö¸´
ÈÃÊý¾Ý¿â·ÉÆðÀ´ 10´óDB2ÓÅ»¯
oracleµÄÁÙʱ±í¿Õ¼äдÂú´ÅÅÌ
Êý¾Ý¿âµÄ¿çƽ̨Éè¼Æ


²¢·¢¡¢´óÈÝÁ¿¡¢¸ßÐÔÄÜÊý¾Ý¿â
¸ß¼¶Êý¾Ý¿â¼Ü¹¹Éè¼ÆÊ¦
HadoopÔ­ÀíÓëʵ¼ù
Oracle Êý¾Ý²Ö¿â
Êý¾Ý²Ö¿âºÍÊý¾ÝÍÚ¾ò
OracleÊý¾Ý¿â¿ª·¢Óë¹ÜÀí


GE Çø¿éÁ´¼¼ÊõÓëʵÏÖÅàѵ
º½Ìì¿Æ¹¤Ä³×Ó¹«Ë¾ Nodejs¸ß¼¶Ó¦Óÿª·¢
ÖÐÊ¢Òæ»ª ׿Խ¹ÜÀíÕß±ØÐë¾ß±¸µÄÎåÏîÄÜÁ¦
ijÐÅÏ¢¼¼Êõ¹«Ë¾ PythonÅàѵ
ij²©²ÊITϵͳ³§ÉÌ Ò×ÓÃÐÔ²âÊÔÓëÆÀ¹À
ÖйúÓÊ´¢ÒøÐÐ ²âÊÔ³ÉÊì¶ÈÄ£Ðͼ¯³É(TMMI)
ÖÐÎïÔº ²úÆ·¾­ÀíÓë²úÆ·¹ÜÀí