ά¶È½¨Ä£ÊÇÊý¾Ý½¨Ä£µÄÒ»ÖÖÌØÊâ·½·¨¡£Î¬¶È½¨Ä£ÓÐÁ½¸öͬÒå´Ê£¬Êý¾Ý¼¯ÊкÍÐÇÐͽṹ¡£ÐÇÐͽṹÊÇΪÁ˸üºÃµØ½øÐÐÊý¾Ý·ÖÎö£¬²Î¿¼ÏÂÃæÍ¼Ê¾µÄά¶ÈÄ£ÐÍ£¬¿ÉÒÔÓÐÒ»¸öºÜÖ±¹ÛµÄÀí½â¡£Í¨¹ýËü¿ÉÒÔÁ¢¼´ÖªµÀÈçºÎͨ¹ý¿Í»§¡¢²úÆ·¡¢Ê±¼ä¶Ô¶©µ¥½øÐзָÈçºÎͨ¹ý¶ÈÁ¿µÄ¾Û¼¯ºÍ±È½Ï¶Ô¶©µ¥ÒµÎñ¹ý³Ì½øÐм¨Ð§ÆÀ¹À¡£

ά¶È½¨Ä£ÒÑËÀ?
ÔڻشðÕâ¸öÎÊÌâ֮ǰ£¬ÈÃÎÒÃÇ»ØÍ·À´¿´¿´Ê²Ã´ÊÇËùνµÄά¶ÈÊý¾Ý½¨Ä£¡£
ΪʲôÐèҪΪÊý¾Ý½¨Ä£?
ÓÐÒ»¸ö³£¼ûµÄÎóÇø£¬Êý¾Ý½¨Ä£µÄÄ¿µÄÊÇÓà ER ͼÀ´Éè¼ÆÎïÀíÊý¾Ý¿â£¬Êµ¼ÊÉÏÔ¶²»½öÈç´Ë¡£Êý¾Ý½¨Ä£´ú±íÁËÆóÒµÒµÎñÁ÷³ÌµÄ¸´ÔÓ¶È£¬¼Ç¼ÁËÖØÒªµÄÒµÎñ¹æÔòºÍ¸ÅÄ²¢ÓÐÖúÓڹ淶ÆóÒµµÄ¹Ø¼üÊõÓï¡£ËüÇåÎúµØ²ûÊö¡¢ÐÖúÆóÒµ½ÒʾÉÌÒµ¹ý³ÌÖÐÄ£ºýµÄÏë·¨ºÍÆçÒå¡£´ËÍ⣬¿ÉÒÔʹÓÃÊý¾ÝÄ£ÐÍÓëÆäËûÀûÒæÏà¹ØÕß½øÐÐÓÐЧ¹µÍ¨¡£Ã»ÓÐÀ¶Í¼£¬²»¿ÉÄܽ¨ÔìÒ»¸ö·¿×Ó»òÇÅÁº¡£ËùÒÔ£¬Ã»ÓÐÊý¾ÝÄ£ÐÍÕâÑùÒ»¸öÀ¶Í¼£¬ÎªÊ²Ã´Òª½¨Á¢Ò»¸öÊý¾ÝÓ¦Ó㬱ÈÈçÊý¾Ý²Ö¿âÄØ?
ΪʲôÐèҪά¶È½¨Ä£?
ά¶È½¨Ä£ÊÇÊý¾Ý½¨Ä£µÄÒ»ÖÖÌØÊâ·½·¨¡£Î¬¶È½¨Ä£ÓÐÁ½¸öͬÒå´Ê£¬Êý¾Ý¼¯ÊкÍÐÇÐͽṹ¡£ÐÇÐͽṹÊÇΪÁ˸üºÃµØ½øÐÐÊý¾Ý·ÖÎö£¬²Î¿¼ÏÂÃæÍ¼Ê¾µÄά¶ÈÄ£ÐÍ£¬¿ÉÒÔÓÐÒ»¸öºÜÖ±¹ÛµÄÀí½â¡£Í¨¹ýËü¿ÉÒÔÁ¢¼´ÖªµÀÈçºÎͨ¹ý¿Í»§¡¢²úÆ·¡¢Ê±¼ä¶Ô¶©µ¥½øÐзָÈçºÎͨ¹ý¶ÈÁ¿µÄ¾Û¼¯ºÍ±È½Ï¶Ô¶©µ¥ÒµÎñ¹ý³Ì½øÐм¨Ð§ÆÀ¹À¡£
ά¶È½¨Ä£×î¹Ø¼üµÄÒ»µã£¬ÊÇÒª¶¨ÒåÊÂÎñÐÔÒµÎñ¹ý³ÌÖеÄ×îµÍÁ£¶ÈÊÇʲô¡£Èç¹ûÇиî»ò×êÈëÊý¾Ý£¬µ½Ò¶¼¶¾Í²»ÄÜÔÙÍùÏÂ×êÈ¡¡£´ÓÁíÒ»¸ö½Ç¶È¿´£¬ÐÇÐͽṹÖеÄ×îµÍÁ£¶È£¬¼´ÊÂʵºÍά¶ÈÖ®¼äûÓнøÐÐÈκξۼ¯µÄ¹ØÁª¡£

Êý¾Ý½¨Ä£ºÍά¶È½¨Ä£
±ê×¼Êý¾Ý½¨Ä£µÄÈÎÎñ£¬ÊÇÏû³ýÖØ¸´ºÍÈßÓàµÄÊý¾Ý¡£µ±Êý¾Ý·¢Éú±ä»¯Ê±£¬ÎÒÃÇÖ»ÐèÔÚÒ»¸öµØ·½ÐÞ¸ÄËü£¬ÕâÓÐÖúÓÚ±£Ö¤Êý¾ÝµÄÖÊÁ¿£¬±ÜÃâÁ˲»Í¬µØ·½µÄÊý¾Ý²»Í¬²½¡£²Î¿¼ÏÂÃæÍ¼Ê¾µÄÄ£ÐÍ£¬Ëü°üº¬ÁË´ú±íµØÀí¸ÅÄîµÄ¼¸ÕÅ±í¡£Ôڹ淶»¯Ä£ÐÍÖУ¬Ã¿¸öʵÌåÓÐÒ»¸ö¶ÀÁ¢µÄ±í£¬Êý¾Ý½¨Ä£Ö»ÓÐÒ»ÕÅ±í£ºgeography¡£ÔÚÕâÕűíÖУ¬city
»áÖØ¸´³öÏֺܶà´Î¡£¶ø¶ÔÓÚÿ¸ö city£¬Èç¹û country ¸Ä±äÁËÃû×Ö£¬¾Í²»µÃ²»ÔÚºÜ¶àµØ·½½øÐиüС£

×¢£º±ê×¼Êý¾ÝÄ£ÐÍ×ÜÊÇ×ñÊØ 3NF ģʽ¡£
±ê×¼µÄÊý¾Ý½¨Ä££¬±¾Éí²¢²»ÊÇΪÁËÉÌÒµÖÇÄܵŤ×÷¸ºÔضøÉè¼ÆµÄ¡£Ì«¶àµÄ±í»áµ¼Ö¹ý¶àµÄ¹ØÁª£¬¶ø±í¹ØÁª»áµ¼ÖÂÐÔÄÜϽµ£¬ÔÚÊý¾Ý·ÖÎöÖÐÎÒÃÇÒª¾¡Á¦È¥±ÜÃâÕâÖÖÇéÐη¢Éú¡£Êý¾Ý½¨Ä£¹ý³ÌÖУ¬Í¨¹ý·´¹æ·¶»¯°Ñ¶à¸öÏà¹Ø±íºÏ²¢³ÉÒ»¸ö±í£¬ÀýÈçÇ°ÃæÀý×ÓÀïµÄ¶à¸ö±í±»Ô¤ºÏ²¢³ÉÒ»¸ö
geography 񡭜
ÄÇôΪºÎ²¿·ÖÈËÈÏΪά¶È½¨Ä£ÒÑËÀ?
Ò»°ãÈ˶¼ÈÏ¿ÉÊý¾Ý½¨Ä£µÄ·½Ê½£¬¶ø°Ñά¶È½¨Ä£µ±³ÉÌØÊâ´¦Àí·½Ê½£¬ËüÃǶ¼ÊÇÓмÛÖµµÄ¡£ÄÇΪʲôÔÚ´óÊý¾ÝºÍ Hadoop
µÄʱ´ú£¬²¿·ÖÈË»áÈÏΪά¶È½¨Ä£Ã»ÓÃÁË?
¡°Êý¾Ý²Ö¿âÖ®ËÀ¡±
Ê×ÏÈ£¬Ò»Ð©ÈË»ìÏýÁËά¶È½¨Ä£ºÍÊý¾Ý²Ö¿â¡£ËûÃÇÈÏΪÊý¾Ý²Ö¿âÒÑËÀ£¬ÓÚÊǵóö½áÂÛ£ºÎ¬¶È½¨Ä£Ò²¿ÉÒÔ±»¶ª½øÀúÊ·µÄÀ¬»øÏä¡£ÕâÖÖÂÛµãÔÚÂß¼ÉÏÊÇÁ¬¹áµÄ£¬µ«ÊÇ£¬Êý¾Ý²Ö¿âµÄ¸ÅÄîԶûÓйýʱ¡£ÎÒÃÇ×ÜÊÇÐèÒª¼¯³ÉµÄ¡¢¿É¿¿µÄÊý¾ÝÀ´²úÉúÉÌÒµÖÇÄÜÒDZíÅÌ(BI
Dashboards)¡£
Ö»¶Á½á¹¹µÄÎó½â
µÚ¶þ¸ö³£Ìý¼ûµÄÕùÂÛ£¬±ÈÈç¡°ÎÒÃÇ×ñÑÖ»¶Á·½Ê½µÄ½á¹¹(Schema)£¬ËùÒÔ²»ÐèÒª¶ÔÊý¾ÝÔÙ½øÐн¨Ä£ÁË¡±¡£ÒÀÎÒ¿´À´£¬ÕâÊÇÊý¾Ý·ÖÎö¹ý³ÌÖÐ×î´óµÄÎó½âÖ®Ò»¡£ÎÒͬÒâÆð³õ½öת´¢ÔʼÊý¾Ý£¬Õâʱ²»¹ý¶à¿¼ÂǽṹÊÇÓÐÒâÒåµÄ¡£µ«ÊÇ£¬Õâ²»Ó¦¸Ã³ÉΪ²»¶ÔÊý¾Ý½øÐн¨Ä£µÄ½è¿Ú¡£Ö»¶Á·½Ê½µÄ½á¹¹Ö»ÊǽµµÍÁËÏÂÓÎϵͳµÄÄÜÁ¦ºÍÔðÈΣ¬Ò»Ð©È˲»µÃ²»Ò§ÑÀÈ¥¶¨ÒåÊý¾ÝÀàÐÍ¡£·ÃÎÊÎÞģʽÊý¾Ýת´¢µÄÿһ¸ö½ø³Ì¶¼ÐèÒª×Ô¼ºÅªÇå³þ·¢ÉúÁËʲô£¬¶øÕâÍêÈ«ÊǶàÓàµÄ¡£Í¨¹ý¶¨ÒåÊý¾ÝÀàÐͺÍÕýÈ·µÄ½á¹¹£¬¿ÉÒÔºÜÈÝÒ׵رÜÃâÕâЩ¹¤×÷¡£
ÔÙ̸·´¹æ·¶»¯ºÍÎïÀíÄ£ÐÍ
ÊÇ·ñÄÇЩÐû´«Î¬¶È½¨Ä£µÄ¹Ûµãʵ¼ÊÉÏÒѹýʱÁË?µÄÈ·ÓÐЩ¹Ûµã±ÈÉÏÃæÁгöµÄÁ½Ìõ¸üºÃ£¬ÒªÀí½âËüÃÇÐèÒª¶ÔÎïÀí½¨Ä£ºÍ
Hadoop µÄ¹¤×÷·½Ê½ÓÐһЩÁ˽⡣
Ç°Ãæ¼òµ¥Ìáµ½²ÉÓÃά¶È½¨Ä£µÄÔÒòÖ®Ò»£¬ºÍÊý¾ÝµÄÎïÀí´æ´¢·½Ê½Óйء£±ê×¼Êý¾Ý½¨Ä£ÖÐÿ¸öÕæÊµÊÀ½çÀïµÄʵÌ壬ÓÐÒ»¸ö×Ô¼ºµÄ±í¡£ÎÒÃÇÕâÑù×ö£¬ÊÇΪÁ˱ÜÃâÊý¾ÝÈßÓàºÍÖÊÁ¿ÎÊÌâÔÚÊý¾ÝÖÐÂûÑÓ¡£Ô½¶àµÄ±í£¬¾ÍÐèÒªÔ½¶àµÄ¹ØÁª£¬ÕâÊDZê×¼½¨Ä£µÄȱµã¡£±í¹ØÁªµÄ´ú¼ÛÊǰº¹óµÄ£¬ÌرðÊǹØÁªÊý¾Ý¼¯ÖйØÁª´óÁ¿¼Ç¼µÄʱºòÓÈÆäÍ»³ö¡£µ±ÎÒÃÇ¿¼ÂÇά¶È½¨Ä£Ê±£¬»á°Ñ¶à¸ö±íºÏ²¢ÆðÀ´£¬Õâ¾ÍÊÇËùνµÄÔ¤¹ØÁª»òÕß˵Êý¾Ý·´¹æ·¶»¯¡£×îºóµÄ½á¹ûÊÇ£¬µÃµ½¸üÉÙµÄ±í¡¢¸üÉٵĹØÁª¡¢¸üµÍµÄÑӳٺ͸üºÃµÄ²éѯÐÔÄÜ¡£
¿É²ÎÓëÁìÓ¢ÉÏÏà¹ØµÄÌÖÂÛ¡£
³¹µ×·´¹æ·¶»¯
Ϊʲô²»°Ñ·´¹æ·¶»¯×öµ½³¹µ×?È¥µôËùÓÐµÄ±í¹ØÁªÖ»±£ÁôÒ»Õűí?µÄÈ·£¬ÕâÑù×ö¿ÉÒÔ²»ÐèÒª¶ÔÈÎºÎ±í½øÐйØÁª£¬µ«ÊÇ¿ÉÒÔÏëÏóµ½£¬Ëü»á´øÀ´Ò»Ð©¸ºÃæÓ°Ïì¡£Ê×ÏÈ£¬ËüÐèÒª¸ü¶àµÄ´æ´¢£¬ÒòΪҪ´æ´¢´óÁ¿µÄÈßÓàÊý¾Ý¡£Ëæ×ÅÊý¾Ý·ÖÎöµÄÁÐʽ´æ´¢¸ñʽµÄ³öÏÖ£¬ÕâÒ»µãÏÖÔÚ²»ÄÇôÁîÈ˵£ÓÇÁË¡£·´¹æ·¶»¯×î´óµÄÎÊÌâÊÇ£¬Ã¿´ÎÊôÐÔÖµ·¢Éú±ä»¯£¬¾Í²»µÃ²»ÔÚºÜ¶àµØ·½½øÐиüУ¬¿ÉÄÜÊǼ¸Ç§ÉõÖÁ¼¸°ÙÍò´Î¸üС£Ò»¸ö½â¾ö°ì·¨ÊÇÔÚÍíÉ϶ÔÄ£ÐͽøÐÐÈ«Á¿ÖØÔØ£¬Í¨³£Õâ±ÈÔöÁ¿¸üÐÂÒª¸ü¿ì¡¢¸üÈÝÒס£ÁÐʽÊý¾Ý¿âͨ³£²ÉÓÃÕâÖÖ·½·¨£¬Ê×ÏȽ«Òª×öµÄ¸üд洢ÔÚÄÚ´æÖУ¬È»ºóÒì²½µØÐ´Èë´ÅÅÌ¡£
·Ö²¼Ê½¹ØÏµÐÍÊý¾Ý¿â(MPP)ÉϵÄÊý¾Ý·Ö²¼
ÔÚ Hadoop£¬ÀýÈç Hive¡¢SparkSQL ÉϽ¨Á¢Î¬¶ÈÄ£ÐÍ£¬ÒªºÜºÃµØÀí½âÒ»¸ö¼¼ÊõÉϵĺËÐÄÌØÕ÷£¬¾ÍÊÇËüºÍ·Ö²¼Ê½¹ØÏµÐÍÊý¾Ý¿â(MPP)ÉϵĽ¨Á¢·½Ê½ÊDz»Ò»ÑùµÄ¡£ÔÚ
MPP ÖеĽڵãÉÏ·Ö²¼Êý¾Ý£¬¿ÉÒÔ¿ØÖÆÃ¿ÌõÊý¾Ý¼Ç¼µÄλÖ᣻ùÓÚ·ÖÇø²ßÂÔ£¬ÀýÈç Hash¡¢List¡¢Range
µÈ£¬¿ÉÒÔÔÚͬһ¸ö½ÚµãÉÏ¿ç±íͬ¶¨Î»(co-located)¸÷¸ö¼Ç¼µÄ¼üÖµ¡£ÓÉÓÚÊý¾ÝµÄ¾Ö²¿ÐԵõ½±£Ö¤£¬¹ØÁªËÙ¶È»á·Ç³£¿ì£¬ÒòΪ²»ÐèÒªÔÚÍøÂçÉÏ·¢ËÍÈκÎÊý¾Ý¡£²Î¿¼ÏÂÃæÍ¼Ê¾µÄÀý×Ó£¬ÔÚ
ORDER ºÍ ORDER_ITEM ±íÖÐÓÐÏàͬ ORDER_ID µÄ¼Ç¼´æ´¢ÔÚͬһ½ÚµãÉÏ£º

ORDER ºÍ ORDER_ITEM ±íÖÐ ORDER_ID ¶ÔÓ¦µÄ¼üÖµ£¬ÔÚÏàͬµÄ½Úµã×öµ½Í¬¶¨Î»¡£
HadoopÉϵÄÊý¾Ý·Ö²¼
Êý¾Ý·Ö²¼ÔÚ»ùÓÚ Hadoop µÄϵͳÖÐÊǷdz£²»Í¬µÄ£¬ÎÒÃǽ«Êý¾Ý·Ö¸î³É´óÐ͵Ŀé(chunks)£¬²¢ÔÚ
Hadoop ·Ö²¼Ê½Îļþϵͳ(HDFS)µÄ¸÷¸ö½Úµã½øÐзַ¢ºÍ¸´ÖÆ¡£ÕâÖÖÊý¾Ý·Ö·¢²ßÂÔ²»Äܱ£Ö¤Êý¾ÝµÄÒ»ÖÂÐÔ¡£²Î¿¼ÏÂÃæÍ¼Ê¾µÄÀý×Ó£¬¼Ç¼
ORDER_ID µÄ¼ü±»´æ´¢ÔÚ²»Í¬µÄ½Úµã£º

ΪÁ˹ØÁªËüÃÇ£¬ÐèÒªÔÚÍøÂçÉÏ·¢ËÍÊý¾Ý£¬ÕâÑù×ö»áÓ°ÏìÐÔÄÜ¡£
´¦ÀíÕâ¸öÎÊÌâµÄÒ»¸ö²ßÂÔ£¬ÊÇÔÚ¼¯ÈºµÄËùÓнڵãÉϸ´ÖÆÒª¹ØÁªµÄ±í£¬¸Ã²ßÂÔ±»³ÆÎª¹ã²¥Ê½¹ØÁª(broadcast
join)¡£Èç¹û¶Ô MPP ʹÓÃÏàͬµÄ²ßÂÔ£¬¿ÉÒÔÏëÏó£¬Ö»ÄÜÓÃÔÚ½ÏСµÄ lookup »òά¶È±íÖС£

ÄÇôµ±¹ØÁªÒ»¸ö´óµÄÊÂʵ±íºÍÒ»¸ö´óµÄά¶È±í£¬±ÈÈç¿Í»§»ò²úÆ·£¬ÉõÖÁ¹ØÁªÁ½¸ö´óÐÍÊÂʵ±íʱ£¬ÎÒÃǸÃÔõô°ì?
HadoopÉϵÄά¶È½¨Ä£
ΪÁ˽â¾öÐÔÄÜÎÊÌ⣬¿ÉÒÔÀûÓ÷´¹æ·¶»¯½«´óµÄά¶È±í·Å½øÊÂʵ±í£¬ÒÔ±£Ö¤Êý¾ÝÊÇͬ¶¨Î»µÄ(co-located)£¬¶ø¶Ô½ÏСµÄά¶È±í¿ÉÒÔÔÚËùÓнڵãÉϹ㲥(broadcast)¡£
¹ØÁªÁ½¸ö´óÐÍÊÂʵ±íʱ£¬¿ÉÒ԰ѵÍÁ£¶ÈµÄ±íǶÌ×µ½¸ü¸ßÁ£¶ÈµÄ±íÖУ¬ÀýÈç°Ñ
ORDER_ITEM ±íǶÌ×µ½ ORDER ±íÖС£¸ß¼¶µÄ²éѯÒýÇæ£¬±ÈÈç Impala »ò Drill
¿ÉÒÔÈÃÊý¾Ý±âƽ»¯(flatten out)£º

ǶÌ×Êý¾ÝµÄ²ßÂÔºÜÓÐÓã¬ÀàËÆÓÚ Kimball ¸ÅÄîÖÐÓÃÇŽӱíÀ´±íʾά¶ÈÄ£ÐÍÖÐµÄ M:N ¹ØÏµ¡£
HadoopºÍ»ºÂý±ä»¯Î¬
Hadoop ÎļþϵͳÖеĴ洢ÊDz»¿É±äµÄ£¬»»¾ä»°Ëµ£¬Ö»ÄܲåÈëºÍ×·¼Ó¼Ç¼£¬²»ÄÜÐÞ¸ÄÊý¾Ý¡£Èç¹ûÄãÊìϤµÄÊǹØÏµÐÍÊý¾Ý²Ö¿â£¬Õâ¿´ÆðÀ´¿ÉÄÜÓÐµãÆæ¹Ö¡£µ«ÊÇ´ÓÄÚ²¿»úÖÆ¿´£¬Êý¾Ý¿âÊÇÒÔÀàËÆµÄ»úÖÆ¹¤×÷£¬ÔÚÒ»¸ö½ø³ÌÒì²½µØ¸üÐÂÊý¾ÝÎļþÖеÄÊý¾Ý֮ǰ£¬½«ËùÓбä¸ü±£´æÔÚÒ»¸ö²»¿É±äµÄԤдʽÈÕÖ¾(WAL-
write-ahead log£¬OracleÖгÆÎªredo log)ÖС£
²»¿É±äÐÔ(immutability)¶Ôά¶ÈÄ£ÐÍÓÐʲôӰÏì?ÄãÒ²Ðí»¹¼ÇµÃά¶È½¨Ä£¿Î³ÌÖн¥±äάµÄ¸ÅÄî(Slowly
Changing Dimensions ¨C SCDS)¡£SCDS ÓÐÑ¡ÔñµØ±£´æÊôÐÔÖµ±ä¸üµÄÀúÊ·£¬ÓÚÊÇ¿ÉÒÔÔÚij¸öʱ¼äµãÉ϶ÔÊôÐÔÖµ½øÐжÈÁ¿¡£µ«Õâ²»ÊÇĬÈϵĴ¦Àí·½Ê½£¬Ä¬ÈÏÇé¿öÏ»áÓÃ×îеÄÖµÀ´¸üÐÂά¶È±í¡£ÄÇôÔÚ
Hadoop ÉÏÈçºÎÑ¡ÔñÄØ?¼Çס!ÎÒÃDz»ÄܸüÐÂÊý¾Ý¡£ÎÒÃÇ¿ÉÒÔ¼òµ¥µØÎª SCD Ñ¡ÔñĬÈÏ·½Ê½²¢¶Ôÿһ¸ö±ä»¯½øÐÐÉóºË(audit)¡£Èç¹ûÏëÔËÐлùÓÚµ±Ç°ÖµµÄ±¨±í£¬¿ÉÒÔÔÚ
SCD Ö®ÉÏ´´½¨Ò»¸öÊÓͼ£¬ÈÃËü½ö½ö¼ìË÷µ½×îÐÂÖµ£¬ÀûÓà Windows º¯Êý¿ÉÒÔºÜÈÝÒ××öµ½ÕâÒ»µã¡£»òÕߣ¬¿ÉÒÔÔËÐÐÒ»¸öËùνºÏ²¢(Compaction)µÄ·þÎñ£¬ÓÃ×îеÄÖµÎïÀíµØ´´½¨Î¬¶È±íµÄÒ»¸öµ¥¶À°æ±¾¡£
HadoopµÄ´æ´¢ÑÝ»¯
Hadoop ƽ̨µÄ¹©Ó¦É̲¢Ã»ÓкöÊÓÕâЩ Hadoop µÄÏÞÖÆ£¬ÀýÈç Hive ¾ÍÌṩÁËÂú×ã ACID
µÄÊÂÎñºÍ¿É¸üÐÂµÄ±í¡£¸ù¾Ý´óÁ¿µÄÖ÷Òª¹«¿ªÎÊÌâÒÔ¼°¸öÈ˾Ñ飬Õâ¸öÌØÐÔ»¹Ã»ÓÐÍêÉÆµ½¿ÉÒÔ²¿ÊðÉú²ú»·¾³¡£Cloudera
²ÉÈ¡ÁËÁíÍâÒ»¸öÊֶΣ¬ÀûÓà Kudu ½¨Á¢ÁËÒ»¸öеĿɱä¸ü´æ´¢¸ñʽ£¬Ëü²¢Ã»ÓлùÓÚ HDFS£¬¶øÊÇ»ùÓÚ±¾µØ
OS ²Ù×÷ϵͳ¡£ËüÍêÈ«°ÚÍÑÁË Hadoop µÄÏÞÖÆ£¬ÀàËÆÓÚÁÐʽ MPP µÄ´«Í³´æ´¢²ã¡£Í¨³£À´Ëµ£¬ÔÚ
Impala + Kudu ÕâÑùÒ»¸ö MPP ÉÏÔËÐÐ BI ºÍ Dashboard µÄÈκÎʹÓó¡¾°£¬»á±È
Hadoop ¸üºÃ¡£²»µÃ²»Ëµ£¬µ±ËüÉæ¼°µ½µ¯ÐÔ¡¢²¢·¢ÐÔºÍÀ©Õ¹ÐÔʱ£¬ÓÐ×Ô¼ºµÄ¾ÖÏÞ¡£µ±Óöµ½ÕâЩÏÞÖÆÊ±£¬Hadoop
ºÍËüµÄ½üÇ× Spark Êǽâ¾ö BI ¹¤×÷¸ºÔصĺÃÑ¡Ôñ¡£
Åоö£ºÎ¬¶ÈÄ£ÐͺÍÐÇÐÍģʽ¹ýʱÁËÂð?
ÎÒÃǶ¼ÖªµÀ£¬Ralph Kimball ÒѾÍËÐÝÁË£¬µ«ËûÉè¼ÆÔÔòµÄ˼ÏëºÍ¹ÛÄîÈÔÈ»ÊÇÓÐЧµÄ£¬Ò²½«»á¼ÌÐø´æÔÚ¡£¼´Ê¹ÎÒÃDz»µÃ²»ÈÃËüÃÇÊÊӦеļ¼ÊõºÍ´æ´¢ÀàÐÍ£¬ËüÃÇÈÔÈ»Äܹ»´øÀ´¾Þ´óµÄ¼ÛÖµ¡£
|