±à¼ÍƼö: |
±¾ÎÄÖ÷Òª½éÉÜÁË»ù´¡ÔÀí¡¢Í³¼ÆÑ§¡¢±à³ÌÄÜÁ¦ºÍ»úÆ÷ѧϰ¡£
±¾ÎÄÀ´×Ô΢ÐÅÇØÂ·£¬ÓÉ»ðÁú¹ûÈí¼þAnna±à¼¡¢ÍƼö¡£ |
|
ÉÙÄ꣬Äã¿ÊÍûÁ¦Á¿Ã´£¿

Õâ²ÅÊÇÕæÕýµÄÁ¦Á¿£¬ÄêÇáÈË£¡
ÕâÊÇSwami ChandrasekaranËù»æÖƵÄÒ»ÕŵØÍ¼¡£Ãû×Ö½ÐMetroMap to Data
Scientist£¨Êý¾Ý¿ÆÑ§¼Ò֮·£©£¬±ð³ÆÔõôËÀ¶¼²»ÖªµÀµÄ¡£
Êý¾Ý¿ÆÑ§¼ÒÊǽüÄê»ð±¬ÐËÆðµÄְ룬ËüÊÇÊý¾Ý·ÖÎöʦµÄºóÐø½ø½×£¬ÈÚºÏÁËͳ¼Æ¡¢ÒµÎñ¡¢±à³Ì¡¢»úÆ÷ѧϰ¡¢Êý¾Ý¹¤³ÌµÄ¸´ºÏÐÍְλ¡£
¸ÃµØÍ¼Ò»¹²Ê®Ìõ·Ïߣ¬·Ö±ðÊÇ»ù´¡ÔÀí¡¢Í³¼ÆÑ§¡¢±à³ÌÄÜÁ¦¡¢»úÆ÷ѧϰ¡¢Îı¾ÍÚ¾ò£¯×ÔÈ»ÓïÑÔ´¦Àí¡¢Êý¾Ý¿ÉÊÓ»¯¡¢´óÊý¾Ý¡¢Êý¾Ý»ñÈ¡¡¢Êý¾ÝÇåÀí¡¢³£Óù¤¾ß¡£ÌõÌõ·Ïß¶¼²»ÊÇÈË×ߵġ£ÒòÎªÍøÉÏÖ»ÓÐÓ¢Îİ棬ÎÒ½«Æä·Òë³ÉÖÐÎÄ£¬²¢¶ÔÄÚÈÝ×÷һЩ½âÊͺͲ¹³ä¡£
¸ÃÖ¸ÄÏÖ÷񻃾¼°Ó²¼¼ÄÜ£¬Êý¾Ý¿ÆÑ§¼ÒµÄÁíÍâÒ»¸öºËÐÄÒµÎñÄÜÁ¦£¬ÕâÀïûÓÐÉæ¼°£¬Ëü²¢²»´ú±í²»ÖØÒª¡£
¡ª¡ª¡ª¡ª¡ª¡ª
FundamentalsÔÀí
ËãÊǶàѧ¿ÆµÄ½»²æ»ù´¡£¬ÊôÓÚÊý¾Ý¿ÆÑ§¼ÒµÄ±Ø±¸ËØÖÊ¡£
Matrices & Linear Algebra
¾ØÕóºÍÏßÐÔ´úÊý
¾ØÕó£¨Matrix£©ÊÇÒ»¸ö°´ÕÕ³¤·½ÕóÁÐÅÅÁеĸ´Êý»òʵÊý¼¯ºÏ¡£Éæ¼°µ½µÄ»úÆ÷ѧϰӦÓÃÓÐSVD¡¢PCA¡¢×îС¶þ³Ë·¨¡¢¹²éîÌݶȷ¨µÈ¡£
ÏßÐÔ´úÊýÊÇÑо¿ÏòÁ¿¡¢ÏòÁ¿¿Õ¼ä¡¢ÏßÐԱ任µÈÄÚÈݵÄÊýѧ·ÖÖ§¡£ÏòÁ¿ÊÇÏßÐÔ´úÊý×î»ù±¾µÄÄÚÈÝ¡£ÖÐѧʱ£¬ÊýѧÊ鏿ËßÎÒÃÇÏòÁ¿Êǿռ䣨ͨ³£ÊǶþάµÄ×ø±êϵ£©ÖеÄÒ»¸ö¼ýÍ·£¬ËüÓз½ÏòºÍÊýÖµ¡£ÔÚÊý¾Ý¿ÆÑ§¼ÒÑÛÖУ¬ÏòÁ¿ÊÇÓÐÐòµÄÊý×ÖÁÐ±í¡£ÏßÐÔ´úÊýÊÇÎ§ÈÆÏòÁ¿¼Ó·¨ºÍ³Ë·¨Õ¹¿ªµÄ¡£
¾ØÕóºÍÏßÐÔ´úÊýÓÐʲô¹ØÏµÄØ£¿µ±ÏòÁ¿½øÐÐÏßÐԱ任ʱ£¬ÕâÖֱ任¿ÉÒÔÏëÏó³É¼¸ºÎÒâÒåÉϵÄÏßÐÔ¼·Ñ¹ºÍÀ³¶£¬¶ø¾ØÕóÔòÊÇÃèÊöÕâÖֱ任µÄÐÅÏ¢£¬Óɱ任ºóµÄ»ùÏòÁ¿¾ö¶¨¡£
¾ØÕóºÍÏßÐÔ´úÊýÊÇÒ»ÌåµÄ£¬¾ØÕóÊÇÃèÊöÏßÐÔ´úÊýµÄ²ÎÊý¡£ËüÃǹ¹³ÉÁË»úÆ÷ѧϰµÄÅÓ´ó»ùʯ¡£
Hash Functions,Binary Tree,O(n)
¹þÏ£º¯Êý£¬¶þ²æÊ÷£¬Ê±¼ä¸´ÔÓ¶È
¹þÏ£º¯ÊýÒ²½ÐÉ¢Áк¯Êý£¬ËüÄܽ«ÈÎÒâµÄÊý¾Ý×÷ΪÊäÈ룬ȻºóÊä³ö¹Ì¶¨³¤¶ÈµÄÊý¾Ý£¬Õâ¸öÊý¾Ý ½Ð¹þÏ£ÖµÒ²½ÐÉ¢ÁÐÖµ£¬ÓÃh±íʾ£¬´Ëʱh¾ÍÊäÈëÊý¾ÝµÄÖ¸ÎÆ¡£
¹þÏ£º¯ÊýÓÐÒ»¸ö»ù±¾ÌØÐÔ£¬Èç¹ûÁ½¸ö¹þÏ£Öµ²»Ïàͬ£¬ÄÇôËüµÄÊäÈëÒ²¿Ï¶¨²»Ïàͬ¡£·´¹ýÀ´£¬Èç¹ûÁ½¸ö¹þÏ£ÖµÊÇÏàͬµÄ£¬ÄÇôÊäÈëÖµ¿ÉÄÜÏàͬ£¬Ò²¿ÉÄܲ»Ïàͬ£¬¹ÊÎÞ·¨Í¨¹ý¹þÏ£ÖµÀ´ÅжÏÊäÈë¡£
¹þÏ£º¯Êý³£ÓÃÔÚÊý¾Ý½á¹¹¡¢ÃÜÂëѧÖС£
¶þ²æÊ÷ÊǼÆËã»ú¿ÆÑ§µÄÒ»¸ö¸ÅÄËüÊÇÒ»ÖÖÊ÷Ðνṹ¡£ÔÚÕâ¸ö½á¹¹ÖУ¬Ã¿¸ö½Úµã×î¶àÓÐÁ½¸ö×ÓÊ÷£¨×ó×ÓÊ÷ºÍÓÒ×ÓÊ÷£©£¬×ÓÊ÷´ÎÐò²»Äܵߵ¹¡£¶þ²æÊ÷ÓÖÓжàÖÖÐÎ̬¡£

¶þ²æÊ÷ÊÇÊ÷ÕâÀàÊý¾Ý½á¹¹µÄµÚÒ»ÖÖÊ÷£¬ºóÐø»¹ÓкìºÚÊ÷µÈ£¬ºÜ¶àÓïÑÔµÄset£¬map¶¼ÊÇÓöþ²æÊ÷дµÄ¡£
ʱ¼ä¸´ÔÓ¶ÈÊDZà³ÌÖеÄÒ»¸ö¸ÅÄËüÃèÊöÁËÖ´ÐÐËã·¨ÐèÒªµÄʱ¼ä¡£²»Í¬Ëã·¨Óв»Í¬µÄʱ¼ä¸´ÔÓ¶È£¬ÀýÈç¿ìÅÅ¡¢Ã°Åݵȡ£
¼ò±ãµÄ¼ÆËã·½·¨ÊÇ¿´Óм¸¸öforÑ»·£¬Ò»¸öÊÇO(n)£¬Á½¸öÊÇO(n^2)£¬Èý¸öÊÇO(n^3)¡£µ±¸´ÔÓ¶ÈÊÇn^3+n^2ʱ£¬ÔòÈ¡×î´óµÄÁ¿¼¶n^3¼´¿É¡£
ÓëÖ®Ïà¶ÔÓ¦µÄ»¹Óпռ临ÔÓ¶È£¬Ëü´ú±íµÄÊÇËã·¨Õ¼ÓõÄÄÚ´æ¿Õ¼ä¡£Ë㷨ͨ³£ÒªÔÚʱ¼äºÍÄÚ´æÖÐÈ¡µÃÒ»¸öƽºâ£¬¼ÈÄڴ滻ʱ¼ä£¬»òÕßʱ¼ä»»ÄÚ´æ¡£
Relational Algebra
¹ØÏµ´úÊý
ËüÊÇÒ»ÖÖ³éÏóµÄ²éѯÓïÑÔ¡£»ù±¾µÄ´úÊýÔËËãÓÐÑ¡Ôñ¡¢Í¶Ó°¡¢¼¯ºÏ²¢¡¢¼¯ºÏ²î¡¢µÑ¿¨¶û»ýºÍ¸üÃû¡£
¹ØÏµÐÍÊý¾Ý¿â¾ÍÊÇÒÔ¹ØÏµ´úÊýΪ»ù´¡¡£ÔÚSQLÓïÑÔÖж¼ÄÜÕÒµ½¹ØÏµ´úÊýÏàÓ¦µÄ¼ÆËã¡£
Inner¡¢Outer¡¢Cross¡¢Theta Join
ÄÚÁ¬½Ó¡¢ÍâÁ¬½Ó¡¢½»²æÁ¬½Ó¡¢¦ÈÁ¬½Ó
ÕâÊǹØÏµÄ£ÐÍÖеĸÅÄҲÊÇÊý¾Ý¿âµÄ²éѯ»ù´¡¡£
ÄÚÁ¬½Ó£¬Ö»Á¬½ÓÆ¥ÅäµÄÐУ¬ÓֽеÈÖµÁ¬½Ó¡£
ÍâÁ¬½Ó£¬Á¬½Ó×óÓÒÁ½±íËùÓÐÐУ¬²»ÂÛËüÃÇÊÇ·ñÆ¥Åä¡£
½»²æÁ¬½ÓÊǶÔÁ½¸öÊý¾Ý¼¯ËùÓÐÐнøÐеѿ¨¶û»ýÔËË㣬±ÈÈçÒ»·ùÆË¿ËÅÆ£¬ÆäÖÐÓÐA¼¯£¬ÊÇ13¸öÅÆµÄµãÊý¼¯ºÏ£¬¼¯ºÏBÔòÊÇ4¸ö»¨É«µÄ¼¯ºÏ£¬¼¯ºÏAºÍ¼¯ºÏBµÄ½»²æÁ´½Ó¾ÍÊÇ4*13¹²52¸ö¡£
¦ÈÁ¬½ÓʹÓÃwhere×Ó¾äÒýÈëÁ¬½ÓÌõ¼þ£¬¦ÈÁ¬½Ó¿ÉÒÔÊÓ×÷½»²æÁ¬½ÓµÄÒ»¸öÌØÊâÇé¿ö¡£where ¿ÉÒÔÊǵÈÖµ£¬Ò²¿ÉÒÔÊǷǵÈÖµÈç´óÓÚСÓÚ¡£
²»Í¬Êý¾Ý¿âµÄjoin·½Ê½»áÓвîÒì¡£
CAP Theorem
CAP¶¨Àí
Ö¸µÄÊÇÔÚÒ»¸ö·Ö²¼Ê½ÏµÍ³ÖУ¬ Consistency£¨Ò»ÖÂÐÔ£©¡¢ Availability£¨¿ÉÓÃÐÔ£©¡¢Partition
tolerance£¨·ÖÇøÈÝ´íÐÔ£©£¬ÈýÕß²»¿ÉµÃ¼æ¡£
Ò»ÖÂÐÔ£¨C£©£ºÔÚ·Ö²¼Ê½ÏµÍ³ÖеÄËùÓÐÊý¾Ý±¸·Ý£¬ÔÚͬһʱ¿ÌÊÇ·ñͬÑùµÄÖµ¡££¨µÈͬÓÚËùÓнڵã·ÃÎÊͬһ·Ý×îеÄÊý¾Ý¸±±¾£©
¿ÉÓÃÐÔ£¨A£©£ºÔÚ¼¯ÈºÖÐÒ»²¿·Ö½Úµã¹ÊÕϺ󣬼¯ÈºÕûÌåÊÇ·ñ»¹ÄÜÏìÓ¦¿Í»§¶ËµÄ¶ÁдÇëÇó¡££¨¶ÔÊý¾Ý¸üо߱¸¸ß¿ÉÓÃÐÔ£©
·ÖÇøÈÝ´íÐÔ£¨P£©£ºÒÔʵ¼ÊЧ¹û¶øÑÔ£¬·ÖÇøÏ൱ÓÚ¶ÔͨÐŵÄʱÏÞÒªÇó¡£ÏµÍ³Èç¹û²»ÄÜÔÚʱÏÞÄÚ´ï³ÉÊý¾ÝÒ»ÖÂÐÔ£¬¾ÍÒâζ×Å·¢ÉúÁË·ÖÇøµÄÇé¿ö£¬±ØÐë¾Íµ±Ç°²Ù×÷ÔÚCºÍAÖ®¼ä×ö³öÑ¡Ôñ¡£
Êý¾ÝϵͳÉè¼Æ±ØÐëÔÚÈý¸öÐÔÄÜ·½±ã×ö³öÈ¡Éᣬ²»Í¬µÄÊý¾Ý¿â£¬CAPÇãÏòÐÔ²»Í¬¡£
tabular data
ÁбíÊý¾Ý
¼´¶þάµÄ±í¸ñÊý¾Ý£¬¹ØÏµÐÍÊý¾Ý¿âµÄ»ù´¡¡£
DataFrames & Series
PandasÊý¾Ý½á¹¹
SeriesÊÇÒ»¸öһάÊý¾Ý¶ÔÏó£¬ÓÉÒ»×éNumPyµÄarrayºÍÒ»×éÓëÖ®Ïà¹ØµÄË÷Òý×é³É¡£Python×ÖµäºÍÊý×é¶¼ÄÜת»»³ÉÊý×é¡£SeriesÒÔ0Ϊ¿ªÊ¼£¬²½³¤Îª1×÷ΪË÷Òý¡£
x = Series([1,2,3,4,5])
x
0 1
1 2
2 3
3 4
4 5 |
DataFramesÊÇÒ»¸ö±í¸ñÐ͵ÄÊý¾Ý£¬ÊÇSeriesµÄ¶àά±íÏÖ¡£DataFrames¼´ÓÐÐÐË÷ÒýÒ²ÓÐÁÐË÷Òý£¬¿ÉÒÔ¿´×÷Series×é³ÉµÄ×ֵ䡣
Sharding
·ÖƬ
·ÖƬ²»ÊÇÒ»ÖÖÌØ¶¨µÄ¹¦ÄÜ»òÕß¹¤¾ß£¬¶øÊǼ¼Êõϸ½ÚÉϵijéÏó´¦Àí£¬ÊÇË®Æ½ÍØÕ¹µÄ½â¾ö·½·¨¡£Ò»°ãÊý¾Ý¿âÓöµ½ÐÔÄÜÆ¿¾±£¬²ÉÓõÄÊÇScale
Up£¬¼´ÏòÉÏÔö¼ÓÐÔÄܵķ½·¨£¬µ«µ¥¸ö»úÆ÷×ÜÓÐÉÏÏÞ£¬ÓÚÊÇË®Æ½ÍØÕ¹Ó¦Ô˶øÉú¡£
·ÖƬÊÇ´Ó·ÖÇø(Partition)µÄ˼Ïë¶øÀ´£¬·ÖÇøÍ¨³£Õë¶Ô±íºÍË÷Òý£¬¶ø·ÖƬ¿ÉÒÔ¿çÓòÊý¾Ý¿âºÍÎïÀí¼ÙÆÚ¡£±ÈÈçÎÒÃǽ«Öйú»®·ÖÄϱ±·½£¬ÄÏ·½Óû§·ÅÔÚÒ»¸ö·þÎñÆ÷ÉÏ£¬±±·½Óû§·ÅÔÚÁíÒ»¸ö·þÎñÆ÷ÉÏ¡£
ʵ¼ÊÐÎʽÉÏ£¬Ã¿Ò»¸ö·ÖƬ¶¼°üº¬Êý¾Ý¿âµÄÒ»²¿·Ö£¬¿ÉÒÔÊǶà¸ö±íµÄÄÚÈÝÒ²¿ÉÒÔÊǶà¸öʵÀýµÄÄÚÈÝ¡£µ±ÐèÒª²éѯʱ£¬ÔòÈ¥ÐèÒª²éѯÄÚÈÝËùÔÚµÄ·ÖÆ¬·þÎñÆ÷Éϲéѯ¡£ËüÊǼ¯Èº£¬µ«²»Í¬ÓÚHadoopµÄMR¡£
Èç¹ûÄܹ»±£Ö¤Êý¾ÝÁ¿ºÜÄѳ¬¹ýÏÖÓÐÊý¾Ý¿â·þÎñÆ÷µÄÎïÀí³ÐÔØÁ¿£¬ÄÇôֻÐèÀûÓÃMySQL5.1ÌṩµÄ·ÖÇø(Partition)¹¦ÄÜÀ´¸ÄÉÆÊý¾Ý¿âÐÔÄܼ´¿É£»·ñÔò£¬»¹ÊÇ¿¼ÂÇÓ¦ÓÃShardingÀíÄî¡£ÁíÍâÒ»¸öÁ÷´«Éõ¹ãµÄ¹ÛµãÊÇ£ºÎÒÃǵÄÊý¾ÝÒ²ÐíûÓÐÄÇô´ó£¬Hadoop²»ÊDZØÐèµÄ£¬ÓÃsharding¼´¿É¡£
OLAP
Áª»ú·ÖÎö´¦Àí£¨Online Analytical Processing£©
ËüÊÇÊý¾Ý²Ö¿âϵͳÖ÷ÒªµÄÓ¦Óã¬Ö÷ÒªÓÃÓÚ¸´ÔӵķÖÎö²Ù×÷¡£
Õë¶ÔÊý¾Ý·ÖÎöÈËÔ±£¬Êý¾ÝÊǶàάÊý¾Ý¡£²éѯ¾ùÊÇÉæ¼°µ½¶à±íµÄ¸´ÔÓ¹ØÁª²éѯ£¬ÎªÁËÖ§³ÖÊý¾ÝÒµÎñϵͳµÄ´î½¨£¬OLAP¿ÉÒÔÏëÏó³ÉÒ»¸ö¶àά¶ÈµÄÁ¢·½Ì壬ÒÔά¶È£¨Dimension£©ºÍ¶ÈÁ¿£¨Measure£©Îª»ù±¾¸ÅÄî¡£ÎÒÃÇÓõ½µÄ¶àά·ÖÎö¾ÍÊÇOLAPµÄ¾ßÏó»¯Ó¦Óá£
OLAP¸üÆ«ÏòÓÚ´«Í³ÆóÒµ£¬»¥ÁªÍøÆóÒµ»áÁé»î±ä¶¯Ò»Ð©¡£ÁíÍ⻹ÓÐÒ»¸öOLTPµÄ¸ÅÄî¡£
Multidimensional Data Model
¶àάÊý¾ÝÄ£ÐÍ¡£
ËüÊÇOLAP´¦ÀíÉú³ÉºóµÄÊý¾ÝÁ¢·½Ìå¡£ËüÌṩÁË×îÖ±¹Û¹Û²ìÊý¾ÝµÄ·½·¨¡£

Éæ¼°×êÈ¡£¬ÉÏ¾í£¬ÇÐÆ¬£¬Çп飬ÐýתµÈ²Ù×÷£¬¾ÍÊǰÑÉÏÃæµÄÁ¢·½Ìå±ä±ä±äÀ²¡£
ETL
ETLÊdzéÈ¡£¨extract£©¡¢×ª»»£¨transform£©¡¢¼ÓÔØ£¨load£©µÄ¹ý³Ì¡£³£ÓÃÔÚÊý¾Ý²Ö¿â¡£
Õû¸öÁ÷³ÌÊÇ´ÓÊý¾ÝÔ´³éÈ¡Êý¾Ý£¬½á¹ûÊý¾ÝÇåÏ´ºÍת»»£¬×îÖÕ½«Êý¾ÝÒÔÌØ¶¨Ä£ÐͼÓÔØµ½Êý¾Ý²Ö¿âÖÐÈ¥¡£

ETLÊÇÒ»¸ö¹ÅÀϵĸÅÄÔÚÒÔǰSQLÊý¾Ý²Ö¿âʱ´úºÍOLAP°éËæ¶øÉú£¬ÔÚÏÖÔÚÈÕÐÂÔÂÒìµÄ¼¼ÊõÉú̬Ȧ£¬»áÖð²½Ñݽøµ½HadoopÏà¹ØµÄ¼¼ÊõÁË¡£
Reporting vs BI vs Analytics
±¨±íÓëÉÌÒµÖÇÄÜÓë·ÖÎö
ÕâÊÇBIµÄÈý¸ö×é³É²¿·Ö¡£ReportingÊÇÊý¾Ý±¨±í¡£ÀûÓñí¸ñºÍͼ±í³ÊÏÖÊý¾Ý¡£±¨±íͨ³£ÊǶ¯Ì¬¶àÑùµÄ¡£Êý¸ö±¨±íµÄ¼¯ºÏͳ³ÆÎªDashboard¡£
BIÊÇÉÌÒµÖÇÄÜ£¬ÊÇ¶ÔÆóÒµµÄÊý¾Ý½øÐÐÓÐЧÕûºÏ£¬Í¨¹ýÊý¾Ý±¨±í¿ìËÙ×÷³ö¾ö²ß¡£
AnalyticsÊÇÊý¾Ý·ÖÎö£¬»ùÓÚÊý¾Ý±¨±í×÷³ö·ÖÎö¡£°üÀ¨Ç÷ÊÆµÄ²¨¶¯£¬Î¬¶ÈµÄ¶Ô±ÈµÈ¡£
JSON & XML
JSONÊÇÒ»ÖÖÇáÁ¿¼¶µÄÊý¾Ý½»»»¸ñʽ£¬Ò×ÓÚÔĶÁºÍ±àд£¬Ò²Ò×ÓÚ»úÆ÷½âÎöºÍÉú³É¡£
JSONµÄÓï·¨¹æÔòÊÇ£º
{ }±£´æ¶ÔÏó£»
[ ]±£´æÊý×飻
Êý¾ÝÓɶººÅ·Ö¸ô£»
Êý¾ÝÔÚ¼üÖµ¶ÔÖУ»
ÏÂÃæ·¶Àý¾ÍÊÇÒ»×éJSONÖµ
{ "firstName":
"John", "lastName": "Smith",
"age": 25, "address":
{ "streetAddress": "21 2nd
Street", "city": "New
York", "state": "NY",
"postalCode": "10021"
}
}
|
XMLÊÇ¿ÉÍØÕ¹±ê¼ÇÓïÑÔ£¬±»Éè¼ÆÓÃÀ´´«ÊäºÍ´æ´¢Êý¾Ý£¬ÓëÖ®¶ÔÓ¦µÄHTMLÔòÊÇÏÔʾÊý¾Ý¡£XMLºÍHTML·þÎñÓÚ²»Í¬Ä¿µÄ£¬XMLÊDz»×÷ΪµÄ¡£
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>
|
ÉÏÃæµÄ·¶Àý£¬´¿´â¾ÍÊÇÓÃÀ´´«ÊäµÄÒ»¶ÎÐÅÏ¢£¬Ã»ÓÐÈκÎÒâÒå¡£
NoSQL
·ºÖ¸·Ç¹ØÏµÐ͵ÄÊý¾Ý¿â£¬ÒâΪNot Only SQL¡£
NoSQLÊÇËæ×Å´óÊý¾Ýʱ´ú·¢Õ¹ÆðÀ´µÄ£¬´«Í³µÄ¹ØÏµÊý¾Ý¿âÔڸ߲¢·¢´ó¹æÄ£¶àÊý¾ÝÀàÐ͵Ļ·¾³ÏÂÁ¦²»´ÓÐÄ£¬¶øNoSQL¾ÍÊÇΪÁ˽â¾öÕâЩÎÊÌâ¶ø²úÉúµÄ¡£
NoSQLÖ÷Òª·ÖΪËÄ´óÀࣺ
¼üÖµKeyValueÊý¾Ý¿â
ÕâÀàÊý¾Ý¿â»áʹÓùþÏ£±í£¬¹þÏ£±íÖÐÓÐÒ»¸öÌØ¶¨µÄ¼üÖ¸ÏòÒ»¸öÌØ¶¨µÄÖµ£¬KeyValueµÄÌØµãÊÇÈ¥ÖÐÐÄ»¯£¬²»Éæ¼°ÒµÎñ¹ØÏµ¡£´ú±íRedis¡£
ÁÐÊý¾Ý¿â
ÕâÀàÊý¾Ý¿âÓÃÓÚ·Ö²¼Ê½º£Á¿´æ´¢£¬ºÍKeyValueµÄÇø±ðÔÚÓÚÕâÀïµÄKeyÖ¸ÏòµÄÊÇÁС£ºáÏòÍØÕ¹ÐԺã¬ÊʺϴóÊý¾ÝÁ¿¸ßIO¡£´ú±íHBase£¬Cassandra
ÎĵµÐÍÊý¾Ý¿â
ÊôÓÚKeyValueÊý¾Ý¿âµÄÉý¼¶°æ£¬ÔÊÐíǶÌ×¼üÖµ¡£ÎĵµÊÇ´¦ÀíÐÅÏ¢µÄ»ù±¾µ¥Î»£¬Ò»¸öÎĵµµÈÓÚÒ»¸ö¹ØÏµÊý¾Ý¿âµÄÒ»Ìõ¼Ç¼¡£
ÒòΪÎĵµµÄ×ÔÓÉÐÔ£¬ÎĵµÐÍÊý¾Ý¿âÊʺϸ´ÔÓ¡¢ËÉÉ¢¡¢Î޽ṹ»ò°ë½á¹¹»¯µÄÊý¾ÝÄ£ÐÍ£¬ºÍJSONÀàËÆ£¬½Ð×öBSON£¨MongoDBµÄ´æ´¢¸ñʽ£©¡£´ú±íMongoDB
ͼÐÎÊý¾Ý¿â
»ùÓÚͼÂÛËã·¨µÄÊý¾Ý¿â£¬½«Êý¾Ý¼¯ÒÔͼÐÎÔªËØ£¨µã¡¢Ïß¡¢Ã棩½¨Á¢ÆðÀ´¡£ÕâÖÖÊý¾Ý¿â³£Ó¦ÓÃÔÚÉç½»ÍøÂç¹ØÏµÁ´£¬N¶È¹ØÏµµÈ¡£´ú±íNeo4j
Regex
ÕýÔò±í´ïʽ£¨Regular Expression£©
ÕýÔò±íͨ³£±»ÓÃÀ´¼ìË÷¡¢Ìæ»»ÄÇЩ·ûºÏij¸öģʽ(¹æÔò)µÄ×Ö·û´®¡£Í¨¹ýÌØ¶¨×Ö·ûµÄ×éºÏ£¬¶Ô×Ö·û´®½øÐÐÂß¼¹ýÂË¡£ÀýÈç×¢²áÕ˺Åʱ¼ì²é¶Ô·½Óʼþ¸ñʽ¶Ô²»¶Ô°¡£¬ÊÖ»úºÅ¸ñʽ¶Ô²»¶Ô°¡¡£
ѧÆðÀ´¿¿¼Ç£¬¼ÇÁËÒ²»áÍü£¬Ã¿´ÎÓõò飬²éÁË»¹µÃ¼ìÑé¡£ÍøÉϼÇÒä¿Ú¾÷Ò»¶Ñͼ±í£¬Ïà¹ØÍøÕ¾Ò²²»ÉÙ£¬ÈÊÕß¼ûÈÊÁË¡£

Vendor Landscape
²»¶®£¬¹©Ó¦ÉÌ·ç¾°£¿
Env Setup
»·¾³°²×°
ÏëÁ˰ëÌ죬EnvÓ¦¸ÃÊÇ»·¾³°²×°µÄÒâ˼£¬IDE°¡£¬GUI°¡µÈµÈÈ«²¿°²×°ÉÏÈ¥£¬ÔÙµ÷¸÷ÖÖ·¾¶É¶µÄ¡£Õë¶ÔÊý¾Ý¿ÆÑ§¼Ò£¬Anaconda
+ RstudioÓõıȽ϶ࡣ
¡ª¡ª¡ª¡ª¡ª¡ª
Statistics ͳ¼Æ
ͳ¼ÆÊÇÊý¾Ý¿ÆÑ§¼ÒµÄºËÐÄÄÜÁ¦Ö®Ò»£¬»úÆ÷ѧϰ¾ÍÊÇ»ùÓÚͳ¼ÆÑ§ÔÀíµÄ£¬ÎÒ²»Ë㾫ͨÕâÒ»¿é£¬Ðí¶àÄÚÈݶ¼ÊÇÍøÂç½Ì¿ÆÊéʽµÄÓïÑÔ¡£¶¼ÕÆÎÕºóÔÙÖØÐ´Ò»±é¡£
Pick a Dataset(UCI Repo)
ÕÒÊý¾Ý£¨UCIÊý¾Ý¼¯£©
UCIÊý¾Ý¿âÊǼÓÖÝ´óѧŷÎÄ·ÖУ(University of CaliforniaIrvine)Ìá³öµÄÓÃÓÚ»úÆ÷ѧϰµÄÊý¾Ý¿â£¬Õâ¸öÊý¾Ý¿âĿǰ¹²ÓÐ335¸öÊý¾Ý¼¯£¬ÆäÊýÄ¿»¹ÔÚ²»¶ÏÔö¼Ó£¬¿ÉÒÔÄÃÀ´Íæ»úÆ÷ѧϰ¡£ÍøÉÏËѵĵ½¡£ÁíÍâµÄÊý¾ÝÀ´Ô´ÊÇKaggle¾ºÈüµÈ¡£
×î¾µäµÄÊý¾ÝιýÓÚIrisÁË¡£
Descriptive Statistics£¨mean, median, range, SD, Var£©
ÃèÊöÐÔͳ¼Æ£¨¾ùÖµ£¬ÖÐλÊý£¬¼«²î£¬±ê×¼²î£¬·½²î£©
¾ùÖµÒ²½Ðƽ¾ùÊý£¬ÊÇͳ¼ÆÑ§ÖеĸÅÄСѧѧϰµÄËãÊýƽ¾ùÊýÊÇÆäÖеÄÒ»ÖÖ¾ùÖµ£¬³ý´ËÒÔÍ⻹ÓÐÖÚÊýºÍÖÐλÊý¡£
ÖÐλÊý¿ÉÒÔ±ÜÃ⼫¶ËÖµ£¬ÔÚÊý¾Ý³ÊÏÖÆ«Ì¬µÄÇé¿öÏ»áʹÓá£
¼«²î¾ÍÊÇ×î´óÖµ¼õ×îСֵ¡£
±ê×¼²î£¬Ò²½Ð×ö¾ù·½²î¡£ÏÖʵÒâÒåÊDZíÊö¸÷Êý¾ÝÆ«ÀëÕæÊµÖµµÄÇé¿ö£¬·´Ó³µÄÊÇÒ»×éÊý¾ÝµÄÀëÉ¢³Ì¶È¡£Æ½¾ùÊýÏàͬµÄÁ½×éÊý¾Ý£¬Èç[1,9]ºÍ[4,6]£¬Æ½¾ùÊýÏàͬ£¬±ê×¼²î²»Ò»Ñù£¬Ç°ÕßµÄÀëÉ¢³Ì¶È¸ü´ó¡£
·½²î£¬ÊDZê×¼²îµÄƽ·½¡£·½²îºÍ±ê×¼²îµÄÁ¿¸ÙÊÇÒ»Öµġ£ÔÚʵ¼ÊʹÓùý³ÌÖУ¬±ê×¼²îÐèÒª±È·½²î¶àÒ»²½¿ªÆ½·½µÄÔËË㣬µ«ËüÔÚÃèÊöÏÖʵÒâÒåÉϸüÌùÇУ¬¸÷ÓÐÓÅÁÓ¡£
Exploratory Data Analysis
̽Ë÷ÐÔÊý¾Ý·ÖÎö
»ñµÃÒ»×éÊý¾Ý¼¯Ê±£¬Í¨³£·ÖÎöʦÐèÒªÕÆÎÕÊý¾ÝµÄ´óÌåÇé¿ö£¬´Ëʱ¾ÍÒªÓõ½Ì½Ë÷ÐÔÊý¾Ý·ÖÎö¡£
Ö÷ÒªÊÇÁ½Àࣺ
ͼÐ稣¬Í¨¹ýÖ±·½Í¼¡¢ÏäÏßͼ¡¢¾¥Ò¶Í¼¡¢É¢µãͼ¿ìËÙ»ã×ÜÃèÊöÊý¾Ý¡£
ÊýÖµ·¨£º¹Û²ìÊý¾ÝµÄ·Ö²¼ÐÎ̬£¬°üÀ¨ÖÐλÊý¡¢¼«Öµ¡¢¾ùÖµµÈ£¬¹Û²ì¶à±äÁ¿Ö®¼äµÄ¹ØÏµ¡£
̽Ë÷ÐÔÊý¾Ý·ÖÎö²»»áÉæ¼°µ½¸´ÔÓÔËË㣬¶øÊÇͨ¹ý¼òµ¥µÄ·½Ê½¶ÔÊý¾ÝÓÐÒ»¸ö´ó¸ÅµÄÁ˽⣬Ȼºó²ÅÈ¥ÉîÈëÍÚ¾òÊý¾Ý¼ÛÖµ£¬ÔÚPythonºÍRÖУ¬¶¼ÓÐÏà¹ØµÄsummaryº¯Êý¡£
Histograms
Ö±·½Í¼
ËüÓÖ³ÆÖÊÁ¿·Ö²¼Í¼£¬ÊÇÒ»ÖÖ±íʾÊý¾Ý·Ö²¼µÄͳ¼Æ±¨¸æÍ¼¡£
½üËÆÍ¼±íÖеÄÌõÐÎͼ£¬²»¹ýÖ±·½Í¼µÄÌõÐÎÊÇÁ¬ÐøÅÅÁУ¬Ã»Óмä¸ô¡¢ÒòΪ·Ö×éÊý¾Ý¾ßÓÐÁ¬ÐøÐÔ£¬²»ÄÜ·Å¿ª¡£
Õý³£µÄÖ±·½Í¼ÊÇÖмä¸ß¡¢Á½±ßµÍ¡¢×óÓÒ½üËÆ¶Ô³Æ¡£¶øÒì³£Ð͵ÄÖ±·½Í¼ÖÖÀà¹ý¶à£¬²»Í¬µÄÒì³£´ú±í²»Í¬µÄ¿ÉÄÜÇé¿ö¡£
Percentiles & Outliers
°Ù·ÖλÊýºÍ¼«Öµ
ËüÃÇÊÇÃèÊöÐÔͳ¼ÆµÄÔªËØ¡£
°Ù·ÖλÊýÖ¸½«Ò»×éÊý¾Ý´ÓСµ½´óÅÅÐò£¬²¢¼ÆËãÏàÓöµÄÀÛ»ý°Ù·ÖÖµ£¬Ä³Ò»°Ù·ÖλËù¶ÔÓ¦Êý¾ÝµÄÖµ¾Í³ÆÎªÕâÒ»°Ù·ÖλµÄ°Ù·ÖλÊý¡£±ÈÈç1¡«100µÄÊý×éÖУ¬25´ú±í25·Ö룬60´ú±í60·Öλ¡£
ÎÒÃdz£½«°Ù·ÖλÊý¾ùÔÈËĵȷ֣ºµÚ25°Ù·ÖλÊý£¬½Ð×öµÚÒ»ËÄ·ÖλÊý£»µÚ50°Ù·ÖλÊý£¬³ÆµÚ¶þËÄ·ÖλÊý£¬Ò²½ÐÖÐλÊý£»µÚ75°Ù·ÖλÊý£¬½Ð×öµÚÈýËÄ·ÖλÊý¡£Í¨¹ýËÄ·ÖλÊýÄܹ»¼òµ¥¿ìËٵĺâÁ¿Ò»×éÊý¾ÝµÄ·Ö²¼¡£ËüÃǹ¹³ÉÁËÏäÏßͼµÄÖ¸±ê¡£
¼«ÖµÊÇ×î´óÖµºÍ×îСֵ£¬Ò²ÊǵÚÒ»°Ù·ÖλÊýºÍµÚÒ»°Ù°Ù·ÖλÊý¡£
°Ù·ÖλÊýºÍ¼«Öµ¿ÉÒÔÓÃÀ´Ãè»æÏäÏßͼ¡£
Probability Theory
¸ÅÂÊÂÛ£¬Í³¼ÆÑ§µÄºËÐÄÖ®Ò»£¬Ö÷ÒªÑо¿Ëæ»úÏÖÏó·¢ÉúµÄ¿ÉÄÜÐÔ¡£
Bayes Theorem
±´Ò¶Ë¹¶¨Àí
Ëü¹ØÓÚËæ»úʼþAºÍBµÄÌõ¼þ¸ÅÂʵ͍Àí¡£
ÏÖʵÊÀ½çÓкܶàͨ¹ýijЩÐÅÏ¢ÍÆ¶Ï³öÆäËûÐÅÏ¢µÄÍÆÀíºÍ¾ö²ß£¬±ÈÈç¿´µ½Ìì°µÁË¡¢òßòѵͷÉÁË£¬ÄÇô¾Í±íʾÓпÉÄÜÏÂÓê¡£Õâ×é¹ØÏµ±»³ÆÎªÌõ¼þ¸ÅÂÊ£ºÓÃP(A|B)±íʾÔÚB·¢ÉúµÄÇé¿öÏÂA·¢ÉúµÄ¿ÉÄÜÐÔ¡£
±´Ò¶Ë¹¹«Ê½£ºP(B|A) = P(A|B)*P(B) / P(A)
ÏÖʵÉú»îÖÐ×î¾µäµÄÀý×Ó¾ÍÊǼ²²¡¼ì²â£¬Èç¹ûijÖÖ¼²²¡µÄ·¢²¡ÂÊΪǧ·ÖÖ®Ò»¡£ÏÖÔÚÓÐÒ»ÖÖÊÔÖ½£¬ËüÔÚ»¼Õߵò¡µÄÇé¿öÏ£¬ÓÐ99%µÄ׼ȷÅжϻ¼Õߵò¡£¬ÔÚ»¼ÕßûÓеò¡µÄÇé¿öÏ£¬ÓÐ5%µÄ¿ÉÄÜÎóÅл¼Õߵò¡¡£ÏÖÔÚÊÔֽ˵һ¸ö»¼ÕßµÃÁ˲¡£¬ÄÇô»¼ÕßÕæµÄµÃ²¡µÄ¸ÅÂÊÊǶàÉÙ£¿
´ÓÎÒÃǵÄÖ±¾õ¿´£¬ÊDz»ÊÇ»¼Õߵò¡µÄ¸ÅÂʺܴó£¬ÓÐ80%£¿90%£¿Êµ¼ÊÉÏ£¬»¼Õߵò¡µÄ¸ÅÂÊÖ»ÓÐ1.9%¡£¹Ø¼üÔÚÄÄÀһ¸öÊǼ²²¡µÄ·¢²¡ÂʹýµÍ£¬Ò»¸öÊÇ5%µÄÎóÅÐÂÊÌ«¸ß£¬µ¼Ö´ó¶àÊýûÓеò¡µÄÈ˱»ÎóÅС£Õâ¾ÍÊDZ´Ò¶Ë¹¶¨ÀíµÄ×÷Óã¬ÓÃÊýѧ£¬¶ø²»ÊÇÖ±¾õ×öÅжϡ£
×î¾µäµÄÓ¦ÓÃιýÓÚÀ¬»øÓʼþµÄ¹ýÂË¡£
Random Variables
Ëæ»ú±äÁ¿
±íÊ¾Ëæ»úÊÔÑé¸÷ÖÖ½á¹ûµÄʵ¼ÊÖµ¡£±ÈÈçÌìÆøÏÂÓêµÄ½µË®Á¿£¬±ÈÈçijһʱ¼ä¶ÎÉ̳ǵĿÍÁ÷Á¿¡£
Ëæ»ú±äÁ¿ÊǹæÂɵķ´Ó¦£¬ÈÓһöӲ±Ò£¬¼ÈÓпÉÄÜÕýÃæ¡¢Ò²ÓпÉÄÜ·´Ã棬Á½ÕߵĸÅÂʶ¼ÊÇ50%¡£ÈÓ÷»×Ó£¬½á¹ûÊÇ1¡«6Ö®¼äµÄÈκÎÒ»¸ö£¬¸ÅÂÊÒ²ÊÇÁù·ÖÖ®Ò»¡£ËäÈ»×öÒ»´ÎÊÔÑ飬½á¹û¿Ï¶¨ÊDz»È·¶¨ÐԵ쬵«ÊǸÅÂÊÊÇÒ»¶¨µÄ¡£Ëæ»ú±äÁ¿ÊǸÅÂʵĻùʯ¡£
Cumul Dist Fn(CDF)
ÀۼƷֲ¼º¯Êý£¨Cumulative Distribution Function£©
ËüÊǸÅÂÊÃܶȺ¯ÊýµÄ»ý·Ö£¬Äܹ»ÍêÕûÃèÊöÒ»¸öʵÊýËæ»ú±äÁ¿XµÄ¸ÅÂÊ·Ö²¼¡£Ö±¹Û¿´£¬ÀÛ»ý·Ö²¼º¯ÊýÊǸÅÂÊÃܶȺ¯ÊýÇúÏßϵÄÃæ»ý¡£

ÉÏͼÒõÓ°²¿·Ö¾ÍÊÇÒ»¸ö±ê×¼µÄÀÛ»ý·Ö²¼º¯ÊýF(x)£¬¸ø¶¨ÈÎÒâÖµx£¬¼ÆËãСÓÚxµÄ¸ÅÂÊΪ¶à´ó¡£Êµ¼Ê¹¤×÷Öв»»áÉæ¼°CDFµÄ¼ÆË㣬¶¼ÊǼÆËã»ú¸ºÔðµÄ¡£¼ÇµÃÔÚÎÒ´óѧ¿¼ÊÔ£¬Ò²ÊÇרÃŲé±íµÄ¡£
ÏÖʵÉú»îÖУ¬ÎÒÃÇÃèÊöµÄºÜ¶à¸ÅÂʶ¼ÊÇÀÛ»ý·Ö²¼º¯Êý£¬ÎÒÃÇ˵¿¼ÊÔ90·ÖÒÔÉϵĸÅÂÊÓÐ95%£¬Êµ¼ÊÊÇ90·Ö¡«100·ÖËùÓеĸÅÂÊÇóºÍΪ95%¡£
Continuos Distributions(Normal, Poisson, Gaussian)
Á¬Ðø·Ö²¼£¨Õý̬¡¢²´ËÉ¡¢¸ß˹£©
·Ö²¼ÓÐÁ½ÖÖ£¬ÀëÉ¢·Ö²¼ºÍÁ¬Ðø·Ö²¼¡£Á¬Ðø·Ö²¼ÊÇËæ»ú±äÁ¿ÔÚÇø¼äÄÚÄܹ»È¡ÈÎÒâÊýÖµ¡£
Õý̬·Ö²¼ÊÇͳ¼ÆÑ§ÖÐ×îÖØÒªµÄ·Ö²¼Ö®Ò»£¬ËüµÄÐÎ×´³ÊÖÓÐÍ£¬Á½Í·µÍ£¬Öмä¸ß£¬×óÓҶԳơ£

Õý̬·Ö²¼ÓÐÁ½¸ö²ÎÊý£¬ÆÚÍû¦ÌºÍ±ê×¼²î¦Ò£º¦Ì·´Ó¦ÁËÕý̬·Ö²¼µÄ¼¯ÖÐÇ÷ÊÆÎ»Ö㬦ҷ´Ó¦ÁËÀëÉ¢³Ì¶È£¬¦ÒÔ½´ó£¬ÇúÏßÔ½±âƽ£¬¦ÒԽС£¬ÇúÏßԽոߡ£
×ÔÈ»½ìÖдóÁ¿µÄÏÖÏó¶¼°´Õý̬ÐÎʽ·Ö²¼£¬±ê×¼Õý̬·Ö²¼ÔòÊÇÕý̬·Ö²¼µÄÒ»ÖÖ£¬Æ½¾ùÊýΪ0£¬±ê×¼²îΪ1¡£Ó¦ÓÃÖУ¬¶¼»á½«Õý̬·Ö²¼ÏÈת»»³É±ê×¼Õý̬·Ö²¼½øÐмÆËã¡£ºÜ¶àͳ¼ÆÑ§·½·¨£¬¶¼»áÒªÇóÊý¾Ý·ûºÏÕý̬·Ö²¼²ÅÄܼÆËã¡£
²´ËÉ·Ö²¼ÊÇÀëÉ¢¸ÅÂÊ·Ö²¼¡£ÊʺÏÃèÊöij¸öËæ»úʼþÔÚµ¥Î»Ê±¼ä£¯¾àÀë£¯Ãæ»ýµÈ³öÏֵĴÎÊý¡£µ±n³öÏֵĴÎÊý×ã¹»¶àʱ£¬²´ËÉ·Ö²¼¿ÉÒÔ¿´×÷Õý̬·Ö²¼¡£

¸ß˹·Ö²¼¾ÍÊÇÕý̬·Ö²¼¡£
Skewness
Æ«¶È
ËüÊÇÊý¾Ý·Ö²¼Çãб·½ÏòºÍ³Ì¶ÈµÄ¶ÈÁ¿£¬µ±Êý¾Ý·Ç¶Ô³ÆÊ±£¬ÐèÒªÓõ½Æ«¶È¡£
Õý̬·Ö²¼µÄÆ«¶ÈΪ0£¬µ±Æ«¶ÈΪ¸ºÊ±£¬Êý¾Ý·Ö²¼Íù×óÆ«À룬½Ð×ö¸ºÆ«À룬Ҳ³Æ×óƫ̬¡£·´Ö®½ÐÓÒÆ«Ì¬¡£

ANOVA
·½²î·ÖÎö
ÓÃÓÚ¶à¸ö±äÁ¿µÄÏÔÖøÐÔ¼ìÑé¡£»ù±¾Ë¼ÏëÊÇ£ºÍ¨¹ý·ÖÎöÑо¿²»Í¬À´Ô´µÄ±äÒì¶Ô×ܱäÒìµÄ¹±Ï×´óС£¬´Ó¶øÈ·¶¨¿É¿ØÒòËØ¶ÔÑо¿½á¹ûÓ°ÏìÁ¦µÄ´óС¡£
·½²î·ÖÎöÊôÓڻعé·ÖÎöµÄÌØÀý¡£·½²î·ÖÎöÓÃÓÚ¼ìÑéËùÓбäÁ¿µÄÏÔÖøÐÔ£¬¶ø»Ø¹é·ÖÎöͨ³£Õë¶Ôµ¥¸ö±äÁ¿µÄ¡£
Prob Den Fn(PDF)
¸ÅÂÊÃܶȺ¯Êý
PDFÊÇÓÃÀ´ÃèÊöÁ¬ÐøÐÍËæ»ú±äÁ¿µÄÊä³öÖµ¡£¸ÅÂÊÃܶȺ¯ÊýÓ¦¸ÃºÍ·Ö²¼º¯ÊýÒ»Æð¿´:

À¶É«ÇúÏßÊǸÅÂÊÃܶȺ¯Êý£¬ÒõÓ°²¿·ÖÊÇÀÛ»ý·Ö²¼º¯Êý¡£ÎÒÃÇÓøÅÂÊÃܶȺ¯ÊýÔÚÄ³Ò»Çø¼äÉϵĻý·ÖÀ´¿Ì»Ëæ»ú±äÁ¿ÂäÔÚÕâ¸öÇø¼äÖеĸÅÂÊ¡£¸ÅÂʵÈÓÚÇø¼ä³Ë¸ÅÂÊÃܶȣ¬ÀÛ»ý·Ö²¼µÈÓÚËùÓиÅÂʵÄÀÛ¼Ó¡£
¸ÅÂÊÃܶȺ¯Êý£ºf(x) = P(X=x)
ÀÛ»ý·Ö²¼º¯Êý£ºF(x) = P(X<=x)
¸ÅÂÊÃܶȺ¯ÊýÊÇÀÛ»ý·Ö²¼º¯ÊýµÄµ¼Êý£¬ÏÖÓзֲ¼º¯Êý£¬²ÅÓÐÃܶȺ¯Êý¡£ÀÛ»ý·Ö²¼º¯Êý¼´¿ÉÒÔÀëÉ¢Ò²¿ÉÒÔÁ¬Ðø£¬¶øÃܶȺ¯ÊýÊÇÓÃÔÚÁ¬Ðø·Ö²¼Öеġ£
Central Limit THeorem
ÖÐÐļ«ÏÞ¶¨Àí
ËüÊǸÅÂÊÂÛÖÐ×îÖØÒªµÄÒ»ÀඨÀí¡£
×ÔÈ»½ìÖкܶàËæ»ú±äÁ¿¶¼·þ´ÓÕý̬·Ö²¼£¬ÖÐÐļ«ÏÞ¶¨Àí¾ÍÊÇÀí½âºÍ½âÊÍÕâÐ©Ëæ»ú±äÁ¿µÄ¡£ÎÒÃÇÓÐÒ»¸ö×ÜÌåÑù±¾£¬´ÓÖÐÈ¡Ñù±¾Á¿ÎªnµÄÑù±¾£¬Õâ¸öÑù±¾ÓÐÒ»¸ö¾ùÖµ£¬µ±ÎÒÃÇÖØ¸´È¡ÁËm´Îʱ£¬¶ÔÓ¦ÓÐm¸ö¾ùÖµ£¬Èç¹ûÎÒÃǰÑÊý¾Ý·Ö²¼»³öÀ´£¬µÃµ½µÄ½á¹û½üËÆÕý̬·Ö²¼¡£
Õâ¾ÍÊÇÖÐÐļ«ÏÞ¶¨Àí£¬ËüÉñÆæµÄµØ·½¾ÍÔÚÓÚ²»¹Ü×ÜÌåÊÇʲô·Ö²¼¡£ÎÒÃǺܶàÍÆµ¼¶¼ÊÇ»ùÓÚÖÐÐļ«ÏÞ¶¨ÀíµÄ¡£
Monte Carlo Method
ÃÉÌØ¿¨ÂÞ·½·¨
ËüÊÇʹÓÃËæ»úÊýÀ´½â¾ö¼ÆËãÎÊÌâµÄ·½·¨¡£
ÃÉÌØ¿¨ÂÞÊÇÒ»¸ö´ó¶Ä³¡£¬ÒÔËüÃüÃû£¬º¬Òå½üËÆÓÚËæ»ú¡£ÎÒÃÇÓÐʱºò»áÒòΪ¸÷ÖÖÏÞÖÆ¶øÎÞ·¨Ê¹ÓÃÈ·¶¨ÐԵķ½·¨£¬´ËʱÎÒÃÇÖ»ÄÜËæ»úÄ£Ä⣬ÓÃͨ¹ý¸ÅÂÊʵÑéËùÇóµÄ¸ÅÂÊÀ´¹À¼ÆÎÒÃǸÐÐËȤµÄÒ»¸öÁ¿¡£×îÖªÃûµÄÀý×ÓÓв¼·áͶÕëÊÔÑé¡£
18ÊÀ¼Í£¬²¼·áÌá³öÒÔÏÂÎÊÌ⣺ÉèÎÒÃÇÓÐÒ»¸öÒÔÆ½ÐÐÇҵȾàÄ¾ÎÆÆÌ³ÉµÄµØ°å£¬Ä¾ÎƼä¾àΪa£¬ÏÖÔÚËæÒâÅ×Ò»Ö§³¤¶Èl±ÈÄ¾ÎÆÖ®¼ä¾àÀëaСµÄÕ룬ÇóÕëºÍÆäÖÐÒ»ÌõÄ¾ÎÆÏཻµÄ¸ÅÂÊ¡£²¼·á¼ÆËã³öÀ´Á˸ÅÂÊΪp
= 2l/¦Ða¡£
ΪÁ˼ÆËãÔ²ÖÜÂÊ£¬ÈËÃÇ·×·×ͶÕ룬ÒÔʵ¼ÊµÄÊÔÑé½á¹ûÀ´¼ÆËã¡£

ÏÂͼÔòÊǼÆËã»úÄ£ÄâµÄ½á¹û

Õâ¾ÍÊÇÃÉÌØ¿¨ÂÞ·½·¨µÄʵ¼ÊÓ¦Óá£ËüµÄÀíÂÛÒÀ¾ÝÊÇ´óÊý¶¨ÀíºÍÖÐÐļ«ÏÞ¶¨Àí¡£
Hypothesis Testing
¼ÙÉè¼ìÑé
ËüÊǸù¾ÝÒ»¶¨µÄ¼ÙÉèÌõ¼þÓÉÑù±¾ÍƶÏ×ÜÌåµÄ·½·¨¡£
Ê×Ïȸù¾Ýʵ¼ÊÎÊÌâ×÷³öÒ»¸ö¼ÙÉ裬¼Ç×÷H0£¬Ïà·´µÄ¼ÙÉè³ÆÎª±¸Ôñ¼ÙÉè¡£ËüµÄºËÐÄ˼ÏëÊÇС¸ÅÂÊ·´Ö¤·¨£¬Èç¹ûÕâ¸ö¼ÙÉè·¢ÉúµÄ¸ÅÂÊ̫СÒÔÖÁÓÚ²»¿ÉÄÜ·¢Éú£¬½á¹ûËü·¢ÉúÁË£¬ÄÇôÎÒÃÇÈÏΪ¼ÙÉèÊDz»³ÉÁ¢µÄ¡£
¼ÙÉè¼ìÑéÊÇÐèÒªÈÝÈ̵ģ¬ÒòΪÑù±¾»á´æÔÚ²¨¶¯£¬Õâ¸ö²¨¶¯·¶Î§²»»áÌ«Ñϸñ£¬ÔÚÕâ¸ö·¶Î§ÄÚ³öÏÖµÄʼþÎÒÃǶ¼ÄܽÓÊÜ¡£µ«ÊÇÎÒÃǶ¼ÕâôÈÝÈÌÁË£¬»¹ÊdzöÏÖÁËÎ¥±³Ô¼ÙÉèµÄС¸ÅÂÊʼþ£¬ÄÇô˵Ã÷Ô¼ÙÉèÓÐÎÊÌâ¡£²»ÄÜÈÝÈ̵ķ¶Î§¼´¾Ü¾øÓò£¬ÔھܾøÓò·¢ÉúµÄ¸ÅÂÊÎÒÃǶ¼ÈÏΪËüÊÇС¸ÅÂÊʼþ¡£
¼ÙÉè¼ìÑéÈÝÒ×·¸Á½Àà´íÎ󣬵ÚÒ»Àà´íÎóÊÇÕæÊµÇé¿öΪh0³ÉÁ¢£¬µ«ÅжÏh0²»³ÉÁ¢£¬·¸ÁË¡°ÒÔÕæÎª¼Ù¡±µÄ´íÎó¡£µÚ¶þÀà´íÎóÊÇh0ʵ¼Ê²»³ÉÁ¢£¬µ«ÅжÏËü³ÉÁ¢£¬·¸ÁË¡°ÒÔ¼ÙÎªÕæ¡±µÄ´íÎó¡£
¼ÙÉè¼ìÑéÓÐU¼ìÑé¡¢T¼ìÑé¡¢F¼ìÑéµÈ·½·¨¡£
p-Value
PÖµ
ËüÊǽøÐмÙÉè¼ìÑéÅж¨µÄÒ»¸ö²ÎÊý¡£µ±Ô¼ÙÉèÎªÕæÊ±Ñù±¾¹Û²ì½á¹û£¨»ò¸ü¼«¶Ë½á¹û£©³öÏֵĸÅÂÊ¡£PÖµºÜС£¬ËµÃ÷Ô¼ÙÉè·¢ÉúµÄ¸ÅÂʺÜС£¬µ«Ëüȷʵ·¢ÉúÁË£¬ÄÇôÎÒÃǾÍÓÐÀíÓɾܾøÔ¼ÙÉè¡£
ÖÁÓÚPÖµµÄÑ¡Ôñ¸ù¾Ý¾ßÌåÇé¿ö£¬Ò»°ãÊÇ1%£¬5%¼¸¸öµµ´Î¡£
È»¶ø£¬PÖµÔÚͳ¼ÆÑ§ÉÏÕùÒéºÜ´ó£¬PÖµÊÇ·ñÊǽÓÊÜÔ¼ÙÉèµÄ±ê×¼£¬¶¼ÊÇͳ¼ÆÑ§¸÷ÖÖÁ÷ÅÉ»ìºÏºóµÄ¹Ûµã¡£PÖµ´ÓÀ´Ã»Óб»Ö¤Ã÷¿ÉÒÔÓÃÀ´½ÓÊÕij¸ö¼ÙÉ裨ËùÒÔÎÒÉÏÎĵÄ˵Ã÷²¢²»ÑϽ÷£©£¬ËüÖ»Êǽö¹©²Î¿¼¡£ÏÖÔÚͳ¼ÆÑ§¼ÒÃÇÒ²¿ªÊ¼³«µ¼£ºÓ¦¸Ã¸ø³öÖÃÐÅÇø¼äºÍͳ¼Æ¹¦Ð§£¬Êµ¼ÊµÄÐж¯ÅжÁ»¹ÊÇÁô¸øÈ˰ɡ£
Chi2 Test
¿¨·½¼ìÑé
Chi¶Á×÷¿¨¡£Í¨³£ÓÃ×÷¶ÀÁ¢ÐÔ¼ìÑéºÍÄâºÏÓŶȼìÑé¡£
¿¨·½¼ìÑé»ùÓÚ¿¨·½·Ö²¼¡£¼ìÑéµÄ¼ÙÉèÊÇ¹Û²ìÆµÊýÓëÆÚÍûƵÊýûÓвî±ð¡£
¶ÀÁ¢ÐÔ¼ìÑ飺¿¨·½·Ö²¼µÄÒ»¸öÖØÒªÓ¦ÓÃÊÇ»ùÓÚÑù±¾Êý¾ÝÅжÏÁ½¸ö±äÁ¿µÄ¶ÀÁ¢ÐÔ¡£¶ÀÁ¢ÐÔ¼ìÑéʹÓÃÁÐÁª±í¸ñʽ£¬Òò´ËÒ²±»³ÆÎªÁÐÁª±í¼ìÑé¡£Ô¼ÙÉèÖУ¬ÁбäÁ¿ÓëÐбäÁ¿¶ÀÁ¢£¬Í¨¹ýÿ¸öµ¥Ôª¸ñµÄÆÚÍûƵÊý¼ìÑéͳ¼ÆÁ¿¡£
ÄâºÏÓŶȼìÑ飺ËüÒÀ¾Ý×ÜÌå·Ö²¼×´¿ö£¬¼ÆËã³ö·ÖÀà±äÁ¿Öи÷Àà±ðµÄÆÚÍûƵÊý£¬Óë·Ö²¼µÄ¹Û²ìƵÊý½øÐжԱȣ¬ÅÐ¶ÏÆÚÍûƵÊýÓë¹Û²ìƵÊýÊÇ·ñÓÐÏÔÖø²îÒ졣ĿµÄÊÇÅжϼÙÉèµÄ¸ÅÂÊ·Ö²¼Ä£ÐÍÊÇ·ñÄÜÓÃ×÷Ñо¿×ÜÌåµÄÄ£ÐÍ¡£
¶ÀÁ¢ÐÔ¼ìÑéÊÇÄâºÏÓŶȼìÑéµÄÍÆ¹ã¡£
Estimation
¹À¼Æ
ͳ¼ÆÑ§ÀïÃæ¹À¼Æ·ÖΪ²ÎÊý¹À¼ÆºÍ·Ç²ÎÊý¹À¼Æ¡£
²ÎÊý¹À¼ÆÊÇÓÃÑù±¾Ö¸±ê¹À¼Æ×ÜÌåÖ¸±ê£¬Õâ¸öÖ¸±ê¿ÉÒÔÊÇÆÚÍû¡¢·½²î¡¢Ïà¹ØÏµÊýµÈ£¬Ö¸±êµÄÕýʽÃû³Æ¾ÍÊDzÎÊý¡£µ±¹À¼ÆµÄÊÇÕâЩ²ÎÊýµÄֵʱ£¬½Ð×öµã¹À¼Æ¡£µ±¹À¼ÆµÄÊÇÒ»¸öÇø¼ä£¬¼´×ÜÌåÖ¸±êÔÚij·¶Î§ÄڵĿÉÄÜʱ£¬½Ð×öÇø¼ä¹À¼Æ£¬¼òµ¥ÈÏΪÊÇÈËÃdz£ËµµÄÓжàÉÙ°ÑÎÕ±£Ö¤Ä³ÖµÔÚij¸ö·¶Î§ÄÚ¡£
²ÎÊý¹À¼ÆÐèÒªÏÈÃ÷È·¶ÔÑù±¾µÄ·Ö²¼ÐÎ̬ÓëÄ£Ð͵ľßÌåÐÎʽ×ö¼ÙÉè¡£³£¼ûµÄ¹À¼Æ·½·¨Óм«´óËÆÈ»¹À¼Æ·¨¡¢×îС¶þ³Ë·¨¡¢±´Ò¶Ë¹¹À¼Æ·¨µÈ¡£
·Ç²ÎÊý¹À¼ÆÔòÊDz»×ö¼ÙÉ裬ֱ½ÓÀûÓÃÑù±¾Êý¾ÝÈ¥×ö±Æ½ü£¬ÕÒ³öÏàÓ¦µÄÄ£ÐÍ¡£
Confid Int(CI)
ÖÃÐÅÇø¼ä
ËüÊDzÎÊý¼ìÑéÖжÔij¸öÑù±¾µÄ×ÜÌå²ÎÊýµÄÇø¼ä¹À¼Æ¡£ËüÃèÊöµÄÊÇÕâ¸ö²ÎÊýÓÐÒ»¶¨¸ÅÂÊÂäÔÚ²âÁ¿½á¹ûµÄ·¶Î§³Ì¶È¡£Õâ¸ö¸ÅÂʽÐ×öÖÃÐÅˮƽ¡£
ÒÔÍøÉÏÀý×ÓÀ´Ëµ£¬Èç¹ûÔÚÒ»´Î´óÑ¡ÖÐijÈ˵ÄÖ§³ÖÂÊΪ55%£¬¶øÖÃÐÅˮƽ0.95ÒÔÉϵÄÖÃÐÅÇø¼äÊÇ£¨50%,60%£©£¬ÄÇôËûµÄÕæÊµÖ§³ÖÂÊÓÐ95%µÄ¸ÅÂÊÂäÔÚºÍ50¡«60µÄÖ§³ÖÂÊÖ®¼ä¡£ÎÒÃÇÒ²¿ÉÒÔºÜÈÝÒ×µÄÍÆµÃ£¬µ±ÖÃÐÅÇø¼äÔ½´ó£¬ÖÃÐÅˮƽҲһ¶¨Ô½´ó£¬ÂäÔÚ40¡«70%Ö§³ÖÂʵĿÉÄÜÐÔ¾ÍÓÐ99.99%ÁË¡£µ±È»£¬Ô½´óµÄÖÃÐÅÇø¼ä£¬ËüÔÚÏÖʵµÄ¾ö²ß¼ÛÖµÒ²Ô½µÍ¡£
ÖÃÐÅÇø¼ä¾³£¼ûÓÚ³éÑùµ÷ÑУ¬AB²âÊԵȡ£
MLE
¼«´óËÆÈ»¹À¼Æ
ËüÊǽ¨Á¢ÔÚ¼«´óËÆÈ»ÔÀíµÄ»ù´¡ÉÏ¡£
Èç¹ûÊÔÑéÈçÓÐÈô¸É¸ö¿ÉÄܵĽá¹ûA£¬B£¬C¡¡£ÈôÔÚ½ö½ö×÷Ò»´ÎÊÔÑéÖУ¬½á¹ûA³öÏÖ£¬ÔòÒ»°ãÈÏΪÊÔÑéÌõ¼þ¶ÔA³öÏÖÓÐÀû£¬Ò²¼´A³öÏֵĸÅÂʺܴó¡£
´ËʱÎÒÃÇÐèÒªÕÒ³öij¸ö²ÎÊý£¬²ÎÊýÄÜʹÕâ¸öÑù±¾³öÏֵĸÅÂÊ×î´ó£¬ÎÒÃǵ±È»²»»áÔÙȥѡÔñÆäËûС¸ÅÂʵÄÑù±¾£¬ËùÒԸɴà¾Í°ÑÕâ¸ö²ÎÊý×÷Ϊ¹À¼ÆµÄÕæÊµÖµ¡£
Kernel Density Estimate
ºËÃܶȹÀ¼Æ
ËüÊǸÅÂÊÂÛÖйÀ¼ÆÎ´ÖªµÄÃܶȺ¯Êý£¬ÊôÓڷDzÎÊý¼ìÑé¡£
Ò»°ãµÄ¸ÅÂÊÎÊÌ⣬ÎÒÃǶ¼»á¼Ù¶¨Êý¾Ý·Ö²¼Âú×ã״̬£¬ÊÇ»ùÓÚ¼Ù¶¨µÄÅбð¡£ÕâÖֽвÎÊý¼ìÑé¡£Èç¹ûÈç¹ûÊý¾ÝÓë¼Ù¶¨´æÔںܴóµÄ²îÒ죬ÄÇôÕâЩ·½·¨¾Í²»ºÃÓã¬ÓÚÊDZãÓÐÁ˷DzÎÊý¼ìÑé¡£ºËÃܶȹÀ¼Æ¾ÍÊǷDzÎÊý¼ìÑ飬Ëü²»ÐèÒª¼Ù¶¨Êý¾ÝÂú×ãÄÇÖÖ·Ö²¼¡£
Regression
»Ø¹é
»Ø¹é£¬Ö¸Ñо¿Ò»×éËæ»ú±äÁ¿(Y1 £¬Y2 £¬¡£¬Yi)ºÍÁíÒ»×é(X1£¬X2£¬¡£¬Xk)±äÁ¿Ö®¼ä¹ØÏµµÄͳ¼Æ·ÖÎö·½·¨£¬ÓֳƶàÖØ»Ø¹é·ÖÎö¡£Í¨³£Y1£¬Y2£¬¡£¬YiÊÇÒò±äÁ¿£¬X1¡¢X2£¬¡£¬XkÊÇ×Ô±äÁ¿¡£
»Ø¹é·ÖÎö³£ÓÃÀ´Ì½ÌÖ±äÁ¿Ö®¼äµÄ¹ØÏµ£¬ÔÚÓÐÏÞÇé¿öÏ£¬Ò²ÄÜÍÆ¶ÏÏà¹ØÐÔºÍÒò¹ûÐÔ¡£¶øÔÚ»úÆ÷ѧϰÁìÓòÖУ¬Ëü±»ÓÃÀ´Ô¤²â£¬Ò²ÄÜÓÃÀ´É¸Ñ¡ÌØÕ÷¡£

»Ø¹é°üÀ¨ÏßÐԻع顢·ÇÏßÐԻع顢Âß¼»Ø¹éµÈ¡£ÉÏͼ¾ÍÊÇÏßÐԻع顣
Convariance
з½²î
ÓÃÓÚºâÁ¿Á½¸ö±äÁ¿µÄ×ÜÌåÎó²î£¬·½²îÊÇз½²îµÄÒ»ÖÖÌØÊâÇé¿ö£¬¼´Á½¸ö±äÁ¿Ïàͬ¡£
з½²îÓÃÊý¾ÝÆÚÍûÖµE¼ÆË㣺cov(x,y) = E[XY]-E[X][Y]¡£
Èç¹ûXY»¥Ïà¶ÀÁ¢£¬Ôòcov(x,y)=0.´ËʱE[XY] = E[X][Y]¡£
Correlation
Ïà¹ØÐÔ
¼´±äÁ¿Ö®¼äµÄ¹ØÁªÐÔ£¬Ïà¹ØÐÔֻɿ¼°Êýѧ²ãÃæ£¬¼´Ò»¸ö±äÁ¿±ä»¯£¬ÁíÍâÒ»¸ö±äÁ¿»á²»»á±ä»¯£¬µ«ÊÇÁ½¸ö±äÁ¿µÄÒò¹ûÐÔ²»×öÑо¿¡£
Ïà¹Ø¹ØÏµÊÇÒ»ÖÖ·ÇÈ·¶¨ÐԵĹØÏµ£¬¼´ÎÞ·¨Í¨¹ýÒ»¸ö±äÁ¿¾«È·µØÈ·¶¨ÁíÍâÒ»¸ö±äÁ¿£¬±ÈÈçÎÒÃǶ¼ÈÏΪ£¬Ò»¸öÈËÉí¸ßÔ½¸ßÌåÖØÔ½ÖØ£¬µ«ÊDz»ÄÜÕæµÄͨ¹ýÉí¸ßȥȷ¶¨È˵ÄÌåÖØ¡£
Pearson Coeff
Ƥ¶ûÑ·Ïà¹ØÏµÊý
ËüÊǶÈÁ¿Á½¸ö±äÁ¿ÏßÐÔÏà¹ØµÄϵÊý£¬ÓÃr±íʾ£¬ÆäÖµ½éÓÚ-1Óë1Ö®¼ä¡£1±íʾÍêÈ«ÕýÏà¹Ø£¬0±íʾÍêÈ«Î޹أ¬-1±íʾÍêÈ«¸ºÏà¹Ø¡£

Causation
Òò¹ûÐÔ
ºÍÏà¹ØÐÔÊÇÒ»¶ÑºÃ»ùÓÑ¡£Ïà¹ØÐÔ´ú±íÊýѧÉϵĹØÏµ£¬µ«²¢²»´ú±í¾ßÓÐÒò¹ûÐÔ¡£
ÏÄÌ죬³ÔÀäÒûµÄÈËÊýºÍÑÍËÀµÄÈËÊý¶¼³ÊÏÖÕýÏà¹Ø¡£ÄѵÀÊdzÔÀäÒûµ¼ÖÂÁËÑÍËÀ£¿²»Êǵģ¬ÊÇÒòΪÌìÈÈ£¬ÌìÈȳÔÀäÒûµÄÈ˶àÁË£¬ÓÎÓ¾µÄÈËÒ²¶àÁË¡£
¡¶´óÊý¾Ýʱ´ú¡·Ôø¾Ç¿µ÷£¬ÎÒÃÇÓ¦¸ÃÖØÊÓÏà¹ØÐÔ¶ø²»ÊÇÒò¹ûÐÔ£¬ÕâÊÇ´æÒɵģ¬ÒòΪ¶ÔÊý¾Ý¿ÆÑ§¼ÒÀ´Ëµ£¬¶ÔÒµÎñÒò¹ûÐÔµÄÁ˽âÍùÍùʤÓÚÏà¹ØÐÔ£¬±ÈÈçÄãÔ¤²âÒ»¸öÈËÊÇ·ñ»áµÃ°©Ö¢£¬Äã²»ÄÜÄÃÊÇ·ñ×ö¹ý·ÅÁÆ×÷ÎªÌØÕ÷£¬ÒòΪ·ÅÁÆÒѾÊǰ©Ö¢µÄ¹û£¬±ØÈ»ÊǷdz£Ç¿Ïà¹Ø£¬µ«ÊǶÔÔ¤²âûÓÐÈκΰïÖú£¬Ö»ÊDzâÊÔÊý¾ÝÉϺÿ´¶øÒÑ¡£
Least2 fit
×îС¶þ³Ë·¨
ËüÊÇÏßÐԻعéµÄÒ»ÖÖÓÃÓÚ»úÆ÷ѧϰÖеÄÓÅ»¯¼¼Êõ¡£
×îС¶þ³ËµÄ»ù±¾Ë¼ÏëÊÇ£º×îÓÅÄâºÏÖ±ÏßÓ¦¸ÃÊÇʹ¸÷µãµ½»Ø¹éÖ±ÏߵľàÀëºÍ×îСµÄÖ±Ïߣ¬¼´Æ½·½ºÍ×îС¡£ËüÊÇ»ùÓÚŷʽ¾àÀëµÄ¡£
Eculidean Distance
Å·ÊϾàÀë
Ö¸ÔÚmά¿Õ¼äÖÐÁ½¸öµãÖ®¼äµÄÕæÊµ¾àÀ롣СѧʱÇóµÄ×ø±êÖáÖáÉÏÁ½¸öµãµÄÖ±Ïß¾àÀë¾ÍÊǶþά¿Õ¼äµÄŷʽ¾àÀë¡£ºÜ¶àËã·¨¶¼ÊÇ»ùÓÚŷʽ¾àÀëÇó½âµÄ¡£
¶þά£º

¡ª¡ª¡ª¡ª¡ª¡ª
Programming ±à³Ì
Êý¾Ý¿ÆÑ§¼ÒÊÇÐèÒªÒ»¶¨µÄ±à³ÌÄÜÁ¦£¬ËäÈ»²»ÐèÒª³ÌÐòÔ±ÄÇô¾«Í¨£¬×¢ÖصÄÊǽâ¾öµÄÄÜÁ¦£¬¶ø²»Êǹ¤³Ì»¯µÄÄÜÁ¦¡£×÷Õß´ÓÄÚÈÝ¿´¸üÍÆ³çR£¬ÎÒ¸öÈËÊÇÍÆ³çPythonµÄ¡£
Python Basics
Python»ù´¡ÖªÊ¶¡£
ÈËÉú¿à¶Ì£¬ÎÒÓÃPython¡£
PythonµÄ»ù´¡ÄÚÈݱÈR·á¸»µÄ¶à£¬½ü¼¸Ä꣬PythonÓÐ×÷ΪµÚÒ»Êý¾Ý¿ÆÑ§ÓïÑÔµÄÇ÷ÊÆ¡£»ù´¡ÄÚÈݾͲ»¶à¸´ÊöÁË¡£
Working in Excel
Excel¸É»î
ÕÆÎÕ³£Óú¯Êý£¬¶®µÃÊý¾Ý·ÖÎö¿â£¬»áPowerϵÁмӷ֡£VBAÕâÖ־Ͳ»ÓÃѧÁË¡£
R Setup, RStudio R
°²×°RºÍRStudio
RÊÇÒ»ÃÅͳ¼ÆÑ§ÓïÑÔ¡£ÏÂÁеÄÄÚÈÝ£¬¶¼ÊÇRÓïÑÔÏà¹Ø¡£
R Basics
RµÄ»ù´¡£¬²»¶à×÷³ÂÊöÁË¡£
Varibles
±äÁ¿
±äÁ¿ÊǼÆËã»úÓïÑÔÖеijéÏó¸ÅÄ¿ÉÒÔÀí½â³ÉÎÒÃǼÆËãµÄ½á¹û»òÕßÖµ£¬²»Í¬¼ÆËãÓïÑԵıäÁ¿ÐÔÖʲ»Ò»Ñù¡£Ö÷ÒªÀí½âRºÍPythonµÄ±äÁ¿¾ÍÐС£´óÊý¾ÝÄÇ¿é¿ÉÄÜ»¹»áÉæ¼°µ½JavaºÍScala¡£
R Óà <- ¸ø±äÁ¿¸³Öµ£¬=Ò²ÄÜÓ㬵«²»½¨Òé¡£
Vectors
ÏòÁ¿
ÏòÁ¿ÊÇһάÊý×飬¿ÉÒÔ´æ´¢ÊýÖµÐÍ¡¢×Ö·ûÐÍ»òÂß¼ÐÍÊý¾ÝµÄһάÊý×é¡£RÀïÃæÊ¹Óú¯Êýc( )´´½¨ÏòÁ¿¡£
ÏòÁ¿ÖеÄÊý¾Ý±ØÐëÓµÓÐÏàͬµÄÊý¾ÝÀàÐÍ£¬ÎÞ·¨»ìÔÓ¡£
Matrices
¾ØÕó
¾ØÕóÊÇÒ»¸ö¶þάÊý×飬ºÍÏòÁ¿Ò»Ñù£¬Ã¿¸öÔªËØ±ØÐëÓµÓÐÏàͬµÄÊý¾ÝÀàÐÍ¡£µ±Î¬¶È³¬¹ý2ʱ£¬ÎÒÃǸü½¨ÒéʹÓÃÊý×é
m <- matrix(1:20,nrow=5,ncol=4) |
Arrays
Êý×é
Êý×éÓë¾ØÕóÀàËÆ£¬µ«ÊÇά¶È¿ÉÒÔ´óÓÚ2£¬Êý¾ÝÀàÐͱØÐëÒ»Ñù¡£
Factors
Òò×Ó
Òò×ÓÊÇRÖеÄÓÐÐò±äÁ¿ºÍÀà±ð±äÁ¿¡£
Àà±ð±äÁ¿Ò²½Ð×öÃûÒå±äÁ¿£¬ËüûÓÐ˳ÐòÖ®·Ö£¬±ÈÈçÄÐÅ®£¬ËäÈ»±àÂëÖпÉÄÜÄÐΪ1£¬Å®Îª2£¬µ«²»¾ß±¸ÊýÖµ¼ÆË㺬Òå¡£ÓÐÐò±äÁ¿Ôò±íʾһÖÖ˳Ðò¹ØÏµ£¬ÉÙÄê¡¢ÇàÄê¡¢ÀÏÄêÔòÊÇÒ»ÖÖÓÐÐò±äÁ¿¡£
f <- factor(c("type1","type2","type1)) |
ÔÚfactorº¯ÊýÖмÓÈë²ÎÊýordered = True£¬¾Í±íʾΪÓÐÐòÐͱäÁ¿ÁË¡£
Lists
Áбí
ËüÊÇR×ÔÓµÄÊý¾ÝÀàÐÍ£¬Ëü¿ÉÒÔÊÇÉÏÊöÊý¾Ý½á¹¹µÄ×éºÏ¡£
l <- list(names
= v,m,a,f ) |
ÉÏÊöÀý×ӾͰüº¬ÁËÏòÁ¿¡¢¾ØÕó¡¢Êý×é¡¢Òò×Ó¡£ÎÒÃÇ¿ÉÒÔʹÓÃË«ÖØ·½À¨ºÅ[[ ]]ѡȡÁбíÖеÄÔªËØ¡£RÖеÄϱ겻´Ó0¿ªÊ¼£¬ËùÒÔlist[[1]]
ѡȡµÄÊÇv¡£
Data Frames
Êý¾Ý¿ò
ÔÚRºÍPythonÖÐΪ³£ÓõÄÊý¾Ý½á¹¹¡£
RÓïÑÔÖÐΪdata.frame£¬PythonÖÐΪPandasµÄDataFrame¡£ÕâÀïÒÔRÓïÑÔ¾ÙÀý¡£
Êý¾Ý¿ò¿ÉÒÔ°üº¬²»Í¬Êý¾ÝÀàÐ͵ÄÁУ¬ËüÊDZȾØÕó¸ü¹ã·ºµÄ¸ÅÄҲÊÇRÖÐ×î³£ÓõÄÊý¾Ý½á¹¹¡£Ã¿Ò»ÁеÄÊý¾ÝÀàÐͱØÐëΨһ¡£
x <- data.frame(col1,col2,col3) |
Reading CSV Data
¶ÁÈ¡CSV
ÕâÒ»¿é±È½Ï¿ÓµÄµØ·½ÊÇÖÐÎÄ£¬RÓïÑÔ¶ÔÖÐÎıàÂëµÄÖ§³Ö±È½ÏÂé·³¡£
Reading Raw Data
¶ÁÈ¡ÔʼÊý¾Ý
²»Çå³þÕâºÍCSVµÄÇø±ð¡£
Subsetting Data
¹¹½¨Êý¾Ý¼¯
RÌṩÁ˳£Óú¯Êý·½±ãÎÒÃǹ¹½¨Êý¾Ý¼¯£¨·´ÕýÀ´È¥¶¼ÄǼ¸¸öÓ¢ÎÄ£©¡£
Êý¾Ý¼¯ºÏ²¢Ê¹ÓÃmergeº¯Êý¡£
Ìí¼ÓÊý¾ÝÐÐʹÓÃrbindº¯Êý¡£
dataframeѡȡ×Ó¼¯ÓÃ[ row,column]¡£
ɾ³ý±äÁ¿¿ÉÒÔͨ¹ý <- Null¡£
¸´ÔÓ²éѯÔòʹÓÃsubsetº¯Êý¡£
Èç¹ûÒѾϰ¹ßSQLº¯Êý£¬¿ÉÒÔÔØÈëlibrary(sqldf)ºóÓÃsqldfº¯Êý¡£
Manipulate Data Frames
²Ù×÷Êý¾Ý¿ò
³ýÁËÉÏÃæµÄ¹¹½¨Êý¾Ý¼¯µÄ¼¼ÇÉ£¬Èç¹ûÎÒÃÇÐèÒª¸ü¸´ÔӵIJÙ×÷£¬¼Ó¹¤Ä³Ð©Êý¾Ý£¬ÈçÇó±äÁ¿ºÍ¡¢¼ÆËã·½²îµÈ£¬ÔòÒªÓõ½RÓïÑÔµÄÆäËûº¯Êý¡£
R±¾ÉíÌṩÁËabs(x),sort(x),mean(x),cos(x)µÈ³£ÓõÄͳ¼Æ·½·¨£¬ÈçºÎÓ¦ÓÃÔÚÊý¾Ý¿òÄØ£¿ÎÒÃÇʹÓÃapplyº¯Êý£¬¿É½«ÈÎÒâÒ»¸öº¯ÊýÓ¦ÓÃÔÚ¾ØÕó¡¢Êý×é¡¢Êý¾Ý¿òÖС£
apply(dataframe,margin,fun) |
Functions
º¯Êý
RÓïÑÔ×Ô´øÁ˷ḻµÄͳ¼Æº¯Êý£¬¿ÉÒÔͨ¹ý¹Ù·½/µÚÈý·½Îĵµ²éѯ£¬RÒ²¿ÉÒÔ×Ô½¨º¯Êý¡£
myfunction <-
function(arg1,arg2,¡¡){
statements
return(object)
} |
º¯ÊýÖеĶÔÏóÖ»ÔÚº¯ÊýÄÚ²¿Ê¹Óá£Èç¹ûÒªµ÷ÊÔº¯Êý£¬¿ÉÒÔʹÓÃwarning( ),messagr( ),stop(
)µÈ¾À´í¡£
Factor Analysis
Òò×Ó·ÖÎö
ÎÒ²»ÖªµÀÕâ¿éµÄ±à³Ì»ù´¡ÄÚÈÝΪʲôҪ¼ÓÈëÒò×Ó·ÖÎö¡£RÓïÑÔµÄÒò×Ó·ÖÎöº¯ÊýÊÇfactanal()
Install Pkgs
µ÷°üÏÀ
RµÄ°ü·Ç³£·á¸»£¨Python¸üÊÇ£©£¬¿ÉÒÔͨ¹ýcranÏÂÔØ£¬°üÀ¨ÅÀ³æ¡¢½âÎö¡¢¸÷רҵÁìÓòµÈ¡£º¯Êýlibrary¿ÉÒÔÏÔʾÓÐÄÄЩ°ü£¬¿ÉÄÜÖ±½Ó¼ÓÈë°ü¡£RStudioÔòÌṩÁËÓë°üÏà¹ØµÄ·á¸»²éѯ½çÃæ¡£
¡ª¡ª¡ª¡ª¡ª¡ª
Machine Learning»úÆ÷ѧϰ
Êý¾Ý¿ÆÑ§µÄÖÕ¼«Ó¦Óã¬ÏÖÔÚÒѾÊÇÉî¶ÈѧϰÁË¡£ÕâÌõ·Ҳ½Ð´Óµ÷°üµ½¿ÆÑ§µ÷²Î¡£ÕâÀïµÄËã·¨ÊôÓÚ¾µäËã·¨£¬µ«ÊÇÏòGBDT¡¢XGBoost¡¢RFµÈ½ü¼¸Ä꾺ÈüÖдó·¢Òì²ÊµÄË㷨ûÓÐÉæ¼°£¬Ó¦¸ÃÊÇдµÃ±È½ÏÔçµÄÔÒò¡£
What is ML?
»úÆ÷ѧϰÊÇɶ×ÓÓ´
»úÆ÷ѧϰ£¬Çø±ðÓÚÊý¾ÝÍÚ¾ò£¬»úÆ÷ѧϰµÄËã·¨»ùÓÚͳ¼ÆÑ§ºÍ¸ÅÂÊÂÛ£¬¸ù¾ÝÒÑÓÐÊý¾Ý²»¶Ï×Ô¶¯Ñ§Ï°ÕÒµ½×îÓŽ⡣Êý¾ÝÍÚ¾òÄܰüº¬»úÆ÷ѧϰµÄËã·¨£¬µ«ÊÇÐͬ¹ýÂË£¬¹ØÁª¹æÔò²»ÊÇ»úÆ÷ѧϰ£¬ÔÚ»úÆ÷ѧϰµÄ½Ì³ÌÉÏ¿´²»µ½£¬µ«ÊÇÔÚÊý¾ÝÍÚ¾òÊé±¾ÄÜ¿´µ½¡£
Numerical Var
ÊýÖµ±äÁ¿
»úÆ÷ѧϰÖÐÖ÷ÒªÊÇÁ½Àà±äÁ¿£¬ÊýÖµ±äÁ¿ºÍ·ÖÁ¿±äÁ¿¡£
ÊýÖµ±äÁ¿¾ßÓмÆËãÒâÒ壬¿ÉÓüӼõ³Ë³ý¡£Êý¾ÝÀàÐÍÓÐint¡¢floatµÈ¡£
ÔںܶàÄ£ÐÍÖУ¬Á¬ÐøÐÔµÄÊýÖµ±äÁ¿²»»áÖ±½ÓʹÓã¬ÎªÁËÄ£Ð͵ķº»¯ÄÜÁ¦»á½«Æäת»»Îª·ÖÀà±äÁ¿¡£
Categorical Var
·ÖÀà±äÁ¿
·ÖÀà±äÁ¿¿ÉÒÔÓ÷ÇÊýÖµ±íʾ£¬ËüÊÇÀëÉ¢±äÁ¿¡£
ÓÐʱºòΪÁË·½±ãºÍ½ÚÊ¡´æ´¢¿Õ¼ä£¬Ò²»áÓÃÊýÖµ±íʾ£¬±ÈÈç1´ú±íÄУ¬0´ú±íÅ®¡£µ«ËüÃÇûÓмÆËãÒâÒå¡£ÔÚÊäÈëÄ£Ð͵Ĺý³ÌÖУ¬»á½«Æäת±äÎªÑÆ±äÁ¿¡£
Supervised Learning
¼à¶½Ñ§Ï°
»úÆ÷ѧϰÖ÷Òª·ÖΪ¼à¶½Ñ§Ï°ºÍ·Ç¼à¶½Ñ§Ï°¡£
¼à¶½Ñ§Ï°ÊÇ´Ó¸ø¶¨µÄѵÁ·¼¯ÖÐѧϰ³öÒ»¸ö³¬¼¶º¯ÊýY=F(X)£¬ÎÒÃÇÒ²³ÆÖ®ÎªÄ£ÐÍ¡£µ±ÐÂÊý¾Ý·ÅÈ뵽ģÐ͵Äʱºò£¬ËüÄÜÊä³öÎÒÃÇÐèÒªµÄ½á¹û´ïµ½·ÖÀà»òÕßÔ¤²âµÄÄ¿µÄ¡£½á¹ûY½Ð×öÄ¿±ê£¬X½Ð×öÌØÕ÷¡£µ±ÓÐÐÂÊý¾Ý½øÈ룬Äܹ»²úÉúеÄ׼ȷµÄ½á¹û¡£
¼ÈÈ»´ÓѵÁ·¼¯ÖÐÉú³ÉÄ£ÐÍ£¬ÄÇôѵÁ·¼¯µÄ½á¹ûYÓ¦¸ÃÊÇÒÑÖªµÄ£¬ÖªµÀÊäÈëXºÍÊä³öY£¬Ä£ÐͲŻὨÁ¢£¬Õâ¸ö¹ý³Ì½Ð×ö¼à¶½Ñ§Ï°¡£Èç¹ûÊä³öÖµÊÇÀëÉ¢µÄ£¬ÊÇ·ÖÀ࣬Èç¹ûÊä³öÖµÊÇÁ¬ÐøµÄ£¬ÊÇÔ¤²â¡£
¼à¶½Ñ§Ï°³£¼ûÓÚKNN¡¢ÏßÐԻع顢ÆÓËØ±´Ò¶Ë¹¡¢Ëæ»úÉÁֵȡ£
Unsupervied Learning
·Ç¼à¶½Ñ§Ï°
Î޼ලѧϰºÍ¼à¶½Ñ§Ï°£¬¼à¶½Ñ§Ï°ÊÇÖªµÀ½á¹ûY£¬Î޼ලѧϰÊDz»ÖªµÀY£¬½öͨ¹ýÒÑÓеÄX£¬À´ÕÒ³öÒþ²ØµÄ½á¹¹¡£
Î޼ලѧϰ³£¼ûÓÚ¾ÛÀà¡¢ÒþÂí¶û¿É·òÄ£Ð͵ȡ£
Concepts, Inputs & Attributes
¸ÅÄî¡¢ÊäÈëºÍÌØÕ÷
»úÆ÷ѧϰ°üÀ¨ÊäÈë¿Õ¼ä¡¢Êä³ö¿Õ¼ä¡¢ºÍÌØÕ÷¿Õ¼äÈýÀà¡£ÌØÕ÷Ñ¡ÔñµÄÄ¿µÄÊÇɸѡ³ö½á¹ûÓÐÓ°ÏìµÄÊý¾Ý¡£
Traning & Test Data
ѵÁ·¼¯ºÍ²âÊÔ¼¯
»úÆ÷ѧϰµÄÄ£ÐÍÊǹ¹½¨ÔÚÊý¾Ý¼¯Éϵģ¬ÎÒÃÇ»á²ÉÓÃËæ»ú³éÑù»òÕß·Ö²ã³éÑùµÄ½«Êý¾Ý·Ö³É´óСÁ½¸ö²¿·Ö£¬Äóö´ó²¿·ÖÑù±¾½øÐн¨Ä£ÐÍ£¬ÁôС²¿·ÖÑù±¾Óøս¨Á¢µÄÄ£ÐͽøÐÐÔ¤±¨£¬Í¨¹ýСÑù±¾µÄÔ¤²â½á¹ûºÍÕæÊµ½á¹û×ö¶Ô±È£¬À´ÅжÏÄ£ÐÍÓÅÁÓ¡£Õâ¸ö½Ð×ö½»²æÑéÖ¤¡£
½»²æÑéÖ¤Äܹ»Ìá¸ßÄ£Ð͵ÄÎȶ¨ÐÔ£¬µ«²»ÊÇÍêÈ«±£Ïյģ¬ÒÀ¾ÉÓйýÄâºÏµÄ·çÏÕ¡£
ͨ³£ÓÃ80%µÄÊý¾Ý¹¹½¨ÑµÁ·¼¯£¬20%µÄÊý¾Ý¹¹½¨²âÊÔ¼¯
Classifier
·ÖÀà
¼à¶½Ñ§Ï°ÖУ¬Èç¹ûÊä³öÊÇÀëÉ¢±äÁ¿£¬Ëã·¨³ÆÎª·ÖÀà¡£
Êä³öµÄÀëÉ¢±äÁ¿Èç¹ûÊǶþÔªµÄ£¬ÔòÊǶþÔª·ÖÀ࣬±ÈÈçÅжÏÊDz»ÊÇÀ¬»øÓʼþ{ÊÇ£¬·ñ}£¬ºÜ¶à·ÖÀàÎÊÌâ¶¼ÊǶþÔª·ÖÀà¡£ÓëÖ®Ïà¶ÔµÄÊǶàÔª·ÖÀà¡£
Prediction
Ô¤²â
¼à¶½Ñ§Ï°ÖУ¬Èç¹ûÊä³öÊÇÁ¬Ðø±äÁ¿£¬Ëã·¨³ÆÎªÔ¤²â¡£
Ô¤²â¼´¿ÉÒÔÊÇÊýÖµÐÍ£¬±ÈÈçδÀ´µÄÏúÁ¿£¬Ò²¿ÉÒÔÊǽéÓÚ[0,1]¼äµÄ¸ÅÂÊÎÊÌâ¡£
ÓÐЩËã·¨ÊʺϷÖÀà¡¢ÓÐЩÔòÊÇÔ¤²â£¬Ò²ÓÐËã·¨¿ÉÒÔÁ½Õß¶¼ÄÜ×öµ½¡£
Lift
LiftÇúÏß
ËüÊǺâÁ¿Ä£ÐÍÐÔÄܵÄÒ»ÖÖ×î³£ÓõĶÈÁ¿£¬Ëü¿¼ÂǵÄÊÇÄ£Ð͵Ä׼ȷÐÔ¡£ËüºËÐĵÄ˼ÏëÊÇÒÔ½á¹û×÷µ¼Ïò£¬ÓÃÁËÄ£Ð͵õ½µÄÕýÀàÊýÁ¿±È²»ÓÃÄ£Ð͵ÄЧ¹ûÌáÉýÁ˶àÉÙ£¿
±ÈÈçijһ´Î»î¶¯ÓªÏú£¬1000¸öÓû§»áÓÐ200¸öÏìÓ¦£¬ÏìÓ¦ÂÊÊÇ20%¡£ÓÃÁËÄ£Ðͺó£¬ÎÒͨ¹ýËã·¨£¬½²Óû§·ÖȺ£¬Ìô³öÁË×îÓпÉÄÜÏìÓ¦µÄÓû§200¸ö£¬²âÊÔºóµÄ½á¹ûÊÇÓÐ100¸ö£¬´ËʱµÄÏìÓ¦Âʱä³ÉÁË50%¡£´ËʱµÄLiftֵΪ5¡£

ÉÏͼ¾ÍÊǰ´LiftÖµ»³öÇúÏߵķ¶Àý¡£×Ý×ø±êÊÇliftÖµ£¬ºá×ø±êÊÇÌôÑ¡µÄµÄ·§Öµ¡£·§ÖµÔ½µÍ£¬ËµÃ÷ÌôÑ¡µÄÔ½Ñϸñ£¬°´ÉÏÎĵÄÀý×ÓÀí½â£¬ÌôÑ¡µÄ¾ÍÊÇ×îÓпÉÄÜÏìÓ¦µÄÓû§¡£µ±Ã»Óз§ÖµÊ±£¬lift¾ÍΪ0ÁË¡£·§ÖµÍ¨³£ÊǸù¾ÝÔ¤²â·ÖÊýÅÅÐòµÄ¡£
»¹ÓÐÒ»ÖÖ³£ÓõĽÐROCÇúÏß¡£
Overfitting
¹ýÄâºÏ
¹ýÄâºÏÊÇ»úÆ÷ѧϰÖг£Åöµ½µÄÒ»ÀàÎÊÌâ¡£Ö÷ÒªÌåÏÖÔÚÄ£ÐÍÔÚѵÁ·Êý¾Ý¼¯ÉϱäÏÖÓÅÐ㣬¶øÔÚÕæÊµÊý¾Ý¼¯ÉϱíÏÖÇ·¼Ñ¡£Ôì³ÉµÄÔÒòÊÇΪÁËÔÚѵÁ·¼¯ÉÏ»ñµÃ³öÉ«µÄ±íÏÖ£¬Ê¹µÃÄ£Ð͵Ĺ¹ÔìÈç´Ë¾«Ï¸¸´ÔÓ£¬¹æÔòÈç´ËÑϸñ£¬ÒÔÖÁÓÚÈκÎÓëÑù±¾Êý¾ÝÉÔÓв»Í¬µÄÎĵµËüÈ«¶¼ÈÏΪ²»ÊôÓÚÕâ¸öÀà±ð¡£

ÉÏͼ£¬ºÚÉ«µÄÏßÌõÊÇÕý³£Ä£ÐÍ£¬ÂÌÉ«µÄÏßÌõÊǹýÄâºÏÄ£ÐÍ¡£
²»Í¬µÄ»úÆ÷ѧϰËã·¨£¬ÊÇ·ñÈÝÒ×ÄâºÏµÄ³Ì¶ÈÒ²²»½öÏàͬ¡£Í¨³£²ÉÓüӴóÑù±¾Êý¾ÝÁ¿¡¢¼õÉÙ¹²ÏßÐÔ¡¢Ôö¼ÓÌØÕ÷·º»¯ÄÜÁ¦µÄ·½·¨½â¾ö¹ýÄâºÏ¡£
ÓëÖ®Ïà·´µÄÊÇÇ·ÄâºÏ¡£
Bias & Variance
Æ«²îºÍ·½²î
Æ«²îºÍ·½²î³ýÁËͳ¼ÆÑ§¸ÅÄîÍ⣬ËüÃÇÒ²ÊǽâÊÍËã·¨·º»¯ÄÜÁ¦µÄÒ»ÖÖÖØÒª¹¤¾ß¡£
Ëã·¨ÔÚ²»Í¬ÑµÁ·¼¯Éϵõ½µÄ½á¹û²»Í¬£¬ÎÒÃÇÓÃÆ«²î¶ÈÁ¿Ëã·¨µÄÆÚÍûÔ¤²âºÍÕæÊµ½á¹ûµÄÆ«Àë³Ì¶È£¬Õâ´ú±íËã·¨±¾ÉíµÄÄâºÏÄÜÁ¦£¬·½²îÔò¶ÈÁ¿ÁËËã·¨ÊÜÊý¾Ý²¨¶¯Ôì³ÉµÄÓ°Ïì¡£
Æ«²îԽС¡¢Ô½Äܹ»ÄâºÏÊý¾Ý£¬·½²îԽС¡¢Ô½Äܹ»¿¸Êý¾Ý²¨¶¯¡£
Trees & Classification
Ê÷·ÖÀà
Ê÷·ÖÀàÊÇÐèҪͨ¹ý¶à¼¶Åбð²ÅÄÜÈ·¶¨Ä£Ê½ËùÊôÀà±ðµÄÒ»ÖÖ·ÖÀà·½·¨¡£¶à¼¶Åбð¹ý³Ì¿ÉÒÔÓÃÊ÷×´½á¹¹±íʾ£¬ËùÒÔ³ÆÎªÊ÷·ÖÀàÆ÷¡£×î¾µäµÄ±ãÊǾö²ßÊ÷Ëã·¨¡£
Classification Rate
·ÖÀàÕýÈ·ÂÊ
ΪÁËÑé֤ģÐ͵ĺûµ£¬¼´×îÖÕÅжϽá¹ûµÄ¶Ô´í£¬ÎÒÃÇÒýÈëÁË·ÖÀàÕýÈ·ÂÊ¡£
·ÖÀàÕýÈ·Âʼ´¿ÉÒÔÅж϶þ·ÖÀàÈÎÎñ£¬Ò²ÊÊÓÃÓÚ¶à·ÖÀàÈÎÎñ¡£ÎÒÃǶ¨Òå·ÖÀà´íÎóµÄÑù±¾ÊýÕ¼×ÜÑù±¾µÄ±ÈÂÊΪ´íÎóÂÊ£¬¾«È·¶ÈÔòÊÇÕýÈ·µÄÑù±¾Êý±ÈÂÊ¡£Á½ÕßÏà¼ÓΪ1¡£
ΪÁ˸üºÃµÄÅжÏÄ£ÐÍ£¬Ö÷ÒªÊÇÒµÎñÐèÒª£¬ÎÒÃÇ»¹¼ÓÈëÁ˲é×¼ÂÊ(precision),²éÈ«ÂÊ(recall)£¬²é×¼ÂÊÊÇÔ¤²âÎªÕæµÄÊý¾ÝÖÐÓжàÉÙÊÇÕæµÄ¡£²éÈ«ÂÊÊÇÕæµÄÊý¾ÝÖÐÓжàÉÙÊý¾Ý±»Ô¤²â¶ÔÁË¡£
Õâ¸öÓеãÈÆ£¬Ö÷ÒªÊÇΪÁËÒµÎñÅжϣ¬¼ÙÈçÎÒÃǵÄÔ¤²âÊDz¡ÈËÊÇ·ñ»¼ÁËij¸öÖÂËÀ¼²²¡£¬¼ÙÉèµÃ²¡ÎªÕ棬ÎÒÃÇÏÔȻϣÍû°ÑÈ«²¿¶¼µÃ²¡µÄ»¼ÕßÕÒ³öÀ´£¬ÄÇô´Ëʱ²éÈ«ÂÊ£¨µÃ²¡µÄ»¼ÕßÓжàÉÙ±»×¼È·Ô¤²â³öÀ´£©±È²é×¼ÂÊ£¨Ô¤²âµÃ²¡µÄ»¼ÕßÓжàÉÙÕæµÄµÃ²¡ÁË£©¸üÖØÒª£¬ÒòΪÕâ¸ö»áËÀÈË£¬ÄÇô¿Ï¶¨ÊÇÑ¡ÔñÓÐɱ´íÎ޷Źý¡£´Ëʱ¸ü×·Çó²éÈ«ÂÊ¡£
Ëã·¨¾ºÈü¾ÍÊÇ»ùÓÚÉÏÊöÖ¸±êÆÀ·ÖµÄ¡£
Decision Tress
¾ö²ßÊ÷
ËüÊÇ»ù±¾µÄ·ÖÀàºÍ»Ø¹é·½·¨¡£¿ÉÒÔÀí½â³ÉIf-ThenµÄ¹æÔò¼¯£¬Ã¿Ò»Ìõ·¾¶¶¼»¥³âÇÒÍ걸¡£¾ö²ßÊ÷·ÖΪÄÚ²¿½ÚµãºÍÒ¶½Úµã£¬ÄÚ²¿½Úµã¾ÍÊÇIf-ThenµÄ¹æÔò£¬Ò¶½Úµã¾ÍÊÇ·ÖÀà½á¹û¡£
¾ö²ßÊ÷Ö÷Á÷ÓÐID3¡¢C4.5£¨C5.0Ò²ÓÐÁË£©¡¢CARTËã·¨¡£
ÒòΪ¾ö²ßÊ÷ÐγɵĽṹÊǸù¾ÝÊ÷Ðεݹé²úÉú£¬Ëü¶ÔѵÁ·Êý¾Ý±íÏÖÁ¼ºÃ£¬µ«ÊÇ»á²úÉú¹ýÄâºÏÏÖÏó¡£ÎªÁ˱ÜÃâÕâÒ»ÏÖÏó£¬»á½øÐмõÖ¦¡£¼ôֽͨ¹ýËðʧº¯Êý»ò´ú¼Ûº¯ÊýʵÏÖ¡£
¾ö²ßÊ÷µÄÓŵãÊÇ£º¸ßУ¼òµ¥¡¢¿É½âÊÍÐÔÇ¿¡¢ÔÚ´óÐÍÊý¾Ý¿âÓÐÁ¼ºÃ±íÏÖ¡¢ÊʺϸßάÊý¾Ý¡£
ȱµãÊÇ£ºÈÝÒ×¹ýÄâºÏ¡¢²¢ÇÒ·ÖÀà½á¹û»áÇãÏòÓµÓиü¶àÊýÖµµÄÌØÕ÷£¨»ùÓÚÐÅÏ¢ÔöÒæ£©¡£
Ëæ»úÉÁÖËã·¨ÊÇ»ùÓÚ¾ö²ßÊ÷µÄ¡£
Boosting
ÌáÉý·½·¨
ÊôÓÚ¼¯³ÉѧϰµÄÒ»ÖÖ¡£ÌáÉý·½·¨BoostingÒ»°ãÊÇͨ¹ý¶à¸öÈõ·ÖÀàÆ÷×é³ÉÒ»¸öÇ¿·ÖÀàÆ÷£¬Ìá¸ß·ÖÀàÐÔÄÜ¡£¼ò¶øÑÔÖ®ÊÇÈý¸ö³ôƤ½³¶¥Ò»¸öÖî¸ðÁÁ¡£
ͨ¹ý¶ÔѵÁ·¼¯ÑµÁ·³öÒ»¸ö»ùѧϰÆ÷£¬È»ºó¸ù¾Ý»ùѧϰÆ÷µÄ·ÖÀà±íÏÖÌø×ªºÍÓÅ»¯£¬·ÖÀà´íÎóµÄÑù±¾½«»á»ñµÃ¸ü¶à¹Ø×¢£¬ÒÔ´ËÖØ¸´µü´ú£¬×îÖÕ²úÉúµÄ¶à¸ö»ù·ÖÀàÆ÷½øÐмÓÇ¿½áºÏµÃ³öÒ»¸öÇ¿·ÖÀàÆ÷¡£
Ö÷Á÷·½·¨ÊÇAdaBoost£¬ÒÔ»ù·ÖÀàÆ÷×öÏßÐÔ×éºÏ£¬Ã¿Ò»ÂÖÌá¸ßǰ¼¸ÂÖ±»´íÎó·ÖÀàµÄȨֵ¡£
Naive Bayes Classifiers
ÆÓËØ±´Ò¶Ë¹·ÖÀà
Ëü»ùÓÚ±´Ò¶Ë¹¶¨ÀíµÄ·ÖÀà·½·¨¡£ÆÓËØ±´Ò¶Ë¹·¨µÄʹÓÃÌõ¼þÊǸ÷Ìõ¼þ»¥Ïà¶ÀÁ¢¡£ÕâÀïÒýÈë¾µäµÄ±´Ò¶Ë¹¶¨Àí£º

ÔÚËã·¨ÖУ¬ÎÒÃǵÄB¾ÍÊÇ·ÖÀà½á¹ûTarget£¬A¾ÍÊÇÌØÕ÷¡£Òâ˼ÊÇÔÚÌØÕ÷ÒѾ·¢ÉúµÄÇé¿öÏ£¬·¢ÉúBµÄ¸ÅÂÊÊǶàÉÙ£¿
¸ÅÂʹÀ¼Æ·½·¨Óм«´óËÆÈ»¹À¼ÆºÍ±´Ò¶Ë¹¹À¼Æ£¬¼«´óËÆÈ»¹À¼ÆÈÝÒײúÉú¸ÅÂÊֵΪ0µÄÇé¿ö¡£
ÓŵãÊǶÔȱʧÊý¾Ý²»Ì«Ãô¸Ð£¬Ëã·¨Ò²±È½Ï¼òµ¥¡£È±µãÊÇÌõ¼þ»¥Ïà¶ÀÁ¢ÔÚʵ¼Ê¹¤×÷Öв»Ì«³ÉÁ¢¡£
K-Nearest Neighbour
K½üÁÚ·ÖÀà¡£
K½üÁÚ·ÖÀàµÄÌØµãÊÇͨ¹ýѵÁ·Êý¾Ý¶ÔÌØÕ÷ÏòÁ¿¿Õ¼ä½øÐл®·Ö¡£µ±ÓÐеÄÊý¾ÝÊäÈëʱ£¬Ñ°ÕÒ¾àÀëËü×î½üµÄK¸öʵÀý£¬Èç¹ûK¸öʵÀý¶àÊýÊôÓÚijÀ࣬ÄÇô¾Í°ÑÐÂÊý¾ÝÒ²Ëã×÷ijÀà¡£

ÌØÕ÷¿Õ¼äÖУ¬Ã¿¸öѵÁ·Êý¾Ý¶¼ÊÇÒ»¸öµã£¬¾àÀë¸Ãµã±ÈÆäËûµã¸ü½üµÄËùÓе㽫×é³ÉÒ»¸ö×ӿռ䣬½Ð×öµ¥ÔªCell£¬Õâʱºò£¬Ã¿¸öµã¶¼ÊôÓÚÒ»¸öµ¥Ôª£¬µ¥Ôª½«ÊǵãµÄ·ÖÀà¡£

kÖµµÄÑ¡Ôñ½«»áÓ°Ïì·ÖÀà½á¹û£¬kֵԽС£¬Ä£ÐÍÔ½¸´ÔÓ£¬ÈÝÒ×¹ýÄâºÏ£¬²»¿¹¸ÉÈÅ¡£KÖµÔ½´ó£¬Ä£Ðͽ«Ô½¼òµ¥£¬·ÖÀàµÄ׼ȷ¶È»áϽµ¡£ÉÏͼÊÇK=1ʱµÄ×ӿռ仮·Ö£¬ÏÂͼÊÇK=5ʱµÄ×ӿռ仮·Ö£¬´ÓÑÕÉ«ºÜÖ±¹ÛµÄ¿´µ½Ó°Ïì¡£

K½üÁÚµÄÕâÀà»ùÓÚ¾àÀëµÄËã·¨£¬ÑµÁ·µÄʱ¼ä¸´ÔӶȵͣ¬ÎªO(n)£¬ÊÊÓ÷¶Î§·¶Î§¹ã¡£µ«ÊÇʱ¼ä¸´ÔӶȵÍÊÇͨ¹ý¿Õ¼ä¸´ÔÓ¶È»»À´µÄ£¬ËùÒÔÐèÒª´óÁ¿µÄ¼ÆËã×ÊÔ´ºÍÄÚ´æ¡£ÁíÍâÑù±¾²»Æ½ºâÎÊÌâ½â¾ö²»ÁË¡£
Logistic Regression
Â߼˹Úлع飬¼ò³ÆÂß¼»Ø¹é¡£
Âß¼»Ø¹éÊôÓÚ¶ÔÊýÏßÐÔÄ£ÐÍ£¬ËäÈ»½Ð»Ø¹é£¬±¾ÖÊÈ´ÊÇ·ÖÀàÄ£ÐÍ¡£Èç¹ûÎÒÃÇÒªÓÃÏßÐÔÄ£ÐÍ×ö·ÖÀàÈÎÎñ£¬ÔòÕÒµ½sigmoidº¯Êý½«·ÖÀàÄ¿±êYºÍ»Ø¹éµÄÔ¤²âÖµÁªÏµÆðÀ´£¬µ±Ô¤²âÖµ´óÓÚ0,ÅжÏÕýÀý£¬Ð¡ÓÚ0Ϊ·´Àý£¬µÈÓÚ0ÈÎÒâÅбð£¬Õâ¸ö·½·¨½ÐÂß¼»Ø¹éÄ£ÐÍ¡£
Ä£ÐͲÎÊýͨ¹ý¼«´óËÆÈ»·¨ÇóµÃ¡£Âß¼»Ø¹éµÄÓŵãÊÇ¿ìËٺͼòµ¥£¬È±µãÊǸßάÊý¾ÝÖ§³Ö²»ºÃ£¬ÈÝÒ×Ç®ÄâºÏ¡£
Ranking
ÅÅÐò£¬PageRank
ÕâÀïÓ¦¸Ã·ºÖ¸GoogleµÄPageRankËã·¨¡£
PageRankµÄºËÐÄ˼ÏëÓÐ2µã£º
Èç¹ûÒ»¸öÍøÒ³±»ºÜ¶àÆäËûÍøÒ³Á´½Óµ½µÄ»°ËµÃ÷Õâ¸öÍøÒ³±È½ÏÖØÒª£¬Ò²¾ÍÊÇpagerankÖµ»áÏà¶Ô½Ï¸ß£»
Èç¹ûÒ»¸öpagerankÖµºÜ¸ßµÄÍøÒ³Á´½Óµ½Ò»¸öÆäËûµÄÍøÒ³£¬ÄÇô±»Á´½Óµ½µÄÍøÒ³µÄpagerankÖµ»áÏàÓ¦µØÒò´Ë¶øÌá¸ß¡£
PageRank²¢²»ÊÇΨһµÄÅÅÃûËã·¨£¬¶øÊÇ×îΪ¹ã·ºÊ¹ÓõÄÒ»ÖÖ¡£ÆäËûËã·¨»¹ÓУºHilltop Ëã·¨¡¢ExpertRank¡¢HITS¡¢TrustRank¡£
Linear Regression
ÏßÐԻعé
ÏßÐԻعéÊÇ»úÆ÷ѧϰµÄÈëÃż¶±ðËã·¨£¬Ëüͨ¹ýѧϰµÃµ½Ò»¸öÏßÐÔ×éºÏÀ´½øÐÐÔ¤²â¡£
Ò»°ãд³ÉF(x) = wx +b£¬ÎÒÃÇͨ¹ý¾ù·½Îó²î»ñµÃwºÍb£¬¾ù·½Îó²îÊÇ»ùÓÚŷʽ¾àÀëµÄÇó½â£¬¾ÍÊÇ×îС¶þ³Ë·¨À²¡£ÕÒµ½Ò»ÌõÏߣ¬ËùÓÐÊý¾Ýµ½ÕâÌõÏßµÄŷʽ¾àÀëÖ®ºÍ×îС¡£
ÏßÐԻعéÈÝÒ×ÓÅ»¯£¬Ä£Ðͼòµ¥£¬È±µãÊDz»Ö§³Ö·ÇÏßÐÔ¡£
Perceptron
¸ÐÖª»ú
ËüÊǶþÀà·ÖÀàµÄÏßÐÔ·ÖÀàÄ£ÐÍ¡£

Ëüͨ¹ýÒ»¸öwx+bµÄ³¬Æ½ÃæS»®·ÖÌØÕ÷¿Õ¼ä¡£ÎªÁËÕÒ³öÕâ¸ö³¬Æ½Ã棬ÎÒÃÇÀûÓÃËðʧº¯Êý¼«Ð¡»¯Çó³ö¡£³¬Æ½ÃæµÄ½â²»ÊÇΨһµÄ£¬²ÉÈ¡²»Í¬³õÖµ»òÎó·ÖÀàµã½«»áÔì³É²»Í¬½á¹û¡£

Hierarchical Clustering
²ã´Î¾ÛÀà
²ã´Î¾ÛÀàÖ¸ÔÚ²»Í¬²ã´Î¶ÔÊý¾Ý¼¯½øÐл®·Ö£¬´Ó¶øÐγÉÊ÷ÐεľÛÀà½á¹¹¡£
Ëü½«Ñù±¾¿´×÷Ò»¸ö³õʼ¾ÛÀà´Ø£¬Ã¿´ÎÔËËãÕÒ³ö×î½üµÄ´Ø½øÐкϲ¢£¬¸Ã¹ý³Ì²»¶ÏºÏ²¢£¬Ö±µ½Âú×ãÔ¤ÉèµÄ´ØµÄ¸öÊý¡£

ÉÏͼ¾ÍÊÇËùÓÐÑù±¾Öظ´Ö´ÐÐ×îÖÕK=1ʱµÄ½á¹û¡£ºáÖáÊǾÛÀà´ØÖ®¼äµÄ¾àÀ룬µ±¾àÀë=5ʱ£¬ÎÒÃÇÓÐÁ½¸ö¾ÛÀà´Ø£¬µ±¾àÀë=3ʱ£¬ÎÒÃÇÓÐËĸö¾ÛÀà´Ø¡£
K-means Clusterning
K¾ÛÀà
È«³ÆK¾ùÖµ¾ÛÀ࣬Î޼ලѧϰµÄ¾µäËã·¨¡£ÎïÒÔÀà¾ÛÈËÒÔȺ·ÖµÄµäÐÍ´ú±í¡£
K¾ÛÀàÐèÒª½«ÔʼÊý¾ÝÎÞÁ¿¸Ù»¯£¬È»ºóÉèÖþÛÀàµãµü´úÇó½â¡£K¾ÛÀàµÄºËÐÄÊÇÕë¶Ô»®·Ö³öµÄȺ´ØÊ¹Æä×îС»¯Æ½·½Îó²î¡£Ö±¹Û˵£¬¾ÍÊÇÈÃÑù±¾½ôÃÜÎ§ÈÆÈº´Ø¾ùÖµ¡£
ÉèÖöàÉÙ¸ö¾ÛÀàµã¶àÉÙÓеãÖ÷¹ÛµÄÒâ˼£¬ÕâÒ²ÊÇK¾ÛÀàΨһµÄ²ÎÊý£¬¿¼²ìµÄÊÇÍⲿָ±ê£¬¼´Äã¾ÛÀà±¾ÉíÊÇÏë·Ö³ö¼¸À࣬ͨ¹ý¶Ô½á¹ûµÄ¹Û²ìÒÔ¼°EÖµÅжϡ£
K¾ÛÀ಻Êʺ϶àÎ¬ÌØÕ÷£¬Ò»°ã3¡«4ά¼´¿É£¬Î¬¶ÈÌ«¶à»áȱ·¦½âÊÍÐÔ£¬RFMÄ£ÐÍÊÇÆä¾µäÓ¦Óá£ÒòΪÎïÒÔÀà¾Û£¬ËùÒÔ¶ÔÆ«Àë¾ùÖµµãµÄÒì³£Öµ·Ç³£Ãô¸Ð¡£
Neural Networks
Éñ¾ÍøÂç
Éñ¾ÍøÂçÊÇÒ»ÖÖÄ£·ÂÉúÎïÉñ¾ÏµÍ³µÄËã·¨£¬Éñ¾ÍøÂçËã·¨ÒÔÉñ¾Ôª×÷Ϊ×î»ù´¡µÄµ¥Î»£¬Éñ¾ÔªÍ¨¹ý½«ÊäÈëÊý¾Ýת»»Îª0»ò1µÄ·§Öµ£¬´ïµ½¼¤»îÓë·ñµÄÄ¿µÄ£¬µ«ÊÇ0ºÍ1²»Á¬Ðø²»¹â»¬£¬¶ÔÓÚÁ¬ÐøÐÔÊý¾Ý£¬ÍùÍùÓÃsigmoidº¯Êýת»»³É[0,1]
¼äµÄ·¶Î§¡£
½«ÕâЩÉñ¾µ¥ÔªÒÔ²ã´Î½á¹¹Á¬½ÓÆðÀ´£¬¾Í³ÉÁËÉñ¾ÍøÂç¡£ÒòΪÕâ¸öÌØÐÔ£¬Éñ¾ÍøÂçÓÐÐí¶àµÄ²ÎÊý£¬¿É²»¾ß±¸¿É½âÊÍÐÔ¡£¶à²ãÉñ¾ÍøÂ磬ËüµÄÊäÈë²ãºÍÊä³ö²ãÖ®¼äµÄ²ã¼¶½Ð×öÒþ²ã£¬¾ÍÊÇÌìÏþµÃËü´ú±íʲôº¬Òå¡£

Éñ¾ÍøÂçµÄ²ãÊýÒ»°ãÊǹ̶¨µÄ£¬µ«ÎÒÃÇÒ²Äܽ«ÍøÂç²ãÊý×÷ΪѧϰµÄÄ¿±êÖ®Ò»£¬ÕÒµ½×îÊʺϵIJãÊý¡£
ÁíÍ⣬²ãÊýÔ½¶à£¬²ÎÊýÔ½¶àµÄÉñ¾ÍøÂ縴ÔÓ¶ÈÔ½¸ß£¬Éî¶Èѧϰ¾ÍÊǵäÐ͵IJãÊýºÜ¶àµÄÉñ¾ÍøÂç¡£³£¼ûµÄÓÐCNN¡¢DNN¡¢RNNµÈËã·¨¡£
Sentiment Analysis
Çé¸Ð·ÖÎö
±È½ÏÇ°ÑØµÄÒ»¸öÁìÓò¡£°üÀ¨Çé¸Ð´ÊµÄÕýÃæ¸ºÃæ·ÖÀ࣬±ê×¢ÓïÁÏ£¬Çé¸Ð´ÊµÄÌáÈ¡µÈ¡£
Çé¸Ð·ÖÎö¿ÉÒÔͨ¹ýÇé¸Ð¹Ø¼ü´Ê¿â¼ÆË㣬±ÈÈç»ã×Ü¿ªÐÄ¡¢±¯ÉË¡¢ÄѹýµÄ´Ê»ã£¬¼ÆËãÇé¸ÐÖµ£¬ÔÙ¼ÓÈë±íʾÇé¸ÐÇ¿Áҳ̶ȵÄά¶È£¬Èç1¡«5µÄÊýÖµ½øÐдò·Ö¡£Óû§¶ÔÉÌÆ·ÆÀÂ۵ķÖÎö¾ÍÊÇÒ»¸ö³£¼ûµÄÇé¸Ð·ÖÎö£ºÕâÊÖ»úÌ«TMÆÆÁË£¬¾ÍÊÇ5·Ö·ßÅ¡£
È»¶øÇé¸Ð´ÊµäÐèҪά»¤£¬¹¹½¨³É±¾½Ï¸ß£¬ÎÒÃÇÒ²¿ÉÒÔÓûúÆ÷ѧϰµÄ·½·¨½«Æä¿´´ýΪ·ÖÀàÎÊÌâ¡£½²¹Ø¼ü´ÊÌØÕ÷ÏòÁ¿»¯£¬³£ÓôʴüÄ£ÐÍ£¨bag-of-words
£©ÒÔ¼°Á¬Ðø·Ö²¼´ÊÏòÁ¿Ä£ÐÍ£¨word Embedding£©£¬ÌØÕ÷»¯ºó£¬ÍùÍùÓÃCNN¡¢RNN»òÕßSVMËã·¨¡£
Collaborative Fitering
Ðͬ¹ýÂË
¼ò³ÆCFËã·¨¡£Ðͬ¹ýÂ˲»ÊôÓÚ»úÆ÷ѧϰÁìÓò£¬ËùÒÔÄãÔÚ»úÆ÷ѧϰµÄÊéÉÏ¿´²»µ½£¬ËüÊôÓÚÊý¾ÝÍÚ¾ò¡£
Ðͬ¹ýÂ˵ĺËÐÄÊÇÒ»ÖÖÉç»á¹¤³ÌµÄ˼Ï룺ÈËÃǸüÇãÏòÓÚÏò¿Úζ±È½ÏÀàËÆµÄÅóÓÑÄÇÀï»ñµÃÍÆ¼ö¡£Ðͬ¹ýÂËÖ÷Òª·ÖΪÁ½À࣬»ùÓÚÓû§µÄuser-based
CFÒÔ¼°»ùÓÚÎïÌåµÄitem-based CF¡£ËäÈ»Ðͬ¹ýÂ˲»ÊÇ»úÆ÷ѧϰ£¬µ«ËüÒ²»áÓõ½SVD¾ØÕó·Ö½â¼ÆËãÏàËÆÐÔ¡£
ÓŵãÊǼòµ¥£¬Äã²¢²»ÐèÒª»ùÓÚÄÚÈÝ×öÄÚÈÝ·ÖÎöºÍ´ò±êÇ©£¬ÍƼöÓÐÐÂÓ±ÐÔ£¬¿ÉÒÔ·¢¾òÓû§µÄDZÔÚÐËȤµã¡£
Ðͬ¹ýÂ˵ÄȱµãÊÇÎÞ·¨½â¾öÀäÆô¶¯ÎÊÌ⣬ÐÂÓû§Ã»ÐÐΪÊý¾Ý£¬Ò²Ã»ÓкÃÓѹØÏµ£¬ÄãÊÇ×î²»µ½ÍƼöµÄ£»ÍƼö»áÊÕµ½Ï¡ÊèÐÔµÄÔ¼Êø£¬ÄãµÄÐÐΪԽ¶à£¬²Å»áÔ½×¼£»Ëæ×ÅÊý¾ÝÁ¿µÄÔö´ó£¬Ëã·¨»áÊÕµ½ÐÔÄܵÄÔ¼Êø£¬²¢ÇÒÄÑÒÔÍØÕ¹¡£
Ðͬ¹ýÂË¿ÉÒÔºÍÆäËûËã·¨»ìºÏ£¬À´Ìá¸ßЧ¹û¡£ÕâÒ²ÊÇÍÆ¼öϵͳµÄÖ÷Á÷×ö·¨¡£
Tagging
±êÇ©/±ê×¢
ÕâÀïÉÔ΢ÓÐÆçÒå¡¢Èç¹ûÊDZêÇ©£¬¼ä½ÓÀí½âΪÓû§»Ïñ£¬Éæ¼°µ½±êǩϵͳ¡£Óû§µÄÄÐÅ®¡¢ÐԱ𡢳öÉúµØ½ÔÊDZêÇ©£¬Ô½·á¸»µÄ±êÇ©£¬Ô½ÄÜÔÚÌØÕ÷¹¤³ÌÖÐΪÎÒÃÇËùÓá£
Èç¹ûÊÇ·ÖÀà±êÇ©/±ê×¢£¬ÔòÊÇÊý¾Ý±ê×¢¡£ÓмලѧϰÐèҪѵÁ·¼¯ÓÐÃ÷È·µÄ½á¹ûY£¬ºÜ¶àÊý¾Ý¼¯ÐèÒªÈ˹¤Ìí¼ÓÉϽá¹û¡£±ÈÈçͼÏñʶ±ð£¬ÄãÐèÒª±êעͼÏñÊôÓÚʲô·ÖÀ࣬ÊÇèÊǹ·¡¢ÊÇÄÐÊÇÅ®µÈ¡£ÔÚÓïÒôʶ±ð£¬ÔòÐèÒª±ê×¢Ëü¶ÔÓ¦µÄÖÐÎĺ¬Ò壬Èç¹ûÉæ¼°µ½·½ÑÔ£¬Ôò»¹ÐèÒª½«·½ÑÔ±êעΪÆÕͨ»°¡£
Êý¾Ý±ê×¢ÊǸö¿àÁ¦»î¡£ |