±à¼ÍƼö: |
±¾ÎĽ«¼ÌÐø¶Ô¿Í»§¶©µ¥Êý¾Ý½øÐд¦Àí£¬½«°üÀ¨¿Í»§Ï¸·ÖºÍ¿Í»§ÐÐΪ·ÖÎöÓëÔ¤²â
£¬Ï£ÍûÄܹ»¸ø´ó¼Ò´øÀ´Ð©Ðí°ïÖú£¬»¶Ó½»Á÷ѧϰ£¡
±¾ÎÄÀ´×Ô
Êý¾ÝSTUDIO
£¬ÓÉ»ðÁú¹ûÈí¼þAlice±à¼¡¢ÍƼö¡£ |
|
±¾ÎÄÖ÷ÒªÄÚÈÝ
±¾´ÎʵսÏîÄ¿¹²·ÖΪÉÏÏÂÁ½²¿·Ö£¬ÉÏÆª ¡¶ Ò»¸öÆóÒµ¼¶Êý¾ÝÍÚ¾òʵսÏîÄ¿£ü¿Í»§Ï¸·ÖÄ£ÐÍ£¨ÉÏ£© ¡· °üÀ¨Êý¾Ý̽Ë÷ÐÔÊý¾Ý·ÖÎö£¬È±Ê§ÖµµÈ´¦Àí£¬¸÷¸ö¹Ø¼ü±äÁ¿µÄ·ÖÎö¡£×îºóͨ¹ý¾ÛÀà·½·¨£¬½«²úÆ·½øÐоÛÀà·ÖÀ࣬²¢Í¨¹ý´ÊÔÆÍ¼ºÍÖ÷³É·Ö·ÖÎö¸÷¸öÀà±ð¾ÛÀà·ÖÀëЧ¹û¡£
ÏÂÆª£¨±¾Æª£©½«¼ÌÐø¶Ô¿Í»§¶©µ¥Êý¾Ý½øÐд¦Àí£¬½«°üÀ¨¿Í»§Ï¸·ÖºÍ¿Í»§ÐÐΪ·ÖÎöÓëÔ¤²â¡£±¾ÆªÖ÷Òª½á¹¹ÓëÄÚÈÝ˼άµ¼Í¼ÈçÏÂͼËùʾ¡£

Êý¾ÝÔ¤´¦Àí
ÔÚÉÏÆªÖУ¬½«²»Í¬µÄ²úÆ··Ö×éΪÎå¸ö´ØÈº¡£½ÓÏÂÀ´Ö÷Òª·ÖÎö¿Í»§·ÖÀ࣬½ÓÏÂÀ´µÄµÚÒ»²½Êǽ«²úÆ··Ö×éÐÅÏ¢ÒýÈëÊý¾Ý¼¯¡£´Ë´¦´´½¨ÁË·ÖÀà±äÁ¿ categ_product À´±íʾÿ¸ö²úÆ·µÄ¼¯Èº¡£


²úÆ··Ö×é´¦Àí
½ÓÏÂÀ´´´½¨ categ_N ±äÁ¿(
N ¡Ê [ 0 : 4 ]
)£¬Ëü°üº¬ÔÚÿ¸ö²úÆ·Àà±ðÖл¨·ÑµÄ½ð¶î¡£ÕâÒ»²½Ï൱ÓÚһάÊý¾Ýת¶þάÊý¾Ý£¬½«Îå¸ö´ØÈºÀ©Õ¹ÎªÎå¸ö·ÖÀà±äÁ¿£¬Ã¿¸ö±äÁ¿Ï´洢µÄÊǸÃÌõ¼Ç¼µÄ¼Û¸ñÊý¾Ý¡£


µ½Ä¿Ç°ÎªÖ¹£¬Óëµ¥¸ö¶©µ¥Ïà¹ØµÄÐÅÏ¢±»»®·Öµ½Êý¾Ý¼¯µÄ¼¸ÐÐÖÐ(ÿ¸ö²úÆ·Ò»ÐÐ)¡£
½ÓÏÂÀ´°´ÕÕµ¥¸ö¶©µ¥¾ÛºÏ£¬½«Ò»¸ö¶©µ¥ÖÐËùÓвúÆ·¾ÛºÏµ½Ò»Ìõ¼Ç¼ÖУ¬²¢¼ÇΪ ¹ºÎï³µ¼Û¸ñ £¬´ú±íij¸öÌØ¶¨¶©µ¥ÖÐËùÓвúÆ·µÄ×ܼۡ£Òò´Ë£¬´´½¨ÁËÒ»¸öеÄÊý¾Ý±í£¬ÆäÖаüº¬Ã¿¸ö¶©µ¥µÄ¹ºÎï³µ¼Û¸ñ£¬ÒÔ¼°ËüÔÚ5Àà²úÆ·Öзֲ¼µÄ·½Ê½¡£


°´ÕÕʱ¼äÐòÁжÔÊý¾Ý½øÐзָî
Êý¾Ý¼¯ÖÐ ¹ºÎïÀº¼Û¸ñ °üº¬ÎªÆÚ12¸öÔµÄÐÅÏ¢¡£½ÓÏÂÀ´µÄÄ¿±êÖ®Ò»½«ÊÇ¿ª·¢Ò»¸öÄ£ÐÍ£¬Äܹ»ÃèÊöºÍÔ¤²â¿Í»§·ÃÎÊÍøÕ¾µÄϰ¹ß£¬²¢ÇÒÊÇ´ÓËûÃǵÚÒ»´Î·ÃÎÊÍøÕ¾¾Í¿ªÊ¼¼Ç¼¡£
ΪÁËÄܹ»»ñµÃѵÁ·ºÍ²âÊÔÄ£Ð͵ÄÊý¾Ý£¬Ñ¡ÔñʹÓÃǰ10¸öÔµÄÊý¾Ý¿ª·¢Ä£ÐͺͽÓÏÂÀ´µÄ2¸öÔµÄÊý¾ÝÀ´²âÊÔÄ£ÐÍ£¬ÕâÑùµÄ²ßÂÔÀ´·Ö¸îÊý¾Ý¼¯¡£
×¢Ò⣬ÕâÀïµÄ·Ö¸îÖ¸±£Áô ¶©µ¥ÈÕÆÚ ÖеÄÈÕÆÚ£¬²»°üº¬¾ßÌåµÄʱ¼ä¡£

Ïû·ÑÕß¶©µ¥×éºÏ
½ÓÏÂÀ´£¬½«¶ÔÓ¦ÓÚͬһÓû§µÄ²»Í¬¶©µ¥·Ö×é¾ÛºÏÔÚÒ»Æð¡£ÓÉ´ËÈ·¶¨ÁËÓû§µÄ¹ºÂò´ÎÊý£¬ÒÔ¼°ÔÚËùÓзÃÎÊÆÚ¼äµÄ×îС¡¢×î´ó¡¢Æ½¾ù½ð¶îºÍ×ܽð¶î¡£

×îºó£¬¶¨ÒåÁËÁ½¸ö¶îÍâµÄ±äÁ¿£¬ËüÃǸø³öÁË×ÔµÚÒ»´Î¹ºÂòÒÔÀ´¾¹ýµÄÌìÊý( µÚÒ»´Î¹ºÂò )ºÍ×Ô×îºóÒ»´Î¹ºÂòÒÔÀ´µÄÌìÊý( ×îºóÒ»´Î¹ºÂò )¡£

ÕâÀïÎÒÃÇ×¢Òâµ½£¬ÓÐÐí¶à¿Í»§Ö»¹ºÂò¹ýÒ»´Î²úÆ·£¬¶øÏ¸·Ö¿Í»§µÄÄ¿±êÖ®Ò»£¬¾ÍÊÇÕë¶ÔÕâЩ¿Í»§×öÒ»Ð©ÌØ¶¨µÄÓªÏú²ßÂÔÒÔÁôסËûÃÇ£¬´ÙʹµÃËûÃÇ×ö¶þ´Î»ò¸ü¶à´Î¹ºÂòÐÐΪ¡£
²¢ÇÒͨ¹ýÏÂÃæµÄ¼ÆËã½á¹ûµÃÖª£¬´ËÀà¿Í»§(½ö·¢ÉúÒ»´Î¹ºÂòÐÐΪµÄ¿Í»§)£¬½Ó½üËùÓпͻ§µÄ60%£¬»¹ÊǷdz£ÅÓ´óµÄÒ»¸ö¿Í»§ÈºÌå¡£

´´½¨¿Í»§Àà±ð
Êý¾Ý±àÂë
Êý¾Ý¼¯ 'transactions_per_user' Öаüº¬µÄÐÅÏ¢±È½Ï·á¸»¡£¸Ã±íÖеÄÿ¸ö¼Ç¼¶ÔÓ¦ÓÚÒ»¸öÌØ¶¨µÄ¿Í»§£¬¿ÉÒÔʹÓÃÕâЩÐÅÏ¢À´ÃèÊö²»Í¬ÀàÐ͵Ŀͻ§¡£

ÕâÀïÖµµÃ×¢ÒâµÄÊÇ£¬Ñ¡ÔñµÄ²»Í¬±äÁ¿µÄÊý¾Ý¾ßÓв»Í¬µÄ³ß¶È·¶Î§£¬ÔÚ¼ÌÐø½ÓÏÂÀ´µÄ·ÖÎö֮ǰ£¬ÐèÒª¶Ôµ±Ç°Êý¾Ý½øÐÐÒ»¸ö±ê×¼»¯µÄ´¦Àí¡£

´´½¨¿Í»§´ØÈº
½ÓÏÂÀ´½«´´½¨¿Í»§¼¯Èº¡£ÔÚ´´½¨ÕâЩ¼¯ÈºÖ®Ç°£¬°´ÕÕ֮ǰ²úÆ··ÖÀàµÄ˼·£¬½«ÓÃÀ´ÃèÊöÓû§ÌØÕ÷µÄÊý¾Ý¼¯½øÐнµÎ¬¶È£¬ÔÚÒ»¸ö½ÏСµÄά¶ÈÉϽ¨Á¢¿Í»§´ØÈº¡£½µÎ¬·½·¨Í¬ÑùÑ¡ÓÃPCAÖ÷³É·Ö·ÖÎö¡£

²¢»æÖƳöÀÛ»ý¿É½âÊÍÐÔ·½²îͼ¿´È·¶¨ÐèÒª½µµ½Ä³¸öά¶È¡£

´´½¨¿Í»§Àà±ð
½ÓÏÂÀ´£¬ÎÒÃÇÐèÒª´Ó֮ǰ¶¨ÒåµÄ±ê×¼»¯¾ØÕóÖж¨Òå¿Í»§¼¯Èº£¬ÕâÀïʹÓÃÁËscikit-learnÖÐµÄ ¡°k-means¡±¾ÛÀàËã·¨ ¡£¸ù¾ÝÂÖÀªÏµÊýÑ¡Ôñ×î¼Ñ¾ÛÀàµÄ´ØÈºÊýÁ¿£¬×îºó·¢ÏÖÓÐ11¸ö¾ÛÀàµÃµ½ÁË×îºÃµÄЧ¹û¡£
Ê×Ïȶ¨Òå´ØÈºÊýÁ¿Îª11¸ö£¬²¢Ê¹ÓýµÎ¬Ö®Ç°µÄÊý¾Ý½øÐоÛÀà¡£

µÃµ½Æ½¾ùÂÖÀªÏµÊýΪ 0.224¡£È»ºó²é¿´Ã¿¸ö¼¯ÈºÖеĿͻ§ÊýÁ¿¡£

PCAÖ÷³É·Ö·ÖÎö
´Ó¿É½âÊÍÐÔ·½²îͼÖпÉÒÔ¿´³ö£¬µ±Î¬¶ÈÔÚ6άʱ£¬ÒѾÄܹ»´ú±í×ÜÌå·½²îµÄ80%ÒÔÉϵÄÐÅÏ¢ÁË£¬Òò´Ë´Ë´¦ÎÒÃÇÑ¡Ôñ ά¶ÈÊýΪ6 ¡£

ÓÉÉÏÃæ¿ÉÒÔ¿´³ö£¬ÒѾ´´½¨µÄ²»Í¬´ØµÄ´óС´æÔÚÒ»¶¨µÄ²îÒì¡£Òò´Ë£¬´Ë´¦Í¨¹ý¿ÉÊÓ»¯³¢ÊÔÀí½âÕâЩ´ØÈºµÄÄÚÈÝ£¬ÒÔ±ãÑéÖ¤(»ò²»ÑéÖ¤)ÕâÖÖÌØÊâµÄ¾ÛÀà¡£

´ÓÕâ¸öͼÖпÉÒÔ¿´³öһЩÓÐÓõÄÐÅÏ¢£¬ÀýÈ磬µÚÒ»¸öÖ÷³É·Ö¿ÉÒÔ½«×îСµÄ´ØÈº´ÓÆäËû´ØÈºÖзÖÀë³öÀ´ £¨´Ø3£¬4£¬10£© ¡£
ÂÖÀªÏµÊý
ÕâÀï֮ͬǰ²úÆ·Àà±ðÒ»Ñù£¬ÁíÒ»Öֲ鿴¾ÛÀàÖÊÁ¿µÄ·½·¨ÊDz鿴²»Í¬´ØÈºÄÚµÄÂÖÀªÏµÊý¡£


¿Í»§ÐÎ̬ÀàÐÍ
µ½Ä¿Ç°ÎªÖ¹£¬ÎÒÃÇÒѾÑéÖ¤Á˲»Í¬µÄ¼¯ÈºÈ·ÊµÊDz»ÏཻµÄ(ÖÁÉÙÔÚÈ«¾Ö·½Ãæ)¡£
ΪÁ˽øÒ»²½Ï¸·Ö¿Í»§£¬Á˽âÿ¸ö¼¯ÈºÖпͻ§µÄϰ¹ß¡£Òò´ËÔÚ±í 'selected_customers' ÖÐÌí¼ÓÒ»¸ö±äÁ¿À´¶¨Òåÿ¸ö¿Í»§¶ËËùÊôµÄ¼¯Èº¡£

È»ºó£¬ÔÚÿ¸ö²»Í¬µÄ¿Í»§¼¯ÈºÖÐÆ½¾ù¸÷¿Í»§ÐÅÏ¢¡£ÕâÑù¾Í¿ÉÒÔ»ñµÃһЩÐÅÏ¢£¬ÀýÈ粻ͬ¼¯ÈºµÄ¿Í»§µÄƽ¾ù¹ºÎï³µ¼Û¸ñ¡¢·ÃÎÊ´ÎÊý»òÏû·Ñ×ܶîµÈµÈ¡£²¢ÇÒ»¹È·¶¨ÁËÿ×éµÄ¿Í»§ÊýÁ¿¡£


×îºó£¬ÖØÐÂ×éÖ¯Êý¾Ý±íÖеÄÄÚÈÝ£¬Í¨¹ýÒÔÏ·½·¨ÅÅÐò²»Í¬µÄ¼¯Èº£ºÊ×ÏÈ£¬¸ù¾Ýÿ¸ö²úÆ·Àà±ðÖл¨·ÑµÄ½ð¶îÅÅÐò£¬È»ºóÔÙ¸ù¾Ý×Ü»¨·Ñ½øÐÐÅÅÐò¡£

¹Ë¿Í»§ÐÎ̬ͼÐαíÕ÷
×îºó£¬´´½¨Á˲»Í¬ÐÎ̬µÄ±íÏÖ¡£ÕâÀﶨÒåÁËÒ»¸öÀàÀ´´´½¨ "À×´ïͼ" ¡£

´ÓÕâ¸öͼÐÎÖпÉÒÔ»ñµÃ²»ÉÙÐÅÏ¢¡£ÀýÈ磬¿ÉÒÔ¿´³öǰ5¸ö¼¯Èº¶ÔÓ¦µÄÊǹºÂòÄ³Ò»ÌØ¶¨Àà±ð²úÆ·µÄÇ¿ÁÒÓÅÊÆ¡£ÆäËû¼¯Èº½«²»Í¬ÓÚÒ»¹ºÎﳵƽ¾ùÊý( sum )¡¢¿Í»§µÄ×Ü»¨·Ñ( sum )»ò·ÃÎÊ×Ü´ÎÊý( count )¡£
¿Í»§µÄ·ÖÀà
ÔÚÕâÒ»²¿·ÖÖУ¬Ä¿±êÊÇѵÁ·Ò»¸ö·ÖÀàÆ÷£¬¸Ã·ÖÀàÆ÷ÔÚÉÏÒ»½ÚÖн¨Á¢µÄ²»Í¬¿Í»§ÈºµÄÀà±ðÖн«Ïû·ÑÕß·ÖÀà¡£
ΪÁËʵÏÖÕâ¸öÄ¿±ê£¬ÎÒ½«²âÊÔ"scikit-learn"Öеö·ÖÀàÆ÷¡£ÎªÁ˼ò»¯ËüÃǵÄʹÓã¬ÎÒ¶¨ÒåÁËÒ»¸öÀ࣬ËüÔÊÐí½Ó¿ÚÕâЩ²»Í¬µÄ·ÖÀàÆ÷³£¼ûµÄ¼¸¸ö¹¦ÄÜ¡£

±¾´ÎÄ¿±êÊǶ¨Òå¿Í»§Àà±ðËùÊô£¬Ò»µ©¿Í»§µÚÒ»´Î·ÃÎÊ£¬¾ÍÖ»±£ÁôÃèÊö¹ºÎï³µÀïµÄÄÚÈݵıäÁ¿£¬²¢ÇÒ²»¿¼ÂÇ·ÃÎÊµÄÆµÂÊ»ò¹ºÎï³µ¼Û¸ñËæÊ±¼äµÄ±ä»¯µÈÏà¹ØµÄ±äÁ¿¡£
Êý¾Ý×¼±¸

½«Êý¾Ý¼¯·Ö³ÉѵÁ·¼¯ºÍ²âÊÔ¼¯¡£

Ö§³ÖÏòÁ¿»ú·ÖÀàÆ÷(SVC)
ʹÓõĵÚÒ»¸ö·ÖÀàÆ÷ÊÇ Ö§³ÖÏòÁ¿»úSVC·ÖÀàÆ÷ ¡£Ôƶä¾ýÒ²×ܽáÁË Ö§³ÖÏòÁ¿»úÖзÇÏßÐԺ˺¯ÊýÔÀí £¬ÒÔ¼° Ò»ÎÄÕÆÎÕsklearnÖеÄÖ§³ÖÏòÁ¿»ú ¡£
´´½¨ÁËÒ»¸ö 'Class_Fit' ÀàµÄʵÀý£¬È»ºóµ÷Óà 'grid_search()' ¡£µ±µ÷ÓÃÕâ¸ö·½·¨Ê±£¬ÐèÒªÌṩ²ÎÊý:
- ³¬²ÎÊý£¬½«Ñ°ÇóÒ»¸ö×îÓÅÖµ
- ÓÃÓÚ½»²æÑéÖ¤µÄÕÛÊý

×¢Ò⣬ÿһ´ÎÔËÐо«¶ÈÖµ¿ÉÄÜ»á¸Ä±ä¡£
»ìÏý¾ØÕó
Ö§³ÖÏòÁ¿»úµÄ½á¹ûµÄ׼ȷÐÔ¿´ÆðÀ´ËƺõÊÇÕýÈ·µÄ¡£µ«Ö®Ç°¶¨ÒåµÄÀ಻һ¶¨¶¼ÊÇÆ½ºâµÄ¡£Ìرðµ±Ò»¸öÀà°üº¬´óÔ¼40%µÄ¿Í»§Ê±¡£Òò´ËÕâÀïÐèÒªÓõ½ÆÀ¼Û²»Æ½ºâÊý¾Ý¼¯ËùÓõ½µÄÆÀ¼ÛÖ¸±ê£¬¼´»ìÏý¾ØÕó¡£
ÈçÓв»Ì«ÊìϤµÄÅóÓÑÃÇ¿ÉÒԲο¼Ôƶä¾ý֮ǰ½éÉÜµÄ »úÆ÷ѧϰÖÐÑù±¾²»Æ½ºâ´¦Àí·½·¨ ¡£ÎÄÖнéÉÜÑù±¾²»Æ½ºâ´¦ÀíÒ»°ã·½·¨£¬ÒÔ¼°²»Æ½ºâʱʹÓÃµÄÆÀ¼ÛÖ¸±ê¡£


ѧϰÇúÏß
ÆÀ¼ÛÄ£ÐÍÄâºÏÖÊÁ¿µÄÒ»ÖÖµäÐÍ·½·¨ÊÇ»æÖÆÑ§Ï°ÇúÏß¡£ÌرðÊÇÕâÖÖÀàÐ͵ÄѧϰÇúÏß¿ÉÒÔ¼ì²âÄ£ÐÍÖпÉÄܵIJ»×㣬ÀýÈ磬¼ì²âµ½Ä£Ð͵ĹýÄâºÏ»òÇ·ÄâºÏ¡£²¢ÇÒ»¹ÄÜ¿´³ö£¬Ä£ÐÍÔÚ½Ï ´óÊý¾Ý ¼¯Öеõ½¸üºÃÄ£ÐÍЧ¹ûµÄ¿ÉÄÜÐÔ¡£ÏÂÃæ»æÖÆÕâÌõÇúÏß¡£

´ÓÕâÌõÇúÏßÉÏ¿ÉÒÔ¿´³ö£¬Ëæ×ÅÑù±¾Á¿µÄÔö¼Ó£¬ÁгµºÍ½»²æÑéÖ¤ÇúÏßÇ÷ÓÚÏàͬµÄ¼«ÏÞ¡£ÕâÊǵäÐ͵ĵͷ½²î½¨Ä££¬²¢Ö¤Ã÷ÁËÄ£ÐͲ»»áÔâÊܹýÄâºÏ¡£´ËÍ⣬ÎÒÃÇ¿ÉÒÔ¿´µ½£¬ÑµÁ·ÇúÏßµÄ׼ȷÐÔÊÇÕýÈ·µÄ¡£Òò´Ë£¬¸ÃÄ£ÐÍûÓÐÇ·ÄâºÏÊý¾Ý¡£
Logistic Regression
ÏÖÔÚ¿¼ÂÇʹÓÃÂß¼»Ø¹é·ÖÀàÆ÷¡£ÈÔȻʹÓÃ֮ǰ´´½¨µÄÒ»¸ö 'Class_Fit' ÀàµÄʵÀý£¬²¢ÔÚѵÁ·Êý¾ÝÉϵ÷ÕûÄ£ÐÍ£¬²¢²é¿´Ô¤²âÓëʵ¼ÊÖµµÄ±È½Ï¡£
ÕâÀïÓÐÁ½ÆªÎÄÕ¿ÉÒԲο¼£º Âß¼»Ø¹éËã·¨ÀíÂÛ ºÍ Âß¼»Ø¹éËã·¨°¸Àý ¡£

ͬÑù»æÖÆÑ§Ï°ÇúÏß¡£


k-Nearest Neighbors
K½üÁÚË㷨ģÐÍ£¬¾ßÌå¿ÉÒԲο¼£º »úÆ÷ѧϰ£üKNN£¬k½üÁÙËã·¨ ¡£ÎÄÖаüÀ¨Ë㷨ģÐÍÀíÂÛºÍʵ²Ù°¸Àý½éÉÜ¡£

Decision Tree
¾ö²ßÊ÷·ÖÀàÆ÷£¬¾ßÌå¿ÉÒԲμû£º »úÆ÷ѧϰ£ü¾ö²ßÊ÷Ä£ÐÍÀíÂÛ ºÍ ¾ö²ßÊ÷Ä£ÐÍʵÀý ¡£

Random Forest
Ëæ»úÉÁÖ·ÖÀàÆ÷£¬¿ÉÒԲμû£º ¼¯³ÉËã·¨£üËæ»úÉÁÖ·ÖÀàÄ£ÐÍ ¡£

AdaBoost Classifier
AdaBoost·ÖÀàÆ÷£¬¿ÉÒԲμû£º ¼¯³ÉËã·¨£üAdaBoostÄ£ÐÍ ¡£

Gradient Boosting Classifier

ͶƱ×éºÏ
×îºó£¬¿ÉÒÔ½«Ç°ÃæÖиø³öµÄ²»Í¬·ÖÀàÆ÷µÄ½á¹û½øÐÐ×éºÏ£¬ÒԸĽø·ÖÀàÄ£ÐÍ¡£Õâ¿ÉÒÔͨ¹ýÑ¡Ôñ´ó¶àÊý·ÖÀàÆ÷ËùָʾµÄ¿Í»§Àà±ðÀ´ÊµÏÖ¡£ÕâÀïʹÓÃÁË"sklearn"°üµÄ "VotingClassifier" ·½·¨¡£
Ê×ÏÈÔÚʹÓÃ֮ǰÕÒµ½µÄÿ¸ö·ÖÀàÆ÷ͨ¹ýÍø¸ñËÑË÷µÃµ½µÄ×î¼Ñ²ÎÊýÀ´µ÷Õû¸÷ÖÖ·ÖÀàÆ÷µÄ²ÎÊý¡£

È»ºó£¬¶¨ÒåÒ»¸ö·ÖÀàÆ÷À´ºÏ²¢¸÷ÖÖ·ÖÀàÆ÷µÄ½á¹û£¬²¢ÇÒѵÁ·¸Ã·ÖÀàÆ÷¡£

×¢Ò⣬ÔÚʵÀý»¯ 'votingC' ·ÖÀàÆ÷ʱ£¬Ö»Ê¹ÓÃÁËÉÏÊö¶¨ÒåµÄÕû¸ö·ÖÀàÆ÷¼¯µÄÒ»¸ö×ÓÑù±¾£¬²¢ÇÒÖ»±£ÁôÁË Random Forest£¬ nearest Neighbors ºÍ Gradient Boosting Èý¸ö·ÖÀàÆ÷¡£¶øÕâһѡÔñÓëÏÂÒ»½ÚÖнøÐеķÖÀàµÄÐÔÄÜÓйء£
²âÊÔÔ¤²â¾«¶È
ÔÚÉÏÒ»½ÚÖУ¬ÎÒÃÇѵÁ·Á˼¸¸ö·ÖÀàÆ÷À´¶Ô¿Í»§½øÐзÖÀà¡£²¢ÇÒÕû¸ö·ÖÎö¶¼ÊÇ»ùÓÚǰ10¸öÔµÄÊý¾Ý¡£ÔÚ±¾½ÚÖУ¬½«Óô洢ÔÚ 'set_test' Êý¾Ý±íÖеÄÊý¾Ý¼¯µÄ×îºóÁ½¸öÔÂÀ´²âÊÔÄ£ÐÍЧ¹û¡£

Ê×Ïȸù¾ÝÔÚѵÁ·¼¯ÉÏʹÓõÄÏàͬ¹ý³ÌÖØÐÂ×éºÏÕâЩÊý¾Ý¡£µ«ÔÚУÕýÊý¾Ý£¬¿¼Âǵ½Á½¸öÊý¾Ý¼¯Ö®¼äµÄʱ¼ä²îÒ죬ÐèÒªÔö¼Ó±äÁ¿ count ºÍ sum µÄÈ¨ÖØÒÔ»ñµÃÓëѵÁ·¼¯µÄ¸ü¼ÑµÄµÈ¼ÛÐÔ¡£


È»ºó½«Êý¾Ý±íת»»ÎªÒ»¸ö¾ØÕ󣬲¢Ö»±£Áô¶¨Òå¿Í»§ËùÊôÀà±ðµÄ±äÁ¿¡£ÕâÀïµÄÊý¾Ý±ê×¼»¯´¦Àí·½·¨ÈÔȻʹÓÃÔÚѵÁ·¼¯ÉÏʹÓõıê×¼»¯·½·¨¡£

Õâ¸ö¾ØÕóÖеÄÿһÐж¼°üº¬Ò»¸ö¿Í»§µÄ¹ºÂòϰ¹ß¡£µ½Ä¿Ç°ÎªÖ¹µÄÎÊÌâÊÇ£¬ÈçºÎʹÓÃÕâЩϰ¹ßÀ´¶¨ÒåÏû·ÑÕßËùÊôµÄÀà±ð¡£¶øÕâЩÀà±ðÒÑÔÚÇ°ÃæÕ½ÚÖÐÈ·¶¨£¬ÕâÀïÐèҪעÒâµÄÊÇ£¬¸ÃÀà±ð¶¨Òå²¢²»¶ÔÓ¦ÓÚ²âÊÔʱµÄ·ÖÀà±¾Éí¡£
Òò´ËÔÚÕâ¸ö½×¶Î£¬ÎÒÃÇͨ¹ý¶¨Òå¿Í»§ËùÊôµÄÀà±ðÀ´×¼±¸²âÊÔÊý¾Ý£¬Õâ¸ö¶¨ÒåÊÇʹÓÃÁË2¸öÔÂÆÚ¼ä»ñµÃµÄÊý¾Ý(ͨ¹ý±äÁ¿ count £¬ min £¬ max ºÍ sum )¡£¶øÔÚ֮ǰµÄ¶¨ÒåµÄ·ÖÀàÆ÷ʹÓÃÁËÒ»×éÏÞÖÆ¸üÑϸñµÄ±äÁ¿£¬ÕâЩ±äÁ¿½«ÔÚ¿Í»§µÚÒ»´Î¹ºÂòʱ¶¨Òå¡£
ÕâÀïʹÓõÄÊÇÁ½¸öÔÂÄÚ¿ÉÓÃÊý¾Ý£¬²¢Ê¹ÓÃÕâЩÊý¾Ý¶¨Òå¿Í»§ËùÊôµÄÀà±ð¡£·ÖÀàÆ÷¿ÉÒÔͨ¹ý±È½ÏÆäÔ¤²âÖµÓëÕâЩÔÓÍÀà±ðÀ´²âÊÔÄ£ÐÍЧ¹û¡£
ΪÁ˶¨Òå¿Í»§¶ËËùÊôµÄÀà±ð£¬ÎÒÃÇ»ØÒäÏÂÇ°ÃæÊ¹ÓÃµÄ 'kmeans' ·½·¨µÄʵÀý¡£Õâ¸öʵÀýµÄ 'predict' ·½·¨¼ÆËãËùÓпͻ§Óë11¸ö¿Í»§ÀàµÄÖÊÐÄÖ®¼äµÄ¾àÀ룬ͨ¹ýÓëºâÁ¿ÄĸöÖÊÐĵľàÀë×îС£¬¶ø½«Æä¹éÊôÓÚÄĸöÀà±ð¡£

½ÓÏÂÀ´Ö»ÐèÒª¼ì²é֮ǰѵÁ·¹ýµÄ²»Í¬·ÖÀàÆ÷µÄÔ¤²âЧ¹û¼´¿É¡£

×îºó£¬ÑµÁ·Ä£ÐÍʱԤ²âµÄÄÇÑù£¬Í¨¹ý½áºÏ¸÷×ÔµÄÔ¤²âÀ´Ìá¸ß·ÖÀàÆ÷µÄЧ¹ûÊÇ¿ÉÐеġ£ÕâÀïÑ¡Ôñ»ìºÏ Random Forest£¬ nearest NeighborsºÍGradient Boosting £¬ÒòΪÕ⽫µ¼ÖÂÔ¤²âÂÔÓиĽø¡£

дÔÚ×îºó
ÖÁ´Ë£¬±¾´ÎPythonÒµÎñ·ÖÎöʵսÏîÄ¿ÒѾ¸æÒ»¶ÎÂä¡£´Ó¿ªÊ¼Êý¾ÝÔ¤´¦Àí£¬È±Ê§Öµ·ÖÎö£¬¸÷¸öÌØÕ÷±äÁ¿·ÖÎö£¬²úÆ·Àà±ð»®·Ö£¬¿Í»§ÈºÌå¾ÛÀ࣬¿Í»§ÐÐΪ·ÖÎö£¬µ½×îÖÕ¿Í»§ÐÐΪԤ²âÄ£Ðͽ¨Á¢ÓëÆÀ¼Û¡£
|