±à¼ÍƼö: |
±¾ÎÄÖ÷Òª½éÉÜÁËSpark
Streaming¹¤×÷ÔÀí,ÔÚ´óÊý¾Ýʱ´úSparkStreamingÄÜ×öʲô£¿Êý¾Ý¼ÛÖµÒ»°ãÔõô¶¨Ò壿ÒÔ¼°Ó¦Óá£
±¾ÎÄÀ´×Ô¹«ÖÚºÅDT_Spark£¬ÓÉ»ðÁú¹ûÈí¼þAnna±à¼¡¢ÍƼö¡£ |
|
°¸Àý¶¯ÊÖʵս²¢ÔÚµç¹âʯ»ð¼äÀí½âÆä¹¤×÷ÔÀí Á÷£¨Streaming£©£¬ÔÚ´óÊý¾Ýʱ´úΪÊý¾ÝÁ÷´¦Àí£¬¾ÍÏñË®Á÷Ò»Ñù£¬ÊÇÊý¾ÝÁ÷£»¼ÈÈ»ÊÇÊý¾ÝÁ÷´¦Àí£¬¾Í»áÏëµ½Êý¾ÝµÄÁ÷Èë¡¢Êý¾ÝµÄ¼Ó¹¤¡¢Êý¾ÝµÄÁ÷³ö¡£ ÈÕ³£¹¤×÷¡¢Éú»îÖÐÊý¾ÝÀ´Ô´ºÜ¶à²»Í¬µÄµØ·½¡£ÀýÈ磺¹¤ÒµÊ±´úµÄÆû³µÖÆÔì¡¢¼à¿ØÉ豸¡¢¹¤ÒµÉ豸»á²úÉúºÜ¶àÔ´Êý¾Ý£»ÐÅϢʱ´úµÄµçÉÌÍøÕ¾¡¢ÈÕÖ¾·þÎñÆ÷¡¢Éç½»ÍøÂç¡¢½ðÈÚ½»Ò×ϵͳ¡¢ºÚ¿Í¹¥»÷¡¢À¬»øÓʼþ¡¢½»Í¨¼à¿ØµÈ£»Í¨ÐÅʱ´úµÄÊÖ»ú¡¢Æ½°å¡¢ÖÇÄÜÉ豸¡¢ÎïÁªÍøµÈ»á²úÉúºÜ¶àʵʱÊý¾Ý£¬Êý¾ÝÁ÷ÎÞ´¦²»ÔÚ¡£
ÔÚ´óÊý¾Ýʱ´úSparkStreamingÄÜ×öʲô£¿ ƽʱÓû§¶¼ÓÐÍøÉϹºÎïµÄ¾Àú£¬Óû§ÔÚÍøÕ¾ÉϽøÐеĸ÷ÖÖ²Ù×÷ͨ¹ýSpark StreamingÁ÷´¦Àí¼¼Êõ¿ÉÒÔ±»¼à¿Ø£¬Óû§µÄ¹ºÂò°®ºÃ¡¢¹Ø×¢¶È¡¢½»Ò׵ȿÉÒÔ½øÐÐÐÐΪ·ÖÎö¡£ÔÚ½ðÈÚÁìÓò£¬Í¨¹ýSpark
StreamingÁ÷´¦Àí¼¼Êõ¿ÉÒÔ¶Ô½»Ò×Á¿ºÜ´óµÄÕ˺ŽøÐÐ¼à¿Ø£¬·ÀÖ¹×ﷸϴǮ¡¢²Æ²ú×ªÒÆ¡¢·ÀÆÛÕ©µÈ¡£ÔÚÍøÂ簲ȫÐÔ·½Ã棬ºÚ¿Í¹¥»÷ʱÓз¢Éú£¬Í¨¹ýSpark
StreamingÁ÷´¦Àí¼¼Êõ¿ÉÒÔ½«Ä³Àà¿ÉÒÉIP½øÐÐ¼à¿Ø²¢½áºÏ»úÆ÷ѧϰѵÁ·Ä£ÐÍÆ¥Åä³öµ±Ç°ÇëÇóÊÇ·ñÊôÓںڿ͹¥»÷¡£ÆäËû·½Ã棬È磺À¬»øÓʼþ¼à¿Ø¹ýÂË¡¢½»Í¨¼à¿Ø¡¢ÍøÂç¼à¿Ø¡¢¹¤ÒµÉ豸¼à¿ØµÄ±³ºó¶¼ÊÇSpark
Streaming·¢»ÓÇ¿´óÁ÷´¦ÀíµÄµØ·½¡£
´óÊý¾Ýʱ´ú£¬Êý¾Ý¼ÛÖµÒ»°ãÔõô¶¨Ò壿 ?ËùÓÐû¾¹ýÁ÷´¦ÀíµÄÊý¾Ý¶¼ÊÇÎÞЧÊý¾Ý»òûÓмÛÖµµÄÊý¾Ý£»Êý¾Ý²úÉúÖ®ºóÁ¢¼´´¦Àí²úÉúµÄ¼ÛÖµÊÇ×î´óµÄ£¬Êý¾Ý·ÅÖÃÔ½¾Ã»òÔ½ÖͺóÆäʹÓüÛÖµÔ½µÍ¡£ÒÔǰ¾ø´ó¶àÊýµçÉÌÍøÕ¾Ó¯Àû×ßµÄÊÇÍøÂçÁ÷Á¿£¨¼´Óû§µÄ·ÃÎÊÁ¿£©£¬Èç½ñ£¬µçÉÌÍøÕ¾²»½ö½öÐèÒª¹Ø×¢Á÷Á¿¡¢½»Ò×Á¿£¬¸üÖØÒªµÄÊÇҪͨ¹ýÊý¾ÝÁ÷¼¼ÊõÈõçÉÌÍøÕ¾µÄ¸÷ÖÖÊý¾ÝÁ÷¶¯ÆðÀ´£¬Í¨¹ýʵʱÁ÷¶¯µÄÊý¾Ý¼°Ê±·ÖÎö¡¢ÍÚ¾ò³ö¸÷ÖÖÓмÛÖµµÄÊý¾Ý£»±ÈÈ磺¶Ô²»Í¬½»Ò×Á¿µÄÓû§Ö¸¶¨Óû§»Ïñ£¬´Ó¶øÌṩ²»Í¬·þÎñÖÊÁ¿£»×¼¶ÔÓû§·ÃÎʵçÉÌÍøÕ¾°å¿é°®ºÃ¼°Ê±ÍƼöÏà¹ØµÄÐÅÏ¢¡£
SparkStreaming VSHadoopMR£º Spark StreamingÊÇÒ»¸ö׼ʵʱÁ÷´¦Àí¿ò¼Ü£¬¶øHadoop MRÊÇÒ»¸öÀëÏß¡¢Åú´¦Àí¿ò¼Ü£»ºÜÏÔÈ»£¬ÔÚÊý¾ÝµÄ¼ÛÖµÐԽǶȣ¬Spark
StreamingÍêʤÓÚHadoop MR¡£
SparkStreaming VS Storm£º Spark StreamingÊÇÒ»¸ö׼ʵʱÁ÷´¦Àí¿ò¼Ü£¬´¦ÀíÏìӦʱ¼äÒ»°ãÒÔ·ÖÖÓΪµ¥Î»£¬Ò²¾ÍÊÇ˵´¦ÀíʵʱÊý¾ÝµÄÑÓ³Ùʱ¼äÊÇÃë¼¶±ðµÄ£»StormÊÇÒ»¸öʵʱÁ÷´¦Àí¿ò¼Ü£¬´¦ÀíÏìÓ¦ÊǺÁÃë¼¶µÄ¡£ËùÒÔÔÚÁ÷¿ò¼ÜÑ¡ÐÍ·½ÃæÒª¿´¾ßÌåÒµÎñ³¡¾°¡£ÐèÒª³ÎÇåµÄÊÇÏÖÔںܶàÈËÈÏΪSpark
StreamingÁ÷´¦ÀíÔËÐв»Îȶ¨¡¢Êý¾Ý¶ªÊ§¡¢ÊÂÎñÐÔÖ§³Ö²»ºÃµÈµÈ£¬ÄÇÊÇÒòΪºÜ¶àÈ˲»»á¼ÝÔ¦Spark
Streaming¼°Spark±¾Éí¡£ÔÚSpark StreamingÁ÷´¦ÀíµÄÑÓ³Ùʱ¼ä·½Ã棬DT_Spark´óÊý¾ÝÃ餳§¼´½«ÍƳöµÄSpark¶¨Öư汾£¬»á½«Spark
StreamingµÄÑÓ³Ù´ÓÃë¼¶±ðÍÆ½øµ½100ºÁÃëÖ®ÄÚÉõÖÁ¸üÉÙ¡£
SparkStreamingÓŵ㣺
1¡¢ÌṩÁ˷ḻµÄAPI£¬ÆóÒµÖÐÄÜ¿ìËÙʵÏÖ¸÷ÖÖ¸´ÔÓµÄÒµÎñÂß¼¡£
2¡¢Á÷ÈëSpark StreamingµÄÊý¾ÝÁ÷ͨ¹ýºÍ»úÆ÷ѧϰËã·¨½áºÏ£¬Íê³É»úÆ÷Ä£ÄâºÍͼ¼ÆËã¡£
3¡¢Spark Streaming»ùÓÚSparkÓÅÐãµÄѪͳ¡£
SparkStreamingÄܲ»ÄÜÏñStormÒ»Ñù£¬Ò»ÌõÒ»Ìõ´¦ÀíÊý¾Ý£¿
Storm´¦ÀíÊý¾ÝµÄ·½Ê½ÊÇÒÔÌõΪµ¥Î»À´Ò»ÌõÒ»Ìõ´¦ÀíµÄ£¬¶øSpark Streaming»ùÓÚµ¥Î»Ê±¼ä´¦ÀíÊý¾ÝµÄ£¬SparkStreamingÄܲ»ÄÜÏñStormÒ»ÑùÄØ£¿´ð°¸ÊÇ£º¿ÉÒԵġ£
Òµ½çÒ»°ãµÄ×ö·¨ÊÇSpark StreamingºÍKafka´îµµ¼´¿É´ïµ½ÕâÖÖЧ¹û,ÈëÏÂͼ£º

KafkaÒµ½çÈÏͬ×îÖ÷Á÷µÄ·Ö²¼Ê½ÏûÏ¢¿ò¼Ü£¬´Ë¿ò¼Ü¼´·ûºÏÏûÏ¢¹ã²¥Ä£Ê½ÓÖ·ûºÏÏûÏ¢¶ÓÁÐģʽ¡£
KafkaÄÚ²¿Ê¹Óõļ¼Êõ£º
1¡¢Cache
2¡¢Interface
3¡¢Persistence£¨Ä¬ÈÏ×î´ó³Ö¾Ã»¯Ò»ÖÜ£©
4¡¢Zero-Copy¼¼ÊõÈÃKafkaÿÃëÍÌÍÂÁ¿¼¸°ÙÕ×£¬¶øÇÒÊý¾ÝÖ»ÐèÒª¼ÓÔØÒ»´Îµ½ÄÚºËÌṩÆäËûÓ¦ÓóÌÐòʹÓÃ
Íⲿ¸÷ÖÖÔ´Êý¾ÝÍÆ½ø£¨Push£©Kafka£¬È»ºóÔÙͨ¹ýSpark Streamingץȡ£¨Pull£©Êý¾Ý£¬×¥È¡µÄÊý¾ÝÁ¿¿ÉÒÔ¸ù¾Ý×Ô¼ºµÄʵ¼ÊÇé¿öÈ·¶¨Ã¿Ò»ÃëÖÐÒª´¦Àí¶àÉÙÊý¾Ý¡£
ͨ¹ýSpark Streaming¶¯ÊÖʵսwordCountʵÀý
ÕâÀïÊÇÔËÐÐÒ»¸öSpark StreamingµÄ³ÌÐò£ºÍ³¼ÆÕâ¸öʱ¼ä¶ÎÄÚÁ÷½øÀ´µÄµ¥´Ê³öÏֵĴÎÊý. Ëü¼ÆËãµÄÊÇ£ºËû¹æ¶¨µÄʱ¼ä¶ÎÄÚÿ¸öµ¥´Ê³öÏÖÁ˶àÉٴΡ£
1¡¢ÏÈÆô¶¯ÏÂSpark¼¯Èº£º

ÎÒÃÇ´Ó¼¯ÈºÀïÃæ´ò¿ªÏ¹ٷ½ÍøÕ¾



½ÓÊÜÕâ¸öÊý¾Ý½øÐмӹ¤£¬¾ÍÊÇÁ÷´¦ÀíµÄ¹ý³Ì£¬¸Õ²ÅÄǸöWordCount¾ÍÊÇÒÔ1s×öÒ»¸öµ¥Î»¡£
¸Õ²ÅÔËÐеÄʱºò£¬ÎªÊ²Ã´Ã»Óнá¹ûÄØ£¿ÒòΪÐèÒªÊý¾ÝÔ´¡£
2¡¢»ñÈ¡Êý¾ÝÔ´:

пªÒ»¸öÃüÁîÖÕ¶Ë£¬È»ºóÊäÈ룺
$nc-lk 9999

ÏÖÔÚÎÒÃÇ¿½±´Êý¾ÝÔ´½øÈëÔËÐУº


È»ºó°´»Ø³µÔËÐÐ


DStreamºÍRDD¹ØÏµ£º
ûÓÐÊäÈëÊý¾Ý»á´òÓ¡µÄÊǿսá¹û£º


µ«ÊÇʵ¼ÊÉÏ£¬JobµÄÖ´ÐÐÊÇSpark Streaming¿ò¼Ü°ïÎÒÃDzúÉúµÄºÍ¿ª·¢Õß×Ô¼ºÐ´µÄSpark´úÂëÒµÎñÂ߼ûÓйØÏµ£¬¶øÇÒSpark
Streaming¿ò¼ÜµÄÖ´ÐÐʱ¼ä¼ä¸ô¿ÉÒÔÊÖ¶¯ÅäÖã¬È磺ÿ¸ôÒ»ÃëÖӾͻá²úÉúÒ»´ÎJobµÄµ÷Óá£ËùÒÔÔÚ¿ª·¢Õß±àдºÃµÄSpark´úÂëʱ£¨È磺flatmap¡¢map¡¢collect£©£¬²»»áµ¼ÖÂjobµÄÔËÐУ¬jobÔËÐÐÊÇSpark
Streaming¿ò¼Ü²úÉúµÄ£¬¿ÉÒÔÅäÖóÉÿ¸ôÒ»ÃëÖж¼»á²úÉúÒ»´Îjobµ÷Óá£
Spark StreamingÁ÷½øÀ´µÄÊý¾ÝÊÇDStream£¬µ«Spark Core¿ò¼ÜÖ»ÈÏRDD£¬Õâ¾Í²úÉúì¶ÜÁË£¿
Spark Streaming¿ò¼ÜÖУ¬×÷ҵʵÀýµÄ²úÉú¶¼ÊÇ»ùÓÚrddʵÀýÀ´²úÉú£¬ÄãдµÄ´úÂëÊÇ×÷ÒµµÄÄ£°å£¬¼´rddÊÇ×÷ÒµµÄÄ£°å£¬Ä£°åÒ»ÔËÐÐrdd¾Í»á±»Ö´ÐУ¬´Ëʱaction±ØÐë´¦ÀíÊý¾Ý¡£RDDµÄÄ£°å¾ÍÊÇDStreamÀëÉ¢Á÷£¬RDDÖ®¼ä´æÔÚÒÀÀµ¹ØÏµ£¬DStream¾ÍÓÐÁËÒÀÀµ¹ØÏµ£¬Ò²¾Í¹¹³ÉÁËDStream
ÓÐÏòÎÞ»·Í¼¡£Õâ¸öDAGͼ£¬ÊÇÄ£°å¡£Spark StreamingÖ»²»¹ýÊÇÔÚ¸½ÔÚRDDÉÏÃæÒ»²ã±¡±¡µÄ·â×°¶øÒÑ¡£ÄãдµÄ´úÂë²»ÄܲúÉúJob,Ö»Óпò¼Ü²ÅÄܲúÉúJob.
Èç¹ûÒ»ÃëÄÚ¼ÆËã²»ÍêÊý¾Ý£¬¾ÍÖ»Äܵ÷ÓÅÁË.

|