±à¼ÍƼö: |
±¾½ÚÖ÷Òª½éÉÜ
ÁËDataOpsÊǺËÐÄÄÜÁ¦£¬ÄÇôʲôÊÇDataOps£¬ÎªÊ²Ã´ÆóÒµÐèÒªDataOps£¬ÈçºÎ½¨ÉèDataOpsÌåÏµÄØ,Ï£Íû¶ÔÄúµÄѧϰÓÐËù°ïÖú¡£
±¾ÎÄÀ´×ÔÓëÊý¾ÝͬÐУ¬ÓÉ»ðÁú¹ûÈí¼þAlice±à¼¡¢ÍƼö¡£ |
|
ǰÑÔ
Êý¾ÝÖÐ̨µÄáÈÆð´ú±íÁËÆóÒµÊý×Ö»¯×ªÐÍ´ÓÁ÷³ÌÇý¶¯×ßÏòÊý¾ÝÇý¶¯£¬´ÓÊý×Ö»¯×ßÏòÖÇÄÜ»¯¡£¶øDataOpsÔòÊÇÊý¾ÝÖÐÌ¨Çø±ðÓÚ´«Í³ÆóÒµÊý¾Ý¼Ü¹¹µÄºËÐIJîÒ죬Êǽ¨ÉèÊý¾ÝÖÐ̨µÄ±Ø±¸µ××ùÄÜÁ¦¡£
ÒªÉÏÊý¾ÝÖÐ̨£¬DataOpsÊǺËÐÄÄÜÁ¦£¬ÄÇôʲôÊÇDataOps£¬ÎªÊ²Ã´ÆóÒµÐèÒªDataOps£¬ÈçºÎ½¨ÉèDataOpsÌåÏµÄØ£¿
ʲôÊÇDataOps
DataOpsµÄÀúÊ·
2014Ä꣬Lenny LiebmannÌá³öDataOps[1]µÄ¸ÅÄÔÚ¡¶3
reasons why DataOps is essential for big data success¡·ÕâÆªÎÄÕÂÖУ¬LennyÌá³öDataOpsÊÇÓÅ»¯Êý¾Ý¿ÆÑ§ºÍÔËÓªÍŶÓÖ®¼äÐ×÷µÄһЩʵ¼ù¼¯¡£
2015Ä꣬Andy Palmer[2]½«Õâ¸öÀíÄî·¢Ñï¹â´ó£¬Ìá³öÁËDataOpsµÄËĸö¹Ø¼ü¹¹³É£¬Êý¾Ý¹¤³Ì£¬Êý¾Ý¼¯³É£¬Êý¾Ý°²È«ºÍÊý¾ÝÖÊÁ¿¡£
2017Ä꣬NexlaµÄJarah Euston°ÑDataOpsµÄºËÐ͍ÒåΪ´ÓÊý¾Ýµ½¼ÛÖµ£¬Õâ¸öÊÇÊ״ΰÑDataOpsºÍÒµÎñ¼ÛÖµ¹ØÁªÆðÀ´µÄ¶¨Òå¡£
2018Ä꣬Gartner°ÑDataOpsÄÉÈëµ½Data ManagementµÄ¼¼Êõ³ÉÊì¶ÈÇúÏߣ¬±êÖ¾×ÅDataOpsÕýʽ±»Òµ½çËù½ÓÄɲ¢ÍƹãÆðÀ´¡£
DataOpsÊÇÒ»ÖÖÐ×÷ʽÊý¾Ý¹ÜÀíµÄʵ¼ù£¬ÖÂÁ¦ÓÚ¸ÄÉÆ×éÖ¯ÖÐÊý¾Ý¹ÜÀíÕßÓëʹÓÃÕßÖ®¼äÊý¾ÝÁ÷µÄ¹µÍ¨£¬¼¯³ÉºÍ×Ô¶¯»¯¡£
ÏñDevOpsÒ»Ñù£¬DataOpsÒ²²»ÊÇÒ»³É²»±äµÄ½ÌÌõ£¬¶øÊÇÒ»ÖÖ»ùÓÚÔÔòµÄʵ¼ù£¬»áÓ°ÏìÈçºÎÌṩºÍ¸üÐÂÊý¾ÝÒÔÂú×ã×éÖ¯Êý¾ÝÏû·ÑÕßµÄÐèÇó¡£
GartnerÑо¿¸±×ܲÃNick Heudecker±íʾ£º¡° DataOpsÊÇÒ»ÖÖûÓÐÈκαê×¼»ò¿ò¼ÜµÄÐÂʵ¼ù¡£¡±Ô½À´Ô½¶àµÄ¼¼ÊõÌṩÉÌÔÚ̸ÂÛËûÃǵIJúƷʱÒѾ¿ªÊ¼Ê¹ÓøÃÊõÓ¶øÇÒÎÒÃÇ»¹¿´µ½Êý¾ÝºÍ·ÖÎöÍŶÓÔÚ¹Ø×¢ÕâÒ»¸ÅÄDataOpsÕý´¦ÓÚѸËÙÉÏÉýµÄÖÜÆÚ¡£¡±

DataOpsµÄ³öÏÖÊÇÔÚDevOps£¬Agile£¬LeanµÄ·¢Õ¹»ù´¡ÉÏ£¬Ó¦¶ÔÆóÒµ²»¶ÏÔö³¤µÄÊý¾Ý·ÖÎö£¬Êý¾ÝÀûÓõÄÐèÇóµÄÒ»ÖÖ½â¾ö·½°¸¡£
DataOpsµÄ¶¨Òå
DataOpsÔÚÐÐÒµÀïµÄ¶¨ÒåÓв»ÉÙ£¬±È½ÏȨÍþµÄÓÐÒÔϼ¸¸ö£º
DataOps (data operations) is an Agile
approach to designing, implementing and maintaining
a distributed data architecture that will support
a wide range of open source tools and frameworks in
production¡£The goal of DataOps is to create business
value from big data¡£[3]
DataOps£¨Êý¾ÝÔËÓª£©ÊÇÒÔÒ»ÖÖÃô½ÝµÄ·½·¨£¬ÓÃÀ´Éè¼Æ¡¢ÊµÊ©ºÍά»¤·Ö²¼Ê½Êý¾Ý¼Ü¹¹£¬Ö§³Ö¹ã·ºµÄ¿ªÔ´¹¤¾ßºÍ¿ò¼Ü£¬Êý¾ÝÔËÓªµÄÄ¿µÄÊÇ´Ó´óÊý¾ÝÖлñȡҵÎñ¼ÛÖµ¡£
Õâ¸ö¶¨ÒåÖУ¬Ç¿µ÷Ãô½ÝµÄ·½·¨¡£
DataOps is an automated, process-oriented
methodology, used by analytic and data teams, to improve
the quality and reduce the cycle time of data analytics.[4]
DataOpsÊÇÒ»¸ö×Ô¶¯µÄ¡¢ÃæÏòÁ÷³ÌµÄ·½·¨ÂÛ£¬±»Êý¾ÝºÍ·ÖÎöÍŶÓʹÓ㬴ӶøÌá¸ßÖÊÁ¿Ëõ¶ÌÊý¾Ý·ÖÎöµÄÖÜÆÚ¡£
Õâ¸ö¶¨ÒåÖУ¬Ç¿µ÷×Ô¶¯µÄ·½Ê½¡£
DataOps is the function within an
organization that controls the data journey from source
to value.
DataOpsÊÇÔÚÒ»¸ö×éÖ¯ÖпØÖÆÊý¾ÝÂó̴Ӷø²úÉú¼ÛÖµµÄÒ»¸öÖ°ÄÜ¡£
Õâ¸ö¶¨ÒåÖУ¬Ç¿µ÷µÄÊÇÊý¾ÝÂó̺ÍÒµÎñ¼ÛÖµ¡£
DataOps applies rigor to developing,
testing, and deploying code that manages data flows
and creates analytic solutions.
DataOps¶Ô¿ª·¢£¬²âÊԺͲ¿Êð´úÂë½øÐÐÁËÑϸñµÄ¹ÜÀí£¬ÕâЩ´úÂë¹ÜÀíÊý¾ÝÁ÷²¢´´½¨·ÖÎö½â¾ö·½°¸¡£
Õâ¸ö¶¨ÒåÖУ¬Ç¿µ÷Á˶ÔÓÚÊý¾ÝÁ÷µÄ¹ÜÀí¡£
ÎÒ¸öÈ˾õµÃÏÂÃæÕâ¸öͼÊǸü¼ÓÇåÎúµÄ±í´ïÁËDataOpsµÄ¶¨ÒåµÄ£º

DataOpsÊǰüÀ¨ÈË£¬Á÷³ÌºÍ¼¼ÊõµÄÒ»×éÌåϵ£¬ÓÃÀ´¹ÜÀí´úÂ룬¹¤¾ß£¬»ù´¡¼Ü¹¹ºÍÊý¾Ý±¾Éí£¬´Ó¶øÊµÏÖÈý¸öºËÐŦÄÜ£º
½«DevOpsµÄÃô½Ý¿ª·¢ºÍ³ÖÐø¼¯³ÉÓ¦Óõ½Êý¾ÝÁìÓò
ÓÅ»¯ºÍ¸Ä½øÊý¾Ý¹ÜÀíÕߣ¨Éú²úÕߣ©ºÍÊý¾ÝÏû·ÑÕßµÄÐ×÷
³ÖÐø½»¸¶Êý¾ÝÁ÷Éú²úÏß
¶øÏÂͼÔò¸ß¶È³éÏóµÄÌåÏÖÁËDataOpsµÄÈýÒªËØ£º³ÖÐø¼¯³É£¬³ÖÐø¿ª·¢£¬³ÖÐø²¿Êð

ΪʲôÐèÒªDataOps
DataOpsµÄ³öÏÖ£¬´ÓÒòΪÊý×Ö»¯×ªÐͽøÈëÁËÊý¾ÝΪºËÐĵÄÖÇÄÜʱ´ú£¬ÎªÁËÂú×ãÆóÒµ¶ÔÓÚÊý¾Ý¹ÜÀí£¬Êý¾ÝÀûÓõÄÈý´óÕ½ÂÔÇ÷ÊÆ£º
Êý¾Ý·ÖÎöÃñÖ÷»¯/Democratization of Data Analytics
ÔÀ´Êý¾Ý·ÖÎöÄÜÁ¦ÊÇÆóÒµÉÙÊýÈËÐèÒªÕÆÎպ͹¹½¨µÄÄÜÁ¦£¬¶øÏÖÔÚÊý¾Ý·ÖÎöÒѾÔÚ×ßÏòÃñÖ÷»¯µÄÇ÷ÊÆ£¬ÈκÎÒ»¸ö¸Úλ¶¼ÐèÒªÊý¾ÝµÄÖ§³Å¡£ËùÒÔÈçºÎÄܹ»ÈÃÊý¾ÝºÍ·ÖÎöÄÜÁ¦¿ÉÒԹ㷺µÄ±»ËùÓб³¾°µÄÈËËùÕÆÎÕ£¬³ÉΪÁËÆóÒµÊý¾Ý²¿ÃÅËù×·ÇóµÄÄ¿±ê¡£
¶ø´«Í³µÄÊý¾Ý·ÖÎöµÄ¹ý³ÌÊǷdz£¸´Ôӵģ¬ÈçÏÂͼËùʾ£º

DataOpsÒª½â¾öµÄÊ×ÒªÎÊÌâ¾ÍÊǹ¹½¨Ò»Ì×ÌåϵÄܹ»½µµÍÈËÃÇʹÓã¬ÀûÓ㬷ÖÎöÊý¾ÝµÄÃż÷£¬ÈÃËùÓÐÈ˶¼Äܹ»¡°ÍæÊý¾Ý¡±¡£
Êý¾Ý¼¼Êõ¶àÔª»¯/Diversification of Data Technology
Ê®ÄêÒÔÀ´£¬Êý¾Ý´¦ÀíºÍÀûÓõļ¼Êõ£¨Data-Tech)µÄ·¢Õ¹Í»·ÉÃͽø£¬´ÓÔÀ´µÄÖÐÐÄ»¯µÄÊý¾Ý²Ö¿â£¬ETL¼¼Êõ£¬ÑÜÉúµ½ÁËÒ»¸ö·±ÔÓµÄÊý¾Ý¼¼ÊõÌåϵ£¬Ï¸·Ö³É¶àÖÖÊý¾Ý´¦ÀíÁìÓò£¬±ÈÈ磺
Êý¾Ý·ÖÎö
Êý¾Ý¿ÉÊÓ»¯
»úÆ÷ѧϰ
ÔÆÊý¾Ý´¦Àí
Á÷ʽÊý¾Ý´¦Àí
ÀëÏßÊý¾Ý´¦Àí
ͳ¼ÆºÍÊý¾ÝÍÚ¾ò
ÿһ¸öÁìÓòÓÖÓжàÔª»¯µÄÊý¾Ý´¦Àí¹¤¾ß£¬¿ò¼Ü£¬ÈçÏÂͼËùʾ£º

https://dev.to/minchulkim87/my-data-science-tech-stack-2020-1poa
Õâ´ó´ó¼Ó¾çÁËÊý¾Ý¹¤×÷ÕßµÄÈëÃŵÄÃż÷ºÍѧϰ¸´ÔÓ¶È¡£
DataOpsºÜÖØÒªµÄÒ»¸öÄ¿µÄ¾ÍÊÇÀûÓÃÕâ¸öÌåϵ£¬Äܹ»½µµÍÕâ¸ö¸´ÔÓ¶È£¬ÈÃÊý¾Ý¹¤×÷ÕßÄܹ»¸üÈÝÒ׵ļÝÔ¦ÕâЩԽÀ´Ô½¸´ÔӺͶàÔª»¯µÄÊý¾Ý¼¼ÊõºÍ¹¤¾ßÌåϵ¡£
ÒµÎñ¼ÛÖµ¾«Ò滯/Lean of Business Value
DataOpsµÄÊÕÒæ
DataOpsµÄ¹¹½¨¶ÔÓÚÆóÒµÓкܶàµÄÊÕÒæ£¬×ܽáÏÂÀ´ÓÐÈçÏÂÕâЩµã£º
ÌṩʵʱµÄÊý¾Ý¶´²ìÄÜÁ¦
¼ÓËÙÊý¾ÝÓ¦ÓõĹ¹½¨¹ý³Ì
ÈÃÊý¾Ý¼ÛÖµÁ´µÄÿһ¸ö½ÇÉ«¶¼ÄܸüºÃ£¬¸ü¸ßЧµÄÐ×÷
Ìá¸ßÊý¾ÝµÄ͸Ã÷¶È£¬´Ó¶øÄܹ»¸üºÃµÄ²úÉúÊý¾Ý´´ÐºÍÔö½øÐ×÷
ÌáÉýÊý¾ÝºÍÊý¾Ý·þÎñµÄ¿É¸´ÓÃÐÔ
ÓÅ»¯Êý¾ÝÖÊÁ¿
¹¹½¨Ò»¸öͳһµÄ£¬±ê×¼»¯µÄ£¬Í¬Ô´µÄÊý¾ÝÐ×÷ƽ̨
ΪÁ˸üÖ±¹ÛµÄÌåÏÖÓÐÁËDataOpsºÍûÓÐDataOpsµÄÇø±ð£¬ÏÂͼµÄ¶Ô±ÈÊÇÒ»¸öºÜºÃÀí½âµÄ·½Ê½£º
ÏÂͼÊÇÒ»¸öµäÐ͵Ĵ«Í³Êý¾ÝÉú²ú¹ý³Ì£º

´ÓÊý¾ÝÔ´£¬µ½Ö÷Êý¾Ý£¬ÔÙµ½ÔËÓªÐÍÊý¾Ý¼¯ÊУ¬ÔÙµ½Êý¾Ý²Ö¿â£¬×îÖÕ½øÐÐÊý¾Ý·ÖÎö£¬Õû¸ö¹ý³ÌÓÐÒÔϵÄÎÊÌ⣺
ÖØ¸´ÅúÁ¿µÄÊý¾ÝÒÆ¶¯
ÄÑÒÔ¹ÜÀíµÄÓ²±àÂëETL£¨¹¤¾ßÀàSQL±àдµÄET£©
µ¥ÌåÊý¾Ý¼Ü¹¹
ÒµÎñÏìÓ¦Âý

DataOpsÒª¹¹½¨µÄÊý¾Ý´¦ÀíÁ÷³ÌÊÇÈçÏÂËùʾµÄ£º

´ÓÊý¾ÝÔ´Ö±½Óʵʱ»ñÈ¡Êý¾Ý£¬È»ºó½øÈëÊý¾Ýºþ£¬Í¨¹ýÁ÷ʽÊý¾Ý´¦Àí£¬ÊµÊ±Êý¾Ý²Ö¿â£¬¹æÄ£»¯µÄ×Ô¶¯Êý¾Ý´¦Àí¹ý³ÌµÈ¹¤¾ß¹¹½¨·ÖÎöÊý¾Ý¹ÜÀí±Õ»·£¬×îÖÕÊä³ö¶àÔª»¯µÄÊý¾Ý·þÎñ¡£
ÕâÑùµÄģʽÄܹ»´øÀ´ÈçϵÄÊÕÒæ£º
ʵʱÊý¾ÝÒÆ¶¯
×Ô¶¯»¯µÄÉè¼ÆºÍ´úÂëÉú³É
ÒµÎñ³¡¾°Çý¶¯µÄ¹æÄ£»¯¼¼Êõ¼Ü¹¹
¸ßÏìÓ¦Á¦

ÕâÑùÒÔÀ´£¬DataOpsÖ§³Å×Å´ÓÔ´Êý¾Ýµ½ÒµÎñ¼ÛÖµµÄÕû¸ö¼ÛÖµÁ´ÈçÏÂͼËùʾ£º

ÓÃEckersonµÄWayne EckersonµÄÒ»¾ä»°À´ÐÎÈÝDataOpsµÄ¼ÛÖµ£º
¡° ÿһ¸öÊý¾Ý´¦ÀíÁ´ÖУ¬Êý¾Ý±ØÐëÄܹ»±»¶¨Òå¡¢»ñÈ¡¡¢¸ñʽ»¯¡¢±êÇ©»¯¡¢±»ÑéÖ¤¡¢±»»Ïñ¡¢±»ÇåÏ´¡¢±»×ª»»£¬±»ºÏ²¢£¬±»¼¯³É£¬°²È«µÄ£¬Ä¿Â¼»¯£¬±»ÖÎÀí£¬±»Òƶ¯£¬±»²éѯ£¬±»¿ÉÊÓ»¯£¬±»·ÖÎöºÍ±»Ö´ÐС£¡±
Õâ¾ÍÊÇÏÖ´ú»¯µÄDataOpsÌåϵÐèÒª¾ß±¸µÄÄÜÁ¦¡£

DataOpsµÄËĸöÄÜÁ¦¹¹³É
DataOps±»Òµ½ç¹«ÈϵķֳÉÁËËĸö¹Ø¼ü¹¹³É£¬»òÕß˵ÊÇÄÜÁ¦½á¹¹¡£
ÈçÏÂͼËùʾ£¬ÔÚAgile£¬DevOpsºÍLeanµÄ¼Ó³ÖÏ£¬DataOps°üÀ¨Êý¾Ý¹¤³Ì¡¢Êý¾Ý¼¯³É¡¢Êý¾Ý°²È«ºÍÒþ˽£¬Êý¾ÝÖÊÁ¿ËĸöÄÜÁ¦¹¹³É£º

Êý¾Ý¹¤³Ì/Data Engineering
DataOpsµÄºËÐÄÊÇÊý¾Ý¹¤³ÌÄÜÁ¦£¬¾ÍÊÇÀûÓÃÈí¼þ¹¤³ÌÀ´´¦ÀíºÍ¼Ó¹¤Êý¾ÝµÄÄÜÁ¦,Ò²¾ÍÊÇ´ÓÊý¾ÝÔ´µ½Êý¾Ý²úÆ·ÖмäµÄ¹ý³Ì£¬¿ÉÒÔÓÃÏÂͼÀ´¼òµ¥±íʾ£º

Ò»°ã°üÀ¨Êý¾ÝÇåÎú£¬Êý¾Ý´¦Àí£¬ÌØÕ÷¹¤³ÌµÈ¹ý³Ì¡£
Êý¾Ý¼¯³É/Data Integration
ÔÚÊý¾Ý´¦Àí¹ý³ÌÖУ¬´¦Àí¶àÑù»¯µÄÊý¾ÝÀ´Ô´£¬ÈÃËûÃÇÄܹ»Ï໥¼¯³É£¬Ï໥²¹³ä£¬ÊÇDataOpsÀïÃæºÜÖØÒªµÄÄÜÁ¦£¬Ö÷Òª°üÀ¨²»Í¬Êý¾ÝԴϵͳ£¬Êý¾ÝÄ£ÐÍ£¬Êý¾Ýƽ̨£¬Êý¾Ý¸ñʽ£¬Êý¾Ý±ê×¼µÈ¶à·½µÄ¼¯³É´¦Àí¹ý³Ì£¬ÈçÏÂͼËùʾ£º

Êý¾Ý°²È«ºÍÒþ˽/Data Security & Privacy
ÔÚDataOpsµÄÈ«¹ý³ÌÖУ¬ÈçºÎÄܹ»Ìṩȫ·½Î»£¬¶Ëµ½¶ËµÄÊý¾Ý°²È«ºÍÒþ˽µÄ¹ÜÀíÖ§³Å£¬ÊǷdz£ÖØÒªµÄºËÐŦÄÜ£¬ËùÒÔÐÐÒµÀïÓÐʱºòÒ²³ÆÆäΪ£ºDataSecOps¡£

Êý¾ÝÖÊÁ¿/Data Quality
Êý¾ÝÖÊÁ¿¹ÜÀíÊÇDataOpsµÄÖØÒª¼ÛÖµºÍÄÜÁ¦£¬ÎÒÃÇÒ»°ãÓÃÏÂÃæµÄ7¸öά¶ÈÀ´¶ÈÁ¿Êý¾ÝµÄÖÊÁ¿£¬Ò»ÖÂÐÔ£¬×¼È·ÐÔ£¬¿É¿¿ÐÔ£¬ÓÐÐòÐÔ£¬Î¨Ò»ÐԺͼ°Ê±ÐÔ£º

https://www.scnsoft.com/blog/guide-to-data-quality-management
³É¹¦DataOpsµÄËĸöÌØÖÊCAUTA

ÉÏͼÊǵäÐ͵ÄÊý¾Ý¼ÛÖµÁ´¹ý³Ì£¬¶øDataOps¾ÍÊÇÖ§³Å×ÅÕû¸öÈ«ÉúÃüÖÜÆÚµÄµ××ù£¬³É¹¦µÄDataOpsÌåϵÓÐËĸöÌØÖÊ£ºCAUTA¡£
³ÖÐø/Continuous
DataOpsÊ×Òª±£Ö¤µÄ¾ÍÊǾ¡¿ÉÄܵijÖÐøÐÔ£¬²»¼ä¶Ï£¬²»ÂÛʲôÑùµÄÇé¿ö³öÏÖ£¬¶¼Äܹ»×ÔÊÊÓ¦µÄ³ÖÐøÈÃData
PipelineÁ÷¶¯ÆðÀ´£¬ËùÒÔ³ÖÐøÐÔÊÇDataOpsµÄÊ×ÒªÌØÖÊ¡£
³ÖÐøÐÔ¿ÉÒÔ×ܽáΪÈý¸ö¹Ø¼üµã£º

±£Ö¤µ±Á÷Êý¾ÝºÍÔªÊý¾Ý·¢Éú±ä»¯Ê±Äܹ»³ÖÐø
½»Ò×ϵͳÊý¾ÝÈÕÖ¾Êý¾Ý¶ÔÓÚDataOpsµÄ×îСӰÏì
¶ÔÓÚËùÓеÄԴϵͳºÍÄ¿±êϵͳ¶¼ÓÐÒ»¶¨µÄÓÅ»¯
Ãô½ÝAgilitly
ÔÚ³ÖÐøµÄ»ù´¡ÉÏ£¬DataOpsÐèÒªÒ»¶¨µÄÃô½ÝÐÔ£¬Äܹ»¿ìËÙÏìÓ¦ÍⲿµÄ¸÷Öֱ仯£¬Ö÷Òª´ÓÈý¸ö½Ç¶È£º

Ö§³Ö¶àÖÖ²¿Êðģʽ£¬¹«ÓÐÔÆ£¬Ë½ÓÐÔÆ
×Ô¶¯Ö§³ÖÊý¾ÝºþºÍÊý¾Ý²Ö¿â
Ö§³ÖδÀ´µÄ¼Ü¹¹±ä»¯
ÓÃÏÂͼ¿ÉÒÔ¸üºÃµØÀí½âÒ»¸öºÃµÄDataOpsÌåϵÐèÒªÖ§³ÖµÄËÄÖÖÊý¾Ý²¿Êðģʽ£º

È«Ãæ/Universal
×÷ΪÆóҵȫÓòÊý¾ÝµÄµ××ù£¬DataOpsÒªÈ«ÃæµÄÖ§³ÖËùÓеij¡¾°ºÍÊý¾Ý£¬ÈçÏÂͼËùʾÀý£¬ÁÐʾ³öÁ˳£ÓõÄ30ÖÖÊý¾ÝÔ´ºÍ40ÖÖÄ¿±êÊý¾Ý¡£

¿ÉÒÔ·Ö½âµÄ¸ü¼ÓϸÖ£º

¿ÉÐÅ/Trust
Êý¾ÝµÄ¿ÉÐŰüÀ¨Èý¸ö²ãÃæ£º

Êý¾ÝĿ¼£º±£Ö¤Êý¾Ý×ʲúºÍÓû§²úÉúµÄÊý¾Ý¼¯µÄ¿É·ÃÎÊÐÔ
Êý¾ÝѪԵ£ºÄܹ»ÇåÎúµÄÖªµÀÊý¾Ý´ÓÄÄÀïÀ´µÄ£¬ÊÇÔõô±»¼Ó¹¤ºÍ´¦ÀíµÄ¹ý³Ì
Êý¾ÝÑéÖ¤£ºÈ·±£Ã¿Ò»¸öÔ´Êý¾ÝÔڱ仯µÄʱºòËùÓÐÏà¹ØµÄÊý¾Ý¼¯Ò²±»¸´Öƺ͸üÐÂ
Ö»ÓÐÂú×ãÒÔÉϵÄÈýµãÒªÇ󣬲ÅÄܱ»ÈÏΪÊý¾ÝÊÇ¿ÉÐŵġ£
×Ô¶¯/Automation
×Ô¶¯»¯ÊÇDataOpsµÄÖØÒª»ù´¡ÄÜÁ¦£¬´ÓÊý¾ÝµÄ²úÉú£¬´¦Àíµ½½»¸¶Êý¾Ý²úÆ·ºÍ·þÎñ£¬Õû¸ö¹ý³ÌÒª¾¡¿ÉÄܵÄ×Ô¶¯»¯´¦Àí¡£

µäÐÍDataOpsƽ̨¼Ü¹¹
Ò»¸öµäÐ͵ÄDataOpsƽ̨µÄ¼Ü¹¹ÈçÏÂͼ[4]Ëùʾ£¬°üÀ¨°Ë´ó×é¼þ¹¦ÄÜ£º

https://www.valdas.blog/2019/04/17/data-ops/
ÿһ²¿·Ö¶ÔÓ¦µÄ³£¼û×é¼þºÍ¹¤¾ßÈçÏ£º

Êý¾Ý¹ÜÀíµÄ¹¦ÄÜ
Êý¾Ý»ñÈ¡
ͨ¹ýÅúÁ¿ÈÎÎñ£¬Îļþ´«Ê䣬Á÷ʽ´¦ÀíµÈ¼¼ÊõÊֶλñÈ¡Êý¾Ý¡£³£¼ûµÄÊý¾Ý»ñÈ¡µÄ¹¤¾ßºÍ×é¼þÓÐKafka£¬SQLµÈ¡£
Êý¾Ý´æ´¢
½«»ñÈ¡µÄÊý¾ÝÒÔ²»Í¬µÄÀàÐÍ´æ´¢ÆðÀ´£¬Ö÷ÒªÓйØÏµÐÍÊý¾Ý¿â£¬NOSQLÊý¾Ý¿â£¬ÔÆÊý¾Ý×é¼þµÈ¡£
Êý¾Ý¼¯³É
½«²»Í¬Ô´£¬²»Í¬¸ñʽ£¬²»Í¬ÀàÐ͵ÄÊý¾Ý½øÐд¦Àí´Ó¶ø¼¯³ÉÕûºÏ£¬Ö÷ÒªµÄ¹¤¾ßÓÐAirFlow£¬ETL¹¤¾ßµÈ¡£
Êý¾ÝÖÎÀí
Êý¾ÝÖÎÀíÆ½Ì¨½øÐÐÊý¾ÝµÄ±ê×¼¡¢ÔªÊý¾Ý¹ÜÀí£¬Êý¾ÝѪԵ¹ÜÀí£¬Êý¾Ý·¢ÏÖºÍËÑË÷£¬Êý¾Ý°²È«ºÍȨÏ޵ȹÜÀí¹¦ÄÜ£¬´Ó¶ø±£Ö¤Êý¾ÝµÄÒ»ÖÂÐÔ£¬Ö÷ÒªµÄ¹¤¾ßÓÐAtlas£¬Talend£¬InformaticaµÈ
Êý¾Ý·ÖÎö
³£¼ûµÄÊý¾Ý·ÖÎö¹¤¾ßºÜ¶à£¬±ÈÈçPowerBI£¬H2OµÈ¡£
Êý¾Ý¿ª·¢µÄ¹¦ÄÜ
Ð×÷
DataOpsµÄÄ¿±êÖ®Ò»¾ÍÊǹ¹½¨Ò»¸öÀͨ¶Ëµ½¶ËµÄÊý¾Ý¿ª·¢¼ÛÖµÁ´£¬ËùÒÔ¹¹½¨Ò»¸ö¸ßЧ£¬·Ö²¼Ê½µÄÐ×÷ÌåϵÊÇDataOpsºÜÖØÒªµÄ×é¼þÄ£¿é¡£µ±È»£¬ÕâÀïµÄÐ×÷¹µÍ¨¹¤¾ßºÍDevOpsËùʹÓõĺܶ඼ÊÇÀàËÆµÄ£¬ÈçSlack£¬JiraµÈ¡£
¿ª·¢
Êý¾Ý¿ª·Åƽ̨»áÓкܶ࣬һ¸öºÃµÄDataOpsƽ̨ÐèÒªÄܹ»ÎÞ·ìµÄ¼¯³ÉÕâЩ¿ª·¢»·¾³£¬ÔÚ²»Í¬µÄ¿ª·¢»·¾³Ö®¼ä¿ìËٵļ¯³ÉºÍÀͨ¡£
²¿Êð
×÷ΪDataOpsÌåϵÀ´Ëµ£¬³ÖÐø²¿ÊðÊǺÜÖØÒªµÄ»ù´¡ÄÜÁ¦£¬Äܹ»¼æÈݺܶàµ×²ãµÄÈÝÆ÷ºÍ²¿Ê𹤾ߣ¬±ÈÈçKubernate£¬JenkinsµÈ
񅏏
½«Êý¾Ý·þÎñºÍ´¦Àí½Úµã½øÐÐÁé»îµÄ±àÅÅ£¬ÐγÉеÄÊý¾Ý´¦ÀíÁ´£¬³£ÓõŤ¾ßÓÐPuppetºÍAirflowµÈ¡£
²âÊÔºÍ¼à¿Ø
×Ô¶¯»¯²âÊÔºÍ¼à¿ØµÄ×é¼þÊDZ£Ö¤Êý¾Ý´¦ÀíÁ´ÖÊÁ¿µÄ»ù´¡±£ÕÏ£¬³£ÓõÄÓÐStack£¬DataDogµÈ¡£
´ÓDataOpsµ½MLOps
ÔÚDataOpsÔÚ²»¶ÏÊÕµ½¹Ø×¢µÄͬʱ£¬Machine Learning
OpsÒ²ÔÚ²»¶ÏáÈÆð£¬ÄÇôDataOpsºÍMLOpsµÄ¹ØÏµÊÇÊ²Ã´ÄØ£¿
DataOpsµÄµÄÔ´Í·ÊÇÊý¾ÝԴϵͳ£¬ÖÕµãÊÇÊý¾Ý²úÆ·ºÍ·þÎñ£¬¶øMachine
LearningµÄ²úÆ·Ò²ÊÇÊý¾Ý·þÎñºÍ²úÆ·µÄÒ»ÖÖ£¬ËùÒÔ´ÓÕâ¸ö½Ç¶ÈÀ´½²£¬DataOpsÊDZÈMLOps·¶Î§¸ü¹ãµÄ¡£
ÎÒ¾õµÃÏÂͼ[5]ÊDZȽÏÇåÎúµÄչʾÁËDataOpsºÍMLOpsÖ®¼äµÄ¹ØÏµ£º

https://www.linkedin.com/pulse/get-rhythm-data-science-initiatives-dataops-mlops-ash-hassan/
¿ÉÒÔ×ܽáΪÈçϼ¸µã£º
DataOps±ÈMLOps¼ÛÖµÁ´¸ü³¤
DataOps¶Ëµ½¶Ë¹ÜÀí´ÓÊý¾ÝÔ´µ½Êý¾Ý²úÆ·µÄÈ«¹ý³Ì£¬¶øMLOpsÔòÊÇ´ÓÄ£ÐÍѵÁ·¿ªÊ¼µ½Ä£ÐÍÉÏÏß½áÊø¡£
DataOpsÊÇMLOpsµÄ»ù´¡ÄÜÁ¦
MLOpsÖ÷Òªº¸ÇµÄ¹ý³ÌÈçÏÂͼ[6]Ëùʾ£º

https://www.iguazio.com/blog/mlops-challenges-solutions-future-trends/
MLOpsÊÇ·þÎñÓÚ»úÆ÷ѧϰϵͳµÄ£¬¶ø»úÆ÷ѧϰϵͳÓëÒ»°ãÈí¼þϵͳÓÐÈçϲîÒì[7]£º
ÍŶӼ¼ÄÜ£º
ÔÚ»úÆ÷ѧϰÏîÄ¿ÖУ¬ÍŶÓͨ³£°üÀ¨Êý¾Ý¿ÆÑ§¼Ò»ò»úÆ÷ѧϰÑо¿ÈËÔ±£¬ËûÃÇÖ÷Òª¸ºÔð½øÐÐ̽Ë÷ÐÔÊý¾Ý·ÖÎö¡¢Ä£ÐÍ¿ª·¢ºÍʵÑé¡£ÕâЩ³ÉÔ±¿ÉÄܲ»ÊǾÑé·á¸»µÄ¡¢Äܹ»¹¹½¨Éú²ú¼¶·þÎñµÄÈí¼þ¹¤³Ìʦ¡£
¿ª·¢£º
»úÆ÷ѧϰÔÚ±¾ÖÊÉϾßÓÐʵÑéÐÔ¡£ÄúÓ¦¸Ã³¢ÊÔ²»Í¬µÄÌØÕ÷¡¢Ëã·¨¡¢½¨Ä£¼¼ÊõºÍ²ÎÊýÅäÖã¬ÒԱ㾡¿ìÕÒµ½ÎÊÌâµÄ×î¼Ñ½â¾ö·½°¸¡£ÄúËùÃæÁÙµÄÌôÕ½ÔÚÓÚ¸ú×ÙÄÄЩ·½°¸ÓÐЧ¡¢ÄÄЩ·½°¸ÎÞЧ£¬²¢ÔÚ×î´ó³Ì¶ÈÌá¸ß´úÂëÖØ¸´Ê¹ÓÃÂʵÄͬʱά³Ö¿ÉÖØÏÖÐÔ¡£
²âÊÔ£º
²âÊÔ»úÆ÷ѧϰϵͳ±È²âÊÔÆäËûÈí¼þϵͳ¸ü¸´ÔÓ¡£³ýÁ˵äÐ͵ĵ¥Ôª²âÊԺͼ¯³É²âÊÔÖ®Í⣬Äú»¹ÐèÒªÑéÖ¤Êý¾Ý¡¢ÆÀ¹À¾¹ýѵÁ·µÄÄ£ÐÍÖÊÁ¿ÒÔ¼°Ñé֤ģÐÍ¡£
²¿Êð£º
ÔÚ»úÆ÷ѧϰϵͳÖУ¬²¿Êð²»Êǽ«ÀëÏßѵÁ·µÄ»úÆ÷ѧϰģÐͲ¿ÊðΪԤ²â·þÎñÄÇÑù¼òµ¥¡£»úÆ÷ѧϰϵͳ¿ÉÄÜ»áÒªÇóÄú²¿Êð¶à²½ÖèÁ÷Ë®ÏßÒÔ×Ô¶¯ÖØÐÂѵÁ·ºÍ²¿ÊðÄ£ÐÍ¡£´ËÁ÷Ë®Ïß»áÔö¼Ó¸´ÔÓÐÔ£¬²¢ÒªÇóÄú×Ô¶¯Ö´Ðв¿Êð֮ǰÓÉÊý¾Ý¿ÆÑ§¼ÒÊÖ¶¯Ö´ÐеIJ½Ö裬ÒÔѵÁ·ºÍÑéÖ¤ÐÂÄ£ÐÍ¡£
Éú²ú£º
»úÆ÷ѧϰģÐ͵ÄÐÔÄÜ¿ÉÄÜ»áϽµ£¬²»½öÊÇÒòΪ±àÂë²»ÀíÏ룬¶øÇÒÒ²ÒòΪÊý¾Ý×ÊÁÏÔÚ²»¶ÏÑݱ䡣»»¾ä»°Ëµ£¬Ó봫ͳµÄÈí¼þϵͳÏà±È£¬Ä£ÐÍ¿ÉÄÜ»áͨ¹ý¸ü¶à·½Ê½Ë¥ÍË£¬¶øÄúÐèÒª¿¼ÂÇÕâÖÖ½µ¼¶ÏÖÏó¡£Òò´Ë£¬ÄúÐèÒª¸ú×ÙÊý¾ÝµÄժҪͳ¼ÆÐÅÏ¢²¢¼à¿ØÄ£Ð͵ÄÔÚÏßÐÔÄÜ£¬ÒÔ±ãϵͳÔÚÖµÓëÔ¤ÆÚ²»·ûʱ·¢ËÍ֪ͨ»ò»Ø¹ö¡£
»úÆ÷ѧϰºÍÆäËûÈí¼þϵͳÔÚÔ´´úÂë¿ØÖÆµÄ³ÖÐø¼¯³É¡¢µ¥Ôª²âÊÔ¡¢¼¯³É²âÊÔÒÔ¼°Èí¼þÄ£¿é»òÈí¼þ°üµÄ³ÖÐø½»¸¶·½ÃæÀàËÆ¡£
µ«ÊÇ£¬ÔÚ»úÆ÷ѧϰÖУ¬ÓÐһЩÏÔÖøµÄ²îÒ죺
CI ²»ÔÙ½ö½ö²âÊÔºÍÑéÖ¤´úÂë¼°×é¼þ£¬¶øÇÒ»¹»á²âÊÔºÍÑéÖ¤Êý¾Ý¡¢Êý¾Ý¼Ü¹¹ºÍÄ£ÐÍ¡£
CD ²»ÔÙÕë¶Ôµ¥¸öÈí¼þ°ü»ò·þÎñ£¬¶ø»áÕë¶ÔÓ¦×Ô¶¯²¿ÊðÆäËû·þÎñ£¨Ä£ÐÍÔ¤²â·þÎñ£©µÄϵͳ£¨»úÆ÷ѧϰѵÁ·Á÷Ë®Ïߣ©¡£
CT ÊÇ»úÆ÷Ñ§Ï°ÏµÍ³ÌØÓеÄÒ»¸öÐÂÊôÐÔ£¬ËüÖ÷񻃾¼°×Ô¶¯ÖØÐÂѵÁ·ºÍÌṩģÐÍ¡£
ÏÂͼÊÇÒ»¸öµäÐ͵Ä×Ô¶¯»¯»úÆ÷ѧϰµÄʾÒâͼ

Õâ²»ÊDZ¾ÎĵÄÖØµã£¬ÕâÀï¾Í²»×¸ÊöÁË¡£
×ܶøÑÔÖ®£¬MLOpsÊÇDataOpsÖкÜÖØÒªµÄÒ»²¿·Ö£¬ÊÇDataOpsÍŶӱØÐë¹¹½¨µÄÄÜÁ¦£¬Ò²ÊÇÖ§³ÅÊý¾ÝºÍÖÇÄÜÏîÄ¿µÄ±Ø±¸»ù´¡£¬DataOpsÒѾ±»ÐÐÒµÈÏΪÊÇÊý¾ÝºÍÖÇÄÜÁìÓòµÄÖ÷ÒªÇ÷ÊÆ[8]¡£
|