Äú¿ÉÒÔ¾èÖú£¬Ö§³ÖÎÒÃǵĹ«ÒæÊÂÒµ¡£

1Ôª 10Ôª 50Ôª





ÈÏÖ¤Â룺  ÑéÖ¤Âë,¿´²»Çå³þ?Çëµã»÷Ë¢ÐÂÑéÖ¤Âë ±ØÌî



  ÇóÖª ÎÄÕ ÎÄ¿â Lib ÊÓÆµ iPerson ¿Î³Ì ÈÏÖ¤ ×Éѯ ¹¤¾ß ½²×ù Model Center   Code  
»áÔ±   
   
 
     
   
 ¶©ÔÄ
  ¾èÖú
DataOps£ºÊý¾ÝÖÐ̨µÄ±Ø±¸µ××ù
 
×÷Õߣº¿­¸ç
  2135  次浏览      27
2021-7-19 
 
±à¼­ÍƼö:
±¾½ÚÖ÷Òª½éÉÜ ÁËDataOpsÊǺËÐÄÄÜÁ¦£¬ÄÇôʲôÊÇDataOps£¬ÎªÊ²Ã´ÆóÒµÐèÒªDataOps£¬ÈçºÎ½¨ÉèDataOpsÌåÏµÄØ,Ï£Íû¶ÔÄúµÄѧϰÓÐËù°ïÖú¡£
±¾ÎÄÀ´×ÔÓëÊý¾ÝͬÐУ¬ÓÉ»ðÁú¹ûÈí¼þAlice±à¼­¡¢ÍƼö¡£

ǰÑÔ

Êý¾ÝÖÐ̨µÄáÈÆð´ú±íÁËÆóÒµÊý×Ö»¯×ªÐÍ´ÓÁ÷³ÌÇý¶¯×ßÏòÊý¾ÝÇý¶¯£¬´ÓÊý×Ö»¯×ßÏòÖÇÄÜ»¯¡£¶øDataOpsÔòÊÇÊý¾ÝÖÐÌ¨Çø±ðÓÚ´«Í³ÆóÒµÊý¾Ý¼Ü¹¹µÄºËÐIJîÒ죬Êǽ¨ÉèÊý¾ÝÖÐ̨µÄ±Ø±¸µ××ùÄÜÁ¦¡£

ÒªÉÏÊý¾ÝÖÐ̨£¬DataOpsÊǺËÐÄÄÜÁ¦£¬ÄÇôʲôÊÇDataOps£¬ÎªÊ²Ã´ÆóÒµÐèÒªDataOps£¬ÈçºÎ½¨ÉèDataOpsÌåÏµÄØ£¿

ʲôÊÇDataOps

DataOpsµÄÀúÊ·

2014Ä꣬Lenny LiebmannÌá³öDataOps[1]µÄ¸ÅÄÔÚ¡¶3 reasons why DataOps is essential for big data success¡·ÕâÆªÎÄÕÂÖУ¬LennyÌá³öDataOpsÊÇÓÅ»¯Êý¾Ý¿ÆÑ§ºÍÔËÓªÍŶÓÖ®¼äЭ×÷µÄһЩʵ¼ù¼¯¡£

2015Ä꣬Andy Palmer[2]½«Õâ¸öÀíÄî·¢Ñï¹â´ó£¬Ìá³öÁËDataOpsµÄËĸö¹Ø¼ü¹¹³É£¬Êý¾Ý¹¤³Ì£¬Êý¾Ý¼¯³É£¬Êý¾Ý°²È«ºÍÊý¾ÝÖÊÁ¿¡£

2017Ä꣬NexlaµÄJarah Euston°ÑDataOpsµÄºËÐ͍ÒåΪ´ÓÊý¾Ýµ½¼ÛÖµ£¬Õâ¸öÊÇÊ״ΰÑDataOpsºÍÒµÎñ¼ÛÖµ¹ØÁªÆðÀ´µÄ¶¨Òå¡£

2018Ä꣬Gartner°ÑDataOpsÄÉÈëµ½Data ManagementµÄ¼¼Êõ³ÉÊì¶ÈÇúÏߣ¬±êÖ¾×ÅDataOpsÕýʽ±»Òµ½çËù½ÓÄɲ¢ÍƹãÆðÀ´¡£

DataOpsÊÇÒ»ÖÖЭ×÷ʽÊý¾Ý¹ÜÀíµÄʵ¼ù£¬ÖÂÁ¦ÓÚ¸ÄÉÆ×éÖ¯ÖÐÊý¾Ý¹ÜÀíÕßÓëʹÓÃÕßÖ®¼äÊý¾ÝÁ÷µÄ¹µÍ¨£¬¼¯³ÉºÍ×Ô¶¯»¯¡£

ÏñDevOpsÒ»Ñù£¬DataOpsÒ²²»ÊÇÒ»³É²»±äµÄ½ÌÌõ£¬¶øÊÇÒ»ÖÖ»ùÓÚÔ­ÔòµÄʵ¼ù£¬»áÓ°ÏìÈçºÎÌṩºÍ¸üÐÂÊý¾ÝÒÔÂú×ã×éÖ¯Êý¾ÝÏû·ÑÕßµÄÐèÇó¡£

GartnerÑо¿¸±×ܲÃNick Heudecker±íʾ£º¡° DataOpsÊÇÒ»ÖÖûÓÐÈκαê×¼»ò¿ò¼ÜµÄÐÂʵ¼ù¡£¡±Ô½À´Ô½¶àµÄ¼¼ÊõÌṩÉÌÔÚ̸ÂÛËûÃǵIJúƷʱÒѾ­¿ªÊ¼Ê¹ÓøÃÊõÓ¶øÇÒÎÒÃÇ»¹¿´µ½Êý¾ÝºÍ·ÖÎöÍŶÓÔÚ¹Ø×¢ÕâÒ»¸ÅÄDataOpsÕý´¦ÓÚѸËÙÉÏÉýµÄÖÜÆÚ¡£¡±

DataOpsµÄ³öÏÖÊÇÔÚDevOps£¬Agile£¬LeanµÄ·¢Õ¹»ù´¡ÉÏ£¬Ó¦¶ÔÆóÒµ²»¶ÏÔö³¤µÄÊý¾Ý·ÖÎö£¬Êý¾ÝÀûÓõÄÐèÇóµÄÒ»ÖÖ½â¾ö·½°¸¡£

DataOpsµÄ¶¨Òå

DataOpsÔÚÐÐÒµÀïµÄ¶¨ÒåÓв»ÉÙ£¬±È½ÏȨÍþµÄÓÐÒÔϼ¸¸ö£º

DataOps (data operations) is an Agile approach to designing, implementing and maintaining a distributed data architecture that will support a wide range of open source tools and frameworks in production¡£The goal of DataOps is to create business value from big data¡£[3]

DataOps£¨Êý¾ÝÔËÓª£©ÊÇÒÔÒ»ÖÖÃô½ÝµÄ·½·¨£¬ÓÃÀ´Éè¼Æ¡¢ÊµÊ©ºÍά»¤·Ö²¼Ê½Êý¾Ý¼Ü¹¹£¬Ö§³Ö¹ã·ºµÄ¿ªÔ´¹¤¾ßºÍ¿ò¼Ü£¬Êý¾ÝÔËÓªµÄÄ¿µÄÊÇ´Ó´óÊý¾ÝÖлñȡҵÎñ¼ÛÖµ¡£

Õâ¸ö¶¨ÒåÖУ¬Ç¿µ÷Ãô½ÝµÄ·½·¨¡£

DataOps is an automated, process-oriented methodology, used by analytic and data teams, to improve the quality and reduce the cycle time of data analytics.[4]

DataOpsÊÇÒ»¸ö×Ô¶¯µÄ¡¢ÃæÏòÁ÷³ÌµÄ·½·¨ÂÛ£¬±»Êý¾ÝºÍ·ÖÎöÍŶÓʹÓ㬴ӶøÌá¸ßÖÊÁ¿Ëõ¶ÌÊý¾Ý·ÖÎöµÄÖÜÆÚ¡£

Õâ¸ö¶¨ÒåÖУ¬Ç¿µ÷×Ô¶¯µÄ·½Ê½¡£

DataOps is the function within an organization that controls the data journey from source to value.

DataOpsÊÇÔÚÒ»¸ö×éÖ¯ÖпØÖÆÊý¾ÝÂó̴Ӷø²úÉú¼ÛÖµµÄÒ»¸öÖ°ÄÜ¡£

Õâ¸ö¶¨ÒåÖУ¬Ç¿µ÷µÄÊÇÊý¾ÝÂó̺ÍÒµÎñ¼ÛÖµ¡£

DataOps applies rigor to developing, testing, and deploying code that manages data flows and creates analytic solutions.

DataOps¶Ô¿ª·¢£¬²âÊԺͲ¿Êð´úÂë½øÐÐÁËÑϸñµÄ¹ÜÀí£¬ÕâЩ´úÂë¹ÜÀíÊý¾ÝÁ÷²¢´´½¨·ÖÎö½â¾ö·½°¸¡£

Õâ¸ö¶¨ÒåÖУ¬Ç¿µ÷Á˶ÔÓÚÊý¾ÝÁ÷µÄ¹ÜÀí¡£

ÎÒ¸öÈ˾õµÃÏÂÃæÕâ¸öͼÊǸü¼ÓÇåÎúµÄ±í´ïÁËDataOpsµÄ¶¨ÒåµÄ£º

DataOpsÊǰüÀ¨ÈË£¬Á÷³ÌºÍ¼¼ÊõµÄÒ»×éÌåϵ£¬ÓÃÀ´¹ÜÀí´úÂ룬¹¤¾ß£¬»ù´¡¼Ü¹¹ºÍÊý¾Ý±¾Éí£¬´Ó¶øÊµÏÖÈý¸öºËÐŦÄÜ£º

½«DevOpsµÄÃô½Ý¿ª·¢ºÍ³ÖÐø¼¯³ÉÓ¦Óõ½Êý¾ÝÁìÓò

ÓÅ»¯ºÍ¸Ä½øÊý¾Ý¹ÜÀíÕߣ¨Éú²úÕߣ©ºÍÊý¾ÝÏû·ÑÕßµÄЭ×÷

³ÖÐø½»¸¶Êý¾ÝÁ÷Éú²úÏß

¶øÏÂͼÔò¸ß¶È³éÏóµÄÌåÏÖÁËDataOpsµÄÈýÒªËØ£º³ÖÐø¼¯³É£¬³ÖÐø¿ª·¢£¬³ÖÐø²¿Êð

ΪʲôÐèÒªDataOps

DataOpsµÄ³öÏÖ£¬´ÓÒòΪÊý×Ö»¯×ªÐͽøÈëÁËÊý¾ÝΪºËÐĵÄÖÇÄÜʱ´ú£¬ÎªÁËÂú×ãÆóÒµ¶ÔÓÚÊý¾Ý¹ÜÀí£¬Êý¾ÝÀûÓõÄÈý´óÕ½ÂÔÇ÷ÊÆ£º

Êý¾Ý·ÖÎöÃñÖ÷»¯/Democratization of Data Analytics

Ô­À´Êý¾Ý·ÖÎöÄÜÁ¦ÊÇÆóÒµÉÙÊýÈËÐèÒªÕÆÎպ͹¹½¨µÄÄÜÁ¦£¬¶øÏÖÔÚÊý¾Ý·ÖÎöÒѾ­ÔÚ×ßÏòÃñÖ÷»¯µÄÇ÷ÊÆ£¬ÈκÎÒ»¸ö¸Úλ¶¼ÐèÒªÊý¾ÝµÄÖ§³Å¡£ËùÒÔÈçºÎÄܹ»ÈÃÊý¾ÝºÍ·ÖÎöÄÜÁ¦¿ÉÒԹ㷺µÄ±»ËùÓб³¾°µÄÈËËùÕÆÎÕ£¬³ÉΪÁËÆóÒµÊý¾Ý²¿ÃÅËù×·ÇóµÄÄ¿±ê¡£

¶ø´«Í³µÄÊý¾Ý·ÖÎöµÄ¹ý³ÌÊǷdz£¸´Ôӵģ¬ÈçÏÂͼËùʾ£º

DataOpsÒª½â¾öµÄÊ×ÒªÎÊÌâ¾ÍÊǹ¹½¨Ò»Ì×ÌåϵÄܹ»½µµÍÈËÃÇʹÓã¬ÀûÓ㬷ÖÎöÊý¾ÝµÄÃż÷£¬ÈÃËùÓÐÈ˶¼Äܹ»¡°ÍæÊý¾Ý¡±¡£

Êý¾Ý¼¼Êõ¶àÔª»¯/Diversification of Data Technology

Ê®ÄêÒÔÀ´£¬Êý¾Ý´¦ÀíºÍÀûÓõļ¼Êõ£¨Data-Tech)µÄ·¢Õ¹Í»·ÉÃͽø£¬´ÓÔ­À´µÄÖÐÐÄ»¯µÄÊý¾Ý²Ö¿â£¬ETL¼¼Êõ£¬ÑÜÉúµ½ÁËÒ»¸ö·±ÔÓµÄÊý¾Ý¼¼ÊõÌåϵ£¬Ï¸·Ö³É¶àÖÖÊý¾Ý´¦ÀíÁìÓò£¬±ÈÈ磺

Êý¾Ý·ÖÎö

Êý¾Ý¿ÉÊÓ»¯

»úÆ÷ѧϰ

ÔÆÊý¾Ý´¦Àí

Á÷ʽÊý¾Ý´¦Àí

ÀëÏßÊý¾Ý´¦Àí

ͳ¼ÆºÍÊý¾ÝÍÚ¾ò

ÿһ¸öÁìÓòÓÖÓжàÔª»¯µÄÊý¾Ý´¦Àí¹¤¾ß£¬¿ò¼Ü£¬ÈçÏÂͼËùʾ£º

https://dev.to/minchulkim87/my-data-science-tech-stack-2020-1poa

Õâ´ó´ó¼Ó¾çÁËÊý¾Ý¹¤×÷ÕßµÄÈëÃŵÄÃż÷ºÍѧϰ¸´ÔÓ¶È¡£

DataOpsºÜÖØÒªµÄÒ»¸öÄ¿µÄ¾ÍÊÇÀûÓÃÕâ¸öÌåϵ£¬Äܹ»½µµÍÕâ¸ö¸´ÔÓ¶È£¬ÈÃÊý¾Ý¹¤×÷ÕßÄܹ»¸üÈÝÒ׵ļÝÔ¦ÕâЩԽÀ´Ô½¸´ÔӺͶàÔª»¯µÄÊý¾Ý¼¼ÊõºÍ¹¤¾ßÌåϵ¡£

ÒµÎñ¼ÛÖµ¾«Ò滯/Lean of Business Value

DataOpsµÄÊÕÒæ

DataOpsµÄ¹¹½¨¶ÔÓÚÆóÒµÓкܶàµÄÊÕÒæ£¬×ܽáÏÂÀ´ÓÐÈçÏÂÕâЩµã£º

ÌṩʵʱµÄÊý¾Ý¶´²ìÄÜÁ¦

¼ÓËÙÊý¾ÝÓ¦ÓõĹ¹½¨¹ý³Ì

ÈÃÊý¾Ý¼ÛÖµÁ´µÄÿһ¸ö½ÇÉ«¶¼ÄܸüºÃ£¬¸ü¸ßЧµÄЭ×÷

Ìá¸ßÊý¾ÝµÄ͸Ã÷¶È£¬´Ó¶øÄܹ»¸üºÃµÄ²úÉúÊý¾Ý´´ÐºÍÔö½øÐ­×÷

ÌáÉýÊý¾ÝºÍÊý¾Ý·þÎñµÄ¿É¸´ÓÃÐÔ

ÓÅ»¯Êý¾ÝÖÊÁ¿

¹¹½¨Ò»¸öͳһµÄ£¬±ê×¼»¯µÄ£¬Í¬Ô´µÄÊý¾ÝЭ×÷ƽ̨

ΪÁ˸üÖ±¹ÛµÄÌåÏÖÓÐÁËDataOpsºÍûÓÐDataOpsµÄÇø±ð£¬ÏÂͼµÄ¶Ô±ÈÊÇÒ»¸öºÜºÃÀí½âµÄ·½Ê½£º

ÏÂͼÊÇÒ»¸öµäÐ͵Ĵ«Í³Êý¾ÝÉú²ú¹ý³Ì£º

´ÓÊý¾ÝÔ´£¬µ½Ö÷Êý¾Ý£¬ÔÙµ½ÔËÓªÐÍÊý¾Ý¼¯ÊУ¬ÔÙµ½Êý¾Ý²Ö¿â£¬×îÖÕ½øÐÐÊý¾Ý·ÖÎö£¬Õû¸ö¹ý³ÌÓÐÒÔϵÄÎÊÌ⣺

ÖØ¸´ÅúÁ¿µÄÊý¾ÝÒÆ¶¯

ÄÑÒÔ¹ÜÀíµÄÓ²±àÂëETL£¨¹¤¾ßÀàSQL±àдµÄET£©

µ¥ÌåÊý¾Ý¼Ü¹¹

ÒµÎñÏìÓ¦Âý

DataOpsÒª¹¹½¨µÄÊý¾Ý´¦ÀíÁ÷³ÌÊÇÈçÏÂËùʾµÄ£º

´ÓÊý¾ÝÔ´Ö±½Óʵʱ»ñÈ¡Êý¾Ý£¬È»ºó½øÈëÊý¾Ýºþ£¬Í¨¹ýÁ÷ʽÊý¾Ý´¦Àí£¬ÊµÊ±Êý¾Ý²Ö¿â£¬¹æÄ£»¯µÄ×Ô¶¯Êý¾Ý´¦Àí¹ý³ÌµÈ¹¤¾ß¹¹½¨·ÖÎöÊý¾Ý¹ÜÀí±Õ»·£¬×îÖÕÊä³ö¶àÔª»¯µÄÊý¾Ý·þÎñ¡£

ÕâÑùµÄģʽÄܹ»´øÀ´ÈçϵÄÊÕÒæ£º

ʵʱÊý¾ÝÒÆ¶¯

×Ô¶¯»¯µÄÉè¼ÆºÍ´úÂëÉú³É

ÒµÎñ³¡¾°Çý¶¯µÄ¹æÄ£»¯¼¼Êõ¼Ü¹¹

¸ßÏìÓ¦Á¦

ÕâÑùÒÔÀ´£¬DataOpsÖ§³Å×Å´ÓÔ´Êý¾Ýµ½ÒµÎñ¼ÛÖµµÄÕû¸ö¼ÛÖµÁ´ÈçÏÂͼËùʾ£º

ÓÃEckersonµÄWayne EckersonµÄÒ»¾ä»°À´ÐÎÈÝDataOpsµÄ¼ÛÖµ£º

¡° ÿһ¸öÊý¾Ý´¦ÀíÁ´ÖУ¬Êý¾Ý±ØÐëÄܹ»±»¶¨Òå¡¢»ñÈ¡¡¢¸ñʽ»¯¡¢±êÇ©»¯¡¢±»ÑéÖ¤¡¢±»»­Ïñ¡¢±»ÇåÏ´¡¢±»×ª»»£¬±»ºÏ²¢£¬±»¼¯³É£¬°²È«µÄ£¬Ä¿Â¼»¯£¬±»ÖÎÀí£¬±»Òƶ¯£¬±»²éѯ£¬±»¿ÉÊÓ»¯£¬±»·ÖÎöºÍ±»Ö´ÐС£¡±

Õâ¾ÍÊÇÏÖ´ú»¯µÄDataOpsÌåϵÐèÒª¾ß±¸µÄÄÜÁ¦¡£

DataOpsµÄËĸöÄÜÁ¦¹¹³É

DataOps±»Òµ½ç¹«ÈϵķֳÉÁËËĸö¹Ø¼ü¹¹³É£¬»òÕß˵ÊÇÄÜÁ¦½á¹¹¡£

ÈçÏÂͼËùʾ£¬ÔÚAgile£¬DevOpsºÍLeanµÄ¼Ó³ÖÏ£¬DataOps°üÀ¨Êý¾Ý¹¤³Ì¡¢Êý¾Ý¼¯³É¡¢Êý¾Ý°²È«ºÍÒþ˽£¬Êý¾ÝÖÊÁ¿ËĸöÄÜÁ¦¹¹³É£º

Êý¾Ý¹¤³Ì/Data Engineering

DataOpsµÄºËÐÄÊÇÊý¾Ý¹¤³ÌÄÜÁ¦£¬¾ÍÊÇÀûÓÃÈí¼þ¹¤³ÌÀ´´¦ÀíºÍ¼Ó¹¤Êý¾ÝµÄÄÜÁ¦,Ò²¾ÍÊÇ´ÓÊý¾ÝÔ´µ½Êý¾Ý²úÆ·ÖмäµÄ¹ý³Ì£¬¿ÉÒÔÓÃÏÂͼÀ´¼òµ¥±íʾ£º

Ò»°ã°üÀ¨Êý¾ÝÇåÎú£¬Êý¾Ý´¦Àí£¬ÌØÕ÷¹¤³ÌµÈ¹ý³Ì¡£

Êý¾Ý¼¯³É/Data Integration

ÔÚÊý¾Ý´¦Àí¹ý³ÌÖУ¬´¦Àí¶àÑù»¯µÄÊý¾ÝÀ´Ô´£¬ÈÃËûÃÇÄܹ»Ï໥¼¯³É£¬Ï໥²¹³ä£¬ÊÇDataOpsÀïÃæºÜÖØÒªµÄÄÜÁ¦£¬Ö÷Òª°üÀ¨²»Í¬Êý¾ÝԴϵͳ£¬Êý¾ÝÄ£ÐÍ£¬Êý¾Ýƽ̨£¬Êý¾Ý¸ñʽ£¬Êý¾Ý±ê×¼µÈ¶à·½µÄ¼¯³É´¦Àí¹ý³Ì£¬ÈçÏÂͼËùʾ£º

Êý¾Ý°²È«ºÍÒþ˽/Data Security & Privacy

ÔÚDataOpsµÄÈ«¹ý³ÌÖУ¬ÈçºÎÄܹ»Ìṩȫ·½Î»£¬¶Ëµ½¶ËµÄÊý¾Ý°²È«ºÍÒþ˽µÄ¹ÜÀíÖ§³Å£¬ÊǷdz£ÖØÒªµÄºËÐŦÄÜ£¬ËùÒÔÐÐÒµÀïÓÐʱºòÒ²³ÆÆäΪ£ºDataSecOps¡£

Êý¾ÝÖÊÁ¿/Data Quality

Êý¾ÝÖÊÁ¿¹ÜÀíÊÇDataOpsµÄÖØÒª¼ÛÖµºÍÄÜÁ¦£¬ÎÒÃÇÒ»°ãÓÃÏÂÃæµÄ7¸öά¶ÈÀ´¶ÈÁ¿Êý¾ÝµÄÖÊÁ¿£¬Ò»ÖÂÐÔ£¬×¼È·ÐÔ£¬¿É¿¿ÐÔ£¬ÓÐÐòÐÔ£¬Î¨Ò»ÐԺͼ°Ê±ÐÔ£º

https://www.scnsoft.com/blog/guide-to-data-quality-management

³É¹¦DataOpsµÄËĸöÌØÖÊCAUTA

ÉÏͼÊǵäÐ͵ÄÊý¾Ý¼ÛÖµÁ´¹ý³Ì£¬¶øDataOps¾ÍÊÇÖ§³Å×ÅÕû¸öÈ«ÉúÃüÖÜÆÚµÄµ××ù£¬³É¹¦µÄDataOpsÌåϵÓÐËĸöÌØÖÊ£ºCAUTA¡£

³ÖÐø/Continuous

DataOpsÊ×Òª±£Ö¤µÄ¾ÍÊǾ¡¿ÉÄܵijÖÐøÐÔ£¬²»¼ä¶Ï£¬²»ÂÛʲôÑùµÄÇé¿ö³öÏÖ£¬¶¼Äܹ»×ÔÊÊÓ¦µÄ³ÖÐøÈÃData PipelineÁ÷¶¯ÆðÀ´£¬ËùÒÔ³ÖÐøÐÔÊÇDataOpsµÄÊ×ÒªÌØÖÊ¡£

³ÖÐøÐÔ¿ÉÒÔ×ܽáΪÈý¸ö¹Ø¼üµã£º

±£Ö¤µ±Á÷Êý¾ÝºÍÔªÊý¾Ý·¢Éú±ä»¯Ê±Äܹ»³ÖÐø

½»Ò×ϵͳÊý¾ÝÈÕÖ¾Êý¾Ý¶ÔÓÚDataOpsµÄ×îСӰÏì

¶ÔÓÚËùÓеÄԴϵͳºÍÄ¿±êϵͳ¶¼ÓÐÒ»¶¨µÄÓÅ»¯

Ãô½ÝAgilitly

ÔÚ³ÖÐøµÄ»ù´¡ÉÏ£¬DataOpsÐèÒªÒ»¶¨µÄÃô½ÝÐÔ£¬Äܹ»¿ìËÙÏìÓ¦ÍⲿµÄ¸÷Öֱ仯£¬Ö÷Òª´ÓÈý¸ö½Ç¶È£º

Ö§³Ö¶àÖÖ²¿Êðģʽ£¬¹«ÓÐÔÆ£¬Ë½ÓÐÔÆ

×Ô¶¯Ö§³ÖÊý¾ÝºþºÍÊý¾Ý²Ö¿â

Ö§³ÖδÀ´µÄ¼Ü¹¹±ä»¯

ÓÃÏÂͼ¿ÉÒÔ¸üºÃµØÀí½âÒ»¸öºÃµÄDataOpsÌåϵÐèÒªÖ§³ÖµÄËÄÖÖÊý¾Ý²¿Êðģʽ£º

È«Ãæ/Universal

×÷ΪÆóҵȫÓòÊý¾ÝµÄµ××ù£¬DataOpsÒªÈ«ÃæµÄÖ§³ÖËùÓеij¡¾°ºÍÊý¾Ý£¬ÈçÏÂͼËùʾÀý£¬ÁÐʾ³öÁ˳£ÓõÄ30ÖÖÊý¾ÝÔ´ºÍ40ÖÖÄ¿±êÊý¾Ý¡£

¿ÉÒÔ·Ö½âµÄ¸ü¼ÓϸÖ£º

¿ÉÐÅ/Trust

Êý¾ÝµÄ¿ÉÐŰüÀ¨Èý¸ö²ãÃæ£º

Êý¾ÝĿ¼£º±£Ö¤Êý¾Ý×ʲúºÍÓû§²úÉúµÄÊý¾Ý¼¯µÄ¿É·ÃÎÊÐÔ

Êý¾ÝѪԵ£ºÄܹ»ÇåÎúµÄÖªµÀÊý¾Ý´ÓÄÄÀïÀ´µÄ£¬ÊÇÔõô±»¼Ó¹¤ºÍ´¦ÀíµÄ¹ý³Ì

Êý¾ÝÑéÖ¤£ºÈ·±£Ã¿Ò»¸öÔ´Êý¾ÝÔڱ仯µÄʱºòËùÓÐÏà¹ØµÄÊý¾Ý¼¯Ò²±»¸´Öƺ͸üÐÂ

Ö»ÓÐÂú×ãÒÔÉϵÄÈýµãÒªÇ󣬲ÅÄܱ»ÈÏΪÊý¾ÝÊÇ¿ÉÐŵġ£

×Ô¶¯/Automation

×Ô¶¯»¯ÊÇDataOpsµÄÖØÒª»ù´¡ÄÜÁ¦£¬´ÓÊý¾ÝµÄ²úÉú£¬´¦Àíµ½½»¸¶Êý¾Ý²úÆ·ºÍ·þÎñ£¬Õû¸ö¹ý³ÌÒª¾¡¿ÉÄܵÄ×Ô¶¯»¯´¦Àí¡£

µäÐÍDataOpsƽ̨¼Ü¹¹

Ò»¸öµäÐ͵ÄDataOpsƽ̨µÄ¼Ü¹¹ÈçÏÂͼ[4]Ëùʾ£¬°üÀ¨°Ë´ó×é¼þ¹¦ÄÜ£º

https://www.valdas.blog/2019/04/17/data-ops/

ÿһ²¿·Ö¶ÔÓ¦µÄ³£¼û×é¼þºÍ¹¤¾ßÈçÏ£º

Êý¾Ý¹ÜÀíµÄ¹¦ÄÜ

Êý¾Ý»ñÈ¡

ͨ¹ýÅúÁ¿ÈÎÎñ£¬Îļþ´«Ê䣬Á÷ʽ´¦ÀíµÈ¼¼ÊõÊֶλñÈ¡Êý¾Ý¡£³£¼ûµÄÊý¾Ý»ñÈ¡µÄ¹¤¾ßºÍ×é¼þÓÐKafka£¬SQLµÈ¡£

Êý¾Ý´æ´¢

½«»ñÈ¡µÄÊý¾ÝÒÔ²»Í¬µÄÀàÐÍ´æ´¢ÆðÀ´£¬Ö÷ÒªÓйØÏµÐÍÊý¾Ý¿â£¬NOSQLÊý¾Ý¿â£¬ÔÆÊý¾Ý×é¼þµÈ¡£

Êý¾Ý¼¯³É

½«²»Í¬Ô´£¬²»Í¬¸ñʽ£¬²»Í¬ÀàÐ͵ÄÊý¾Ý½øÐд¦Àí´Ó¶ø¼¯³ÉÕûºÏ£¬Ö÷ÒªµÄ¹¤¾ßÓÐAirFlow£¬ETL¹¤¾ßµÈ¡£

Êý¾ÝÖÎÀí

Êý¾ÝÖÎÀíÆ½Ì¨½øÐÐÊý¾ÝµÄ±ê×¼¡¢ÔªÊý¾Ý¹ÜÀí£¬Êý¾ÝѪԵ¹ÜÀí£¬Êý¾Ý·¢ÏÖºÍËÑË÷£¬Êý¾Ý°²È«ºÍȨÏ޵ȹÜÀí¹¦ÄÜ£¬´Ó¶ø±£Ö¤Êý¾ÝµÄÒ»ÖÂÐÔ£¬Ö÷ÒªµÄ¹¤¾ßÓÐAtlas£¬Talend£¬InformaticaµÈ

Êý¾Ý·ÖÎö

³£¼ûµÄÊý¾Ý·ÖÎö¹¤¾ßºÜ¶à£¬±ÈÈçPowerBI£¬H2OµÈ¡£

Êý¾Ý¿ª·¢µÄ¹¦ÄÜ

Э×÷

DataOpsµÄÄ¿±êÖ®Ò»¾ÍÊǹ¹½¨Ò»¸öÀ­Í¨¶Ëµ½¶ËµÄÊý¾Ý¿ª·¢¼ÛÖµÁ´£¬ËùÒÔ¹¹½¨Ò»¸ö¸ßЧ£¬·Ö²¼Ê½µÄЭ×÷ÌåϵÊÇDataOpsºÜÖØÒªµÄ×é¼þÄ£¿é¡£µ±È»£¬ÕâÀïµÄЭ×÷¹µÍ¨¹¤¾ßºÍDevOpsËùʹÓõĺܶ඼ÊÇÀàËÆµÄ£¬ÈçSlack£¬JiraµÈ¡£

¿ª·¢

Êý¾Ý¿ª·Åƽ̨»áÓкܶ࣬һ¸öºÃµÄDataOpsƽ̨ÐèÒªÄܹ»ÎÞ·ìµÄ¼¯³ÉÕâЩ¿ª·¢»·¾³£¬ÔÚ²»Í¬µÄ¿ª·¢»·¾³Ö®¼ä¿ìËٵļ¯³ÉºÍÀ­Í¨¡£

²¿Êð

×÷ΪDataOpsÌåϵÀ´Ëµ£¬³ÖÐø²¿ÊðÊǺÜÖØÒªµÄ»ù´¡ÄÜÁ¦£¬Äܹ»¼æÈݺܶàµ×²ãµÄÈÝÆ÷ºÍ²¿Ê𹤾ߣ¬±ÈÈçKubernate£¬JenkinsµÈ

񅏏

½«Êý¾Ý·þÎñºÍ´¦Àí½Úµã½øÐÐÁé»îµÄ±àÅÅ£¬ÐγÉеÄÊý¾Ý´¦ÀíÁ´£¬³£ÓõŤ¾ßÓÐPuppetºÍAirflowµÈ¡£

²âÊÔºÍ¼à¿Ø

×Ô¶¯»¯²âÊÔºÍ¼à¿ØµÄ×é¼þÊDZ£Ö¤Êý¾Ý´¦ÀíÁ´ÖÊÁ¿µÄ»ù´¡±£ÕÏ£¬³£ÓõÄÓÐStack£¬DataDogµÈ¡£

´ÓDataOpsµ½MLOps

ÔÚDataOpsÔÚ²»¶ÏÊÕµ½¹Ø×¢µÄͬʱ£¬Machine Learning OpsÒ²ÔÚ²»¶ÏáÈÆð£¬ÄÇôDataOpsºÍMLOpsµÄ¹ØÏµÊÇÊ²Ã´ÄØ£¿

DataOpsµÄµÄÔ´Í·ÊÇÊý¾ÝԴϵͳ£¬ÖÕµãÊÇÊý¾Ý²úÆ·ºÍ·þÎñ£¬¶øMachine LearningµÄ²úÆ·Ò²ÊÇÊý¾Ý·þÎñºÍ²úÆ·µÄÒ»ÖÖ£¬ËùÒÔ´ÓÕâ¸ö½Ç¶ÈÀ´½²£¬DataOpsÊDZÈMLOps·¶Î§¸ü¹ãµÄ¡£

ÎÒ¾õµÃÏÂͼ[5]ÊDZȽÏÇåÎúµÄչʾÁËDataOpsºÍMLOpsÖ®¼äµÄ¹ØÏµ£º

https://www.linkedin.com/pulse/get-rhythm-data-science-initiatives-dataops-mlops-ash-hassan/

¿ÉÒÔ×ܽáΪÈçϼ¸µã£º

DataOps±ÈMLOps¼ÛÖµÁ´¸ü³¤

DataOps¶Ëµ½¶Ë¹ÜÀí´ÓÊý¾ÝÔ´µ½Êý¾Ý²úÆ·µÄÈ«¹ý³Ì£¬¶øMLOpsÔòÊÇ´ÓÄ£ÐÍѵÁ·¿ªÊ¼µ½Ä£ÐÍÉÏÏß½áÊø¡£

DataOpsÊÇMLOpsµÄ»ù´¡ÄÜÁ¦

MLOpsÖ÷Òªº­¸ÇµÄ¹ý³ÌÈçÏÂͼ[6]Ëùʾ£º

https://www.iguazio.com/blog/mlops-challenges-solutions-future-trends/

MLOpsÊÇ·þÎñÓÚ»úÆ÷ѧϰϵͳµÄ£¬¶ø»úÆ÷ѧϰϵͳÓëÒ»°ãÈí¼þϵͳÓÐÈçϲîÒì[7]£º

ÍŶӼ¼ÄÜ£º

ÔÚ»úÆ÷ѧϰÏîÄ¿ÖУ¬ÍŶÓͨ³£°üÀ¨Êý¾Ý¿ÆÑ§¼Ò»ò»úÆ÷ѧϰÑо¿ÈËÔ±£¬ËûÃÇÖ÷Òª¸ºÔð½øÐÐ̽Ë÷ÐÔÊý¾Ý·ÖÎö¡¢Ä£ÐÍ¿ª·¢ºÍʵÑé¡£ÕâЩ³ÉÔ±¿ÉÄܲ»ÊǾ­Ñé·á¸»µÄ¡¢Äܹ»¹¹½¨Éú²ú¼¶·þÎñµÄÈí¼þ¹¤³Ìʦ¡£

¿ª·¢£º

»úÆ÷ѧϰÔÚ±¾ÖÊÉϾßÓÐʵÑéÐÔ¡£ÄúÓ¦¸Ã³¢ÊÔ²»Í¬µÄÌØÕ÷¡¢Ëã·¨¡¢½¨Ä£¼¼ÊõºÍ²ÎÊýÅäÖã¬ÒԱ㾡¿ìÕÒµ½ÎÊÌâµÄ×î¼Ñ½â¾ö·½°¸¡£ÄúËùÃæÁÙµÄÌôÕ½ÔÚÓÚ¸ú×ÙÄÄЩ·½°¸ÓÐЧ¡¢ÄÄЩ·½°¸ÎÞЧ£¬²¢ÔÚ×î´ó³Ì¶ÈÌá¸ß´úÂëÖØ¸´Ê¹ÓÃÂʵÄͬʱά³Ö¿ÉÖØÏÖÐÔ¡£

²âÊÔ£º

²âÊÔ»úÆ÷ѧϰϵͳ±È²âÊÔÆäËûÈí¼þϵͳ¸ü¸´ÔÓ¡£³ýÁ˵äÐ͵ĵ¥Ôª²âÊԺͼ¯³É²âÊÔÖ®Í⣬Äú»¹ÐèÒªÑéÖ¤Êý¾Ý¡¢ÆÀ¹À¾­¹ýѵÁ·µÄÄ£ÐÍÖÊÁ¿ÒÔ¼°Ñé֤ģÐÍ¡£

²¿Êð£º

ÔÚ»úÆ÷ѧϰϵͳÖУ¬²¿Êð²»Êǽ«ÀëÏßѵÁ·µÄ»úÆ÷ѧϰģÐͲ¿ÊðΪԤ²â·þÎñÄÇÑù¼òµ¥¡£»úÆ÷ѧϰϵͳ¿ÉÄÜ»áÒªÇóÄú²¿Êð¶à²½ÖèÁ÷Ë®ÏßÒÔ×Ô¶¯ÖØÐÂѵÁ·ºÍ²¿ÊðÄ£ÐÍ¡£´ËÁ÷Ë®Ïß»áÔö¼Ó¸´ÔÓÐÔ£¬²¢ÒªÇóÄú×Ô¶¯Ö´Ðв¿Êð֮ǰÓÉÊý¾Ý¿ÆÑ§¼ÒÊÖ¶¯Ö´ÐеIJ½Ö裬ÒÔѵÁ·ºÍÑéÖ¤ÐÂÄ£ÐÍ¡£

Éú²ú£º

»úÆ÷ѧϰģÐ͵ÄÐÔÄÜ¿ÉÄÜ»áϽµ£¬²»½öÊÇÒòΪ±àÂë²»ÀíÏ룬¶øÇÒÒ²ÒòΪÊý¾Ý×ÊÁÏÔÚ²»¶ÏÑݱ䡣»»¾ä»°Ëµ£¬Ó봫ͳµÄÈí¼þϵͳÏà±È£¬Ä£ÐÍ¿ÉÄÜ»áͨ¹ý¸ü¶à·½Ê½Ë¥ÍË£¬¶øÄúÐèÒª¿¼ÂÇÕâÖÖ½µ¼¶ÏÖÏó¡£Òò´Ë£¬ÄúÐèÒª¸ú×ÙÊý¾ÝµÄժҪͳ¼ÆÐÅÏ¢²¢¼à¿ØÄ£Ð͵ÄÔÚÏßÐÔÄÜ£¬ÒÔ±ãϵͳÔÚÖµÓëÔ¤ÆÚ²»·ûʱ·¢ËÍ֪ͨ»ò»Ø¹ö¡£

»úÆ÷ѧϰºÍÆäËûÈí¼þϵͳÔÚÔ´´úÂë¿ØÖÆµÄ³ÖÐø¼¯³É¡¢µ¥Ôª²âÊÔ¡¢¼¯³É²âÊÔÒÔ¼°Èí¼þÄ£¿é»òÈí¼þ°üµÄ³ÖÐø½»¸¶·½ÃæÀàËÆ¡£

µ«ÊÇ£¬ÔÚ»úÆ÷ѧϰÖУ¬ÓÐһЩÏÔÖøµÄ²îÒ죺

CI ²»ÔÙ½ö½ö²âÊÔºÍÑéÖ¤´úÂë¼°×é¼þ£¬¶øÇÒ»¹»á²âÊÔºÍÑéÖ¤Êý¾Ý¡¢Êý¾Ý¼Ü¹¹ºÍÄ£ÐÍ¡£

CD ²»ÔÙÕë¶Ôµ¥¸öÈí¼þ°ü»ò·þÎñ£¬¶ø»áÕë¶ÔÓ¦×Ô¶¯²¿ÊðÆäËû·þÎñ£¨Ä£ÐÍÔ¤²â·þÎñ£©µÄϵͳ£¨»úÆ÷ѧϰѵÁ·Á÷Ë®Ïߣ©¡£

CT ÊÇ»úÆ÷Ñ§Ï°ÏµÍ³ÌØÓеÄÒ»¸öÐÂÊôÐÔ£¬ËüÖ÷񻃾¼°×Ô¶¯ÖØÐÂѵÁ·ºÍÌṩģÐÍ¡£

ÏÂͼÊÇÒ»¸öµäÐ͵Ä×Ô¶¯»¯»úÆ÷ѧϰµÄʾÒâͼ

Õâ²»ÊDZ¾ÎĵÄÖØµã£¬ÕâÀï¾Í²»×¸ÊöÁË¡£

×ܶøÑÔÖ®£¬MLOpsÊÇDataOpsÖкÜÖØÒªµÄÒ»²¿·Ö£¬ÊÇDataOpsÍŶӱØÐë¹¹½¨µÄÄÜÁ¦£¬Ò²ÊÇÖ§³ÅÊý¾ÝºÍÖÇÄÜÏîÄ¿µÄ±Ø±¸»ù´¡£¬DataOpsÒѾ­±»ÐÐÒµÈÏΪÊÇÊý¾ÝºÍÖÇÄÜÁìÓòµÄÖ÷ÒªÇ÷ÊÆ[8]¡£

 

   
2135 ´Îä¯ÀÀ       27
Ïà¹ØÎÄÕÂ

»ùÓÚEAµÄÊý¾Ý¿â½¨Ä£
Êý¾ÝÁ÷½¨Ä££¨EAÖ¸ÄÏ£©
¡°Êý¾Ýºþ¡±£º¸ÅÄî¡¢ÌØÕ÷¡¢¼Ü¹¹Óë°¸Àý
ÔÚÏßÉ̳ÇÊý¾Ý¿âϵͳÉè¼Æ ˼·+Ч¹û
 
Ïà¹ØÎĵµ

GreenplumÊý¾Ý¿â»ù´¡Åàѵ
MySQL5.1ÐÔÄÜÓÅ»¯·½°¸
ijµçÉÌÊý¾ÝÖÐ̨¼Ü¹¹Êµ¼ù
MySQL¸ßÀ©Õ¹¼Ü¹¹Éè¼Æ
Ïà¹Ø¿Î³Ì

Êý¾ÝÖÎÀí¡¢Êý¾Ý¼Ü¹¹¼°Êý¾Ý±ê×¼
MongoDBʵս¿Î³Ì
²¢·¢¡¢´óÈÝÁ¿¡¢¸ßÐÔÄÜÊý¾Ý¿âÉè¼ÆÓëÓÅ»¯
PostgreSQLÊý¾Ý¿âʵսÅàѵ
×îл¼Æ»®
DeepSeekÔÚÈí¼þ²âÊÔÓ¦ÓÃʵ¼ù 4-12[ÔÚÏß]
DeepSeek´óÄ£ÐÍÓ¦Óÿª·¢Êµ¼ù 4-19[ÔÚÏß]
UAF¼Ü¹¹ÌåϵÓëʵ¼ù 4-11[±±¾©]
AIÖÇÄÜ»¯Èí¼þ²âÊÔ·½·¨Óëʵ¼ù 5-23[ÉϺ£]
»ùÓÚ UML ºÍEA½øÐзÖÎöÉè¼Æ 4-26[±±¾©]
ÒµÎñ¼Ü¹¹Éè¼ÆÓ뽨ģ 4-18[±±¾©]
 
×îÐÂÎÄÕÂ
InfluxDB¸ÅÄîºÍ»ù±¾²Ù×÷
InfluxDB TSM´æ´¢ÒýÇæÖ®Êý¾ÝдÈë
Éî¶ÈÂþ̸Êý¾Ýϵͳ¼Ü¹¹¡ª¡ªLambda architecture
Lambda¼Ü¹¹Êµ¼ù
InfluxDB TSM´æ´¢ÒýÇæÖ®Êý¾Ý¶ÁÈ¡
×îпγÌ
OracleÊý¾Ý¿âÐÔÄÜÓÅ»¯¡¢¼Ü¹¹Éè¼ÆºÍÔËÐÐά»¤
²¢·¢¡¢´óÈÝÁ¿¡¢¸ßÐÔÄÜÊý¾Ý¿âÉè¼ÆÓëÓÅ»¯
NoSQLÊý¾Ý¿â£¨Ô­Àí¡¢Ó¦Óá¢×î¼Ñʵ¼ù£©
ÆóÒµ¼¶Hadoop´óÊý¾Ý´¦Àí×î¼Ñʵ¼ù
OracleÊý¾Ý¿âÐÔÄÜÓÅ»¯×î¼Ñʵ¼ù
³É¹¦°¸Àý
ij½ðÈÚ¹«Ë¾ Mysql¼¯ÈºÓëÐÔÄÜÓÅ»¯
±±¾© ²¢·¢¡¢´óÈÝÁ¿¡¢¸ßÐÔÄÜÊý¾Ý¿âÉè¼ÆÓëÓÅ»¯
ÖªÃûijÐÅϢͨÐŹ«Ë¾ NoSQL»º´æÊý¾Ý¿â¼¼Êõ
±±¾© oracleÊý¾Ý¿âSQLÓÅ»¯
ÖйúÒÆ¶¯ IaaSÔÆÆ½Ì¨-Ö÷Á÷Êý¾Ý¿â¼°´æ´¢¼¼Êõ