±à¼ÍƼö: |
±¾ÎÄÖ÷Òª½éÉÜÁËÔªÊý¾Ý¹ÜÀíÃæÁÙµÄÌôÕ½¡¢ÔÆÔÉúÊý¾ÝºþµÄÔªÊý¾Ý¹ÜÀí¼Ü¹¹¡¢ÔªÊý¾Ý¹ÜÀíºËÐļ¼Êõ½âÎö¼°ÔÆÔÉúÊý¾Ýºþ×î¼Ñʵ¼ù¡£Ï£ÍûÄܹ»¶Ô´ó¼ÒÓÐËùÆô·¢ºÍ°ïÖú¡£
±¾ÎÄÀ´×ÔÓÚÖªºõ£¬ÓÉ»ðÁú¹ûÈí¼þLinda±à¼¡¢ÍƼö¡£ |
|
±³¾°
Êý¾Ýºþµ±Ç°ÔÚ¹úÄÚÍâÊDZȽÏÈȵķ½°¸£¬MarketsandMarketsÊг¡µ÷ÑÐÏÔʾԤ¼ÆÊý¾ÝºþÊг¡¹æÄ£ÔÚ2024Äê»á´Ó2019ÄêµÄ79ÒÚÃÀ½ðÔö³¤µ½201ÒÚÃÀ½ð¡£Ò»Ð©ÆóÒµÒѾ¹¹½¨ÁË×Ô¼ºµÄÔÆÔÉúÊý¾Ýºþ·½°¸£¬ÓÐЧ½â¾öÁËÒµÎñÍ´µã£»»¹ÓкܶàÆóÒµÔÚ¹¹½¨»òÕ߼ƻ®¹¹½¨×Ô¼ºµÄÊý¾Ýºþ£¬Gartner
2020Äê·¢²¼µÄ±¨¸æÏÔʾĿǰÒѾÓÐ39%µÄÓû§ÔÚʹÓÃÊý¾Ýºþ£¬34%µÄÓû§¿¼ÂÇÔÚ1ÄêÄÚʹÓÃÊý¾Ýºþ¡£Ëæ×ŶÔÏó´æ´¢µÈÔÆÔÉú´æ´¢¼¼ÊõµÄ³ÉÊ죬һ¿ªÊ¼´ó¼Ò»áÏȰѽṹ»¯¡¢°ë½á¹¹»¯¡¢Í¼Æ¬¡¢ÊÓÆµµÈÊý¾Ý´æ´¢ÔÚ¶ÔÏó´æ´¢ÖС£µ±ÐèÒª¶ÔÕâЩÊý¾Ý½øÐзÖÎöʱ£¬·¢ÏÖȱÉÙÃæÏò·ÖÎöµÄÊý¾Ý¹ÜÀíÊÓͼ£¬ÔÚÕâÑùµÄ±³¾°ÏÂÒµ½çÔÚÃæÏòÔÆÔÉúÊý¾ÝºþµÄÔªÊý¾Ý¹ÜÀí¼¼Êõ½øÐÐÁ˹㷺µÄ̽Ë÷ºÍÂ䵨¡£
Ò»¡¢ÔªÊý¾Ý¹ÜÀíÃæÁÙµÄÌôÕ½
1¡¢Ê²Ã´ÊÇÊý¾Ýºþ
WikipediaÉÏ˵Êý¾ÝºþÊÇÒ»Àà´æ´¢Êý¾Ý×ÔÈ»/Ôʼ¸ñʽµÄϵͳ»ò´æ´¢£¬Í¨³£ÊǶÔÏó¿é»òÕßÎļþ£¬°üÀ¨ÔʼϵͳËù²úÉúµÄÔʼÊý¾Ý¿½±´ÒÔ¼°ÎªÁ˸÷ÀàÈÎÎñ¶ø²úÉúµÄת»»Êý¾Ý£¬°üÀ¨À´×ÔÓÚ¹ØÏµÐÍÊý¾Ý¿âÖеĽṹ»¯Êý¾Ý£¨ÐкÍÁУ©¡¢°ë½á¹¹»¯Êý¾Ý£¨ÈçCSV¡¢ÈÕÖ¾¡¢XML¡¢JSON£©¡¢·Ç½á¹¹»¯Êý¾Ý£¨Èçemail¡¢Îĵµ¡¢PDF¡¢Í¼Ïñ¡¢ÒôƵ¡¢ÊÓÆµ£©¡£
´ÓÉÏÃæ¿ÉÒÔ×ܽá³öÊý¾Ýºþ¾ßÓÐÒÔÏÂÌØÐÔ£º
Êý¾ÝÀ´Ô´£ºÔʼÊý¾Ý¡¢×ª»»Êý¾Ý
Êý¾ÝÀàÐÍ£º½á¹¹»¯Êý¾Ý¡¢°ë½á¹¹»¯Êý¾Ý¡¢·Ç½á¹¹»¯Êý¾Ý¡¢¶þ½øÖÆ
Êý¾Ýºþ´æ´¢£º¿ÉÀ©Õ¹µÄº£Á¿Êý¾Ý´æ´¢·þÎñ
2¡¢Êý¾Ýºþ·ÖÎö·½°¸¼Ü¹¹
µ±Êý¾ÝºþÖ»ÊÇ×÷Ϊ´æ´¢µÄʱºò¼Ü¹¹¼Ü¹¹±È½ÏÇåÎú£¬ÔÚ»ùÓÚÊý¾Ýºþ´æ´¢¹¹½¨·ÖÎöƽ̨¹ý³ÌÖУ¬Òµ½ç½øÐÐÁË´óÁ¿µÄʵ¼ù£¬»ù±¾µÄ¼Ü¹¹ÈçÏ£º

Ö÷Òª°üÀ¨Îå¸öÄ£¿é£º
Êý¾ÝÔ´£ºÔʼÊý¾Ý´æ´¢Ä£¿é£¬°üÀ¨½á¹¹»¯Êý¾Ý(DatabaseµÈ)¡¢°ë½á¹¹»¯(File¡¢ÈÕÖ¾µÈ)¡¢·Ç½á¹¹»¯(ÒôÊÓÆµµÈ)
Êý¾Ý¼¯³É£ºÎªÁ˽«Êý¾Ýͳһµ½Êý¾Ýºþ´æ´¢¼°¹ÜÀí£¬Ä¿Ç°Êý¾Ý¼¯³ÉÖ÷Òª·ÖΪÈýÖÖÐÎ̬¡£µÚÒ»ÖÖΪֱ½Óͨ¹ýÍâ±íµÄ·½Ê½¹ØÁªÔªÊý¾Ý£»µÚ¶þÖÖΪ»ùÓÚETL¡¢¼¯³É¹¤¾ß¡¢Á÷ʽдÈëģʽ£¬ÕâÖÖ·½Ê½Ö±½Ó´¦ÀíÊý¾ÝÄܹ»¸ÐÖªSchema£¬ÔÚдÈëÊý¾ÝµÄ¹ý³ÌÖÐͬʱ´´½¨ÔªÊý¾Ý£»µÚÈýÖÖΪÎļþÖ±½ÓÉÏ´«Êý¾Ýºþ´æ´¢£¬ÐèҪʺóÒì²½¹¹½¨ÔªÊý¾Ý
Êý¾Ýºþ´æ´¢£ºÄ¿Ç°Òµ½çÖ÷ҪʹÓöÔÏó´æ´¢ÒÔ¼°×Ô½¨HDFS¼¯Èº
ÔªÊý¾Ý¹ÜÀí£ºÔªÊý¾Ý¹ÜÀí£¬×÷ΪÁ¬½ÓÊý¾Ý¼¯³É¡¢´æ´¢ºÍ·ÖÎöÒýÇæµÄ×ÜÏß
Êý¾Ý·ÖÎöÒýÇæ£ºÄ¿Ç°ÓзḻµÄ·ÖÎöÒýÇæ£¬±ÈÈçSpark¡¢Hadoop¡¢PrestoµÈ£¬ËûÃÇͨ³£Í¨¹ý¶Ô½ÓÔªÊý¾ÝÀ´»ñµÃÊý¾ÝµÄSchema¼°Â·¾¶£»Í¬Ê±±ÈÈçSparkÒ²Ö§³ÖÖ±½Ó·ÖÎö´æ´¢Â·¾¶£¬ÔÚ·ÖÎö¹ý³ÌÖнøÐÐÔªÊý¾ÝµÄÍÆ¶Ï
ÎÒÃÇ¿ÉÒÔ¿´µ½ÔªÊý¾Ý¹ÜÀíÊÇÊý¾Ýºþ·ÖÎöƽ̨¼Ü¹¹µÄ×ÜÏߣ¬ÃæÏòÊý¾ÝÉú̬Ҫ֧³Ö·á¸»µÄÊý¾Ý¼¯³É¹¤¾ß¶Ô½Ó£¬ÃæÏòÊý¾Ýºþ´æ´¢Òª½øÐÐÍêÉÆµÄÊý¾Ý¹ÜÀí£¬ÃæÏò·ÖÎöÒýÇæÒªÄܹ»Ìṩ¿É¿¿µÄÔªÊý¾Ý·þÎñ¡£
3¡¢ÔªÊý¾Ý¹ÜÀíÃæÁÙµÄÌôÕ½
ÔªÊý¾Ý¹ÜÀíÈç´ËÖØÒª£¬µ«Êǵ±Ç°¿ªÔ´µÄ·½°¸²»¹»³ÉÊ죬¾³£»áÌýµ½´ó¼Ò¹ØÓÚÔªÊý¾Ý¹ÜÀíÏà¹ØµÄÌÖÂÛ£¬±ÈÈ磺
ÓÐ10À´¸öÊý¾Ý´æ´¢ÏµÍ³£¬Ã¿ÖÖ¶¼È¥¶Ô½ÓÊÊÅ䣬ÿ´Î¶¼ÒªÅäÖÃÕËÃÜ¡¢Â·¾¶£¬ÕæÂé·³£¬ÓÐûÓÐͳһµÄÊÓͼ£¿
Ò»¸öÓÐ200¸ö×ֶεÄCSVÎļþ£¬ÊÖ¶¯Ð´³ö200¸ö×ֶεÄDDLÕæµÄºÃÀÛ£¿JSONÌí¼ÓÁË×Ö¶Îÿ´Î¶¼ÐèÒªÊÖ¶¯´¦ÀíÏÂÂð£¿
ÎÒµÄÒµÎñÊý¾Ý£¬ÊÇ·ñÓб»ÆäËûͬѧɾ¿âÅÜ·µÄ·çÏÕ£¿
·ÖÇøÌ«¶àÁË£¬Ã¿´Î·ÖÎöÔÚ¶ÁÈ¡·ÖÇøÉϾÓȻռÓÃÁËÄÇô¶àʱ¼ä£¿
.....
4¡¢Òµ½çÊý¾ÝºþÔªÊý¾Ý¹ÜÀíÏÖ×´
ÉÏÃæÕâЩÊÇ´ó¼ÒÔÚ¶ÔÊý¾Ýºþ½øÐйÜÀí·ÖÎöʱÓöµ½µÄµäÐÍÎÊÌâ¡£ÕâЩÎÊÌâÆäʵ¶¼¿ÉÒÔͨ¹ýÍêÉÆµÄÔªÊý¾Ý¹ÜÀíϵͳÀ´½â¾ö£¬´ÓÔªÊý¾Ý¹ÜÀíµÄÊӽǿÉÒÔ×ܽáΪ£º
ÈçºÎ¹¹½¨Êý¾ÝµÄͳһ¹ÜÀíÊÓͼ£ºÃæÏò¶àÖÖÊý¾ÝÔ´ÐèÒªÓÐÒ»Ì×ͳһµÄÊý¾Ý¹ÜÀíÄ£ÐÍ£¬±ÈÈçͨ¹ýJDBCÁ¬½ÓÊý¾Ý¿â¡¢Í¨¹ýÔÆÕ˺ÅÊÚȨ¹ÜÀí¶ÔÏó´æ´¢Îļþ¡¢Ò»Ì×Serde¹ÜÀí´¦Àí²»Í¬µÄÊý¾Ý¸ñʽ´¦Àí·½Ê½µÈ¡£
ÈçºÎ¹¹½¨¶à×â»§µÄȨÏÞ¹ÜÀí£ºÈç¹ûÈ«ÓòÊý¾Ý¶¼Ê¹ÓÃÊý¾Ýºþ·½°¸¹ÜÀí£¬ÆóÒµ¶à²¿ÃÅÑз¢ÈËÔ±¹²Í¬Ê¹ÓÃÊý¾ÝºþÍÚ¾ò¼ÛÖµ£¬µ«ÊÇȱÉÙÓÐЧµÄÊý¾Ý×â»§¼°È¨ÏÞ¸ôÀ룬»á²úÉúÊý¾Ý·çÏÕ£»
ÈçºÎ×Ô¶¯»¯µÄ¹¹½¨ÔªÊý¾Ý£ºÍ¨¹ýETLģʽµÄÊý¾Ý¼¯³É¹¤¾ßдÈëÊý¾Ýºþ´æ´¢Ê±£¬¶ÔÓ¦¹¤¾ßÖªµÀÊý¾ÝSchema¿ÉÒÔÖ÷¶¯½¨ÔªÊý¾Ý£¬ÕâÑù¾ÍÐèÒªÔªÊý¾Ý·þÎñÓÐÍêÉÆµÄ¿ª·Å½Ó¿Ú¡£µ«ÊÇÔÚijЩ³¡¾°Êý¾ÝÎļþÖ±½ÓÉÏ´«µ½OSS´æ´¢£¬ÇÒÎļþÁ¿¾Þ´ó¡¢Êý¾Ý¶¯Ì¬Ôö³¤±ä»¯£»ÕâÖÖÇé¿öÐèÒªÓÐÒ»Ì×±»¶¯ÍƶÏÌáȡԪÊý¾ÝµÄ·þÎñ£¬×öµ½Schema¸ÐÖªÒÔ¼°ÔöÁ¿Ê¶±ð¡£
ÈçºÎÌá¹©ÃæÏò·ÖÎöµÄÓÅ»¯ÄÜÁ¦£º±ÈÈ纣Á¿·ÖÇøµÄ¸ßЧ¼ÓÔØµÈ¡£
Õë¶ÔÕâЩÎÊÌâÒµ½çÔÚ×öÁË´óÁ¿µÄ̽Ë÷ºÍʵ¼ù£º
Hive Metastore£ºÔÚHadoopÉú̬ΪÁ˹¹½¨Í³Ò»µÄ¹ÜÀíÊÓͼ£¬Óû§»áÔÚ×Ô¼ºµÄHadoop¼¯Èº´î½¨HMS·þÎñ¡£
AWS Glue Meta£ºÌṩ¶à×â»§µÄͳһÊý¾ÝºþÔªÊý¾Ý¹ÜÀí·þÎñ£¬ÅäÌ×ServerlessµÄÔªÊý¾ÝÅÀÈ¡¼¼ÊõÉú³ÉÔªÊý¾Ý¡£Ïà¹Ø¹¦ÄÜÊÕ·Ñ¡£
Aliyun DLA Meta: Meta¼æÈÝHive Metastore£¬Ö§³ÖÔÆÉÏ15+ÖÖÊý¾ÝÊý¾ÝÔ´£¨OSS¡¢HDFS¡¢DB¡¢DW£©µÄͳһÊÓͼ£¬Ìṩ¿ª·ÅµÄÔªÊý¾Ý·ÃÎÊ·þÎñ£¬ÒýÈë¶à×â»§¡¢ÔªÊý¾Ý·¢ÏÖ¡¢¶Ô½ÓHUDIµÈÄÜÁ¦¡£DLA
Meta×·Çó±ß¼Ê³É±¾Îª0£¬Ãâ·ÑÌṩʹÓá£ÏÂÃæÒ²½«Öصã½éÉÜDLA MetaµÄÏà¹Ø¼¼ÊõʵÏÖ¡£
¶þ¡¢ÔÆÔÉúÊý¾ÝºþµÄÔªÊý¾Ý¹ÜÀí¼Ü¹¹
ΪÁ˽â¾öÉÏÃæÕâЩÌôÕ½£¬°¢ÀïÔÆÔÆÔÉúÊý¾Ýºþ·ÖÎö·þÎñDLAµÄÔªÊý¾Ý¹ÜÀí£¬Ö§³ÖͳһµÄ¶à×â»§ÔªÊý¾Ý¹ÜÀíÊÓͼ£»Êý¾ÝÄ£ÐͼæÈÝHive
Metastore£»Ìṩ°¢ÀïÔÆOpenAPI¡¢Client¡¢JDBCÈýÖÖ¿ª·Åģʽ£»Í¬Ê±ÌṩԪÊý¾Ý×Ô¶¯·¢ÏÖ·þÎñÒ»¼üÒì²½¹¹½¨ÔªÊý¾Ý¡£ÏÂÃæÊǸ÷¸öÄ£¿éµÄ½éÉÜ£º

ͳһԪÊý¾ÝÊÓͼ£ºÖ§³Ö15+ÖÐÊý¾ÝÔ´£¬OSS¡¢HDFS¡¢DB¡¢DWµÈ£»²¢¼æÈÝHive MetastoreµÄÊý¾ÝÄ£ÐÍ£¬±ÈÈçSchema¡¢View¡¢UDF¡¢Table¡¢Partition¡¢SerdeµÈ£¬ÓѺöԽÓSpark¡¢Hadoop¡¢HudiµÈÉú̬£»
·á¸»µÄ¿ª·Åģʽ£ºÖ§³Ö°¢ÀïÔÆOpenAPi¡¢Client¡¢JDBCÈýÖÖ½Ó¿Ú¿ª·Åģʽ£¬·½±ãÉú̬¹¤¾ß¼°ÒµÎñ¼¯³ÉDLA
Meta£¬±ÈÈç¿ÉÒÔ¿ª·¢SqoopÔªÊý¾Ý²å¼þ¶Ô½ÓOpenAPI£¬Í¬²½Êý¾Ýʱ¹¹½¨ÔªÊý¾Ý£»Ä¿Ç°¿ªÔ´Apache
HudiÖ§³Öͨ¹ýJDBC·½Ê½¶Ô½ÓDLA Meta£»DLAÄÚÖõÄServerless Spark¡¢Presto¡¢HudiÖ§³Öͨ¹ýClientģʽ¶Ô½ÓDLA
Meta£»
Ö§³Ö¶à×â»§¼°È¨ÏÞ¿ØÖÆ£º»ùÓÚUIDµÄ¶à×â»§»úÖÆ½øÐÐȨÏ޵ĸôÀ룬ͨ¹ýGRANT&REVOKE½øÐÐÕ˺żäµÄȨÏÞ¹ÜÀí¡£
Ö§³ÖˮƽÀ©Õ¹£ºÎªÁËÂú×㺣Á¿ÔªÊý¾ÝµÄ¹ÜÀí£¬·þÎñ±¾ÉíÊÇ¿ÉÒÔˮƽÀ©Õ¹£¬Í¬Ê±µ×²ãʹÓÃRDS&PolarDBµÄ¿â±í²ð·Ö¼¼Êõ£¬Ö§³Ö´æ´¢µÄÀ©Õ¹¡£
ÔªÊý¾Ý·¢ÏÖ·þÎñ£ºµ±Êý¾ÝÈëºþʱûÓйØÁªÔªÊý¾Ý£¬¿ÉÒÔͨ¹ýÔªÊý¾Ý·¢ÏÖ·þÎñÒ»¼ü×Ô¶¯¹ØÁªÔªÊý¾Ý¡£
¿ÉÒÔ¿´³öÔÚ¶Ô½Ó¶àÖÖÊý¾ÝÔ´ÒÔ¼°Êý¾Ý¼¯³É·½Ê½·½ÃæÌṩÁËÓѺõĿª·ÅÐÔ£¬Ä¿Ç°Apache HudiÔÉú¶Ô½ÓÁËDLA
Meta£»ÔÚ·ÖÎöÉú̬·½ÃæÖ§³ÖÒµ½çͨÓõÄÊý¾ÝÄ£Ðͱê×¼(Hive Metastore)£»Í¬Ê±·þÎñ±¾Éí¾ß±¸¶à×â»§¡¢¿ÉÀ©Õ¹µÄÄÜÁ¦Âú×ãÆóÒµ¼¶µÄÐèÇó¡£
Èý¡¢ÔªÊý¾Ý¹ÜÀíºËÐļ¼Êõ½âÎö
ÏÂÃæÖ÷Òª½éÉÜDLA Meta¹ØÓÚÔªÊý¾Ý¶à×â»§¡¢ÔªÊý¾Ý·¢ÏÖ¡¢º£Á¿·ÖÇø¹ÜÀíÈý·½ÃæµÄ¼¼Êõʵ¼ù£¬Õ⼸¿éÒ²ÊÇĿǰҵ½çºËÐĹØ×¢ºÍ̽Ë÷µÄÎÊÌâ¡£
1¡¢ÔªÊý¾Ý¶à×â»§¹ÜÀí
ÔÚ´óÊý¾ÝÌåϵÖУ¬Ê¹ÓÃHive MetaStore £¨ÏÂÃæ¼ò³ÆHMS£©×÷ΪԪÊý¾Ý·þÎñÊǷdz£ÆÕ±éµÄʹÓ÷½·¨¡£DLA
×÷Ϊ¶à×â»§µÄ²úÆ·£¬ÆäÖÐÒ»¸ö±È½ÏÖØÒªµÄ¹¦ÄܾÍÊÇÐèÒª¶Ô²»Í¬Óû§µÄÔªÊý¾Ý½øÐиôÀ룬¶øÇÒÐèÒªÓµÓÐÍêÕûµÄȨÏÞÌåϵ£»HMS
±¾ÉíÊDz»Ö§³Ö¶à×â»§ºÍȨÏÞÌåϵ¡£°¢ÀïÔÆDLA ÖØÐ´ÁËÒ»Ì×Meta ·þÎñ£¬ÆäºËÐÄÄ¿±êÊǼæÈÝ HMS¡¢Ö§³Ö¶à×â»§¡¢Ö§³ÖÍêÕûµÄȨÏÞÌåϵ¡¢Í¬Ê±Ö§³Ö´æ´¢¸÷ÖÖÊý¾ÝÔ´µÄÔªÊý¾Ý¡£
¶à×⻧ʵÏÖ
ΪÁËʵÏÖ¶à×â»§¹¦ÄÜ£¬ÎÒÃǰÑÿÕÅ¿âµÄÔªÊý¾ÝºÍ°¢ÀïÔÆµÄUID ½øÐйØÁª£¬¶ø±íµÄÔªÊý¾ÝÓÖÊǺͿâµÄÔªÐÅÏ¢¹ØÁªµÄ¡£ËùÒÔ»ùÓÚÕâÖÖÉè¼ÆÃ¿Õſ⡢ÿÕÅ±í¶¼ÊÇ¿ÉÒÔ¶ÔÓ¦µ½¾ßÌåµÄÓû§¡£µ±Óû§ÇëÇóÔªÊý¾ÝµÄʱºò£¬³ýÁËÐèÒª´«½ø¿âÃûºÍ±íÃû£¬»¹ÐèÒª½«ÇëÇóµÄ°¢ÀïÔÆUID
´ø½øÀ´£¬ÔÙ½áºÏÉÏÊö¹ØÁª¹ØÏµ¾Í¿ÉÒÔÄõ½ÏàÓ¦Óû§µÄÔªÊý¾Ý¡£Ã¿¸öÔªÊý¾ÝµÄAPI ¶¼ÓÐÒ»¸öUID ²ÎÊý£¬±ÈÈçÈç¹ûÎÒÃÇÐèҪͨ¹ýgetTable
»ñȡij¸öÓû§µÄ±íÐÅÏ¢£¬Õû¸öÁ÷³ÌÈçÏ£º

ÉÏÃæµÄACCOUNT ÊÇDLA Öд洢Óû§ÕË»§ÐÅÏ¢µÄ±í£»DBS ºÍTBLS ÊÇÓÃÓÚ´æ´¢ÔªÊý¾ÝµÄ±í¡£ÐéÏß´ú±íËûÃÇÖ®¼äµÄ¹ØÁª¹ØÏµ¡£
ȨÏÞÌåϵ
ÎÒÃÇÖªµÀ£¬Ò»°ã´óÐÍµÄÆóÒµ»á´æÔÚ¶à¸ö²»Í¬²¿ÃÅ£¬»òÕßÒ»¸ö±È½Ï´óµÄ²¿ÃÅÐè񻂿·Ö³ö²»Í¬µÄÓû§£¬ÕâЩÓû§Ö®¼äÓÖÐèÒª¹²ÏíһЩ×ÊÔ´¡£ÎªÁ˽â¾öÕâ¸öÎÊÌ⣬DLA
½«°¢ÀïÔÆUID ×÷ΪÖ÷Õ˺ţ¬DLA userName ×÷Ϊ×ÓÕ˺ÅÀ´Çø±ðÿ¸öÓû§£¬Í¬Ò»¸ö°¢ÀïÔÆUID
ÏÂÃæµÄ²»Í¬×ÓÓû§·ÃÎʵÄ×ÊÔ´ÊÇÓÐÏÞÖÆµÄ£¬±ÈÈçÖ÷Õ˺ÅÓû§¿ÉÒÔ¿´µ½ËùÓеÄÔªÊý¾Ý£»¶øÒ»°ãÓû§Ö»ÄÜ¿´µ½Ò»²¿·Ö¡£ÎªÁ˽â¾öÕâ¸öÎÊÌ⣬DLA
Meta ʵÏÖÁËÒ»Ì×ÍêÕûµÄȨÏÞÌåϵ£¬Óû§¿ÉÒÔͨ¹ýGRANT/REVOKE ¶ÔÓû§½øÐÐÏà¹ØµÄȨÏÞ²Ù×÷¡£
DLA Meta ÖÐËùÓжÔÍâµÄÔªÊý¾ÝAPI ¶¼ÊÇÓÐȨÏÞУÑéµÄ£¬±ÈÈçCreate Database
ÊÇÐèÒªÓÐÈ«¾ÖµÄCreate »òAll ȨÏ޵ġ£Ö»ÓÐȨÏÞУÑéͨ¹ý²Å¿ÉÒÔ½øÐÐÏÂÒ»²½µÄ²Ù×÷¡£Ä¿Ç°DLA Meta
ȨÏÞ¿ØÖÆÁ£¶ÈÊÇ×öµ½±í¼¶±ðµÄ£¬¿ÉÒÔ¶ÔÓû§ÊÚÓè±í¼¶±ðµÄȨÏÞ£»µ±È»£¬ÁÐÁ£¶È¡¢·ÖÇøÁ£¶ÈµÄȨÏÞÎÒÃÇÒ²ÊÇ¿ÉÒÔ×öµ½µÄ£¬Ä¿Ç°»¹Ôڹ滮ÖС£ÏÂÃæÊÇÎÒÃÇȨÏÞУÑéµÄ´¦ÀíÁ÷³Ì£º

ÓÉÓÚDLA Presto¿ÉÒÔ¼æÈÝMySQL ȨÏÞ²Ù×÷Ïà¹Ø£¬ÎªÁ˽µµÍÓû§µÄʹÓóɱ¾£¬µ±Ç°DLA Meta
µÄȨÏÞÊÇÓëMySQL ȨÏÞÊǼæÈݵģ¬ËùÒÔÈç¹ûÄã¶ÔMySQL µÄȨÏÞÌåϵ±È½ÏÁ˽⣬ÄÇôÕâЩ֪ʶÊÇ¿ÉÒÔÖ±½ÓÔËÓõ½DLA
µÄ¡£
2¡¢ÔªÊý¾Ý·¢ÏÖSchemaÍÆ¶Ï¼¼Êõ
ÔªÊý¾Ý·¢ÏֵĶ¨Î»£ºÎªOSSµÈ´æ´¢ÉÏÃæµÄÊý¾ÝÎļþ×Ô¶¯·¢Ïֺ͹¹½¨±í¡¢×ֶΡ¢·ÖÇø£¬²¢¸ÐÖªÐÂÔö±í&×Ö¶Î&·ÖÇøµÈÔªÊý¾ÝÐÅÏ¢£¬·½±ã¼ÆËãÓë·ÖÎö¡£

´ÓÉÏͼ¿ÉÒÔ¿´³ö£¬ÔªÊý¾Ý·¢ÏÖµÄÊäÈëÊÇÒ»¸ö¸¸Ä¿Â¼£¬ÏÂÃæ¿ÉÒÔ°üº¬°ÙÍò¼¶±ðOSSµÄÎļþ£¬Í¬Ê±ÕâЩÎļþ»¹ÔÚÔöÁ¿µÄÌí¼Ó¡£Êä³öΪ¸ù¾ÝSchemaÐÅÏ¢½øÐоۺÏÉú³ÉÊýĿΪÍò¼¶±ðµÄ±í£¬ÒÔ¼°µ¥±íÍò¼¶±ð·ÖÇø¡£ÔªÊý¾Ý×Ô¶¯·¢ÏÖÒýÇæÖ÷Òª°üÀ¨ÎļþSchemaʶ±ðÆ÷¡¢Îļþ±í·ÖÀàÆ÷¡¢Metaͬ²½Èý¿é£¬ÏÂÃæÖØµã½éÉÜSchemaʶ±ðÆ÷¡¢ÒÔ¼°Îļþ±í·ÖÀàÆ÷¡£
ÎļþSchemaʶ±ðÆ÷£ºÕâ¸öÄ£¿éÖ÷ÒªÓÃÀ´ÍƶÏOSSÉÏÃæÎļþµÄ¸ñʽ¼°×ֶΡ£¶ÔÓÚÒ»¸öÎļþÍêȫûÓÐSchemaÐÅÏ¢Çé¿öÏ£¬Ê×ÏÈÐèÒªÍÆ¶Ï³öÊÇʲô¸ñʽ£¬È»ºó»¹ÐèÒªÍÆ¶Ï³ö¾ßÌåµÄ×ֶΡ£Õû¸öÄ£¿é°üÀ¨Îļþ²ÉÑù¡¢Schemaʶ±ðÆ÷Á½¿é¡£²âÊÔ±íÃ÷µ¥¸öÎļþµÄSchema̽²âÐèÒª150ms×óÓÒ£¬Èç¹û¶ÔËùÓеÄÎļþ½øÐÐÈ«Á¿µÄʶ±ð£¬Õû¸öЧÂÊ»á±È½ÏµÍ£¬DLA
ÔªÊý¾Ý·¢ÏÖÓÐÒ»ÌײÉÑùµÄ¼¼Êõ£¬¼õÉÙÎļþʶ±ðµÄÊýÁ¿¡£¾ßÌåµÄSchemaʶ±ðÆ÷ÓÉÒ»×éSchemaÍÆ¶ÏµÄ²ßÂÔ×é³É£¬Ãæ¶ÔÒ»¸öûÓÐÈκÎÏÈÑéÐÅÏ¢µÄÎļþ£¬Í¨¹ýÖð¸öÆ¥ÅäCSV¡¢JSON¡¢ParquetµÈÍÆ¶ÏÆ÷µÄ·½Ê½À´½øÐÐʶ±ð£¬Ã¿ÖÖÍÆ¶ÏÆ÷ÔÚЧÂʺÍ׼ȷÐÔÉÏÃæ×öÁË´óÁ¿ÓÅ»¯£¬±ÈÈçCSVÄÚ²¿°üº¬ÁË30+ÖÖ¸ù¾Ý±íÍ·¡¢·Ö¸ô·û¡¢×ªÒå¡¢ÒýÓÃ×éºÏµÄ²ßÂÔ£¬Í¬Ê±×ֶεÄʶ±ðʹÓÃÊý¾ÝÐвÉÑùµÄ·½Ê½±£Ö¤×¼È·ÂʵÄÇé¿öÏ£¬¼õÉÙÔ¶³ÌIO¶ÁÈ¡¡£

Îļþ·ÖÀàÆ÷£ºÓÉÓÚÎļþÔÚOSSÉÏÃæÊǰ´ÕÕĿ¼´æ´¢µÄ£¬µ±Í¨¹ýSchemaʶ±ðÆ÷ʶ±ð³öÁËÒ¶×Ó½ÚµãĿ¼ÏÂÃæµÄSchemaÇé¿öºó£¬Èç¹ûÿ¸öÒ¶×Ó½ÚµãĿ¼´´½¨Ò»ÕÅ±í£¬±í»áºÜ¶à£¬¹ÜÀí¸´ÔÓÇÒÄÑÒÔ·ÖÎö¡£Òò´ËÐèÒªÓÐÒ»Ì×Îļþ·ÖÀàÆ÷À´¾ÛºÏÉú³É×îÖÕµÄ±í¡£ÇÒÖ§³ÖÔöÁ¿ÎļþµÄSchema±ä¸ü£¬±ÈÈçÌí¼Ó×ֶΡ¢Ìí¼Ó·ÖÇøµÈ¡£ÏÂÃæÊÇÕû¸ö·ÖÀàËã·¨¹ý³Ì£¬¸ù¾ÝĿ¼Ê÷ÐεĽṹ£¬µÚÒ»²½ÏÈÉî¶È±éÀú²¢½áºÏ¡°ÎļþSchemaʶ±ðÆ÷¡±ÔÚÿ¸ö½Úµã¾ÛºÏ×Ó½ÚµãµÄSchemaÊÇ·ñ¼æÈÝ£¬Èç¹û¼æÈÝÔò°Ñ×ÓĿ¼ÏòÉϺϲ¢Îª·ÖÇø£¬Èç¹û²»¼æÈÝÔòÿ¸ö×ÓĿ¼´´½¨Ò»ÕÅ±í¡£¾¹ýµÚÒ»²½ºóÿ¸ö½ÚµãÊÇ·ñ¿ÉÒÔ´´½¨±í¡¢·ÖÇøÐÅÏ¢£¬ÒÔ¼°ºÏ²¢ºóµÄSchema¶¼»á´æ´¢ÔÚ½ÚµãÉÏÃæ£»µÚ¶þ²½ÔٴαéÀú¿ÉÒÔÉú³É¶ÔÓ¦µÄMeta´´½¨Ê¼þ¡£

ÕâÖÖͨÓõÄËã·¨¿ÉÒÔʶ±ðÈÎÒâĿ¼°Ú·Å£¬µ«ÊÇÓÉÓÚÃæÏòº£Á¿·ÖÇøµÄ³¡¾°£¬ÊÂÏȲ»ÖªµÀ·ÖÇøÄ¿Â¼ÊÇ·ñ¿ÉÒԾۺϣ¬ÕâÑùÿ¸öĿ¼¶¼ÐèÒª²ÉÑùʶ±ð£¬ÇÒÔÚ¾ÛºÏʱÈç¹ûij¸ö·ÖÇøºÍÆäËû·ÖÇø¼æÈݶȴﲻµ½ÒªÇ󣬻á²ð·ÖÉú³É´óÁ¿µÄ±í£¬ÔÚÕâÖÖ³¡¾°ÏÂÐÔÄÜÒ»°ã¡£Èç¹ûÓû§µÄOSSĿ¼½á¹¹°´ÕÕµäÐ͵ÄÊý²Ö½á¹¹£¬¿â¡¢±í¡¢·ÖÇøÄ£Ê½¹æ»®£¬ÄÇôÔÚ·ÖÇøÊ¶±ð¼°±íʶ±ðÉÏÃæ»áÓй̶¨µÄ¹æÔò£¬ÕâÑù¿ÉÒÔ¶ÔÉÏÃæµÄËã·¨±éÀú¹ý³Ì¼ôÖ¦£¬·ÖÇø¼äµÄ²ÉÑùÂʽøÒ»²½¼õÉÙ£¬ÇÒÈÝ´íÂʸü¸ß¡£Êý²ÖģʽµÄĿ¼¹æ»®ÐèÒªÈçÏ£º

3¡¢º£Á¿·ÖÇø´¦Àí¼¼Êõ
·ÖÇøÍ¶Ó°
ÔÚ´óÊý¾Ý³¡¾°ÖУ¬·ÖÇøÊÇÓÃÓÚÌáÉýÐÔÄܷdz£³£¼ûµÄ·½·¨£¬ºÏÀí»®·Ö·ÖÇøÓÐÀûÓÚ¼ÆËãÒýÇæ¹ýÂ˵ô´óÁ¿ÎÞÓõÄÊý¾Ý´Ó¶øÌáÉý¼ÆËãÐÔÄÜ¡£µ«ÊÇÈç¹û·ÖÇø·Ç³£¶à£¬±ÈÈçµ¥±íÊý°ÙÍòµÄ·ÖÇø£¬ÄÇô¼ÆËãÒýÇæ´ÓÔªÊý¾Ý·þÎñ²éѯ·ÖÇøËùÐèÒªµÄʱ¼ä¾Í»áÉÏÉý£¬´Ó¶øÊ¹µÃ²éѯµÄÕûÌåʱ¼ä±ä³¤¡£±ÈÈçÎÒÃǿͻ§ÓÐÕűíÓÐ130¶àÍò·ÖÇø£¬Ò»¸ö¼òµ¥µÄ·ÖÇø¹ýÂ˲éѯԪÊý¾Ý·ÃÎÊÕâ¿é¾Í»¨ÁË4ÃëÒÔÉϵÄʱ¼ä£¬¶øÊ£ÏµļÆËãʱ¼äÈ´²»µ½1Ã룡
Õë¶ÔÕâ¸öÎÊÌ⣬ÎÒÃÇÉè¼Æ¿ª·¢³öÁËÒ»ÖÖ½Ð×ö¡°·ÖÇøÓ³É䡱µÄ¹¦ÄÜ£¬·ÖÇøÓ³ÉäÈÃÓû§Ö¸¶¨·ÖÇøµÄ¹æÔò£¬È»ºó¾ßÌåÿ¸öSQL²éѯµÄ·ÖÇø»áÖ±½Óͨ¹ýSQLÓï¾äÖеIJéѯÌõ¼þ½áºÏÓû§´´½¨±íʱºòÖ¸¶¨µÄ¹æÔòÖ±½ÓÔÚ¼ÆËãÒýÇæÖмÆËã³öÀ´£¬´Ó¶ø²»ÓÃÈ¥²éѯÍⲿµÄÔªÊý¾Ý£¬±ÜÃâÔªÊý¾Ý±¬Õ¨´øÀ´µÄÐÔÄÜÎÊÌâ¡£¾²âÊÔ£¬ÉÏÊö³¡¾°Ï£¬ÀûÓ÷ÖÇøÍ¶Ó°Éú³É·ÖÇøÐèÒªµÄʱ¼ä½µÎª1ÃëÒÔÏ£¬´ó´óÌáÉý²éѯЧÂÊ¡£

»ùÓÚOSSµÄMetatable¼¼Êõ
¿ÉÒÔ¿´µ½DLAµÄ·ÖÇøÍ¶Ó°¼¼Êõ½µµÍÁ˺£Á¿·ÖÇøÇé¿öÏ£¬·ÃÎÊMeta·þÎñµÄʱ¼ä¿ªÏú£¬¸Ã¼¼Êõͨ¹ý¼ÆËã²à¼ÆËã·ÖÇøµÄ·½·¨À´¹æ±Üµôº£Á¿·ÖÇøµÄ·ÃÎÊ¡£DLAĿǰ»ùÓÚApache
HudiʵÏÖDLA Lakehouse£¬Ìṩ¸ßЧµÄºþ²Ö¡£ÆäÖÐÔÚº£Á¿·ÖÇø´¦ÀíÕâ¿é£¬Apache Hudi½«±íµÄº£Á¿·ÖÇøÓ³ÉäÐÅÏ¢´æ´¢ÔÚÒ»¸öOSSÉÏÃæµÄObjectÀïÃæ£¬ÕâÑùͨ¹ý¶ÁÈ¡Èô¸É¸öObjectÎļþ¿ÉÒÔ»ñÈ¡ËùÓеķÖÇøÐÅÏ¢£¬¹æ±Ü·ÃÎÊMeta·þÎñµÄ¿ªÏú¡£ÏÂÃæ½éÉÜDLA
Lakehouse»ùÓÚHudiµÄMetatable¼¼Êõ£º

´ÓÉÏͼ¿ÉÒÔ¿´µ½DLA MetaÖÐ»á´æ´¢¿â¡¢±í¡¢·ÖÇøµÄÐÅÏ¢£¬Ê¹Óõ±Ç°·½°¸OSSÉÏÃæ·ÖÇøÄ¿Â¼¶ÔÓ¦µÄ·ÖÇøÐÅÏ¢»á´æ´¢ÔÚDLA
Meta·þÎñÖУ¬µ±·ÖÎöÒýÇæ·ÃÎÊÕâÕűíµÄʱºò£¬»áͨ¹ýDLA Meta·þÎñ¶ÁÈ¡´óÁ¿µÄ·ÖÇøÐÅÏ¢£¬ÕâЩ·ÖÇøÐÅÏ¢»á´Óµ×²ãµÄRDSÖжÁ³ö£¬ÕâÑù»áÓÐÒ»¶¨µÄ·ÃÎÊ¿ªÏú¡£Èç¹ûʹÓõ½DLA
Lakehouse·½°¸£¬¿ÉÒÔ½«´óÁ¿µÄ·ÖÇøÓ³ÉäÐÅÏ¢µ¥¶À´æ´¢ÔÚ»ùÓÚOSS¶ÔÏóµÄHudi MetatableÖУ¬Metatableµ×²ã»ùÓÚHFileÖ§³Ö¸üÐÂɾ³ý£¬Í¨¹ýKV´æ´¢·½Ê½Ìá¸ß·ÖÇø²éѯЧÂÊ¡£ÕâÑù·ÖÎöÒýÇæÔÚ·ÃÎÊ·ÖÇø±íµÄʱºò£¬¿ÉÒÔÖ»ÔÚMetaÖжÁÈ¡¿â¡¢±íÇáÁ¿µÄÐÅÏ¢£¬·ÖÇøÐÅÏ¢¿ÉÒÔͨ¹ý¶ÁÈ¡OSSµÄ¶ÔÏó»ñÈ¡¡£Ä¿Ç°¸Ã·½°¸»¹Ôڹ滮ÖУ¬DLAÏßÉÏ»¹²»Ö§³Ö¡£
ËÄ¡¢ÔÆÔÉúÊý¾Ýºþ×î¼Ñʵ¼ù
×î¼Ñʵ¼ù£¬ÒÔDLAΪÀý×Ó¡£DLAÖÂÁ¦ÓÚ°ïÖú¿Í»§¹¹½¨µÍ³É±¾¡¢¼òµ¥Ò×Óᢵ¯ÐÔµÄÊý¾Ýƽ̨£¬±È´«Í³HadoopÖÁÉÙ½ÚÔ¼50%µÄ³É±¾¡£ÆäÖÐDLA
MetaÖ§³ÖÔÆÉÏ15+ÖÖÊý¾ÝÊý¾ÝÔ´£¨OSS¡¢HDFS¡¢DB¡¢DW£©µÄͳһÊÓͼ£¬ÒýÈë¶à×â»§¡¢ÔªÊý¾Ý·¢ÏÖ£¬×·Çó±ß¼Ê³É±¾Îª0£¬Ãâ·ÑÌṩʹÓá£DLA
Lakehouse»ùÓÚApache HudiʵÏÖ£¬Ö÷ҪĿ±êÊÇÌṩ¸ßЧµÄºþ²Ö£¬Ö§³ÖCDC¼°ÏûÏ¢µÄÔöÁ¿Ð´È룬ĿǰÕâ¿éÔÚ¼Ó½ô²úÆ·»¯ÖС£DLA
Serverless PrestoÊÇ»ùÓÚApache PrestoDBÑз¢µÄ£¬Ö÷ÒªÊÇ×öÁª°î½»»¥Ê½²éѯÓëÇáÁ¿¼¶ETL¡£DLAÖ§³ÖSparkÖ÷ÒªÊÇΪÔÚºþÉÏ×ö´ó¹æÄ£µÄETL£¬²¢Ö§³ÖÁ÷¼ÆËã¡¢»úÆ÷ѧϰ£»±È´«Í³×Ô½¨SparkÓÐ×Å300%µÄÐÔ¼Û±ÈÌáÉý£¬´ÓECS×Ô½¨Spark»òÕßHiveÅú´¦ÀíÇ¨ÒÆµ½DLA
Spark¿ÉÒÔ½ÚÔ¼50%µÄ³É±¾¡£»ùÓÚDLAµÄÒ»Ì廯Êý¾Ý´¦Àí·½°¸£¬¿ÉÒÔÖ§³ÖBI±¨±í¡¢Êý¾Ý´óÆÁ¡¢Êý¾ÝÍÚ¾ò¡¢»úÆ÷ѧϰ¡¢IOT·ÖÎö¡¢Êý¾Ý¿ÆÑ§µÈ¶àÖÖÒµÎñ³¡¾°¡£

|