提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
原创|行业资讯|编辑:况鱼杰|2020-11-23 11:01:25.047|阅读 212 次
概述:相信接触数据管道的公司都很困惑到底应该选择ETL还是ELT?有人认为ELT可以根据数据的分布情况进行并行处理优化,它更好;也有人认为ETL可以分担数据库系统的负载,可采用单独的硬件服务器部署,所以它更好,到底谁好一直争论不休,那么希望看完本文能平息这一争端。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
相关链接:
相信接触数据管道的公司都很困惑到底应该选择ETL还是ELT?有人认为ELT可以根据数据的分布情况进行并行处理优化,它更好;也有人认为ETL可以分担数据库系统的负载,可采用单独的硬件服务器部署,所以它更好,到底谁好一直争论不休,那么希望看完本文能平息这一争端。
任何数据管道的流动的目的只是将以规定的格式和结构存储的数据从一个地方移动到另一个地方。数据的源头称为源,目的地称为目标,有时也称为汇。有两种模式描述了这个过程,但都没有规定持续时间、频率、传输技术、编程语言或工具。这两种模式如下:
ETL--代表提取、转换、加载,确切地描述了流水线的每个阶段所发生的事情。首先从源头提取数据,然后以某种方式进行转换。最后,数据子集被加载到目标系统中。
ELT - Extract, Load, Transform模式类似。管道开始时,再次从源数据中提取一个数据子集,但随后立即将其加载到目标中。最后一步执行数据转换。
很明显,这两种模式之间的唯一区别是,当你执行数据转换时。请注意,这两种模式都没有规定转换是发生在数据传输之前、期间还是之后。例如,让我们检查一下ETL模式。
下图说明了数据子集是在转换和最终加载发生之前通过线传输的。
同样的道理,在传输和最终加载之前,提取和转换数据子集也同样有效。
在现实中,厂商的实现往往决定了数据传输操作的顺序和优先性。事实上,前面提到的许多实施细节(如频率等)也高度依赖于供应商。
一般来说,ETL流程按照预定的时间表运行,例如每分钟、每小时、每天或每周,这取决于用例。请注意,ETL管道也可以响应外部触发器或事件而运行,但这种情况不太常见。
一个预定的ETL过程被称为以批处理模式运行,其频率往往由以下约束条件决定。
总的来说,这个过程很好用,但当数据量和ETL处理时间超过所需的时效性时,就会出现困难。例如,一家银行可能需要每10分钟更新100万笔交易的数据仓库,但提取、转换和加载批处理需要15分钟。将频率延长到20分钟不是答案,因为数据量也分别增加到了200万行。
它们是做什么的?
银行的备用策略是重新思考流程,并在不同步骤发生时重新安排优先级。如果我们假设提取、传输和加载数据的时间与之前相同,那么使用ELT可以让后端进行转换,可能是在更多资源可用的时候。
这种模式可以通过添加变更数据捕获(CDC)进一步增强。CDC不像ETL那样按批处理计划运行,而是在数据源发生变化时每次都会被触发。因此,在我们银行的例子中,ELT流程为每一笔交易运行,并且通过电报传输的数据量很少。不需要等待处理一百万行的数据。实际上,提取和加载过程是实时发生的。
然后,银行可以选择安排一个批量转换过程,或者推迟转换,直到数据被消耗。通常情况下,我们发现客户会采用这两种选择。
此外,近年来数据的数量、速度和种类都在大规模增长,ELT在很多情况下已经取代ETL成为数据移动的事实模式,尤其是在云数据迁移、数据仓库和湖泊摄取以及ML Ops--利用机器学习实现数据管道的持续交付和自动化等场景下。
在这篇文章的开头,我们争论了对于数据管道来说,ETL还是ELT是更好的模式,最后得出了 "这要看情况 "这个不满意的答案。虽然传统上ETL一直是数据集成的主力军,然而事实是,时效性很重要,而ETL却步履蹒跚。因此,如果你的分析或机器学习项目需要实时的数据,那么ELT是首选模式。
如果您想使用屡获殊荣的ELT解决方案实时移动数据,请选择进行测试。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn
通过提供强大的3D CAD数据访问工具并适用于桌面、移动和Web的高级环境3D可视化发动机,HOOPS在提升造船设计和制造流程的效率方面发挥了重要作用。
HOOPS Luminate在汽车行业中的应用具有广泛的潜力和深远的影响。它通过提供高效的3D可视化、虚拟装配与拆解、性能分析、客户定制等功能,帮助汽车制造商在设计、生产和销售过程中提升效率、降低成本并提高产品质量。
在不断发展的软件开发世界中,使工具和框架与最新的平台版本保持同步至关重要,欢迎查阅~
全球航运业对国际贸易至关重要,全球 90% 以上的商品通过海运运输。准确监控和控制这些集装箱的移动对于维持高效的供应链至关重要。手动输入集装箱号码是这一程序的关键部分,它带来了相当大的挑战,例如人为错误和效率低下。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@cahobeh.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢