提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
原创|大数据新闻|编辑:况鱼杰|2020-06-10 11:27:06.793|阅读 331 次
概述:在开放式混合架构系列的最后三个博客(视觉,关键原则/概念,实际案例)的基础上,现在希望更深入地研究我们的存储环境,尤其是O3(臭氧的分子式)。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
相关链接:
在与CLOUDERA合并之前,此博客文章已发布在HORTONWORKS.COM上。某些链接,资源或参考可能不再准确。
介绍我们的存储环境O3
在开放式混合架构系列的最后三个博客(视觉,关键原则/概念,实际案例)的基础上,现在希望更深入地研究我们的存储环境,尤其是O3(臭氧的分子式)。
首先,我们想回顾一下Hadoop历史。Apache Hadoop文件系统(HDFS)在2006年以5000行代码开始。这是企业采用的第一个软件定义的存储,现在在商品硬件上存储数百EB的大数据,以推动我们今天熟悉的分析革命。现在,又迈出了一大步,我们乘坐上了名为“ O3”的火箭飞船。
Ozone或O3是下一代对象存储,旨在:
我们开始看到存储在云世界中与计算分离,随着网络变得越来越快,规模越来越大,优先级流控制越来越好,计算和存储都可以分别扩展。Cloudera的客户可能会要求解耦存储,以便他们可以分别扩展存储环境。当存储被解耦和共享时,它需要扩展并具有多种协议来支持各种用例。借助对容器编排的支持,现在可以设计工作负载,以便可以将它们部署在本地和云中。但是,需要声明以下说法:一些核心客户仍然喜欢将计算和存储架构耦合以从本地化中受益,没关系,O3架构支持两种部署模型。
取其精华
O3利用了十多年的经验教训,由第一天就参与Apache HDFS的同一社区和核心团队成员设计。
开放
顾名思义,“ O”表示O3是100%开放源代码(Apache Hadoop项目的一部分)。客户不必担心专有数据格式的锁定。
规模
从Apache HDFS的许多优势中受益。像Apache HDFS一样,O3可以扩展到成千上万个节点,因为Cloudera的客户在生产中的单个集群中有成千上万个节点。对于某些对象存储供应商来说,这是一个致命弱点。数据放置算法抑制了某些对象存储供应商的规模,因为节点被永久删除或添加,大量数据移动(超过了删除或添加的数据量)并且新节点无法长时间使用。现在,Apache HDFS还存在文件较小的问题,因为在单个集群中创建了大量文件(为了澄清,HDFS可以轻松地在集群中扩展到250M +文件,但是这是当今连接世界的Hadoop扩展 )。虽然将整个元数据存储在名称节点内部的JVM内存占用中有助于缓解延迟,但它限制了Hadoop群集中文件的总数,现在再使用名称节点联合来推高扩展限制。O3确实使用平坦的键值和存储容器方法彻底解决了小文件问题,因此可以扩展到数百亿个对象。
合并
在与客户交流时,Cloudera的客户希望锁定存放在其归档存储中的暗数据的价值。很多时候,他们必须将数据从一层复制到另一层,从而创建重复数据。他们想将分析应用于暗数据。 O3将提供可扩展的解决方案,以将所有辅助数据孤岛(包括堆栈,日志,备份,存档)整合到一个解决方案中,并打破孤岛,然后Cloudera将最有能力将所有大数据分析带到数据旁边。
一致性
O3高度一致,并且始终遵循Apache HDFS的根源。由于许多内部部署和云对象存储解决方案最终都是一致的,因此上层应用程序需要构建一个一致性层来解决最终的一致性缺陷。很多时候,这意味着它们只限于归档用例,而不能真正合并所有辅助存储层。
多协议
虽然Apache HDFS是为使用Hadoop API的不可变数据(仅附加操作)而设计的,但O3却被设计为在新世界中支持多种协议。在第一次迭代中,O3将支持Hadoop API,以便现有Hadoop工作负载可以按原样工作,而无需进行任何更改。O3也将支持S3 API,以便Cloudera的客户可以使其应用程序跨云和本地部署模型移植,并且Cloudera最近推出了一个支持S3 API的Alpha版本。强化Hadoop和S3 API之后,Cloudera将为O3提供iSCSI和NFS接口。通过一项举措(在内部称为Quadra),这个项目取得了不错的进展,以展示iSCSI卷与Kubernetes容器一起使用。
就地升级
O3可以使用与Apache HDFS相同的服务器集(即数据节点)。这有助于O3和HDFS在同一群集中共存以及从Apache HDFS迁移到O3。我们的强烈意图是为目前管理着数百PB的企业客户提供无缝的就地升级途径。
更好的用户体验
传统上,Cloudera专注于Apache HDFS中强大的文件系统功能,但是围绕Apache HDFS的用户体验还没有那么丰富。从第一天开始,Cloudera就准备好投资O3的用户体验,并将在DataPlane Services中提供丰富的用户体验(HDFS和O3之间的附加监视或数据迁移)。
集装箱就绪
当Cloudera为客户提供选件时,O3可以部署在裸机服务器或Kubernetes容器上。O3将支持容器存储接口(CSI),以便O3可以为Kubernetes或Apache YARN上的容器提供持久性存储(S3 API或iSCSI接口),这又将托管Cloudera的分析工作负载,例如企业数据仓库或数据科学/工程工作负载 。
关于Cloudera
在 Cloudera,我们相信数据可以使今天的不可能,在明天成为可能。我们使人们能够将复杂的数据转换为清晰而可行的洞察力。Cloudera 为任何地方的任何数据从边缘到人工智能提供企业数据云平台服务。在开源社区不懈创新的支持下,Cloudera推动了全球最大型企业的数字化转型历程。
慧都大数据专业团队为企业提供Cloudera大数据平台搭建,免费业务咨询,定制开发等完整服务,快速、轻松、低成本将任何Hadoop集群从试用阶段转移到生产阶段。
欢迎拨打慧都热线023-68661681或咨询慧都在线客服,我们有专业的大数据团队,为您提供免费大数据相关业务咨询!
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn
大数据分析的一些发展趋势将为企业的未来发展做好准备。大数据分析如今成为政府部门和私营企业以及医疗机构抗击新冠疫情的重要资源。这在很大程度上要归功于云计算软件的发展,很多企业现在可以实时跟踪和分析大量业务数据,并相应地对其业务流程进行必要的调整。
生产质量分析是从工厂订单下单-订单生产-流入市场, 针对整个生产链进行全面的质量分析。其中最重要的一环就是对于质量控制。
生产质量分析主要是为了帮助企业更快更准确的发现产品的质量问题,找到影响质量的根本原因,改善原因,提高企业产品良率。下面我们看看慧都科技的质量分析到底能帮助企业解决哪些问题?
在工业制造界,企业极不希望发生停机事故。因为,一小时的停机时间会使企业损失上百万人民币甚至更多。除了资金方面的损失之外,停机还意味着,当持续发生设备故障时,对员工的激励难度则会变大。因此,在企业的日常业务运营中,预测性维护就显得十分重要。
一款用于数据驱动的云优先型企业的平台。
Cloudera Data Warehouse今天,明天及未来的现代分析数据库。
Cloudera DataFlowCloudera DataFlow是一个可扩展的实时流分析平台。
Cloudera Machine Learning使AI第一企业能够通过自助服务访问受控数据。
CDP Data CenterCDP Data Center是用于本地IT环境的全面数据管理和分析平台。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@cahobeh.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢