提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
原创|行业资讯|编辑:郝浩|2017-08-17 10:16:44.000|阅读 448 次
概述:机器学习是当今科技世界的一个时髦词汇,特别是对于那些相信某一天机器人会取代我们的工作并最终统治全世界的人来说,这个词汇包含了趣味,挑战,困惑甚至恐怖。不管喜欢与否,我们都需要适当地在生活中引入一些智能的东西,它能够帮助我们在一瞬间解决最基本的日常问题。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
机器学习是计算机科学的一个分支,它使计算机能够在没有编程的情况下进行学习。
—— 亚瑟·塞缪尔,1959
在熟悉的《终结者》系列中,我们看到了机器学习的身影,对于影片中强大的人工智能,有些人表现了对幻想成真的担忧,而另一些人则表现出了对这全新世界的期待。或许,未来的人工智能可能想要消灭整个人类,但就目前而言,人工智能所带来的成就和收益远远超出了我们想象。
谷歌的无人驾驶汽车,Facebook的人脸识别,亚马逊的智能推荐,Siri和Cortana的语音识别,PayPal的欺诈检测……诸如此类的应用还有很多很多。
所以,我们有必要对机器学习作一个简单的认识。现在我们来看看机器学习的一项热门技术——决策树。
简单地说,决策树是一棵树,其中每个分支节点代表多个备选方案之间的选择,每个叶节点代表一个决策。
它是一种受监督的学习算法(带有预定义的目标变量),主要用于分类问题和对持续性输入输出变量归类的工作。它是归纳推理中应用最广泛、最实用的方法之一。(归纳推理是从具体例子中得出一般结论的过程。)
决策树从给定的例子中学习和训练自己,并预测看不见的情况。
决策树的图形化示例如下所示:
ID3是Iterative Dichotomizer 3的简称,此算法是由Ross Quinlan发明的,他通过对一组固定的示例构建决策树,然后将结果树用于对未来样本进行分类。其基本思想是通过使用一个自上而下的、贪婪算法来构造决策树,在每个树节点上测试各种属性。
这听起来很简单,但是我们该如何选择节点来构建正确和最精确的决策树呢?我们该怎样做出决策呢?
嗯。我们可以采取一些措施来帮助我们进行最好的选择!
在信息论中,熵是对信息来源不确定性的量度。它定量了数据无序的程度。熵越大表示集合越混乱,反之则表示集合越有序。
集合S中包含了与目标内容有正反偏差的实例,那么S在布尔分类上的熵就是:
在这里,p+和p-是S中正反实例的占比。由于这个熵函数涉及到布尔分类,因此p+和p-的取值是介于0和1之间。
注意,如果S中只包含了一种分类,那么熵就是0。例如,如果所有的成员都是正的(p+ = 1),那么p-等于0 ,Entropy(S) = -1 * log2(1)–0 * log2(0) = -1 * 0–0 * log2(0) = 0;当集合中包含的正反例子数量相等时,熵的值就为1;如果集合中包含了不相等的正反例子,那么熵值就介于0和1之间。
它衡量了熵值的预期减少量。它决定了哪个属性会放入决策节点。为了让决策树的深度最小化,拥有最大化减少熵值的属性是最优的选择。
更确切地说,属性A的信息增益Gain(S, A)相对于集合的例子S可被定义为:
其中S为属性A可能出现的任意值的集合,Sv为属性A在值为v时S的子集,|Sv|为Sv中的元素数量,|S|为S中的元素数量。
让我们看看这些措施是如何工作的。
假设我们需要ID3来决定天气是否适合打棒球。在两周的时间里,收集数据来帮助ID3构建决策树。目标分类是“我们应该打棒球吗?”答案为是或者否。
参见下面的表格:
天气属性包含了outlook(气象), temperature(温度), humidity(湿度)和wind speed(风速),它们包含以下的值:
我们需要找到在决策树中哪个属性会成为根节点。
对于其它几个属性我们也可以照这种方法进行计算,得出的结果分别为:
很明显,outlook属性拥有最高的增益值,因此我们选取它作为根节点的决策属性。
由于outlook有三个可能的值,因此其根节点有三个分支(sunny,overcast,rain)。那么下一个问题是,在sunny分支节点应该选什么属性来检测?由于我们已经使用了outlook,那么将在humidity, temperature和wind之间作出选择。
Humidity拥有最高的增益,因此,它被选作决策节点。这个过程一直持续到所有的数据都被完美地分类或者所有属性被用完。
此决策树也可以用规则格式表示为:
以上便是对决策树的简单介绍,希望对你有所帮助。
本文翻译自,译者:慧都控件网-回忆和感动
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn
通过提供强大的3D CAD数据访问工具并适用于桌面、移动和Web的高级环境3D可视化发动机,HOOPS在提升造船设计和制造流程的效率方面发挥了重要作用。
HOOPS Luminate在汽车行业中的应用具有广泛的潜力和深远的影响。它通过提供高效的3D可视化、虚拟装配与拆解、性能分析、客户定制等功能,帮助汽车制造商在设计、生产和销售过程中提升效率、降低成本并提高产品质量。
在不断发展的软件开发世界中,使工具和框架与最新的平台版本保持同步至关重要,欢迎查阅~
全球航运业对国际贸易至关重要,全球 90% 以上的商品通过海运运输。准确监控和控制这些集装箱的移动对于维持高效的供应链至关重要。手动输入集装箱号码是这一程序的关键部分,它带来了相当大的挑战,例如人为错误和效率低下。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@cahobeh.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢