提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
转帖|使用教程|编辑:龚雪|2014-08-13 09:28:55.000|阅读 353 次
概述:张彭善是 PayPal Risk Data Science部门的研发工程师,在PayPal一直致力于使用Hadoop解决风险控制数学模型的特征提取。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
相关链接:
如何利用大数据训练风险控制的数学模型一直以来都是PayPal在欺诈交易检测的挑战。PayPal在风险控制模型训练上大致经历过四个阶段:
其中,Hadoop迭代式计算框架Guagua是PayPal的一个开源机器学习框架的子项目,已经。
张彭善是 PayPal Risk Data Science部门的研发工程师,在PayPal一直致力于使用Hadoop解决风险控制数学模型的特征提取、训练及验证等工作,是Shifu和Guagua的主要开发人员。InfoQ中文站编辑近日对张彭善进行了采访,了解这个框架的开发背景和应用状况。
InfoQ:首先问一下,这个框架为什么取了Guagua这个名字?
张彭善:这个 名字的得来其实很随意。去年公司装修期间,我在家开发Guagua的时候,苦于没有一个合适的名字,我随手翻了本我儿子平时比较喜欢的一本故事书,看到上 面一只小鸭子叫“呱呱”,我当时随手就用了这个名字。后来等到Guagua成型,一直想换一个名字,但是那时Guagua在公司内部已经有了很大的知名 度,而且我的同事帮我设计了一个非常漂亮的Logo,Guagua就一直沿用至今了。
InfoQ:风险控制训练的业务特点是什么?
张彭善:风险控制数学模型的主要特点是训练数据量大、模型特征多、模型通用性低等等。
InfoQ:其训练的算法有什么样的特点?业内都有哪些公开的或者你了解的方法,各自有什么特点和不同?
张彭善:它的训练方法和其它的分类问题并没有太多不同,唯一比较大的不同是如何利用大数据来训练数学模型。业内有很多相关的算法,决策树、逻辑回归、神经网络、SVM等等,但是主要都是单机实现。即便是也并没有把分类模型的分布式做好(Mahout中逻辑回归和神经网络均为单机算法)。
InfoQ:为什么要开发Guagua?换句话说,Guagua为什么是更适合你们业务特点的框架?
张彭善:在 PayPal,Guagua主要解决的是机器学习分类模型的分布式训练问题,以往我们并没有分布式模型的训练框架或者产品,我们只能通过抽样来把我们的训 练数据限定在单机规模。此外,由于单机计算资源和内存的限制,我们以前训练一个风控模型需要10小时左右的时间。使用Guagua,数据和计算都在 Hadoop之上实现了分布式,不仅训练数据达到了我们之前不敢想象的TB级别,而且训练时间也由10小时左右减少到1小时左右,且最终的模型没有比单机 有任何的性能损失。
InfoQ:Guagua现在哪些地方满足了你的要求,哪些方面还不完善,计划做哪些工作改进它?
张彭 善:Guagua主要解决了模型训练的分布式问题,现在PayPal可以利用大数据快速训练风控数学模型。同时Guagua并没有将自己局限在分类模 型,Guagua是一个基于Hadoop的迭代式计算框架,几乎任何基于迭代的算法都可以利用Guagua为其添加分布式功能。此外由于Guagua对分 布式的良好支持,我们以前许多想做又不能做的工作比如模型特征自动选取都可以得以进行。
Guagua目前主要支持的是同步的Master-Workers结构的迭代式计算框架,今后我们希望能够支持异步方式的迭代计算框架,2012年Google MapReduce之父Jeff Dean,上面提到了对神经网络深度模型的支持,文章介绍他们的DistBelief框架训练的神经网络的数学模型可以支持10亿级别的参数。这也是Guagua的另一个方向,支持超大规模的深度神经网络模型。
来自: InfoQ
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn
文章转载自:慧都控件网本文将演示如何使用DevExpress WPF Grid控件实现列和带的固定,欢迎下载最新版组件体验!
在本文中,我们将探讨如何通过使用 JxBrowser 和 Quill.js 将现代富文本编辑器嵌入到 Java 桌面应用程序中,来克服 Swing、JavaFX 和 SWT 中内置编辑器的局限性。
Word 文档中的批注通常用于协作审阅和反馈。这些批注可能包含文本和图片,它们为文档改进提供了重要的参考信息。本文将演示如何使用 Spire.Doc for Java 在 Java 中提取 Word 文档中的批注文本和图片。
本文主要介绍如何使用DevExpress WinForms Data Grid组件实现列重新排序,欢迎下载最新版组件体验!
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@cahobeh.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢