彩票走势图

Power BI教程:在Power BI中构建机器学习模型

翻译|使用教程|编辑:陈津勇|2019-10-29 10:31:37.413|阅读 1015 次

概述:​在本教程中,您将使用自动化机器学习在Power BI中创建和应用二进制预测模型。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

本教程包括创建Power BI数据流的指导,以及使用数据流中定义的实体直接在Power BI中培训和验证机器学习模型。然后,我们使用该模型对新数据进行评分以生成预测。

首先,您将创建一个Binary Prediction机器学习模型,根据在线购物者的一组在线会话属性来预测他们的购买意图。本练习使用基准机器学习数据集。一旦一个模型被训练,Power BI将自动生成一个解释模型结果的验证报告。然后您可以查看验证报告,并将模型应用到您的数据中进行评分。

学习本教程前,请下载Power BI DesktopPower BI Pro,以便同步操作加深学习印象。

下载Power BI Desktop 下载Power BI Pro

本教程包括以下步骤:

  • 使用输入数据创建数据流

  • 创建和训练机器学习模型

  • 查看模型验证报告

  • 将模型应用于数据流实体

  • 使用Power BI报表中模型的评分输出

使用输入数据创建数据流

本教程的第一部分是使用输入数据创建数据流。如以下各节所示,该过程采取了一些步骤,从获取数据开始。

获取数据

创建数据流的第一步是准备好数据源。在我们的案例中,我们使用来自一系列在线会话的机器学习数据集,其中一些最终达到了购买目的。数据集包含一组关于这些会话的属性,我们将使用它们来训练我们的模型。

您可以从UC Irvine网站下载数据集。就本教程而言,我们还可以通过提供此功能。

创建实体

要在数据流中创建实体,请登录Power BI服务,并导航到启用了AI的专用容量的工作区。

如果还没有工作区,可以通过在Power BI服务的左侧导航菜单中选择“工作区”来创建一个工作区,然后在出现的面板底部选择“创建应用程序工作区 ”。这将在右侧打开一个面板,以输入工作区详细信息。输入工作空间名称,然后选择高级。使用单选按钮确认工作空间使用“专用容量”,并且已将其分配给已打开AI的专用容量实例。然后选择保存。

tutorial-machine-learning-model-01.png

创建工作空间后,可以选择“欢迎”屏幕右下角的“ 跳过 ”,如下图所示。

tutorial-machine-learning-model-02.png

选择工作区右上方的Create按钮,然后选择Dataflow。

tutorial-machine-learning-model-03.png

选择添加新实体。这将在浏览器中启动Power Query编辑器。

tutorial-machine-learning-model-04.png

选择Text/CSV File作为数据源,如下图所示。

tutorial-machine-learning-model-05.png

在接下来出现的“ 连接到数据源”页面中,将以下指向online_shoppers_intention.csv的链接粘贴到“ 文件路径”或“ URL”框中,然后选择“ 下一步”:

//raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv

tutorial-machine-learning-model-06.png

Power Query Editor显示CSV文件中数据的预览。您可以通过更改右侧窗格中“名称”框中的值,将查询重命名为更友好的名称。例如,您可以将查询名称更改为Online Visitors。

tutorial-machine-learning-model-07.png

Power Query会自动推断列的类型。您可以通过单击列标题顶部的属性类型图标来更改列类型。在此示例中,我们将“收入”列的类型更改为“真/假”。

tutorial-machine-learning-model-08.png

选择“保存并关闭”按钮以关闭Power Query Editor。提供数据流的名称,然后在对话框上选择“保存 ”,如下图所示。

tutorial-machine-learning-model-09.png

创建和训练机器学习模型

要添加机器学习模型,请在“动作”列表中为包含您的训练数据和标签信息的基本实体选择“应用ML模型”按钮,然后选择“添加机器学习模型”。

tutorial-machine-learning-model-10.png

创建机器学习模型的第一步是识别历史数据,包括您想要预测的结果字段。模型将通过学习这些数据来创建。

对于我们使用的数据集,这是收入字段。选择Revenue作为“输出字段”值,然后选择Next。

tutorial-machine-learning-model-11.png

接下来,我们必须选择要创建的机器学习模型的类型。Power BI分析您已经确定的结果字段中的值,并建议可以创建哪些类型的机器学习模型来预测该字段。

在本例中,由于我们正在预测用户是否会购买的二进制结果,因此建议使用二进制预测。因为我们对预测用户购买感兴趣,所以选择True作为您最感兴趣的收入结果。此外,您可以为自动生成的报告中使用的结果提供友好的标签,该报告将总结模型验证的结果。然后选择Next。

tutorial-machine-learning-model-12.png

接下来,Power BI对您的数据样本进行初步扫描,并提出可能产生更准确预测的输入建议。如果Power BI不建议使用该字段,则会在其旁边提供说明。您可以选择更改选择,以仅包括您要模型研究的字段,或者可以通过选择实体名称旁边的复选框来选择所有字段。选择下一步接受输入。

tutorial-machine-learning-model-13.png

在最后一步,我们必须为模型提供一个名称。将模型命名为“购买意图预测”。您可以选择减少培训时间以查看快速结果,也可以选择增加培训时间以获得最佳模型。然后选择保存并训练以开始训练模型。

tutorial-machine-learning-model-14.png

培训过程将首先对历史数据进行采样和标准化,然后将数据集划分为两个新实体,即购买意向预测培训数据和购买意向预测测试数据。

根据数据集的大小,训练过程可能需要几分钟到上一个屏幕选择的训练时间。此时,您可以在数据流的“ 机器学习模型”选项卡中看到该模型。就绪状态表示该模型已排队等待训练或正在训练中。

您可以通过数据流的状态来确认正在对模型进行训练和验证。这将在工作区的Dataflows选项卡中显示为正在进行的数据刷新。

tutorial-machine-learning-model-15.png

模型训练完成后,数据流将显示更新的刷新时间。您可以通过导航到数据流中的“机器学习模型”选项卡来确认模型已训练。您创建的模型应显示为“已训练”状态,并且“最后一次训练时间”现在应该更新了。

tutorial-machine-learning-model-16.png

查看模型验证报告

要查看模型验证报告,请在机器学习模型选项卡中,选择模型的“操作”列中的“查看培训报告”按钮。该报告描述了您的机器学习模型可能如何执行。

在报告的“ 模型性能”页面中,选择“查看最重要的预测变量”以查看模型的最重要的预测变量。您可以选择一个预测变量,以查看结果分布如何与该预测变量关联。

tutorial-machine-learning-model-17.png

您可以使用“模型性能”页面上的“概率阈值”切片器来检查其对模型的“精确度”和“调用”的影响。

tutorial-machine-learning-model-18.png

报告的其他页面描述了该模型的统计性能指标。

该报告还包括“培训详细信息”页面,该页面描述了运行的不同迭代,如何从输入中提取特征以及所使用的最终模型的超参数。

将模型应用于数据流实体

选择报告顶部的“应用模型”按钮以调用此模型。在“应用”对话框中,可以指定目标实体,该目标实体具有应该将模型应用于其的源数据。

tutorial-machine-learning-model-19.png

出现提示时,您必须刷新数据流才能预览模型的结果。

应用模型将创建两个新实体,后缀分别为<model_name&gt;和<model_name>。在我们的案例中,将模型应用于“在线访问者”实体将创建“在线访问者丰富的购买意图预测”,其中包括该模型的预测输出;以及“在线访问者丰富的购买意图预测”说明,其中包含针对该预测的特定记录最高影响者。

应用二进制预测模型将添加四列,其中包含预测的结果、概率得分、预测的最高记录特定影响者以及解释索引,每列均以指定的列名作为前缀。

tutorial-machine-learning-model-20.png

数据流刷新完成后,您可以选择“在线访问者充实的购买意图预测”实体来查看结果。

tutorial-machine-learning-model-21.png

在Power BI报表中使用模型的评分输出

要使用机器学习模型的评分输出,可以使用数据流连接器从Power BI桌面连接到数据流。现在,可以使用“在线访问者丰富的购买意图预测”实体将来自模型的预测合并到Power BI报表中。



*想要获得Power BI Desktop、Power BI Pro更多资源或正版授权的朋友,可以咨询了解哦~


标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@cahobeh.cn

文章转载自:

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP