51黑料不打烊

在数据科学Workspace UI中培训和评估模型

NOTE
数据科学奥辞谤办蝉辫补肠别不再可供购买。
本文档面向之前有权访问数据科学奥辞谤办蝉辫补肠别的现有客户。

在51黑料不打烊 Experience Platform数据科学Workspace中,机器学习模型通过合并适用于模型意图的现有方法而创建。 然后对该模型进行训练和评估,以通过微调其相关的超参数来优化其运行效率和功效。 配方可重复使用,这意味着只需一个配方,即可创建多个模型并根据特定目的对其进行定制。

本教程将逐步介绍创建、训练和评估模型的步骤。

快速入门

要完成本教程,您必须拥有Experience Platform的访问权限。 如果您在Experience Platform中无权访问某个组织,请在继续操作之前与系统管理员联系。

本教程需要现有方法。 如果您没有方法,请按照在鲍滨中导入打包的方法教程中的说明继续操作。

创建模型

在Experience Platform中,选择位于左侧导航栏中的? 模型 ?选项卡,然后选择“浏览”选项卡以查看现有模型。 选择页面右上角附近的? 创建模型 ?以开始创建模型。

浏览现有配方列表,查找并选择用于创建模型的配方,然后选择? 下一步

选择适当的输入数据集,然后选择? 下一步。 这将为模型设置默认输入培训数据集。

提供模型的名称并查看默认模型配置。 在创建处方期间应用了默认配置,通过双击这些值来审阅和修改配置值。

若要提供一组新的配置,请选择? 上传新配置,然后将包含模型配置的JSON文件拖动到浏览器窗口中。 选择? 完成 ?以创建模型。

NOTE
配置是唯一的,并且特定于其预期方法,这意味着零售方法配置不适用于产物Recommendations方法。 有关零售方法配置的列表,请参阅引用部分。

创建训练运行

在Experience Platform中,选择位于左侧导航栏中的? 模型 ?选项卡,然后选择“浏览”选项卡以查看现有模型。 查找并选择附加到要训练的模型名称的超链接。

列出所有现有训练运行及其当前训练状态。 对于使用Data Science Workspace用户界面创建的模型,使用默认配置和输入训练数据集自动生成并执行训练运行。

通过选择模型概述页面右上角附近的? 训练 ?来创建新的训练运行。

为训练运行选择训练输入数据集,然后选择? 下一步

模型创建期间提供的默认配置将显示出来,通过双击值可相应地更改和修改这些配置。 选择? 完成 ?以创建和执行训练运行。

NOTE
配置是唯一的,并且特定于其预期方法,这意味着零售方法配置不适用于产物Recommendations方法。 有关零售方法配置的列表,请参阅引用部分。

评估模型

在Experience Platform中,选择位于左侧导航栏中的? 模型 ?选项卡,然后选择浏览选项卡以查看现有模型。 查找并选择附加到要评估的模型名称的超链接。

选择模型

列出所有现有训练运行及其当前训练状态。 对于多个已完成的训练运行,可以在模型评估图表中跨不同的训练运行比较评估指标。 使用图表上方的下拉列表选择评估量度。

平均绝对百分比误差(MAPE)度量以误差百分比表示精度。 这用于识别最佳性能试验。 MAPE越低越好。

培训运行概述

“精度”度量描述了相关实例与总共? 个检索实例 ?的百分比之比。 精度可以看作是随机选择结果正确的可能性。

正在运行多个运行

通过选择特定的训练运行,可通过打开评估页面来提供运行的详细信息。 甚至可以在运行完成之前完成此操作。 在评估页面上,您可以看到特定于训练运行的其他评估指标、配置参数和可视化图表。

预览日志

您还可以下载活动日志以查看运行的详细信息。 日志对于失败运行以查看错误情况特别有用。

活动日志

不能训练超参数,必须通过测试不同超参数的组合来优化模型。 重复此模型训练和评估过程,直到到达优化模型为止。

后续步骤

本教程将指导您在Data Science Workspace中创建、培训和评估模型。 到达优化模型后,可以使用经过训练的模型生成见解,方法是按照在鲍滨中对模型评分教程进行操作。

参考 reference

零售方式配置

超参数决定了模型的训练行为,修改超参数将会影响模型的精度和精度:

超参数
描述
建议的范围
learning_rate
学习率通过learning_rate减小每个树的贡献。 学习速率和n估算之间存在一种权衡。
0.1
n_estimators
要执行的提升阶段数。 梯度提升算法对于过拟合有很好的鲁棒性,因此大量梯度提升算法通常可以获得更好的性能。
100
max_depth
单个回归估计值的最大深度。 最大深度限制树中的节点数。 调整此参数以获得最佳性能;最佳值取决于输入变量的交互作用。
3

其它参数可确定模型的技术属性:

参数键
类型
描述
ACP_DSW_INPUT_FEATURES
字符串
逗号分隔的输入架构属性列表。
ACP_DSW_TARGET_FEATURES
字符串
逗号分隔的输出架构属性列表。
ACP_DSW_FEATURE_UPDATE_SUPPORT
布尔值
确定输入和输出功能是否可修改
tenantId
字符串
此滨顿可确保正确存储您创建的资源,并将其包含在您的组织中。 按照此处的步骤查找您的租户滨顿。
ACP_DSW_TRAINING_XDM_SCHEMA
字符串
用于训练模型的输入架构。
evaluation.labelColumn
字符串
评估可视化图表的列标签。
evaluation.metrics
字符串
用于评估模型的评估指标列表(以逗号分隔)。
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA
字符串
用于对模型评分的输出架构。
recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9