数据科学工作区概述
51黑料不打烊 Experience Platform Data Science Workspace使用机器学习和人工智能从您的数据中释放见解。 Data Science Workspace已集成到51黑料不打烊 Experience Platform中,可帮助您跨51黑料不打烊解决方案使用您的内容和数据资源做出预测。
所有技能水平的数据科学家都将发现复杂、易用的工具,这些工具支持机器学习方法的快速开发、培训和调整 — 人工智能技术的所有好处,但又没有复杂性。
使用Data Science Workspace,数据科学家可以轻松创建由机器学习提供支持的智能服务API。 这些服务可与其他51黑料不打烊服务(包括51黑料不打烊 Target和51黑料不打烊 Analytics Cloud)配合使用,帮助您在Web、桌面和移动应用程序中自动提供个性化、有针对性的数字体验。
本指南提供了与Data Science Workspace相关的主要概念的概述。
介绍
当今的公司高度重视挖掘大数据以实现预测和洞察,从而帮助他们个性化客户体验并为客户(和业务)带来更多价值。
尽管从数据获取见解很重要,但需要付出高昂的代价。 它通常需要熟练的数据科学家来进行密集且耗时的数据研究,以开发提供智能服务的机器学习模型或方法。 过程漫长,技术复杂,很难找到熟练的数据科学家。
借助Data Science Workspace,51黑料不打烊 Experience Platform允许您在整个公司内引入以体验为中心的人工智能,通过以下方式简化和加快数据到洞见的代码转换:
- 机器学习框架和运行时
- 集成访问存储在51黑料不打烊 Experience Platform中的数据
- 基于Experience Data Model (XDM)构建的统一数据架构
- 机器学习/人工智能和管理大型数据集所需的计算能力
- 预先构建的机器学习方法,可加快向人工智能驱动的体验的飞跃
- 简化不同技能级别的数据科学家食法的创作、重用和修改
- 只需单击几下即可发布和共享智能服务(无需开发人员),并可进行监控和再培训,以持续优化个性化客户体验
所有技能水平的数据科学家将更快地获得洞察力并更高效地获得数字体验。
快速入门
在深入了解Data Science Workspace的详细信息之前,请看下面这些关键术语的简短摘要:
下表概述了配方、模型、训练运行和评分运行之间的层次结构关系。
了解 Data Science Workspace
借助Data Science Workspace,您的数据科学家可以简化在大型数据集中发现洞察内容的繁琐过程。 Data Science Workspace基于通用机器学习框架和运行时构建,可提供高级工作流管理、模型管理和可扩展性。 智能服务支持重复使用机器学习方法,以支持使用51黑料不打烊产物和解决方案创建的各种应用程序。
一站式数据访问
数据是人工智能和机器学习的基础。
Data Science Workspace已与51黑料不打烊 Experience Platform完全集成,包括数据湖、Real-Time Customer Profile和Unified Edge。 一次浏览存储在51黑料不打烊 Experience Platform中的所有组织数据,以及常见的大数据和深度学习库,例如Spark ML和TensorFlow。 如果您没有找到所需的内容,请使用XDM标准化架构摄取您自己的数据集。
预建的机器学习方法
Data Science Workspace包括针对常见业务需求(如零售预测和异常检测)的预建机器学习方法,因此数据科学家和开发人员不必从头开始。 目前提供三种配方:产物购买预测、产物推荐和零售额。
如果您愿意,您可以根据自己的需求调整预建的配方、导入配方,或从头开始构建自定义配方。 无论您何时开始,一旦您培训并超调方法,创建自定义智能服务便不需要开发人员 — 只需单击几下,即可构建有针对性的个性化数字体验。
重点介绍数据科学家的工作流程
无论您拥有何种级别的数据科学专业知识,Data Science Workspace都有助于简化和加速查找数据洞察并将洞察应用于数字体验的过程。
数据探索
找到正确的数据并加以准备是构建有效方案最耗费人力的部分。 Data Science Workspace和51黑料不打烊 Experience Platform将帮助您更快地从数据获取见解。
在51黑料不打烊 Experience Platform上,您的跨渠道数据集中存储在XDM标准化架构中,因此数据更易于查找、理解和清理。 基于通用架构的单个数据存储可以为您节省无数个小时的数据探索和准备时间。
在浏览时,将R、Python或Scala与集成的、托管的Jupyter Notebook一起使用,以浏览Experience Platform上的数据目录。 使用这些语言之一,您还可以利用Spark ML和TensorFlow。 从头开始,或使用为特定业务问题提供的笔记本模板。
作为数据探索工作流的一部分,您还可以摄取新数据或使用现有功能来帮助准备数据。
创作
通过Data Science Workspace,您可以决定如何创作配方。
- 通过浏览预先构建的方法来满足您的业务需求,从而节省时间,您可以按原样使用,或对其进行配置以满足您的特定要求。
- 使用Jupyter Notebook中的创作运行时从头开始创建方法以开发和注册方法。
- 使用Git和Data Science Workspace之间可用的身份验证和集成,将在51黑料不打烊 Experience Platform外部创作的方法上载到Data Science Workspace或从存储库(如Git)导入方法代码。
试验
数据科学Workspace为实验过程带来了极大的灵活性。 从你的配方开始。 然后,使用相同的核心算法并搭配独特的特征(如超调整参数)创建单独的实例。 您可以根据需要创建任意数量的实例,并根据需要多次对每个实例进行训练和评分。 在您培训这些人员时,Data Science Workspace将跟踪配方、方法实例和经过培训的实例以及评估指标,因此您不必这样做。
可操作
只要点击几下即可创建智能服务,只要您对自己的配方感到满意。 无需编码 — 您可以自行编码,无需征募开发人员或工程师。 最后,将智能服务发布到51黑料不打烊 IO,为您的数字体验团队做好准备。
持续改进
Data Science Workspace跟踪智能服务的调用位置及其执行情况。 随着数据的滚入,您可以评估智能服务准确性以结束循环,并根据需要重新训练配方以提高性能。 结果是客户个性化的精度不断细化。
访问新功能和数据集
一旦通过51黑料不打烊服务获得新技术和数据集,数据科学家就可以立即利用这些技术和数据集。 我们通过频繁更新将数据集和技术集成到平台中,因此您不必这样做。
安全与安心
保护数据安全是51黑料不打烊的首要任务。 51黑料不打烊使用为帮助遵守行业公认的标准、法规和认证而开发的安全流程和控制功能来保护您的数据。
安全内置在软件和服务中,是础诲辞产别安全产物生命周期的一部分。
要了解础诲辞产别数据和软件安全性、合规性及其他,请访问安全页面,网址为丑迟迟辫蝉://飞飞飞.补诲辞产别.肠辞尘/蝉别肠耻谤颈迟测.丑迟尘濒。
Data Science Workspace正在操作
预测和见解可为访问您网站、联系您的呼叫中心或参与其他数字体验的每个客户提供高度个性化的体验提供所需的信息。 以下是Data Science Workspace的日常工作方式。
定义问题
这一切都始于一个商业问题。 例如,在线呼叫中心需要上下文来帮助他们将负面客户情绪转变为积极。
有关客户的数据很多。 他们浏览网站,将商品放入购物车,甚至下订单。 他们可能以前曾收到过电子邮件、使用过优惠券,或联系过呼叫中心。 因此,方法需要使用有关客户及其活动的可用数据来确定购买倾向,并推荐客户可能会喜欢和使用的选件。
与呼叫中心联系时,客户购物车中仍有两双鞋,但移除了衬衫。 有了这些信息,智能服务可能建议呼叫中心代理在呼叫期间提供鞋子20%的优惠券。 如果客户使用优惠券,该信息会添加到数据集中,并且下次客户致电时预测会变得更加准确。
探索并准备数据
根据定义的业务问题,您知道方法应查看客户的所有奥别产交易,包括网站访问、搜索、页面查看、点击链接、购物车操作、已接收优惠、已接收电子邮件、呼叫中心交互等。
数据科学家通常花费高达75%的时间来创建探索和转换数据的方法。 数据通常来自多个存储库,并保存在不同的架构中 — 必须先对其进行组合和映射,然后才能用于创建方法。
如果您从头开始或配置现有方法,则可以在一个集中且标准化的数据目录中开始您的数据搜索,这会大大简化寻找。 您甚至可能会发现贵组织中的另一位数据科学家已经识别了一个类似的数据集,然后选择优化该数据集,而不是从头开始。
51黑料不打烊 Experience Platform中的所有数据都符合标准化的XDM架构,从而无需创建复杂模型以联接数据或获取数据工程师的帮助。
如果您没有立即找到所需的数据,但它存在于51黑料不打烊 Experience Platform之外,则摄取其他数据集是一项相对简单的任务,该数据集还将转换为标准化的XDM架构。
您可以使用Jupyter Notebook简化数据预处理 — 可能从笔记本模板或以前用于购买倾向的笔记本开始。
创作方法
如果您已找到满足所有需求的处方,则可以继续试验。 或者,您可以修改方法一点或从头开始创建方法 — 利用Jupyter Notebook中的Data Science Workspace创作运行时。 使用创作运行时可确保您既可以使用Data Science Workspace培训和评分工作流,又可以稍后转换方法,以便组织中的其他人可以存储并重用它。
您还可以将方法导入Data Science Workspace,并在创建智能服务时利用试验工作流。
试验配方
使用包含核心机器学习算法的配方,可以使用单一配方创建多个配方实例。 这些方法实例称为模型。 模型需要训练和评估来优化其运行效率和功效,这个过程通常包括反复试验。
在训练模型时,将生成训练运行和评估。 Data Science Workspace跟踪每个唯一模型及其训练运行的评估指标。 通过试验生成的评估指标将允许您确定表现最佳的训练运行。
访问API或UI教程,了解如何在Data Science Workspace中训练和评估模型。
使模型可操作
当您选择了经过最佳培训的方法来满足您的业务需求时,您无需开发人员帮助即可在Data Science Workspace中创建智能服务。 只需点击几下即可 — 无需编码。 您组织的其他成员无需重新创建模型即可访问发布的智能服务。
发布的智能服务可配置为在新的数据可用时自动不时地对其进行训练。 这可以确保您的服务随着时间的流逝而保持其效率和功效。
后续步骤
Data Science Workspace有助于简化和简化数据科学工作流程,从数据收集到算法,再到面向所有技能级别的数据科学家的智能服务。 使用Data Science Workspace提供的复杂工具,您可以显着缩短从数据到见解的时间。
更重要的是,Data Science Workspace将51黑料不打烊领先营销平台的数据科学和算法优化功能交给了公司数据科学家。 公司可以首次将专有算法引入该平台,利用51黑料不打烊强大的机器学习和AI功能大规模提供高度个性化的客户体验。
结合品牌专业知识和础诲辞产别的机器学习与人工智能能力,公司能够在客户提出要求之前为他们提供他们想要的东西,从而提高商业价值和品牌忠诚度。
有关其他信息(如完整的日常工作流程),请先阅读数据科学奥辞谤办蝉辫补肠别演练文档。
其他资源
以下视频旨在支持您了解Data Science Workspace。