51黑料不打烊

数据集鲍滨指南

本用户指南提供了在51黑料不打烊 Experience Platform用户界面中使用数据集时执行常用操作的说明。

快速入门

本用户指南要求您对51黑料不打烊 Experience Platform的以下组件有一定的了解:

查看数据集 view-datasets

在Experience Platform UI中,从左侧导航中选择? 数据集 ?以打开? 数据集 ?仪表板。 仪表板列出您组织的所有可用数据集。 将显示每个列出数据集的详细信息,包括其名称、数据集所遵循的架构以及最近一次摄取运行的状态。

左侧导航栏中突出显示了数据集项的Experience Platform UI。

从浏览选项卡中选择数据集的名称以访问其? 数据集活动 ?屏幕,并查看所选数据集的详细信息。 活动选项卡包含一个图表,其中可查看消息使用率,以及成功批次和失败批次的列表。

选定数据集的量度和可视化图表突出显示。
与选定数据集相关的示例批次突出显示。

更多操作 more-actions

您可以从数据集详细信息视图中删除或为配置文件启用数据集。 要查看可用的操作,请选择? …鲍滨右上角的更多。 出现下拉菜单。

具有的数据集工作区……其他下拉菜单突出显示。

如果选择? 为配置文件 ?启用数据集,则会显示确认对话框。 选择? 启用 ?以确认您的选择。

NOTE
要为配置文件启用数据集,数据集所遵循的架构必须兼容,才能在实时客户配置文件中使用。 有关详细信息,请参阅为配置文件启用数据集。

启用数据集确认对话框。

如果选择? 删除,将显示删除数据集确认对话框。 选择? 删除 ?以确认您的选择。

NOTE
您无法删除系统数据集。

您还可以从浏览选项卡上的内联操作中删除数据集或添加数据集以用于实时客户配置文件。 有关详细信息,请参阅内联操作部分

删除数据集确认对话框。

内联数据集操作 inline-actions

数据集UI现在为每个可用数据集提供一组内联操作。 选择要管理的数据集的省略号(…)可在弹出菜单中查看可用选项。 可用的操作包括:

有关这些可用操作的更多信息,请参阅其各自部分。 要了解如何同时管理大量数据集,请参阅批量操作部分。

预览数据集 preview

您可以从浏览选项卡的内联选项以及数据集活动视图中预览数据集样本数据。 从浏览选项卡中,选择要预览的数据集名称旁边的省略号(…)。 出现一个选项菜单列表。 接下来,从可用选项列表中选择? 预览数据集。 如果数据集为空,则取消激活预览链接,并指示预览不可用。

选定数据集的“数据集”工作区的“浏览”选项卡,其中突出显示了省略号和预览数据集选项。

这将打开预览窗口,其中数据集的架构的分层视图显示在右侧。

NOTE
视图左侧的架构图仅显示包含数据的字段。 无数据的字段会自动隐藏,以简化UI并专注于相关信息。

将显示数据集预览对话框,其中包含有关数据集的结构信息以及示例值。

或者,从? 数据集活动 ?屏幕中,选择屏幕右上角附近的? 预览数据集 ?以预览最多100行数据。

预览数据集按钮突出显示。

对于更可靠的数据访问方法,Experience Platform提供下游服务,如Query Service和JupyterLab,以浏览和分析数据。 有关详细信息,请参阅以下文档:

在数据集上管理和强制执行数据治理 manage-and-enforce-data-governance

您可以通过选择浏览选项卡的内联选项来管理数据集的数据治理标签。 选择要管理的数据集名称旁边的省略号(…),然后从下拉菜单中? 管理数据和访问标签

通过在架构级别应用数据使用标签,您可以根据应用于该数据的使用策略对数据集和字段进行分类。 请参阅数据管理概述以了解有关标签的更多信息,或参阅数据使用标签用户指南以了解有关如何将标签应用于架构以传播到数据集的说明。

为实时客户个人资料启用数据集 enable-profile

每个数据集都能够使用其摄取的数据扩充客户用户档案。 为此,数据集所遵循的架构必须兼容才能在Real-Time Customer Profile中使用。 兼容的架构满足以下要求:

  • 架构至少有一个指定为标识属性的属性。
  • 架构具有定义为主标识的标识属性。

有关为笔谤辞蹿颈濒别启用架构的更多信息,请参阅架构编辑器用户指南

您可以从浏览选项卡的内联选项以及数据集活动视图中启用配置文件的数据集。 从数据集工作区的浏览选项卡中,选择要为配置文件启用的数据集的省略号。 出现一个选项菜单列表。 接下来,从可用选项列表中选择? 启用统一配置文件

突出显示省略号和启用统一配置文件的数据集工作区的“浏览”选项卡。

或者,从数据集的? 数据集活动 ?屏幕中,选择? 属性 ?列中的? 配置文件 ?切换开关。 启用后,还将使用摄取到数据集的数据来填充客户配置文件。

NOTE
如果某个数据集已包含数据,然后为Profile启用,则Profile不会自动使用现有数据。 为Profile启用数据集后,建议您重新摄取任何现有数据,以使其贡献到客户个人资料。

数据集详细信息页面中高亮显示配置文件切换。

也可通过此条件筛选为配置文件启用的数据集。 请参阅有关如何筛选启用配置文件的数据集的部分,以获取更多信息。

管理数据集标记 manage-tags

添加自定义创建的标记以组织数据集并改进搜索、筛选和排序功能。 从数据集工作区的浏览选项卡中,选择要管理的数据集的省略号,然后从下拉菜单中选择? 管理标记

选定数据集的“数据集”工作区的“浏览”选项卡(带有省略号和“管理标记”选项)突出显示。

出现管理标记对话框。 输入简短描述以创建自定义标记,或从预先存在的标记中选择以标记您的数据集。 选择? 保存 ?以确认您的设置。

突出显示自定义标记的“管理标记”对话框。

管理标记对话框也可以从数据集中删除现有标记。 只需选择要删除的标记旁边的“x”并选择? 保存 ?即可。

将标记添加到数据集后,可以根据相应的标记筛选数据集。 有关详细信息,请参阅有关如何按标记筛选数据集的部分。

有关如何对业务对象进行分类以便于发现和分类的详细信息,请参阅管理元数据分类指南。 本指南介绍具有正确权限的用户如何在Experience Platform UI中创建预定义标记、将标记分配给类别以及管理所有相关的CRUD操作。

(叠别迟补)设置数据保留策略 data-retention-policy

AVAILABILITY
数据保留设置当前为测试版,仅在? 有限版本 ?中可供选定组织使用。 您的UI可能无法反映下面描述的功能。

使用数据集工作区的浏览选项卡中的内联操作菜单管理数据集到期和保留设置。 您可以使用此功能配置数据在数据湖和配置文件存储中保留的时长。 到期日期基于数据被摄取到Experience Platform中的时间和您配置的保留期。

TIP
数据湖存储原始的未处理数据(如事件日志、点击流数据和批量摄取的记录),以供分析和处理。 配置文件存储区包含客户可识别的数据(包括身份拼接事件和属性信息),以支持实时个性化和激活。

要配置保留期,请选择数据集旁边的省略号,然后从下拉菜单中选择? 设置数据保留策略

带有省略号的数据集工作区的“浏览”选项卡和突出显示的设置数据保留策略选项。

出现设置数据集保留对话框。 该对话框显示沙盒级别的许可证使用量度、数据集级别的详细信息以及当前数据保留设置。 这些量度显示与您的权利对比的使用情况,并帮助您评估特定于数据集的存储和保留期配置。 这些量度包括数据集名称、类型、配置文件启用状态以及数据湖和配置文件存储使用情况。

NOTE
沙盒级别许可的数据湖存储量度仍在开发中,可能无法显示。 您可以在“许可证使用情况”功能板上找到许可证使用情况量度的完整明细。 有关这些量度的描述,请参阅文档。

在数据保留设置对话框中配置首选保留期。 输入一个数字并从下拉菜单中选择一个时间单位(天、月或年)。 您可以为数据湖和配置文件服务配置单独的保留设置。

NOTE
数据湖的最短保留时间为30天。 配置文件服务的最短保留期为一天。

为了支持透明度和监视,为? 最近 ?和? 下一个 ?数据保留作业执行提供了时间戳。 时间戳可帮助您了解上次数据清理何时发生以及何时计划下次数据清理。

存储影响洞察 storage-impact-insights

要打开不同保留策略对存储影响的直观预测,请选择? 查看体验事件数据分发

图表显示了当前选定数据集跨不同保留期的体验事件分布。 将鼠标悬停在每个条上,可查看在应用所选保留期时将删除的记录的精确数量。

您可以使用可视预测来评估不同保留期的影响并做出明智的业务决策。 例如,如果您选择30天的保留期,并且图表显示60%的数据将被删除,则您可以选择延长保留期,以保留更多数据进行分析。

NOTE
体验事件分布图特定于数据集,并仅反映选定数据集的数据。

显示了“设置数据保留”对话框,其中显示了“体验事件”分布图。

如果对配置满意,请选择? 保存 ?以确认设置。

IMPORTANT
应用数据保留规则后,任何超过过期值所定义天数的数据将被永久删除,并且无法恢复。

配置保留设置后,使用监控UI确认系统执行了更改。 监控UI可集中查看所有数据集的数据保留活动。 从此处,您可以跟踪作业执行,查看删除了多少数据,并确保保留策略按预期运行。 此可见性支持治理、法规遵从性和高效的数据生命周期管理。

要了解如何使用监视仪表板在Experience Platform UI中跟踪源数据流,请参阅UI?文档中的监视源数据流。

有关定义数据集过期日期范围的规则以及配置数据保留策略的最佳实践的更多信息,请参阅常见问题解答页面

(叠别迟补)提高了保留期和存储指标的可见性 retention-and-storage-metrics

叠别迟补版用户可以使用四个新列,以便更清楚地了解您的数据管理:数据湖存储数据湖保留配置文件存储 ?和? 配置文件保留。 这些量度显示数据在Data Lake和Profile Service中消耗的存储量及其保留期。

这种更高的可见性使您能够作出明智的决策,更有效地管理存储成本。 按存储大小排序数据集,以识别当前沙盒中最大的数据集。 这些见解还支持更好的治理,并帮助您了解数据生命周期和权利使用情况。

数据集工作区的“浏览”选项卡,其中突出显示了四个新的存储和保留列。

下表概述了测试版中可用的新保留和存储指标。 它详细说明了每列的用途以及它如何支持管理数据保留和存储。

列标题
描述
数据湖保留
数据湖中每个数据集的当前保留期。 此值可配置,并决定在删除之前保留数据的时间。
数据湖存储
数据湖中每个数据集的当前存储使用情况。 使用此量度管理存储限制并优化使用情况。
配置文件存储
配置文件服务中每个数据集的当前存储使用情况。 帮助监控存储消耗和支持数据管理决策。
配置文件保留
配置文件数据集的当前保留期。 您可以更新此值以控制配置文件数据保留多长时间。

移至文件夹 move-to-folders

您可以将数据集放在文件夹中,以便更好地管理数据集。 要将数据集移动到文件夹中,请选择要管理的数据集名称旁边的省略号(…),然后从下拉菜单中? 移动到文件夹

突出显示带有椭圆形和移动到文件夹的数据集仪表板。

出现将数据集移动到文件夹对话框。 选择要将受众移动到的文件夹,然后选择? 移动。 弹出通知会告知您已成功移动数据集。

突出显示带有移动的移动数据集对话框。

TIP
您还可以直接从“移动数据集”对话框创建文件夹。 要创建文件夹,请选择创建文件夹图标( 创建文件夹图标)。 )。
突出显示了移动数据集对话框(创建文件夹图标)。

数据集位于文件夹中后,您可以选择仅显示属于特定文件夹的数据集。 要打开文件夹结构,请选择显示文件夹图标( 显示文件夹图标 )。 接下来,选择您选择的文件夹以查看所有关联的数据集。

显示数据集文件夹结构的数据集仪表板、显示文件夹图标和突出显示的选定文件夹。

删除数据集 delete

您可以从浏览选项卡或数据集活动视图右上角的数据集内联操作中删除数据集。 从浏览视图中,选择要删除的数据集名称旁边的省略号(…)。 出现一个选项菜单列表。 接下来,从下拉菜单中选择? 删除

选定数据集的“数据集”工作区的“浏览”选项卡上带有省略号,且“删除”选项突出显示。

将显示确认对话框。 选择? 删除 ?以确认。

或者,从? 数据集活动 ?屏幕中选择? 删除数据集

NOTE
无法删除由51黑料不打烊应用程序和服务(如51黑料不打烊 Analytics、51黑料不打烊 Audience Manager或Offer Decisioning)创建和利用的数据集。

“删除数据集”按钮在数据集详细信息页面中突出显示。

将出现一个确认框。 选择? 删除 ?以确认删除数据集。

将显示删除的确认模式,并突出显示删除按钮。

删除启用配置文件的数据集

如果为配置文件启用了某个数据集,则通过鲍滨删除该数据集会将其从数据湖、身份服务以及配置文件存储中与该数据集关联的任何配置文件数据中删除。

您可以使用实时客户个人资料API从Profile存储中删除与数据集关联的个人资料数据(将数据保留在数据湖中)。 有关详细信息,请参阅配置文件系统作业础笔滨终结点指南

搜索和筛选数据集 search-and-filter

要搜索或筛选可用数据集的列表,请选择筛选器图标( 筛选器图标)。 )。 左边栏中显示一组过滤器选项。 有多种方法可用于筛选可用数据集。 这些包括:显示系统数据集包含在配置文件中、标记创建日期修改日期、创建者架构

应用的过滤器列表显示在过滤结果上方。

已应用筛选器列表突出显示的数据集工作区的“浏览”选项卡。

显示系统数据集 show-system-datasets

默认情况下,仅显示已摄取数据的数据集。 如果要查看系统生成的数据集,请选择显示系统数据集部分中的? ?复选框。 系统生成的数据集仅用于处理其他组件。 例如,系统生成的配置文件导出数据集用于处理配置文件仪表板。

突出显示显示系统数据集节的数据集工作区的筛选器选项。

启用筛选配置文件的数据集 filter-profile-enabled-datasets

为配置文件数据启用的数据集用于在引入数据后填充客户配置文件。 请参阅有关为配置文件启用数据集的部分以了解详情。

要根据是否已为配置文件启用数据集来筛选数据集,请从筛选选项中选择是复选框。

已突出显示包含在配置文件部分的数据集工作区的筛选器选项。

按标记筛选数据集 filter-by-tag

在标记输入中输入您的自定义标记名称,然后从可用选项列表中选择您的标记,以搜索和筛选与该标记对应的数据集。

数据集工作区的筛选器选项,突出显示标记输入和筛选器图标。

按创建日期筛选数据集 filter-by-creation-date

可以在自定义时段内按创建日期筛选数据集。 这可用于排除历史数据或生成特定的按时间顺序排列的数据洞察和报表。 通过选择每个字段的日历图标,选择开始日期和结束日期。 之后,只有符合该条件的数据集才会显示在浏览选项卡中。

按修改日期筛选数据集 filter-by-modified-date

与创建日期过滤器类似,您可以根据上次修改数据集的日期来筛选数据集。 在修改日期部分中,通过选择每个字段的日历图标来选择开始日期和结束日期。 之后,只有在该时段修改的数据集才会显示在浏览选项卡中。

按架构筛选 filter-by-schema

您可以根据定义数据集结构的架构筛选数据集。 选择下拉图标或将架构名称输入文本字段。 此时将显示一个潜在匹配项列表。 从列表中选择相应的架构。

批量操作 bulk-actions

使用批量操作提高操作效率,并对大量数据集同时执行多项操作。 您可以通过批量操作(如移动到文件夹编辑标记删除数据集)来节省时间并保持有条理的数据结构。

要一次处理多个数据集,请选中每行带有复选框的单个数据集,或选中带有列标题的整个页面。 选中后,将出现批量操作栏。

数据集浏览选项卡,其中选定了大量数据集并突出显示批量操作栏。

对数据集应用批量操作时,将应用以下条件:

  • 您可以从鲍滨的不同页面选择数据集。
  • 如果选择筛选器,则选定的数据集将重置。

按创建日期排序数据集 sort

浏览选项卡中的数据集可以按升序或降序日期排序。 选择Created或Last updated列标题在升序和降序之间替换。 选中后,列将通过列标题侧的向上或向下箭头指示此信息。

数据集工作区的“浏览”选项卡,其中已创建列和上次更新列突出显示。

创建数据集 create

要创建新数据集,请在? 数据集 ?仪表板中选择? 创建数据集

已突出显示“创建数据集”按钮。

在下一个屏幕中,您将看到用于创建新数据集的以下两个选项:

使用现有架构创建数据集 schema

在? 创建数据集 ?屏幕中,选择? 从架构创建数据集 ?以创建新的空数据集。

从架构创建数据集按钮突出显示。

出现? 选择架构 ?步骤。 浏览架构列表并选择数据集将遵循的架构,然后选择? 下一步

将显示架构列表。 将用于创建数据集的架构已突出显示。

将显示? 配置数据集 ?步骤。 为数据集提供名称和可选描述,然后选择? 完成 ?以创建数据集。

已插入数据集的配置详细信息。 这包括数据集名称和描述等详细信息。

可以使用架构筛选器从UI中的可用数据集列表中筛选数据集。 有关详细信息,请参阅有关如何按架构筛选数据集的部分。

使用颁厂痴文件创建数据集 csv

使用颁厂痴文件创建数据集时,将创建一个临时架构,以便为数据集提供匹配提供的CSV文件的结构。 在? 创建数据集 ?屏幕中,选择? 从颁厂痴文件创建数据集

已突出显示“从颁厂痴文件创建数据集”按钮。

出现? 配置 ?步骤。 为数据集提供名称和可选描述,然后选择? 下一步

已插入数据集的配置详细信息。 这包括数据集名称和描述等详细信息。

出现? 添加数据 ?步骤。 通过将CSV文件拖放到屏幕中心来上载该文件,或者选择? 浏览 ?浏览文件目录。 文件大小最多可达10 GB。 上传CSV文件后,选择? 保存 ?以创建数据集。

NOTE
颁厂痴列名称必须以字母数字字符开头,并且只能包含字母、数字和下划线。

将显示“添加数据”屏幕。 您可以为数据集上传CSV文件的位置突出显示。

监测数据摄取

在Experience Platform UI的左侧导航中选择? 监视。 通过? 监控 ?仪表板,可查看来自批处理或流式摄取的入站数据状态。 要查看各个批次的状态,请选择? 批次端对端 ?或? 流式端对端。 仪表板将列出所有批次或流式摄取运行,包括成功、失败或仍在进行的批次或流式摄取运行。 每个列表都提供了批次的详细信息,包括批次滨顿、目标数据集的名称和摄取的记录数。 如果为Profile启用了目标数据集,则还会显示已摄取的身份和配置文件记录数。

将显示监控批次的端到端屏幕。 监视和批处理都高亮显示。

您可以选择单个? 批次滨顿 ?来访问? 批次概述 ?仪表板,并查看批次的详细信息,包括批次无法摄取时的错误日志。

显示选定批次的详细信息。 这包括摄取的记录数、失败的记录数、批次状态、文件大小、摄取的开始和结束时间、数据集和批次滨顿、组织ID、数据集名称和访问信息。

如果要删除批次,请选择仪表板右上角附近的? 删除批次。 删除批次也会从最初将批次摄取到的数据集中删除其记录。

NOTE
如果已为配置文件启用并处理了摄取的数据,则删除批次不会从配置文件存储中删除该数据。

数据集详细信息页面上突出显示了“删除批处理”按钮。

后续步骤

本用户指南提供了在Experience Platform用户界面中使用数据集时执行常用操作的说明。 有关执行涉及数据集的常见Experience Platform工作流的步骤,请参阅以下教程:

recommendation-more-help
c5c02be6-79a3-4a2f-b766-136bffe8b676