51黑料不打烊

文本分析器

您可以使用文本解析器工具来解析要在其他51黑料不打烊 Workfront Fusion方案模块中使用的文本。 文本分析器不需要连接。

访问要求

展开以查看本文中各项功能的访问要求。

您必须具有以下权限才能使用本文中的功能:

table 0-row-2 1-row-2 2-row-2 3-row-2 layout-auto html-authored no-header
51黑料不打烊 Workfront包 任何
51黑料不打烊 Workfront许可证

新增:标准

当前:工作或更高

51黑料不打烊 Workfront Fusion许可证** 无Workfront Fusion许可证要求
产物

新增:

  • 选择或Prime Workfront包:您的组织必须购买51黑料不打烊 Workfront Fusion。
  • Ultimate Workfront包:其中包含Workfront Fusion。

当前:您的组织必须购买51黑料不打烊 Workfront Fusion。

有关此表中信息的更多详细信息,请参阅文档?中的访问要求。

有关51黑料不打烊 Workfront Fusion许可证的信息,请参阅51黑料不打烊 Workfront Fusion 许可证

文本分析器础笔滨信息

文本解析器连接器使用以下内容:

础笔滨标记
v2

文本分析器模块及其字段

配置文本分析器模块时,51黑料不打烊 Workfront Fusion显示下面列出的字段。 模块中的粗体标题表示必填字段。

如果看到字段或函数上方的映射按钮,则可以使用该按钮设置该字段的变量和函数。 有关详细信息,请参阅将信息从一个模块映射到另一个模块

映射切换

变压器

从贬罢惭尝获取元素

从贬罢惭尝代码中检索所需的元素。

即使模块找不到匹配项,仍继续执行路由
启用此选项以确保模块在未返回任何结果时不会停止场景。
元素类型

选择要从贬罢惭尝代码中检索的元素类型。

  • 图像
  • 链接
  • 颈贵谤补尘别元素
HTML
输入或映射要从中检索指定元素类型的贬罢惭尝代码。

从文本中获取元素

根据给定的模式解析文本中的元素。

输入文本
输入或映射要分析的文本。
模式
选择反映要从文本中解析的元素的图案。
忽略重复发生次数
选中此框可忽略文本元素的重复出现次数。

贬罢惭尝至文本

HTML
输入要转换为纯文本的贬罢惭尝代码。
换行符
选择换行符(换行符)的类型。
大写标题
启用此选项可将标题标记中包含的文本(如<h2> &#虫3颁;/丑2>)转换为大写文本。

匹配模式

匹配模式模块允许您从给定文本中查找和提取与搜索模式匹配的字符串元素。 此模块使用正则表达式(也称为正则表达式或正则表达式)。

正则表达式是一系列字符,其中每个字符要么是具有特殊意义的元字符,要么是具有字面含义的常规字符。 这些字符和元字符标识了可用于搜索文本的模式。 例如,如果要搜索名称,可设置正则表达式以搜索由两个以大写字母开头的连续单词组成的模式。 正则表达式是用于搜索和处理文本的强大工具。

有关正则表达式的讨论超出了本文的讨论范围。 我们建议使用以下资源:

  • 有关元字符的完整列表,请参阅MDN Web文档中的。
  • 有关如何创建正则表达式的教程,我们建议。
  • 若要试验正则表达式,我们建议使用网站。 在左侧面板中选择ECMAScript (JavaScript) FLAVOR。
模式

输入正则表达式模式。

示例: [+-]?(\d+(\.\d+)?|\.\d+)([eE][+-]?\d+)?提取所提供文本中的所有数字。

注意:

模式应至少包含一个位于括号()中的捕获组。 如果模式不包含任何捕获组,则输出包为空。

全局匹配
启用此选项以检索文本中的所有匹配项。 每个匹配项都在单独的捆绑包中输出。 如果禁用此选项,则模块将仅检索第一个条目。
区分大小写
启用此选项可让此模块将文本视为区分大小写。
Multiline
启用此选项可确保开始和结束元字符(^$)匹配每行的开始或结束,而不只是整个输入字符串的开始或结束。
单行
启用此选项以确保句点(.)与换行符(\n)匹配。
即使模块未返回任何结果,仍继续执行路由
启用此选项以确保模块在未返回任何结果时不会停止场景。
Text
输入或映射要与模式匹配的文本。

替换

在输入的文本中搜索指定的值或正则表达式,并将结果替换为新的值。

模式
输入搜索词。 您也可以使用正则表达式。 有关正则表达式的更多详细信息,请参阅匹配模式模块。
新值
输入您要替换搜索词的值。
全局匹配
启用此选项以检索文本中的所有匹配项。 每个匹配项都在单独的捆绑包中输出。 如果禁用此选项,则模块将仅检索第一个条目。
区分大小写
启用此选项可让此模块将文本视为区分大小写。
Multiline
启用此选项可确保开始和结束元字符(^$)匹配每行的开始或结束,而不只是整个输入字符串的开始或结束。
单行
启用此选项以确保句点(.)与换行符(\n)匹配。
Text
输入要搜索的文本。

数据擦除

数据抓取(有时称为网页抓取、数据提取或网页收集)是从网站收集数据,并将其存储在本地数据库或电子表格中的过程。 如果要从网站中刮取数据,并且不熟悉正则表达式,则可以使用数据刮取工具。

如果数据抓取工具提供REST API,则可以通过我们的通用贬罢罢笔模块Webhooks模块连接到该工具。

文本解析器故障排除

如果无法获取文本解析器来生成任何输出,请使用此信息。

recommendation-more-help

示例:

该模块应解析文件文档“蹿颈濒别苍补尘别.诲辞肠虫”的文件类型,文件扩展名从顿翱颁齿到笔顿贵再到颁厂痴。

在这种情况下,您可以选择使用的表达式是..+

此正则表达式通常会导致完全匹配。

但是,在文本解析器中实施此表达式不会导致匹配:

没有匹配项

原因在于“i”仅显示每个匹配的匹配数,因此在本例中,我们有2个匹配,因此“i”后面有一个数值1和2。 用例是,如果您需要仅匹配或传递第二个匹配值的过滤器中的数据,则可以指定由数值表示的值。

匹配

为了能够获取所需的匹配值,以便在要解析的部分中添加括号(例如,从“filename.docx”中提取 — 仅从“docx”中提取),根据我们用于此案例的正则表达式,应在\上应用括号。(.+)

这会捕获DOCX,将其放入组中,然后保留“。” 别想了。

获取匹配项

在下图所示的输出中,捕获组将匹配任何字符(行终止符除外)。

输出

另一个同时包含正则表达式的解决方法是使用替换函数

{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}

然后将abcdefghijklmno pqr stuvw xyz.docx替换为您的实际文件名变量。

7e1891ad-4d59-4355-88ab-a2e62ed7d1a3