跳到主要内容

从文本中提取内容

指令说明

从文本中提取符合规则的内容,结果保存为文本列表。支持直接提取数字、手机号、邮箱地址、身份证号,也支持通过自定义正则表达式提取内容。

指令输入参数

输入参数输入参数类型说明
文本str需要提取内容的文本,支持文本变量或 Python 表达式
提取方式枚举项数字、手机号、邮箱地址、身份证号、自定义内容
正则表达式str仅当 提取方式 是 自定义内容 时需要该参数

指令输出参数

输出参数输出参数类型说明
提取结果list[str]匹配到的文本列表,未匹配到内容时为空列表

注意

当 提取方式 是 自定义内容 时,正则表达式必须是有效的 Python 正则表达式。提取结果会保存完整匹配内容,即使正则表达式中包含捕获组,也不会只保存捕获组内容。

DescJson 示例

[
{
"ins": "从文本中提取内容",
"in": {
"文本": "text",
"提取方式": "'手机号'"
},
"out": {
"提取结果": "phoneList"
}
},
{
"ins": "从文本中提取内容",
"in": {
"文本": "text",
"提取方式": "'自定义内容'",
"正则表达式": "'订单号[::]\\\\s*\\\\w+'"
},
"out": {
"提取结果": "orderList"
}
}
]