从文本中提取内容
指令说明
从文本中提取符合规则的内容,结果保存为文本列表。支持直接提取数字、手机号、邮箱地址、身份证号,也支持通过自定义正则表达式提取内容。
指令输入参数
| 输入参数 | 输入参数类型 | 说明 |
|---|---|---|
| 文本 | str | 需要提取内容的文本,支持文本变量或 Python 表达式 |
| 提取方式 | 枚举项 | 数字、手机号、邮箱地址、身份证号、自定义内容 |
| 正则表达式 | str | 仅当 提取方式 是 自定义内容 时需要该参数 |
指令输出参数
| 输出参数 | 输出参数类型 | 说明 |
|---|---|---|
| 提取结果 | list[str] | 匹配到的文本列表,未匹配到内容时为空列表 |
注意
当 提取方式 是 自定义内容 时,正则表达式必须是有效的 Python 正则表达式。提取结果会保存完整匹配内容,即使正则表达式中包含捕获组,也不会只保存捕获组内容。
DescJson 示例
[
{
"ins": "从文本中提取内容",
"in": {
"文本": "text",
"提取方式": "'手机号'"
},
"out": {
"提取结果": "phoneList"
}
},
{
"ins": "从文本中提取内容",
"in": {
"文本": "text",
"提取方式": "'自定义内容'",
"正则表达式": "'订单号[::]\\\\s*\\\\w+'"
},
"out": {
"提取结果": "orderList"
}
}
]