发票提取器工具
发票提取器工具可从发票文件中提取行项目和元数据。在工作流中使用发票提取器工具,可自动捕获发票详情。
注意
GenAI 辅助工具目前处于公开预览版阶段。它们可能存在已知问题,可能不包括所有预期功能,且如有更改,恕不另行通知。
工具组件
发票提取器工具有 4 个锚点(2 个输入和 2 个输出):
M 输入锚点:使用 M 输入锚点连接来自
LLM 覆盖工具 的模型连接设置。D 输入锚点:使用 D 输入锚点连接包含 Blob 格式发票的数据集。
D 输出锚点:使用 D 输出锚点将提取的发票行项目数据向下游传递。
M 输出锚点:使用 M 输出锚点将提取的发票元数据数据向下游传递。
配置工具
在画布上添加一个发票提取器工具。
将 M 输入锚点连接到
LLM 覆盖工具。注意
对图像和 PDF 等非结构化数据的支持取决于您的 LLM 提供商及所选模型。如需详细了解支持的非结构化或多模式数据类型,请参阅您的 LLM 提供商的文档。
将 D 输入锚点连接到包含 Blob 格式发票的数据集。使用
“Blob 输入”工具 将您的图像或 PDF 发票文件连接到发票提取器工具。接受 Alteryx 预览版条款和条件。
从选择字段下拉列表中,选择包含发票数据的列。
(可选)要从发票中提取特定字段,请以逗号分隔输入字段名称:
在用逗号分隔的行项目字段中,列出要从发票表内容中提取的字段。
在用逗号分隔的元数据字段中,列出要从发票元数据中提取的字段。
在配置部分下,从指定提取日期的格式下拉列表中指定如何设置提取日期的格式:
匹配来源:保持日期格式与原始发票一致。
或者,从列表中选择自定义日期格式。
要将检测到的签名作为元数据包含在输出中,请选中在元数据中提取签名复选框。
运行工作流。
输出
发票提取器工具有 2 个输出锚点:
D 输出锚点:将提取的行项目信息以逗号分隔的列表形式向下游传递。您可能需要在下游添加额外工具,以解析此输出中的所有相关字段。
M 输出锚点:将提取的元数据信息向下游传递。
