Extract Invoice Data from PDFs to JSON with Gemini AI and XML Transformation — n8n 工作流
概览
This n8n workflow converts invoices in PDF format into a structured, ready-to-use JSON, using AI and XML transformation — without writing any code.
🚀 How it works
Upload form → The user uploads a PDF file. Text extraction → The PDF content is extracted as plain text. XML schema definition → A standard invoice structure is defined with fields such as:
Invoice number Customer and issuer details Items with description, quantity, and price Totals and taxes Bank account details AI (
使用的节点
Google Gemini
工作流预览
⚡
O
On form submission
E
Extract from File
Message a model
L
Limpio data
L
Limpio XML
X
XML to JSON
6 nodes5 edges
工作原理
- 1
触发器
工作流由 触发器 触发器启动。
- 2
处理
数据流经 6 个节点, connecting extractfromfile, formtrigger, googlegemini。
- 3
输出
工作流完成自动化并将结果发送到配置的目标。
节点详情 (6)
GO#1
Google Gemini
n8n-nodes-langchain.googleGemini
如何导入此工作流
- 1点击右侧 下载 JSON 按钮保存工作流文件。
- 2打开你的 n8n 实例,依次点击 工作流 → 新建 → 从文件导入。
- 3选择下载的
extract-invoice-data-from-pdfs-to-json-with-gemini-ai-and-xml-transformation文件并点击导入。 - 4为每个服务节点配置 凭证(API 密钥、OAuth 等)。
- 5点击 测试工作流 验证一切正常,然后激活它。
或直接在 n8n → 从 JSON 导入 中粘贴:
{ "name": "Extract Invoice Data from PDFs to JSON with Gemini AI and XML Transformation", "nodes": [...], ...}
集成
extractfromfileformtriggergooglegeminisetxml
创建者
Mauricio Perera
@rckflr
标签
extractfromfileformtriggergooglegeminisetxml