Extract Invoice Data from PDFs to JSON with Gemini AI and XML Transformation — n8n ワークフロー
概要
This n8n workflow converts invoices in PDF format into a structured, ready-to-use JSON, using AI and XML transformation — without writing any code.
🚀 How it works
Upload form → The user uploads a PDF file. Text extraction → The PDF content is extracted as plain text. XML schema definition → A standard invoice structure is defined with fields such as:
Invoice number Customer and issuer details Items with description, quantity, and price Totals and taxes Bank account details AI (
使用ノード
Google Gemini
ワークフロープレビュー
⚡
O
On form submission
E
Extract from File
Message a model
L
Limpio data
L
Limpio XML
X
XML to JSON
6 nodes5 edges
仕組み
- 1
トリガー
このワークフローは トリガー トリガーで開始します。
- 2
処理
データは 6 個のノードを流れます, connecting extractfromfile, formtrigger, googlegemini。
- 3
出力
ワークフローは自動化を完了し、設定された宛先に結果を配信します。
ノード詳細 (6)
GO#1
Google Gemini
n8n-nodes-langchain.googleGemini
このワークフローのインポート方法
- 1右側の JSONをダウンロード ボタンをクリックしてワークフローファイルを保存します。
- 2n8nインスタンスを開き、ワークフロー → 新規 → ファイルからインポート に進みます。
- 3ダウンロードした
extract-invoice-data-from-pdfs-to-json-with-gemini-ai-and-xml-transformationファイルを選択し、インポートをクリックします。 - 4各サービスノードの 認証情報(APIキー、OAuthなど)を設定します。
- 5ワークフローをテスト をクリックして動作確認し、有効化します。
またはn8nの JSONからインポート に直接貼り付け:
{ "name": "Extract Invoice Data from PDFs to JSON with Gemini AI and XML Transformation", "nodes": [...], ...}
インテグレーション
extractfromfileformtriggergooglegeminisetxml
作成者
Mauricio Perera
@rckflr
タグ
extractfromfileformtriggergooglegeminisetxml