Extract Invoice Data from PDFs to JSON with Gemini AI and XML Transformation — n8n ワークフロー

複雑度 トリガー6個のノード🏷️ Invoice Processing作成者:Mauricio Perera

概要

This n8n workflow converts invoices in PDF format into a structured, ready-to-use JSON, using AI and XML transformation — without writing any code.

🚀 How it works

Upload form → The user uploads a PDF file. Text extraction → The PDF content is extracted as plain text. XML schema definition → A standard invoice structure is defined with fields such as:

Invoice number Customer and issuer details Items with description, quantity, and price Totals and taxes Bank account details AI (

使用ノード

Google Gemini

ワークフロープレビュー

PDF to text
Clean data and XML structure definition
Generate XML string
String to XML to Json
O
On form submission
E
Extract from File
Message a model
L
Limpio data
L
Limpio XML
X
XML to JSON
6 nodes5 edges

仕組み

  1. 1

    トリガー

    このワークフローは トリガー トリガーで開始します。

  2. 2

    処理

    データは 6 個のノードを流れます, connecting extractfromfile, formtrigger, googlegemini。

  3. 3

    出力

    ワークフローは自動化を完了し、設定された宛先に結果を配信します。

ノード詳細 (6)

GO

Google Gemini

n8n-nodes-langchain.googleGemini

#1

このワークフローのインポート方法

  1. 1右側の JSONをダウンロード ボタンをクリックしてワークフローファイルを保存します。
  2. 2n8nインスタンスを開き、ワークフロー → 新規 → ファイルからインポート に進みます。
  3. 3ダウンロードした extract-invoice-data-from-pdfs-to-json-with-gemini-ai-and-xml-transformation ファイルを選択し、インポートをクリックします。
  4. 4各サービスノードの 認証情報(APIキー、OAuthなど)を設定します。
  5. 5ワークフローをテスト をクリックして動作確認し、有効化します。

またはn8nの JSONからインポート に直接貼り付け:

{ "name": "Extract Invoice Data from PDFs to JSON with Gemini AI and XML Transformation", "nodes": [...], ...}

インテグレーション

extractfromfileformtriggergooglegeminisetxml

このワークフローを取得

ワンクリックでダウンロード&インポート

JSONをダウンロードn8n.ioで見る
ノード6
複雑度medium
トリガーtrigger
カテゴリInvoice Processing

作成者

Mauricio Perera

Mauricio Perera

@rckflr

タグ

extractfromfileformtriggergooglegeminisetxml

n8n初めてですか?

n8nは無料のオープンソースワークフロー自動化ツールです。セルフホストまたはクラウド版をご利用いただけます。

n8nを無料で始める →

Related Invoice Processing Workflows

COCOEMEX+5
medium

Automate Custom QuickBooks Invoice PDFs & Email with n8n

Standard accounting templates often fail to reflect a premium brand identity. This sophisticated n8n workflow bridges the gap between financial record-keeping and professional client presentation. By moving beyond the native limitations of QuickBooks Online, this automation enables businesses to generate high-end, multi-page PDF invoices that align perfectly with their corporate styling. The process begins the moment a new invoice is generated in QuickBooks, triggering a webhook that captures real-time billing data. The workflow then utilizes advanced HTML-to-File conversion and custom Code nodes to structure data into a polished, branded layout. It handles complex logic such as line-item merging and multi-page formatting automatically. Once the document is rendered, the system bypasses generic 'no-reply' senders by routing the finalized PDF through your preferred email provider. This ensures a seamless, white-labeled experience for your clients while eliminating the manual overhead of exporting, styling, and attaching files. Ideal for agencies and service providers, this flow guarantees that your most frequent touchpoint—the bill—is as professional as your work. **Common Use Cases:** - High-end creative agencies requiring bespoke, white-labeled billing documents for premium clients. - Automated recurring subscription billing where custom tax disclosures or localized branding are required. - Service-based businesses needing to attach dynamic project reports or terms of service directly to QuickBooks invoices.

🔗 Webhook·12 nodes