Extract Invoice Data from PDFs to JSON with Gemini AI and XML Transformation — Workflow n8n
Aperçu
This n8n workflow converts invoices in PDF format into a structured, ready-to-use JSON, using AI and XML transformation — without writing any code.
🚀 How it works
Upload form → The user uploads a PDF file. Text extraction → The PDF content is extracted as plain text. XML schema definition → A standard invoice structure is defined with fields such as:
Invoice number Customer and issuer details Items with description, quantity, and price Totals and taxes Bank account details AI (
Nœuds utilisés
Aperçu du workflow
Comment ça fonctionne
- 1
Déclencheur
Le workflow démarre avec un déclencheur déclencheur.
- 2
Traitement
Les données transitent par 6 nœuds, connecting extractfromfile, formtrigger, googlegemini.
- 3
Sortie
Le workflow termine son automatisation et livre le résultat à la destination configurée.
Détails des nœuds (6)
Google Gemini
n8n-nodes-langchain.googleGemini
Comment importer ce workflow
- 1Cliquez sur le bouton Télécharger JSON à droite pour enregistrer le fichier du workflow.
- 2Ouvrez votre instance n8n. Accédez à Workflows → Nouveau → Importer depuis un fichier.
- 3Sélectionnez le fichier
extract-invoice-data-from-pdfs-to-json-with-gemini-ai-and-xml-transformationtéléchargé et cliquez sur Importer. - 4Configurez les identifiants pour chaque nœud de service (clés API, OAuth, etc.).
- 5Cliquez sur Tester le workflow pour vérifier que tout fonctionne, puis activez-le.
Ou collez directement dans n8n → Importer depuis JSON :
Intégrations
Créé par
Mauricio Perera
@rckflr
Tags
Nouveau sur n8n ?
n8n est un outil d'automatisation de workflows gratuit et open-source. Hébergez-le vous-même ou utilisez la version cloud.
Obtenir n8n gratuitement →