Automatisation Google Drive avec n8n : traitement de fichiers PDF
Ce workflow n8n a pour objectif d'automatiser le traitement de fichiers PDF stockés sur Google Drive. Il est particulièrement utile pour les entreprises qui manipulent régulièrement des documents PDF et qui souhaitent optimiser leur flux de travail. Grâce à cette automatisation, les utilisateurs peuvent extraire des données de fichiers PDF, les traiter et les envoyer à des outils d'intelligence artificielle comme Gemini 2.0 et Claude 3.5 pour des analyses avancées. Cela permet de gagner du temps et d'améliorer l'efficacité des équipes. Le workflow commence par un déclencheur manuel, où l'utilisateur clique sur 'Test workflow' pour initier le processus. Ensuite, le nœud 'Extract from File' est utilisé pour extraire des données spécifiques d'un fichier PDF. Une fois les données extraites, le workflow interagit avec Google Drive pour récupérer le fichier nécessaire. Les nœuds HTTP 'Call Gemini 2.0 Flash with PDF Capabilities' et 'Call Claude 3.5 Sonnet with PDF Capabilities' sont ensuite utilisés pour envoyer les données extraites à ces services d'IA, permettant ainsi d'obtenir des résultats enrichis. Les bénéfices de cette automatisation incluent une réduction significative du temps de traitement des documents, une diminution des erreurs humaines et une amélioration de la productivité globale. En intégrant ces outils d'IA, les entreprises peuvent également tirer parti de l'analyse avancée pour des décisions plus éclairées. Tags clés : Google Drive, automatisation, workflow.
Vue d'ensemble du workflow n8n
Schéma des nœuds et connexions de ce workflow n8n, généré à partir du JSON n8n.
Détail des nœuds du workflow n8n
Inscris-toi pour voir l'intégralité du workflow
Inscription gratuite
S'inscrire gratuitementBesoin d'aide ?{
"meta": {
"instanceId": "f4f5d195bb2162a0972f737368404b18be694648d365d6c6771d7b4909d28167"
},
"nodes": [
{
"id": "b6cd232e-e82e-457b-9f03-c010b3eba148",
"name": "When clicking 'Test workflow'",
"type": "n8n-nodes-base.manualTrigger",
"position": [
-40,
0
],
"parameters": {},
"typeVersion": 1
},
{
"id": "2b734806-e3c0-4552-a491-54ca846ed3ac",
"name": "Extract from File",
"type": "n8n-nodes-base.extractFromFile",
"position": [
620,
0
],
"parameters": {
"options": {},
"operation": "binaryToPropery"
},
"typeVersion": 1
},
{
"id": "2c199499-cc4f-405c-8560-765500b7acba",
"name": "Google Drive",
"type": "n8n-nodes-base.googleDrive",
"position": [
420,
0
],
"parameters": {
"fileId": {
"__rl": true,
"mode": "list",
"value": "18Ac2xorxirIBm9FNFDDB5aVUSPBCCg1U",
"cachedResultUrl": "https://drive.google.com/file/d/18Ac2xorxirIBm9FNFDDB5aVUSPBCCg1U/view?usp=drivesdk",
"cachedResultName": "Invoice-798FE2FA-0004.pdf"
},
"options": {},
"operation": "download"
},
"credentials": {
"googleDriveOAuth2Api": {
"id": "AUEpxwlqBJghNMtb",
"name": "Google Drive account"
}
},
"typeVersion": 3
},
{
"id": "e3031c0c-f059-4f30-9684-10014a277d55",
"name": "Call Gemini 2.0 Flash with PDF Capabilities",
"type": "n8n-nodes-base.httpRequest",
"position": [
880,
220
],
"parameters": {
"url": "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp:generateContent",
"method": "POST",
"options": {},
"jsonBody": "={\n \"contents\": [\n {\n \"parts\": [\n {\n \"inline_data\": {\n \"mime_type\": \"application/pdf\",\n \"data\": \"{{ $json.data }}\"\n }\n },\n {\n \"text\": \"{{ $('Define Prompt').item.json.prompt }}\"\n }\n ]\n }\n ]\n}",
"sendBody": true,
"specifyBody": "json",
"authentication": "predefinedCredentialType",
"nodeCredentialType": "googlePalmApi"
},
"credentials": {
"anthropicApi": {
"id": "eOt6Ois0jSizRFMJ",
"name": "Anthropic Mira Account"
},
"googlePalmApi": {
"id": "IQrjvfoUd5LUft3b",
"name": "Google Gemini(PaLM) Api account"
}
},
"typeVersion": 4.2
},
{
"id": "135df716-32a1-47e8-9ed8-30c830b803d6",
"name": "Call Claude 3.5 Sonnet with PDF Capabilities",
"type": "n8n-nodes-base.httpRequest",
"position": [
880,
-140
],
"parameters": {
"url": "https://api.anthropic.com/v1/messages",
"method": "POST",
"options": {},
"jsonBody": "={\n \"model\": \"claude-3-5-sonnet-20241022\",\n \"max_tokens\": 1024,\n \"messages\": [{\n \"role\": \"user\",\n \"content\": [{\n \"type\": \"document\",\n \"source\": {\n \"type\": \"base64\",\n \"media_type\": \"application/pdf\",\n \"data\": \"{{$json.data}}\"\n }\n },\n {\n \"type\": \"text\",\n \"text\": \"{{ $('Define Prompt').item.json.prompt }}\"\n }]\n }]\n}",
"sendBody": true,
"sendHeaders": true,
"specifyBody": "json",
"authentication": "predefinedCredentialType",
"headerParameters": {
"parameters": [
{
"name": "anthropic-version",
"value": "2023-06-01"
},
{
"name": "content-type",
"value": "application/json"
}
]
},
"nodeCredentialType": "anthropicApi"
},
"credentials": {
"anthropicApi": {
"id": "eOt6Ois0jSizRFMJ",
"name": "Anthropic Mira Account"
}
},
"typeVersion": 4.2
},
{
"id": "5b8994d1-4bfd-4776-84ac-b3141aca6378",
"name": "Sticky Note1",
"type": "n8n-nodes-base.stickyNote",
"position": [
-700,
-280
],
"parameters": {
"color": 7,
"width": 601,
"height": 585,
"content": "## Workflow: Extract data from PDF with Claude 3.5 Sonnet or Gemini 2.0 Flash\n\n**Overview**\n- This workflow helps you compare Claude 3.5 Sonnet and Gemini 2.0 Flash when extracting data from a PDF\n- This workflow extracts and processes the data within a PDF in **one single step**, **instead of calling an OCR and then an LLM”**\n\n\n**How it works**\n- The initial 2 steps download the PDF and convert it to base64.\n- This base64 string is then sent to both Claude 3.5 Sonnet and Gemini 2.0 Flash to extract information.\n- This workflow is made to let you compare results, latency, and cost (in their dedicated dashboard).\n\n\n**How to use it**\n- Set up your Google Drive if not already done\n- Select a document on your Google Drive\n- Modify the prompt in \"Define Prompt\" to extract the information you need and transform it as wanted.\n- Get a [Claude API key](https://console.anthropic.com/settings/keys) and/or [Gemini API key](https://aistudio.google.com/app/apikey)\n- Note that you can deactivate one of the 2 API calls if you don't want to try both\n- Test the Workflow\n"
},
"typeVersion": 1
},
{
"id": "616241a9-6199-406b-88dc-0afc7d974250",
"name": "Sticky Note",
"type": "n8n-nodes-base.stickyNote",
"position": [
820,
60
],
"parameters": {
"color": 5,
"width": 320,
"height": 360,
"content": "You can output the result as JSON by adding the following:\n```\n\"generationConfig\": {\n \"responseMimeType\": \"application/json\"\n```\nor even use a structured output.\n[Check the documentation](https://ai.google.dev/gemini-api/docs/structured-output?lang=rest)"
},
"typeVersion": 1
},
{
"id": "bbac8d3d-d68f-4aa2-a41a-b06f7de2317b",
"name": "Define Prompt",
"type": "n8n-nodes-base.set",
"position": [
180,
0
],
"parameters": {
"options": {},
"assignments": {
"assignments": [
{
"id": "dba23ef5-95df-496a-8e24-c7c1544533d2",
"name": "prompt",
"type": "string",
"value": "Extract the VAT numbers for each country"
}
]
}
},
"typeVersion": 3.4
},
{
"id": "3c2e7265-76e5-4911-a950-7e6b0c89ec5a",
"name": "Sticky Note2",
"type": "n8n-nodes-base.stickyNote",
"position": [
820,
-200
],
"parameters": {
"color": 5,
"width": 320,
"height": 240,
"content": "You can force Claude to output JSON with [Prefill response format](https://docs.anthropic.com/en/docs/test-and-evaluate/strengthen-guardrails/increase-consistency#prefill-claudes-response)"
},
"typeVersion": 1
},
{
"id": "f2b46305-5200-486e-ad4d-ecc0d2a14314",
"name": "Sticky Note3",
"type": "n8n-nodes-base.stickyNote",
"position": [
380,
-120
],
"parameters": {
"color": 5,
"width": 380,
"height": 280,
"content": "These 2 steps first download the PDF file, and then convert it to base64.\nThis is required by both APIs to process the file."
},
"typeVersion": 1
},
{
"id": "e5dff70f-b55a-4c23-9025-765a7cf19c4a",
"name": "Sticky Note4",
"type": "n8n-nodes-base.stickyNote",
"position": [
120,
-120
],
"parameters": {
"color": 5,
"width": 220,
"height": 280,
"content": "This prompt is used in both Gemini’s and Claude’s calls to define what information should be extracted and processed."
},
"typeVersion": 1
}
],
"pinData": {},
"connections": {
"Google Drive": {
"main": [
[
{
"node": "Extract from File",
"type": "main",
"index": 0
}
]
]
},
"Define Prompt": {
"main": [
[
{
"node": "Google Drive",
"type": "main",
"index": 0
}
]
]
},
"Extract from File": {
"main": [
[
{
"node": "Call Claude 3.5 Sonnet with PDF Capabilities",
"type": "main",
"index": 0
},
{
"node": "Call Gemini 2.0 Flash with PDF Capabilities",
"type": "main",
"index": 0
}
]
]
},
"When clicking 'Test workflow'": {
"main": [
[
{
"node": "Define Prompt",
"type": "main",
"index": 0
}
]
]
}
}
}Pour qui est ce workflow ?
Ce workflow s'adresse aux entreprises qui utilisent Google Drive pour stocker des fichiers PDF et qui souhaitent automatiser le traitement de ces documents. Il est idéal pour les équipes techniques et les professionnels qui ont une connaissance de base des outils d'automatisation et qui cherchent à améliorer leur efficacité opérationnelle.
Problème résolu
Ce workflow résout le problème de la gestion manuelle des fichiers PDF, qui peut être chronophage et sujet à des erreurs. En automatisant le processus d'extraction et de traitement des données, les utilisateurs peuvent réduire le temps passé sur des tâches répétitives, minimiser les risques d'erreurs humaines et obtenir des résultats plus rapidement. Après la mise en place de cette automatisation, les utilisateurs peuvent s'attendre à un flux de travail plus fluide et à une meilleure utilisation de leurs ressources.
Étapes du workflow
Étape 1 : Le processus débute par un déclencheur manuel où l'utilisateur clique sur 'Test workflow'. Étape 2 : Le nœud 'Extract from File' extrait les données d'un fichier PDF. Étape 3 : Le workflow interagit avec Google Drive pour récupérer le fichier nécessaire. Étape 4 : Les données extraites sont envoyées à Gemini 2.0 via un appel HTTP pour traitement. Étape 5 : Un second appel HTTP est effectué vers Claude 3.5 pour des analyses supplémentaires. Étape 6 : Des notes adhésives sont créées pour visualiser les résultats à chaque étape.
Guide de personnalisation du workflow n8n
Pour personnaliser ce workflow, commencez par ajuster le nœud 'Extract from File' pour spécifier le type de données que vous souhaitez extraire des fichiers PDF. Modifiez l'ID du fichier dans le nœud Google Drive pour pointer vers le document souhaité. Vous pouvez également adapter les paramètres des nœuds HTTP pour répondre à vos besoins spécifiques en matière d'analyses avec Gemini 2.0 et Claude 3.5. Pour sécuriser le flux, assurez-vous d'utiliser des authentifications appropriées pour les appels API et de surveiller les performances du workflow via l'interface n8n.