Automatisation Google Drive avec n8n : extraction d'images PDF
- Ce workflow n8n a pour objectif d'automatiser l'extraction et l'analyse d'images à partir de fichiers PDF stockés sur Google Drive. Dans un contexte où les entreprises manipulent régulièrement des documents PDF, ce processus permet de gagner un temps précieux en automatisant les tâches manuelles d'extraction et d'analyse d'images. Les cas d'usage incluent la gestion de documents, la création de rapports visuels et l'analyse de contenu visuel pour des présentations ou des études de marché.
- Le workflow commence par un déclencheur manuel, permettant à l'utilisateur de tester le flux à la demande. Ensuite, il récupère le fichier PDF depuis Google Drive grâce à un nœud dédié. Une fois le fichier obtenu, le workflow extrait les images contenues dans le PDF via une requête HTTP. Les images sont ensuite analysées à l'aide de l'API OpenAI, qui fournit des insights et des résumés basés sur le contenu visuel. Les résultats de cette analyse sont intégrés dans un contenu consolidé, qui est finalement exporté sous forme de fichier texte.
- Les bénéfices business de cette automatisation incluent une réduction significative du temps consacré à l'extraction manuelle des images et à leur analyse, tout en minimisant les risques d'erreurs humaines. En utilisant ce workflow, les équipes peuvent se concentrer sur des tâches à plus forte valeur ajoutée, améliorant ainsi leur efficacité opérationnelle.
Workflow n8n Google Drive, extraction de données, image : vue d'ensemble
Schéma des nœuds et connexions de ce workflow n8n, généré à partir du JSON n8n.
Workflow n8n Google Drive, extraction de données, image : détail des nœuds
Inscris-toi pour voir l'intégralité du workflow
Inscription gratuite
S'inscrire gratuitementBesoin d'aide ?{
"id": "NDCN2arRu5tLuP61",
"meta": {
"instanceId": "36147281c0732d54779505fe69cf0516d4b8760fdbbc308b1950e452edcf85e8",
"templateCredsSetupCompleted": true
},
"name": "Automate PDF Image Extraction & Analysis with GPT-4o and Google Drive",
"tags": [],
"nodes": [
{
"id": "78bb478a-721d-433f-a615-8f131ef1d87f",
"name": "When clicking ‘Test workflow’",
"type": "n8n-nodes-base.manualTrigger",
"position": [
-1180,
140
],
"parameters": {},
"typeVersion": 1
},
{
"id": "b1c2e97b-3539-4e16-89df-434a34c6a243",
"name": "Sticky Note",
"type": "n8n-nodes-base.stickyNote",
"position": [
-740,
-440
],
"parameters": {
"color": 3,
"width": 360,
"height": 480,
"content": "### Setup\n1.Set up your credentials when you first open the workflow. You’ll need accounts for OpenAI, Convert API, and Google Drive.\n2.Convert API does not rate-limit your API, sometimes you may receive 503 service unavailable error.\nNevertheless, it doesn’t mean that you cannot convert your file. It simply means that you should retry the conversion in a few seconds.\n3.Upload a PDF with images to Google Drive.\n4.Remove unnecessary parts and retrieve image-related information.\n5.Integrate image and image analysis information together.\n6.Analyze each image using the OPENAI GPT-4o model.\n7.Retrieve all image analysis content and image URL\n8.Integrate multiple image URLs and analysis content\n9.Output content to a .txt file.\n\nTemplate was created in n8n v1.83.2"
},
"typeVersion": 1
},
{
"id": "3b2a81eb-19b4-4685-90a3-1b4096b2d3b7",
"name": "Get pdf file",
"type": "n8n-nodes-base.googleDrive",
"position": [
-1000,
40
],
"parameters": {
"fileId": {
"__rl": true,
"mode": "list",
"value": "1WoqaMgaCD-gChGWUqPRJ7-pxbTozEuXN",
"cachedResultUrl": "https://drive.google.com/file/d/1WoqaMgaCD-gChGWUqPRJ7-pxbTozEuXN/view?usp=drivesdk",
"cachedResultName": "Building Effective AI Agents _ Anthropic.pdf"
},
"options": {},
"operation": "download"
},
"credentials": {
"googleDriveOAuth2Api": {
"id": "nxqV58j7kOaLFzhj",
"name": "Google Drive account"
}
},
"typeVersion": 3
},
{
"id": "89208aa8-37d8-424c-a936-52539a9bc7ee",
"name": "Get all img_url",
"type": "n8n-nodes-base.set",
"position": [
-520,
160
],
"parameters": {
"options": {},
"assignments": {
"assignments": [
{
"id": "7715e33a-c5cc-4a22-aa28-ac19a24bbd7c",
"name": "url",
"type": "string",
"value": "={{ $json.Url }}"
}
]
}
},
"typeVersion": 3.4
},
{
"id": "5c1ece53-1910-42d6-a1e4-bfa6d5a83fe9",
"name": "Analyze image",
"type": "@n8n/n8n-nodes-langchain.openAi",
"position": [
-360,
40
],
"parameters": {
"text": "Please analyze the video in detail and provide a thorough explanation",
"modelId": {
"__rl": true,
"mode": "list",
"value": "gpt-4o",
"cachedResultName": "GPT-4O"
},
"options": {},
"resource": "image",
"simplify": false,
"imageUrls": "={{ $json.url }}",
"operation": "analyze"
},
"credentials": {
"openAiApi": {
"id": "4wadssyBOfOAfo2P",
"name": "OpenAi account"
}
},
"typeVersion": 1.8
},
{
"id": "9e09364d-fb82-4524-b6aa-b8a6040893ba",
"name": "Extract pdf image",
"type": "n8n-nodes-base.httpRequest",
"position": [
-840,
140
],
"parameters": {
"url": "https://v2.convertapi.com/convert/pdf/to/extract-images",
"method": "POST",
"options": {},
"sendBody": true,
"contentType": "multipart-form-data",
"sendHeaders": true,
"authentication": "genericCredentialType",
"bodyParameters": {
"parameters": [
{
"name": "StoreFile",
"value": "true"
},
{
"name": "ImageOutputFormat",
"value": "jpg"
},
{
"name": "File",
"parameterType": "formBinaryData",
"inputDataFieldName": "data"
}
]
},
"genericAuthType": "httpHeaderAuth",
"headerParameters": {
"parameters": [
{}
]
}
},
"credentials": {
"httpHeaderAuth": {
"id": "5hUN8DpheywQE5v6",
"name": "convertapi extract image"
}
},
"retryOnFail": true,
"typeVersion": 4.2,
"waitBetweenTries": 5000
},
{
"id": "8fd6e8ae-bea1-4d7f-8599-7bf6f4eee9e5",
"name": "Sticky Note1",
"type": "n8n-nodes-base.stickyNote",
"position": [
-1080,
280
],
"parameters": {
"color": 5,
"width": 202,
"height": 99,
"content": "### You can exchange this with any trigger you like (*e.g. google drive trigger*)"
},
"typeVersion": 1
},
{
"id": "b0ce7fdd-7328-49b2-8ec6-797205aa7ab5",
"name": "Get image data",
"type": "n8n-nodes-base.splitOut",
"position": [
-680,
40
],
"parameters": {
"options": {},
"fieldToSplitOut": "Files"
},
"typeVersion": 1
},
{
"id": "c5855876-41d9-46a4-bdec-e60effa116e8",
"name": "Sticky Note3",
"type": "n8n-nodes-base.stickyNote",
"position": [
-1060,
-220
],
"parameters": {
"width": 300,
"content": "### PDF Image Extraction and Analysis with GPT-4o\nThis n8n workflow automates the process of extracting images from PDF files and analyzing them with AI, then compiling the results into a document."
},
"typeVersion": 1
},
{
"id": "7cea9e1b-0094-4220-bdf6-f13ab795e394",
"name": "Get image analyze content",
"type": "n8n-nodes-base.set",
"position": [
-200,
160
],
"parameters": {
"options": {},
"assignments": {
"assignments": [
{
"id": "2868a5bd-86a8-4962-a867-b4a354276181",
"name": "content",
"type": "string",
"value": "={{ $('Get all img_url').item.json.url }}\n{{ $json.choices[0].message.content }}"
}
]
}
},
"typeVersion": 3.4
},
{
"id": "de4b6fab-d086-4bf3-81fc-a6f7b7eac24b",
"name": "Integrate all content to a a content",
"type": "n8n-nodes-base.code",
"position": [
-40,
40
],
"parameters": {
"jsCode": "const mergedContent = items.map(item => item.json.content).join('\\n');\n\nreturn [\n {\n json: {\n content: mergedContent\n }\n }\n];\n"
},
"typeVersion": 2
},
{
"id": "e66f7c66-9096-4bf5-b1dc-02dafeaa62ee",
"name": "Output content to a .txt file",
"type": "n8n-nodes-base.convertToFile",
"position": [
140,
140
],
"parameters": {
"options": {},
"operation": "toText",
"sourceProperty": "content"
},
"typeVersion": 1.1
}
],
"active": false,
"pinData": {},
"settings": {
"timezone": "Asia/Taipei",
"callerPolicy": "workflowsFromSameOwner",
"executionOrder": "v1"
},
"versionId": "4c2771a6-f532-4bfd-bb98-3eae8b0ee85a",
"connections": {
"Get pdf file": {
"main": [
[
{
"node": "Extract pdf image",
"type": "main",
"index": 0
}
]
]
},
"Analyze image": {
"main": [
[
{
"node": "Get image analyze content",
"type": "main",
"index": 0
}
]
]
},
"Get image data": {
"main": [
[
{
"node": "Get all img_url",
"type": "main",
"index": 0
}
]
]
},
"Get all img_url": {
"main": [
[
{
"node": "Analyze image",
"type": "main",
"index": 0
}
]
]
},
"Extract pdf image": {
"main": [
[
{
"node": "Get image data",
"type": "main",
"index": 0
}
]
]
},
"Get image analyze content": {
"main": [
[
{
"node": "Integrate all content to a a content",
"type": "main",
"index": 0
}
]
]
},
"Output content to a .txt file": {
"main": [
[]
]
},
"When clicking ‘Test workflow’": {
"main": [
[
{
"node": "Get pdf file",
"type": "main",
"index": 0
}
]
]
},
"Integrate all content to a a content": {
"main": [
[
{
"node": "Output content to a .txt file",
"type": "main",
"index": 0
}
]
]
}
}
}Workflow n8n Google Drive, extraction de données, image : pour qui est ce workflow ?
Ce workflow s'adresse aux entreprises qui manipulent régulièrement des documents PDF, notamment dans les secteurs de la gestion de documents, de l'analyse de données et du marketing. Il est idéal pour les équipes techniques et non techniques cherchant à automatiser des processus manuels, quel que soit leur niveau d'expertise en automatisation.
Workflow n8n Google Drive, extraction de données, image : problème résolu
Ce workflow résout le problème de l'extraction manuelle d'images à partir de fichiers PDF, une tâche souvent chronophage et sujette à des erreurs. En automatisant ce processus, les utilisateurs peuvent réduire le temps consacré à ces tâches répétitives et se concentrer sur des analyses plus stratégiques. De plus, il diminue le risque d'erreurs humaines lors de l'extraction et de l'analyse des images, garantissant ainsi des résultats plus fiables.
Workflow n8n Google Drive, extraction de données, image : étapes du workflow
Étape 1 : Le flux est déclenché manuellement par l'utilisateur.
- Étape 1 : Le fichier PDF est récupéré depuis Google Drive.
- Étape 2 : Les images sont extraites du PDF via une requête HTTP.
- Étape 3 : Chaque image est analysée à l'aide de l'API OpenAI pour obtenir des insights.
- Étape 4 : Les données d'image sont traitées et intégrées dans un contenu consolidé.
- Étape 5 : Le contenu final est exporté sous forme de fichier texte.
Workflow n8n Google Drive, extraction de données, image : guide de personnalisation
Pour personnaliser ce workflow, commencez par modifier l'ID du fichier PDF dans le nœud Google Drive pour pointer vers votre document spécifique. Vous pouvez également ajuster les paramètres de l'API OpenAI pour affiner l'analyse des images selon vos besoins. Si vous souhaitez intégrer d'autres outils, envisagez d'ajouter des nœuds supplémentaires pour envoyer les résultats par e-mail ou les stocker dans une base de données. Assurez-vous de sécuriser vos clés API et d'utiliser des méthodes d'authentification appropriées pour protéger vos données.