Workflow n8n

Automatisation Google Drive avec n8n : extraction d'images PDF

Ce workflow n8n a pour objectif d'automatiser l'extraction et l'analyse d'images à partir de fichiers PDF stockés sur Google Drive. Dans un contexte où les entreprises manipulent régulièrement des documents PDF, ce processus permet de gagner un temps précieux en automatisant les tâches manuelles d'extraction et d'analyse d'images. Les cas d'usage incluent la gestion de documents, la création de rapports visuels et l'analyse de contenu visuel pour des présentations ou des études de marché.
Le workflow commence par un déclencheur manuel, permettant à l'utilisateur de tester le flux à la demande. Ensuite, il récupère le fichier PDF depuis Google Drive grâce à un nœud dédié. Une fois le fichier obtenu, le workflow extrait les images contenues dans le PDF via une requête HTTP. Les images sont ensuite analysées à l'aide de l'API OpenAI, qui fournit des insights et des résumés basés sur le contenu visuel. Les résultats de cette analyse sont intégrés dans un contenu consolidé, qui est finalement exporté sous forme de fichier texte.
Les bénéfices business de cette automatisation incluent une réduction significative du temps consacré à l'extraction manuelle des images et à leur analyse, tout en minimisant les risques d'erreurs humaines. En utilisant ce workflow, les équipes peuvent se concentrer sur des tâches à plus forte valeur ajoutée, améliorant ainsi leur efficacité opérationnelle.

Tags clés :automatisationGoogle Driveextraction de donnéesimagen8n

🎯Pour qui ?🧩Problème résolu 📋Étapes du flux 🛠Guide de personnalisation

Catégorie: Manual · Tags: automatisation, Google Drive, extraction de données, image, n8n❤ 0

Workflow n8n Google Drive, extraction de données, image : vue d'ensemble

Schéma des nœuds et connexions de ce workflow n8n, généré à partir du JSON n8n.

React Flow

Besoin d'aide ?

Workflow n8n Google Drive, extraction de données, image : détail des nœuds

When clicking ‘Test workflow’
Déclenche le workflow lorsque l'utilisateur clique sur 'Test workflow'.
Sticky Note
Affiche une note autocollante avec des paramètres de couleur, largeur, hauteur et contenu.
Get pdf file
Récupère un fichier PDF depuis Google Drive en utilisant l'identifiant du fichier.
Get all img_url
Rassemble toutes les URL d'images dans un ensemble de données.
Analyze image
Analyse une image en utilisant un modèle d'OpenAI et retourne le texte simplifié.
Extract pdf image
Effectue une requête HTTP pour extraire une image à partir d'une URL de fichier PDF.
Sticky Note1
Affiche une autre note autocollante avec des paramètres de couleur, largeur, hauteur et contenu.
Get image data
Sépare les données d'image en fonction d'un champ spécifié.
Sticky Note3
Affiche une troisième note autocollante avec des paramètres de largeur et de contenu.
Get image analyze content
Rassemble le contenu analysé de l'image dans un ensemble de données.
Integrate all content to a a content
Intègre tout le contenu dans un format de contenu à l'aide d'un code JavaScript.
Output content to a .txt file
Convertit le contenu en un fichier .txt selon les options spécifiées.

Inscris-toi pour voir l'intégralité du workflow

Inscription gratuite

S'inscrire gratuitement Besoin d'aide ?

{
  "id": "NDCN2arRu5tLuP61",
  "meta": {
    "instanceId": "36147281c0732d54779505fe69cf0516d4b8760fdbbc308b1950e452edcf85e8",
    "templateCredsSetupCompleted": true
  },
  "name": "Automate PDF Image Extraction & Analysis with GPT-4o and Google Drive",
  "tags": [],
  "nodes": [
    {
      "id": "78bb478a-721d-433f-a615-8f131ef1d87f",
      "name": "When clicking ‘Test workflow’",
      "type": "n8n-nodes-base.manualTrigger",
      "position": [
        -1180,
        140
      ],
      "parameters": {},
      "typeVersion": 1
    },
    {
      "id": "b1c2e97b-3539-4e16-89df-434a34c6a243",
      "name": "Sticky Note",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        -740,
        -440
      ],
      "parameters": {
        "color": 3,
        "width": 360,
        "height": 480,
        "content": "###  Setup\n1.Set up your credentials when you first open the workflow. You’ll need accounts for OpenAI, Convert API, and Google Drive.\n2.Convert API does not rate-limit your API, sometimes you may receive 503 service unavailable error.\nNevertheless, it doesn’t mean that you cannot convert your file. It simply means that you should retry the conversion in a few seconds.\n3.Upload a PDF with images to Google Drive.\n4.Remove unnecessary parts and retrieve image-related information.\n5.Integrate image and image analysis information together.\n6.Analyze each image using the OPENAI GPT-4o model.\n7.Retrieve all image analysis content and image URL\n8.Integrate multiple image URLs and analysis content\n9.Output content to a .txt file.\n\nTemplate was created in n8n v1.83.2"
      },
      "typeVersion": 1
    },
    {
      "id": "3b2a81eb-19b4-4685-90a3-1b4096b2d3b7",
      "name": "Get pdf file",
      "type": "n8n-nodes-base.googleDrive",
      "position": [
        -1000,
        40
      ],
      "parameters": {
        "fileId": {
          "__rl": true,
          "mode": "list",
          "value": "1WoqaMgaCD-gChGWUqPRJ7-pxbTozEuXN",
          "cachedResultUrl": "https://drive.google.com/file/d/1WoqaMgaCD-gChGWUqPRJ7-pxbTozEuXN/view?usp=drivesdk",
          "cachedResultName": "Building Effective AI Agents _ Anthropic.pdf"
        },
        "options": {},
        "operation": "download"
      },
      "credentials": {
        "googleDriveOAuth2Api": {
          "id": "nxqV58j7kOaLFzhj",
          "name": "Google Drive account"
        }
      },
      "typeVersion": 3
    },
    {
      "id": "89208aa8-37d8-424c-a936-52539a9bc7ee",
      "name": "Get all img_url",
      "type": "n8n-nodes-base.set",
      "position": [
        -520,
        160
      ],
      "parameters": {
        "options": {},
        "assignments": {
          "assignments": [
            {
              "id": "7715e33a-c5cc-4a22-aa28-ac19a24bbd7c",
              "name": "url",
              "type": "string",
              "value": "={{ $json.Url }}"
            }
          ]
        }
      },
      "typeVersion": 3.4
    },
    {
      "id": "5c1ece53-1910-42d6-a1e4-bfa6d5a83fe9",
      "name": "Analyze image",
      "type": "@n8n/n8n-nodes-langchain.openAi",
      "position": [
        -360,
        40
      ],
      "parameters": {
        "text": "Please analyze the video in detail and provide a thorough explanation",
        "modelId": {
          "__rl": true,
          "mode": "list",
          "value": "gpt-4o",
          "cachedResultName": "GPT-4O"
        },
        "options": {},
        "resource": "image",
        "simplify": false,
        "imageUrls": "={{ $json.url }}",
        "operation": "analyze"
      },
      "credentials": {
        "openAiApi": {
          "id": "4wadssyBOfOAfo2P",
          "name": "OpenAi account"
        }
      },
      "typeVersion": 1.8
    },
    {
      "id": "9e09364d-fb82-4524-b6aa-b8a6040893ba",
      "name": "Extract pdf image",
      "type": "n8n-nodes-base.httpRequest",
      "position": [
        -840,
        140
      ],
      "parameters": {
        "url": "https://v2.convertapi.com/convert/pdf/to/extract-images",
        "method": "POST",
        "options": {},
        "sendBody": true,
        "contentType": "multipart-form-data",
        "sendHeaders": true,
        "authentication": "genericCredentialType",
        "bodyParameters": {
          "parameters": [
            {
              "name": "StoreFile",
              "value": "true"
            },
            {
              "name": "ImageOutputFormat",
              "value": "jpg"
            },
            {
              "name": "File",
              "parameterType": "formBinaryData",
              "inputDataFieldName": "data"
            }
          ]
        },
        "genericAuthType": "httpHeaderAuth",
        "headerParameters": {
          "parameters": [
            {}
          ]
        }
      },
      "credentials": {
        "httpHeaderAuth": {
          "id": "5hUN8DpheywQE5v6",
          "name": "convertapi extract image"
        }
      },
      "retryOnFail": true,
      "typeVersion": 4.2,
      "waitBetweenTries": 5000
    },
    {
      "id": "8fd6e8ae-bea1-4d7f-8599-7bf6f4eee9e5",
      "name": "Sticky Note1",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        -1080,
        280
      ],
      "parameters": {
        "color": 5,
        "width": 202,
        "height": 99,
        "content": "### You can exchange this with any trigger you like (*e.g. google drive trigger*)"
      },
      "typeVersion": 1
    },
    {
      "id": "b0ce7fdd-7328-49b2-8ec6-797205aa7ab5",
      "name": "Get image data",
      "type": "n8n-nodes-base.splitOut",
      "position": [
        -680,
        40
      ],
      "parameters": {
        "options": {},
        "fieldToSplitOut": "Files"
      },
      "typeVersion": 1
    },
    {
      "id": "c5855876-41d9-46a4-bdec-e60effa116e8",
      "name": "Sticky Note3",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        -1060,
        -220
      ],
      "parameters": {
        "width": 300,
        "content": "### PDF Image Extraction and Analysis  with GPT-4o\nThis n8n workflow automates the process of extracting images from PDF files and analyzing them with AI, then compiling the results into a document."
      },
      "typeVersion": 1
    },
    {
      "id": "7cea9e1b-0094-4220-bdf6-f13ab795e394",
      "name": "Get image analyze content",
      "type": "n8n-nodes-base.set",
      "position": [
        -200,
        160
      ],
      "parameters": {
        "options": {},
        "assignments": {
          "assignments": [
            {
              "id": "2868a5bd-86a8-4962-a867-b4a354276181",
              "name": "content",
              "type": "string",
              "value": "={{ $('Get all img_url').item.json.url }}\n{{ $json.choices[0].message.content }}"
            }
          ]
        }
      },
      "typeVersion": 3.4
    },
    {
      "id": "de4b6fab-d086-4bf3-81fc-a6f7b7eac24b",
      "name": "Integrate all content to a a content",
      "type": "n8n-nodes-base.code",
      "position": [
        -40,
        40
      ],
      "parameters": {
        "jsCode": "const mergedContent = items.map(item => item.json.content).join('\\n');\n\nreturn [\n  {\n    json: {\n      content: mergedContent\n    }\n  }\n];\n"
      },
      "typeVersion": 2
    },
    {
      "id": "e66f7c66-9096-4bf5-b1dc-02dafeaa62ee",
      "name": "Output content to a .txt file",
      "type": "n8n-nodes-base.convertToFile",
      "position": [
        140,
        140
      ],
      "parameters": {
        "options": {},
        "operation": "toText",
        "sourceProperty": "content"
      },
      "typeVersion": 1.1
    }
  ],
  "active": false,
  "pinData": {},
  "settings": {
    "timezone": "Asia/Taipei",
    "callerPolicy": "workflowsFromSameOwner",
    "executionOrder": "v1"
  },
  "versionId": "4c2771a6-f532-4bfd-bb98-3eae8b0ee85a",
  "connections": {
    "Get pdf file": {
      "main": [
        [
          {
            "node": "Extract pdf image",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "Analyze image": {
      "main": [
        [
          {
            "node": "Get image analyze content",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "Get image data": {
      "main": [
        [
          {
            "node": "Get all img_url",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "Get all img_url": {
      "main": [
        [
          {
            "node": "Analyze image",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "Extract pdf image": {
      "main": [
        [
          {
            "node": "Get image data",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "Get image analyze content": {
      "main": [
        [
          {
            "node": "Integrate all content to a a content",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "Output content to a .txt file": {
      "main": [
        []
      ]
    },
    "When clicking ‘Test workflow’": {
      "main": [
        [
          {
            "node": "Get pdf file",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "Integrate all content to a a content": {
      "main": [
        [
          {
            "node": "Output content to a .txt file",
            "type": "main",
            "index": 0
          }
        ]
      ]
    }
  }
}

Workflow n8n Google Drive, extraction de données, image : pour qui est ce workflow ?

Ce workflow s'adresse aux entreprises qui manipulent régulièrement des documents PDF, notamment dans les secteurs de la gestion de documents, de l'analyse de données et du marketing. Il est idéal pour les équipes techniques et non techniques cherchant à automatiser des processus manuels, quel que soit leur niveau d'expertise en automatisation.

Workflow n8n Google Drive, extraction de données, image : problème résolu

Ce workflow résout le problème de l'extraction manuelle d'images à partir de fichiers PDF, une tâche souvent chronophage et sujette à des erreurs. En automatisant ce processus, les utilisateurs peuvent réduire le temps consacré à ces tâches répétitives et se concentrer sur des analyses plus stratégiques. De plus, il diminue le risque d'erreurs humaines lors de l'extraction et de l'analyse des images, garantissant ainsi des résultats plus fiables.

Workflow n8n Google Drive, extraction de données, image : étapes du workflow

Étape 1 : Le flux est déclenché manuellement par l'utilisateur.

Étape 1 : Le fichier PDF est récupéré depuis Google Drive.
Étape 2 : Les images sont extraites du PDF via une requête HTTP.
Étape 3 : Chaque image est analysée à l'aide de l'API OpenAI pour obtenir des insights.
Étape 4 : Les données d'image sont traitées et intégrées dans un contenu consolidé.
Étape 5 : Le contenu final est exporté sous forme de fichier texte.

Workflow n8n Google Drive, extraction de données, image : guide de personnalisation

Pour personnaliser ce workflow, commencez par modifier l'ID du fichier PDF dans le nœud Google Drive pour pointer vers votre document spécifique. Vous pouvez également ajuster les paramètres de l'API OpenAI pour affiner l'analyse des images selon vos besoins. Si vous souhaitez intégrer d'autres outils, envisagez d'ajouter des nœuds supplémentaires pour envoyer les résultats par e-mail ou les stocker dans une base de données. Assurez-vous de sécuriser vos clés API et d'utiliser des méthodes d'authentification appropriées pour protéger vos données.

Autres workflows n8n

Workflows n8n proches par tags : automatisation, Google Drive, extraction de données, image

L'auteur

Wladimir Delcros

Founder & Growth Engineer @ Uclic

Expert n8n et automatisation. Je conçois des workflows pour industrialiser l'acquisition et le marketing B2B.

Voir le profil →

Partenariat

Vous souhaitez afficher votre site ou vos contenus ici ? Guest posts, backlinks et visibilité sur notre audience. Contactez-nous.

Nous contacter

Sur mesure

Un workflow n8n ou une automatisation custom ?

Nous concevons pour vous des workflows et automatisations adaptés à vos process. Devis gratuit.

Demander un audit gratuit