← Retour à la liste
★★★★ 4 / 5
Catégorie 05MCP

MCP Firecrawl

Scraping intelligent de la documentation Drupal.org et du web

Installation
Via npm + clé API# 1. Créer un compte sur firecrawl.dev et récupérer la clé API claude mcp add firecrawl \ -e FIRECRAWL_API_KEY=fc-xxxxxxxxxxxx \ -- npx -y firecrawl-mcp
Auto-hébergement (Docker)# Cloner Firecrawl git clone https://github.com/mendableai/firecrawl cd firecrawl && docker compose up -d # Configurer le MCP avec l'URL locale claude mcp add firecrawl \ -e FIRECRAWL_API_KEY=local-key \ -e FIRECRAWL_API_URL=http://localhost:3002 \ -- npx -y firecrawl-mcp
Versionmendableai/firecrawl-mcp-server
PrixGratuit (500 crédits/mois) · Payant à partir de 16$/mois
Plateformes
WindowsmacOSLinux
Commandes4
Exemples3
MCP
À propos

Serveur MCP Firecrawl qui permet à Claude d'extraire proprement le contenu de n'importe quelle page web (JavaScript inclus) au format Markdown. Indispensable pour scraper la documentation des modules Drupal, les issues drupal.org, les changelogs, les forums de support et les pages de documentation technique.

Fonctionnalités clés
Scraping JavaScript-renderedExtraire le contenu des pages qui nécessitent JavaScript (React, Vue, etc.) — contrairement à un simple curl. Idéal pour les nouvelles pages Drupal.org en JavaScript.
Conversion Markdown propreRetourner le contenu en Markdown structuré, sans les menus de navigation, pubs ou éléments parasites. Le contexte injecté dans Claude est minimal et pertinent.
Crawl récursif (multi-pages)Crawler tout un sous-domaine ou une section de documentation. Exemple — scraper toute la doc de l'API Migrate ou la documentation d'un module contrib.
Recherche sémantique dans les pagesMode "search" qui extrait seulement les passages pertinents à une query — sans injecter toute la page dans le contexte.
Auto-hébergementDéployer son propre serveur Firecrawl (open source, Docker Compose) pour un usage illimité sans dépendre du service cloud.
Commandes
CommandeDescription
firecrawl_scrapeExtraire le contenu d'une URL unique en Markdown
firecrawl_crawlCrawler récursivement une section d'un site web
firecrawl_searchChercher et extraire les passages pertinents d'une page
firecrawl_mapMapper toutes les URLs d'un site (sitemap intelligent)
Exemples
Récupérer la doc d'un module Drupal contribCODE
"Scrape la page de documentation du module Search API Solr sur drupal.org
(https://www.drupal.org/project/search_api_solr) et résume :
1. Les versions de Drupal supportées
2. Les dépendances requises
3. Les étapes d'installation rapides
4. Les problèmes connus (known issues)"
Analyser une issue drupal.orgCODE
"Scrape cette issue drupal.org :
https://www.drupal.org/project/drupal/issues/3412345

Et dis-moi :
1. Le résumé du bug
2. Le statut actuel (Needs review, Fixed, etc.)
3. Le patch ou MR proposé
4. Si je dois mettre à jour mon module ou attendre un nouveau core"
Crawler la documentation complète d'une APICODE
"Crawle la section documentation de l'API Migrate Drupal :
https://api.drupal.org/api/drupal/core!modules!migrate!src!MigrateExecutable.php
et toutes les classes liées (suivre les liens dans la même section /api/drupal/).
Résume les méthodes importantes de MigrateExecutable et leurs paramètres."
Points forts & faibles
Points forts
+JavaScript-rendered — fonctionne avec les SPA modernes
+Conversion Markdown propre (moins de bruit dans le contexte)
+Mode crawl pour scraper des sections entières de documentation
+Auto-hébergeable (AGPL) pour contourner les limites et coûts
+Utile pour les issues drupal.org et les changelogs de modules
Points faibles
Service cloud payant au-delà de 500 crédits/mois
Nécessite une clé API Firecrawl (compte requis)
Plus lent qu'un simple fetch (rendu JavaScript)
Auto-hébergement nécessite Docker et une maintenance
Verdict

Bien supérieur à mcp-fetch pour les pages nécessitant JavaScript. Idéal pour récupérer la documentation des modules Drupal, les issues complexes, ou les wikis modernes. Le tier gratuit suffit pour un usage occasionnel.

Développeurs Drupal qui veulent interroger Claude sur la documentation d'un module spécifique, une issue drupal.org ou un changelog — sans copier-coller manuellement le contenu.