🔬 Méthodologie

Comment TenderArc traite et analyse les données

🎯 Périmètre des données

  • Source primaire : DECP fichiers consolidés (data.gouv.fr)
  • Période couverte : marchés notifiés entre 2014 et 2030 (DECP démarre en 2018, on inclut quelques marchés antérieurs et les pluriannuels en cours d'exécution)
  • Seuil : marchés publics > 40 000 € HT (seuil légal d'obligation de publication DECP)
  • Mises à jour : hebdomadaires (synchro automatique avec data.gouv.fr)

🧹 Filtres anti-pollution appliqués

DECP contient ~0.1% de données aberrantes (typos, codes erronés). TenderArc applique systématiquement :

  • Montant strictement entre 0 et 10 milliards € (élimination des typos type "2 quadrillions €" et des nuls)
  • Date de notification entre 2014 et 2030 (élimination des typos type "0001-01-03" ou "5054-03-15")
  • Déduplication par identifiant DECP unique (élimination des doublons inter-fichiers)
  • Code CPV "00000000-0" (non renseigné) signalé séparément

Ces filtres écartent ~280 marchés sur 430 829 (0.06% du dataset).

📊 Indicateurs calculés

Sur les acheteurs publics

  • Indice de concurrence : nombre moyen d'offres reçues par marché. Plus le chiffre est élevé, plus le marché est concurrentiel. < 2 = signal d'alerte.
  • Indice de dépendance top 3 : pourcentage du montant total versé aux 3 plus gros fournisseurs. > 50% = forte dépendance.
  • Marchés mono-offre : marchés avec un seul candidat. Indicateur clé de concurrence.

Sur les entreprises titulaires

  • Diversification : nombre d'acheteurs distincts par rapport au nombre de marchés gagnés.
  • Spécialisation sectorielle : poids du principal secteur CPV dans le portefeuille de marchés.
  • Évolution annuelle : montant cumulé par année de notification.

Sur les secteurs CPV

  • Indice HHI (Herfindahl-Hirschman) : mesure de la concentration du marché. Calculé comme la somme des carrés des parts de marché des entreprises titulaires (en %).
    • HHI < 1 500 : marché concurrentiel
    • HHI 1 500–2 500 : marché modérément concentré
    • HHI > 2 500 : marché très concentré

🔄 Croisements de données

TenderArc enrichit les marchés DECP avec d'autres bases ouvertes :

  • SIRENE → raison sociale, code NAF, tranche d'effectif des entreprises titulaires
  • Annuaire Service-Public → nom officiel et type des acheteurs publics
  • Geo API → nom des communes, départements et régions
  • CPV → libellé en français des codes secteurs

Le croisement se fait par SIRET (acheteurs et titulaires) et par code commune INSEE.

⚠️ Limites connues

  • Les marchés sous 40 000 € HT ne sont pas dans DECP (~30% du volume total des achats publics)
  • L'indicateur "offres reçues" est manquant dans 22% des cas (donnée non publiée par certains acheteurs)
  • Certains marchés sont publiés en plusieurs annonces (déduplication par identifiant DECP, mais doublons résiduels possibles)
  • Les concessions et marchés de services particuliers peuvent être sous-représentés
Source de vérité : les données présentées sur TenderArc proviennent directement de DECP et peuvent être recroisées sur data.gouv.fr.