🔬 Méthodologie
🎯 Périmètre des données
- Source primaire : DECP fichiers consolidés (data.gouv.fr)
- Période couverte : marchés notifiés entre 2014 et 2030 (DECP démarre en 2018, on inclut quelques marchés antérieurs et les pluriannuels en cours d'exécution)
- Seuil : marchés publics > 40 000 € HT (seuil légal d'obligation de publication DECP)
- Mises à jour : hebdomadaires (synchro automatique avec data.gouv.fr)
🧹 Filtres anti-pollution appliqués
DECP contient ~0.1% de données aberrantes (typos, codes erronés). TenderArc applique systématiquement :
- Montant strictement entre 0 et 10 milliards € (élimination des typos type "2 quadrillions €" et des nuls)
- Date de notification entre 2014 et 2030 (élimination des typos type "0001-01-03" ou "5054-03-15")
- Déduplication par identifiant DECP unique (élimination des doublons inter-fichiers)
- Code CPV "00000000-0" (non renseigné) signalé séparément
Ces filtres écartent ~280 marchés sur 430 829 (0.06% du dataset).
📊 Indicateurs calculés
Sur les acheteurs publics
- Indice de concurrence : nombre moyen d'offres reçues par marché. Plus le chiffre est élevé, plus le marché est concurrentiel. < 2 = signal d'alerte.
- Indice de dépendance top 3 : pourcentage du montant total versé aux 3 plus gros fournisseurs. > 50% = forte dépendance.
- Marchés mono-offre : marchés avec un seul candidat. Indicateur clé de concurrence.
Sur les entreprises titulaires
- Diversification : nombre d'acheteurs distincts par rapport au nombre de marchés gagnés.
- Spécialisation sectorielle : poids du principal secteur CPV dans le portefeuille de marchés.
- Évolution annuelle : montant cumulé par année de notification.
Sur les secteurs CPV
- Indice HHI (Herfindahl-Hirschman) : mesure de la concentration du marché. Calculé comme la somme des carrés des parts de marché des entreprises titulaires (en %).
- HHI < 1 500 : marché concurrentiel
- HHI 1 500–2 500 : marché modérément concentré
- HHI > 2 500 : marché très concentré
🔄 Croisements de données
TenderArc enrichit les marchés DECP avec d'autres bases ouvertes :
- SIRENE → raison sociale, code NAF, tranche d'effectif des entreprises titulaires
- Annuaire Service-Public → nom officiel et type des acheteurs publics
- Geo API → nom des communes, départements et régions
- CPV → libellé en français des codes secteurs
Le croisement se fait par SIRET (acheteurs et titulaires) et par code commune INSEE.
⚠️ Limites connues
- Les marchés sous 40 000 € HT ne sont pas dans DECP (~30% du volume total des achats publics)
- L'indicateur "offres reçues" est manquant dans 22% des cas (donnée non publiée par certains acheteurs)
- Certains marchés sont publiés en plusieurs annonces (déduplication par identifiant DECP, mais doublons résiduels possibles)
- Les concessions et marchés de services particuliers peuvent être sous-représentés
Source de vérité : les données présentées sur TenderArc proviennent directement de DECP et peuvent être recroisées sur data.gouv.fr.