ColinMaudry/decp-json

Certaines anomalies des données téléchargées sur marches-publics.info persistent

ColinMaudry opened this issue · 2 comments

Il s'agit des données téléchargeables à cette adresse : https://www.marches-publics.info/mpiaws/index.cfm?fuseaction=pub.affResultats&IDs=25

Voici les anomalies identifiées et corrigées dans b6454a :

  • id doit être une string, pas un nombre (201820180020100)
  • dureeMois doit être un nombre, pas une string (2018M18403GTR00)
  • dureeMois doit être un entier, pas un nombre décimal (20180700) (0.5)
  • dureeMois doit être supérieur à 0 (2019000700)
  • acheteur.id doit être une string, pas un nombre
  • autoriteConcedante.id doit être une string, pas un nombre (2018DSP100)
  • titulaire.id doit être une string, pas un nombre
  • titulaire.denominationSociale doit être une string (201918A10300)
  • modifications.titulaires.id doit être une string, pas un nombre (2019616101)
  • les modifications ne doivent pas être identiques (20191815AC202, 2019007003)
  • donneesExecution doit être un array (2018DSP100)
  • montant doit être un nombre, pas une string
  • codeCPV doit être une string, pas un nombre
  • lieuExecution.code doit être une string, pas un nombre
  • lieuExecution.nom doit être une string, pas un nombre (2019S1813DCP1a00)
  • donneesExecution doit être un array d'objet, pas une string (2018DSP100)
  • il manque un caractère dans les dateNotification et les dateNotificationModification contenant des mois de janvier à septembre (1 à 9) (il manque le zéro)

Voici les anomalies identifiées mais non-corrigées :

  • le code CPV doit être composé de 8 chiffres, et optionnellement de 1 chiffre de contrôle ([0-9]{8}(\-[0-9])?) (2019010400)
  • dans un array modifications, toutes les entrées doivent uniques, aucun doublon n'est autorisé

Je viens de voir que certains marchés n'ont pas de _type, et du coup ils n'ont pas de source au moment du script package.

Migré vers 139bercy#14