Certaines anomalies des données téléchargées sur marches-publics.info persistent
ColinMaudry opened this issue · 2 comments
ColinMaudry commented
Il s'agit des données téléchargeables à cette adresse : https://www.marches-publics.info/mpiaws/index.cfm?fuseaction=pub.affResultats&IDs=25
Voici les anomalies identifiées et corrigées dans b6454a :
- id doit être une string, pas un nombre (201820180020100)
- dureeMois doit être un nombre, pas une string (2018M18403GTR00)
- dureeMois doit être un entier, pas un nombre décimal (20180700) (0.5)
- dureeMois doit être supérieur à 0 (2019000700)
- acheteur.id doit être une string, pas un nombre
- autoriteConcedante.id doit être une string, pas un nombre (2018DSP100)
- titulaire.id doit être une string, pas un nombre
- titulaire.denominationSociale doit être une string (201918A10300)
- modifications.titulaires.id doit être une string, pas un nombre (2019616101)
- les modifications ne doivent pas être identiques (20191815AC202, 2019007003)
- donneesExecution doit être un array (2018DSP100)
- montant doit être un nombre, pas une string
- codeCPV doit être une string, pas un nombre
- lieuExecution.code doit être une string, pas un nombre
- lieuExecution.nom doit être une string, pas un nombre (2019S1813DCP1a00)
- donneesExecution doit être un array d'objet, pas une string (2018DSP100)
- il manque un caractère dans les dateNotification et les dateNotificationModification contenant des mois de janvier à septembre (1 à 9) (il manque le zéro)
Voici les anomalies identifiées mais non-corrigées :
- le code CPV doit être composé de 8 chiffres, et optionnellement de 1 chiffre de contrôle ([0-9]{8}(\-[0-9])?) (2019010400)
- dans un array modifications, toutes les entrées doivent uniques, aucun doublon n'est autorisé
ColinMaudry commented
Je viens de voir que certains marchés n'ont pas de _type
, et du coup ils n'ont pas de source
au moment du script package
.
ColinMaudry commented
Migré vers 139bercy#14