Télécharger des données sur le site de l'Insee

telechargerDonnees(
  donnees,
  date = NULL,
  telDir = getOption("doremifasol.telDir"),
  argsApi = NULL,
  vars = NULL,
  force = FALSE,
  ...
)

Arguments

donnees

le nom des données que l'on souhaite télécharger sur le site de l'Insee, que l'on peut retrouver dans la table liste_donnees.

date

optionnel : le millésime des données si nécessaire. Peut prendre le format YYYY ou encore DD/MM/YYYY ; dans le dernier cas, on prendra le premier jour de la période de référence. Spécifier "dernier" sélectionne automatiquement le millésime le plus récent.

telDir

optionnel : le dossier dans lequel sont téléchargées les données brutes. Par défaut, la valeur définie par options(doremifasol.telDir = ...). Si l'utilisateur n'a pas défini cette valeur au préalable, un dossier temporaire de cache.

argsApi

optionnel : dans le cas où c'est une API REST qui est utilisée, il est possible de spécifier des paramètres spécifiques à cette API de manière à collecter l'information désirée.

vars

optionnel : un vecteur pour spécifier les variables à importer. Utile pour les données massives difficiles à charger en mémoire, voir section Details.

force

forcer le téléchargement, même si le fichier a déjà été téléchargé (et est identique).

...

paramètres additionnels relatifs à l'importation des données

Value

  • un data.frame contenant les données téléchargées sur le site de l'Insee

  • une liste de data.frames si recherche de Siren ou Siret via l'API

Details

La fonction permet de télécharger les données disponibles sur le site de l'Insee sous format csv, xls ou encore xlsx. Les données mises à disposition sont en général des tables de taille raisonnable, qui peuvent être chargées sans problème en mémoire sur un large spectre de machines. Néanmoins, pour certaines données (telles celles du Recensement de Population ou encore SIRENE), les données sont très volumineuses et exigent donc des machines très performantes. L'utilisateur a donc la possibilité de choisir les variables qui l'intéressent et de ne charger que ces dernières en mémoire, de manière à être parcimonieux.

Fichiers zip de grosse taille

Pour tous les gros fichiers zip (repérés par la variable big_zip = TRUE dans les métadonnées), la fonction fait automatiquement appel à la fonction unzip avec le paramètre unzip = "unzip". La commande unzip doit par conséquent être installée sur le poste de l'utilisateur (sur Windows, renseigner le chemin vers unzip dans la variable d'environnement %PATH%).

Examples

if (FALSE) {

# fichiers sur insee.fr
bpe_ens_2019 <- telechargerDonnees(donnees = "BPE_ENS")
rp_log <- telechargerDonnees("RP_LOGEMENT", date = "2016", vars = c("COMMUNE", "IPONDL", "CATL"))

# utilisation de l'API Sirene
telechargerDonnees("SIRENE_SIREN",         
                   argsApi = list(q = "dateCreationUniteLegale:2021-03-01", nombre = 100))
telechargerDonnees("SIRENE_SIRET",         
                   argsApi = list(q = "codeCommuneEtablissement:92046 
                                       AND categorieJuridiqueUniteLegale:9220"))
telechargerDonnees("SIRENE_SIRET_LIENS",   
                   argsApi = list(q = "siretEtablissementPredecesseur:31300257800042"))
telechargerDonnees("SIRENE_SIREN_NONDIFF", 
                   argsApi = list(q = "dateDernierTraitementUniteLegale:2019-04-15"))
telechargerDonnees("SIRENE_SIRET_NONDIFF", argsApi = list(q = "siren:480419449"))
}