Télécharger des données sur le site de l'Insee
telechargerDonnees(
donnees,
date = NULL,
telDir = getOption("doremifasol.telDir"),
argsApi = NULL,
vars = NULL,
force = FALSE,
...
)
le nom des données que l'on souhaite télécharger sur le site de l'Insee, que l'on peut retrouver dans la table liste_donnees
.
optionnel : le millésime des données si nécessaire. Peut prendre le format YYYY ou encore DD/MM/YYYY ; dans le dernier cas, on prendra le premier jour de la période de référence. Spécifier "dernier"
sélectionne automatiquement le millésime le plus récent.
optionnel : le dossier dans lequel sont téléchargées les données brutes. Par défaut, la valeur définie par options(doremifasol.telDir = ...)
. Si l'utilisateur n'a pas défini cette valeur au préalable, un dossier temporaire de cache.
optionnel : dans le cas où c'est une API REST qui est utilisée, il est possible de spécifier des paramètres spécifiques à cette API de manière à collecter l'information désirée.
optionnel : un vecteur pour spécifier les variables à importer. Utile pour les données massives difficiles à charger en mémoire, voir section Details.
forcer le téléchargement, même si le fichier a déjà été téléchargé (et est identique).
paramètres additionnels relatifs à l'importation des données
un data.frame contenant les données téléchargées sur le site de l'Insee
une liste de data.frames si recherche de Siren ou Siret via l'API
La fonction permet de télécharger les données disponibles sur le site de l'Insee sous format csv, xls ou encore xlsx. Les données mises à disposition sont en général des tables de taille raisonnable, qui peuvent être chargées sans problème en mémoire sur un large spectre de machines. Néanmoins, pour certaines données (telles celles du Recensement de Population ou encore SIRENE), les données sont très volumineuses et exigent donc des machines très performantes. L'utilisateur a donc la possibilité de choisir les variables qui l'intéressent et de ne charger que ces dernières en mémoire, de manière à être parcimonieux.
Pour tous les gros fichiers zip (repérés par la variable big_zip = TRUE
dans les métadonnées), la fonction fait automatiquement appel à la fonction unzip
avec le paramètre unzip = "unzip"
.
La commande unzip doit par conséquent être installée sur le poste de l'utilisateur (sur Windows, renseigner le chemin vers unzip dans la variable d'environnement %PATH%).
if (FALSE) { # \dontrun{
# fichiers sur insee.fr
bpe_ens_2019 <- telechargerDonnees(donnees = "BPE_ENS")
rp_log <- telechargerDonnees("RP_LOGEMENT", date = "2016", vars = c("COMMUNE", "IPONDL", "CATL"))
# utilisation de l'API Sirene
telechargerDonnees("SIRENE_SIREN",
argsApi = list(q = "dateCreationUniteLegale:2021-03-01", nombre = 100))
telechargerDonnees("SIRENE_SIRET",
argsApi = list(q = "codeCommuneEtablissement:92046
AND categorieJuridiqueUniteLegale:9220"))
telechargerDonnees("SIRENE_SIRET_LIENS",
argsApi = list(q = "siretEtablissementPredecesseur:31300257800042"))
telechargerDonnees("SIRENE_SIREN_NONDIFF",
argsApi = list(q = "dateDernierTraitementUniteLegale:2019-04-15"))
telechargerDonnees("SIRENE_SIRET_NONDIFF", argsApi = list(q = "siren:480419449"))
} # }