Une évaluation des achats transfrontaliers de tabac et des pertes fiscales associées en France
Exploitation d’une expérience naturelle, la fermeture des frontières en 2020, pour mesurer la part d’achats transfrontaliers de tabac
📺️ Les présentations et le replay de la journée du réseau, le 1er décembre 2025, sont disponibles
1 juin 2021
| Webscraping des prix de nuitées hôtelières pour construire l’indice des prix à la consommation | |
|---|---|
| Détail du projet | L’indice des prix à la consommation pour les nuitées hôtelières est calculé à partir de relevés effectués sur le terrain par des enquêtrices et enquêteurs de l’Insee qui relèvent le prix d’une chambre pour une nuitée le jour même pour 2 personnes avec petit-déjeuner. Afin d’améliorer l’indice et de s’émanciper de certaines limites de la méthode actuelle, ce projet explore une méthode de collecte innovante, le webscraping depuis un site de réservation. Après récolte des données en ligne, celles-ci sont brutes et nécessitent un nettoyage : par exemple la valeur pour une caractéristique n’est pas forcément décrite de la même manière entre deux observations. Pour palier les problèmes liés à un indice à panier fixe, l’indice final est construit à partir de classes homogènes. Enfin, les résultats de l’indice calculé avec les données de la plateforme de réservation en ligne avec l’indice publié. |
| Acteurs | Insee |
| Résultats du projet | La nouvelle méthodologie de récolte des prix est maintenant en production. |
| Produits et documentation du projet | - Indices des prix à la consommation des nuitées hôtelières : l’expérience du webscraping d’une plateforme de réservation en ligne, Journées de méthodologie statistique 2022 |