Une exploration des données d'Open Food Facts.
Vous devez télécharger les données d'Open Food Facts exportées au format CSV https://static.openfoodfacts.org/data/en.openfoodfacts.org.products.csv. Ce fichier pèse 4.3 Go, je vous invite donc à lancer le téléchargement dès que possible.
Pendant que les données sont téléchargées, vous devez vérifier que vous avez sur vos machines, ou installer le cas échéant :
- git ;
- miniconda avec une version récente de python 3 (3.8 et suivantes ; actuellement python 3.9) ou, éventuellement, anaconda avec une version récente de python 3 (idem) si vous l'avez déjà ;
- JupyterLab ou jupyter notebook classique.
Nous allons travailler dans un environment virtuel conda qui contiendra python 3 et les bibliothèques nécessaires à la visualisation et à l'analyse des données: pandas, matplotlib, seaborn...
J'ai préparé un fichier environment.yml
qui permet de créer un environnement nommé off-explore
et d'installer les dépendances.
Dans le terminal (Linux, macOS), ou dans "Anaconda Prompt" (Windows), exécutez la commande:
conda env create -f environment.yml
Pour travailler dans l'environnement, vous devez l'activer dans le terminal avant de lancer jupyter-lab :
conda activate off-explore
jupyter-lab
En fin de session, après avoir fermé jupyter-lab, vous pouvez désactiver l'environnement conda :
conda deactivate
Dans cette série de notebooks, nous allons explorer les données contenues dans la base de données ouverte sur les produits alimentaires Open Food Facts. Nous allons notamment analyser le profil nutritionnel des produits alimentaires recensés.
Open Food Facts est une base de données ouverte sur les produits alimentaires. Elle est produite et gérée comme un bien commun numérique. Tout le monde peut contribuer des données sur les produits alimentaires emballés : photos, ingrédients, valeurs nutritionnelles etc. Cette base de données a permis la construction de nombreuses applications sur téléphone mobile, notamment d'applications de scan de produits pour aider les consommateurs pendant leurs achats.