Skip to content

Latest commit

 

History

History
57 lines (40 loc) · 3.64 KB

README.md

File metadata and controls

57 lines (40 loc) · 3.64 KB

off-explore

Une exploration des données d'Open Food Facts.

Prérequis

Vous devez télécharger les données d'Open Food Facts exportées au format CSV https://static.openfoodfacts.org/data/en.openfoodfacts.org.products.csv. Ce fichier pèse 4.3 Go, je vous invite donc à lancer le téléchargement dès que possible.

Pendant que les données sont téléchargées, vous devez vérifier que vous avez sur vos machines, ou installer le cas échéant :

  • git ;
  • miniconda avec une version récente de python 3 (3.8 et suivantes ; actuellement python 3.9) ou, éventuellement, anaconda avec une version récente de python 3 (idem) si vous l'avez déjà ;
  • JupyterLab ou jupyter notebook classique.

Mise en place initiale

Nous allons travailler dans un environment virtuel conda qui contiendra python 3 et les bibliothèques nécessaires à la visualisation et à l'analyse des données: pandas, matplotlib, seaborn...

J'ai préparé un fichier environment.yml qui permet de créer un environnement nommé off-explore et d'installer les dépendances.

Dans le terminal (Linux, macOS), ou dans "Anaconda Prompt" (Windows), exécutez la commande:

conda env create -f environment.yml

Session de travail

Pour travailler dans l'environnement, vous devez l'activer dans le terminal avant de lancer jupyter-lab :

conda activate off-explore
jupyter-lab

En fin de session, après avoir fermé jupyter-lab, vous pouvez désactiver l'environnement conda :

conda deactivate

OpenFoodFacts

Dans cette série de notebooks, nous allons explorer les données contenues dans la base de données ouverte sur les produits alimentaires Open Food Facts. Nous allons notamment analyser le profil nutritionnel des produits alimentaires recensés.

Open Food Facts est une base de données ouverte sur les produits alimentaires. Elle est produite et gérée comme un bien commun numérique. Tout le monde peut contribuer des données sur les produits alimentaires emballés : photos, ingrédients, valeurs nutritionnelles etc. Cette base de données a permis la construction de nombreuses applications sur téléphone mobile, notamment d'applications de scan de produits pour aider les consommateurs pendant leurs achats.

Notebooks