1.2.0 • Published 7 years ago

scraper_cuisine_libre.fr v1.2.0

Weekly downloads
5
License
ISC
Repository
github
Last release
7 years ago

Mentions légal / Legal notice

Tous les ingrédients et recettes récupérés appartiennent à www.cuisine-libre.fr. Si vous utilisez la base de données générée par ce scraper, vous devez respectez les conditions indiquées dans les mentions légales du site à cette addresse www.cuisine-libre.fr/mentions-legales.

All the ingredients and recipes scraped belong to www.cuisine-libre.fr. If you use the database generated by this scraper, you must respect the conditions indicated in the legal mentions of the site to this address www.cuisine-libre.fr/mentions-legales.

Info

Il s'agit d'un simple projet que j'ai utilisé afin d'apprendre les bases du Node JS et Mongodb. Je n'ai trouvé aucune base de données gratuite, avec une license libre donc j'ai créé ce scraper pour récupérer les données libres du site cuisine-libre.fr.

This is a simple project i use to learn basic Node JS and Mongodb. I found no free database with a free license so I created this scraper to retrieve the free data from the site cuisine-libre.fr.

Update

  • 07/05/2017 : le scrapper fonctionne à ce jour / scrapper is working so far.

Prérequis / Requirements

  • Mongodb

Installation

Installation avec NPM / Install with npm:

npm install scraper_cuisine_libre.fr
cd ./node_modules/scraper_cuisine_libre.fr

Cloner le dépôt / Clone the repo:

git clone https://github.com/vsteffen/scraper_cuisine-libre.fr

Si vous avez installé avec npm, dirigez-vous dans le module "scraper_cuisine_libre.fr" (./node_modules/scraper_cuisine_libre.fr). Avec github, vous serez directement à la racine. Vous trouverez dans ce répertoire le fichier "scraper.js". Vous pouvez changer selon vos besoins les paramètres du scraper tout en haut du fichier scraper.js. En ce qui concerne la base de donnée, ce sera par défaut "localhost", la database s'appellera "scraper_cuisine_libre_fr" dans Mongodb.

If you installed with npm, go to the module "scraper_cuisine_libre.fr" (./node_modules/scraper_cuisine_libre.fr). With github, you'll be directly at the root. You will find in this directory the file "scraper.js". You can change the scraper settings at the top of the "scraper.js" file according to your needs. As for the database, it will be by default "localhost", the database will be called "scraper_cuisine_libre_fr" in Mongodb.

Utilisation / Use

Une fois votre configuration prête, lancez le scraper avec la commande suivante / Once your configuration is ready, run the scraper with the following command:

node scraper.js

A la fin du script, vous aurez vos données dans votre base de donnée. Au même endroit que le script "scraper.js", vous trouverez également le dossier (par défaut "img") contenant les images des recettes.

At the end of the script, you will have your data in your database. In the same place as the script "scraper.js", you will also find the folder (by default "img") containing the pictures of the recipes.

Output

Avec les paramètres par défaut, vous obtiendrez le résultat suivant dans votre base de donnée / With the default settings, you will get the following example in your database:

Ingrédient :
{
    "_id" : ObjectId("xxx"),
    "name" : "Ingrédient",
    "recipe_id" : [
        "lien-relatif-a-la-recette1",
        "lien-relatif-a-la-recette2",
        "..."
    ]
}

Recette :
{
    "_id" : ObjectId("xxx"),
    "url" : "lien-relatif-a-la-recette",
    "title" : "Titre de la recette",
    "author" : "Romy",
    "imgPath" : "/path/to/file.jpeg",
    "hint" : "Astuce si présente",
    "license" : "Type de la license",
    "ingredient" : {
        "title" : "Titre des ingrédients",
        "list" : [
            "10 g de carrotte",
            "300 g laitue",
            "..."
        ],
        "diet" : pratique alimentaire, 0 = aucune, 1 = végétarien, 2 = végétalien
    },
    "instruction" : "Instructions pour votre formidable recette",
    "time" : {
        "preparation" : préparation en min,
        "cooking" : cuisson en min
        "waiting" : attente en min
    }
}

By Vivien STEFFEN (https://github.com/vsteffen)