1.4.0 • Published 6 years ago
ezs-conditor v1.4.0
ezs-conditor
Instructions EZS pour Conditor.
Installation
npm install @ezs/core
npm install ezs-conditorScripts
$ ./bin/affAlign.js < data/1000-notices-conditor-hal.json | ./bin/compareRnsr.js
recall: 0.7162356321839081
correct: 997
total: 1392Instructions EZS
affAlign
Retrouve la combinaison RNSR dans les adresses des affiliations des auteurs.
Exemple
Fichier en entrée:
[{
"authors": [{
"affiliations": [{
"address": "GDR 2989 Université Versailles Saint-Quentin-en-Yvelines, 63009"
}]
}]
}]Script:
[use]
plugin = basics
plugin = conditor
[JSONParse]
[affAlign]
[JSONString]
indent = trueSortie:
[{
"authors": [{
"affiliations": [{
"address": "GDR 2989 Université Versailles Saint-Quentin-en-Yvelines, 63009",
"conditorRnsr": ["200619958X"]
}]
}]
}]Requêtes pour les notices
curl 'https://api-integ.conditor.fr/v1/records?q="source:hal%20AND%20authors>affiliations>\"*\""&page_size=10&includes=authors,sourceUid&access_token=...' \
> data/10-notices-conditor-hal.jsonRègles certaines
Ajouter la référence RNSR retrouvée dans l'affiliation, dans un champ
conditorRnsr.
Conditions nécessaires (pour toutes les règles certaines):
- le
code_postalou laville_postalede la structure doivent être présents dansaddress(de la notice), - et pour au moins une des tutelles (
etabAssoc.*.etab, etetabAssoc.*.etab.natTutEtabvautTUTE):- soit le
sigleou lelibellesont présent dansaddress, - soit
libellecommence parUniversitéet lelibelleest présent dansaddress(mais pas lesigle).
- soit le
On trouve la bonne structure (et donc son num_nat_struct):
- soit
etabAssoc.*.labeletetabAssoc.*.numerosont présent proches (en séquence, ex:GDR2945GDR 2945ouGDR CNRS 2945) dansaddress, - soit
sigleest présent dansaddress, - soit
intituleest présent dansaddress.
À partir de la version 1.1, quand on cherche une chaîne de caractères, on ne tient plus compte de sa casse.
À partir de la version 1.2, quand on cherche une chaîne de caractères, on ne tient plus compte des accents.
À partir de la version 1.3, le traitement est plus rapide.
