🛑 Cette application est conçue pour interagir avec HAL et récolter des métadonnées liées à la base de données.
🛑 Une version plus légère de l’application est en cours de développement, permettant à chacun de créer sa propre application sans nécessiter de connexion à HAL.
Le processus commence avec une base de données de fichiers PDF académiques qui doivent être extraits et traités.
Les fichiers PDF sont envoyés à GROBID, un outil permettant d’extraire des données structurées (comme des informations bibliographiques) à partir de PDF académiques. GROBID génère en sortie des fichiers XML, rendant l’information lisible par machine.
Après GROBID, les données extraites sont transmises à SOFTCITE, qui génère des fichiers JSON. SOFTCITE analyse les citations, les mentions de logiciels ou d’autres informations de référence présentes dans les PDF.
Les fichiers XML et JSON extraits sont ensuite traités par SOFTware-Sync, un outil qui synchronise ces données dans un fichier XML unique.
SOFTware-Viz est chargé de la visualisation des données traitées. Il prend les données synchronisées par SOFTware-Sync et les transforme en tableaux de bord ou autres représentations graphiques.
Les données traitées sont stockées dans ArangoDB, une base de données NoSQL multi-modèle, permettant la gestion des données structurées. Elle sert de stockage principal pour les informations et mentions extraites.
Flask est un framework web utilisé pour développer des applications web. Il interagit avec SOFTware-Viz (pour la visualisation) et ArangoDB (pour la récupération des données).
- Clonez le dépôt :
git clone ../- Accédez au répertoire du projet :
cd ./SOFTware-viz- Créez un environnement virtuel :
python -m venv env- Installez l’image Docker :
docker pull arangodb/arangodb:3.11.6- Lancez un conteneur Docker :
docker run -p 8529:8529 -e ARANGO_NO_AUTH=1 arangodb/arangodb:3.11.6- Installez l’image Elasticsearch :
docker pull docker.elastic.co/elasticsearch/elasticsearch:9.0.2- Lancez un conteneur Docker :
sudo docker run -d \
--name elasticsearch \
-p 9200:9200 \
-p 9300:9300 \
-e "discovery.type=single-node" \
-e "ES_JAVA_OPTS=-Xms1g -Xmx1g" \
-e "xpack.security.enabled=false" \
--memory="2g" \
docker.elastic.co/elasticsearch/elasticsearch:9.0.2- Activez l’environnement virtuel :
source env/bin/activate- Installez les dépendances :
pip install -r requirement.txt- Lancez l’application :
python run.pyExécutez l’application avec la commande suivante (la base de données se créera automatiquement lors du premier lancement) :
python run.py
