SOFTware-Viz

Présentation du projet

🛑 Cette application est conçue pour interagir avec HAL et récolter des métadonnées liées à la base de données.

🛑 Une version plus légère de l’application est en cours de développement, permettant à chacun de créer sa propre application sans nécessiter de connexion à HAL.

-> SOFTware-Viz-Light

Base de données de PDF

Le processus commence avec une base de données de fichiers PDF académiques qui doivent être extraits et traités.

GROBID

Les fichiers PDF sont envoyés à GROBID, un outil permettant d’extraire des données structurées (comme des informations bibliographiques) à partir de PDF académiques. GROBID génère en sortie des fichiers XML, rendant l’information lisible par machine.

SOFTCITE

Après GROBID, les données extraites sont transmises à SOFTCITE, qui génère des fichiers JSON. SOFTCITE analyse les citations, les mentions de logiciels ou d’autres informations de référence présentes dans les PDF.

SOFTware-Sync

Les fichiers XML et JSON extraits sont ensuite traités par SOFTware-Sync, un outil qui synchronise ces données dans un fichier XML unique.

SOFTware-Viz

SOFTware-Viz est chargé de la visualisation des données traitées. Il prend les données synchronisées par SOFTware-Sync et les transforme en tableaux de bord ou autres représentations graphiques.

ArangoDB

Les données traitées sont stockées dans ArangoDB, une base de données NoSQL multi-modèle, permettant la gestion des données structurées. Elle sert de stockage principal pour les informations et mentions extraites.

Flask

Flask est un framework web utilisé pour développer des applications web. Il interagit avec SOFTware-Viz (pour la visualisation) et ArangoDB (pour la récupération des données).

Installation

Depuis `la source`

Clonez le dépôt :

git clone ../

Accédez au répertoire du projet :

cd ./SOFTware-viz

Créez un environnement virtuel :

python -m venv env

Installez l’image Docker :

docker pull arangodb/arangodb:3.11.6

Lancez un conteneur Docker :

docker run -p 8529:8529 -e ARANGO_NO_AUTH=1 arangodb/arangodb:3.11.6

Installez l’image Elasticsearch :

docker pull docker.elastic.co/elasticsearch/elasticsearch:9.0.2

Lancez un conteneur Docker :

sudo docker run -d \
  --name elasticsearch \
  -p 9200:9200 \
  -p 9300:9300 \
  -e "discovery.type=single-node" \
  -e "ES_JAVA_OPTS=-Xms1g -Xmx1g" \
  -e "xpack.security.enabled=false" \
  --memory="2g" \
  docker.elastic.co/elasticsearch/elasticsearch:9.0.2

Activez l’environnement virtuel :

source env/bin/activate

Installez les dépendances :

pip install -r requirement.txt

Lancez l’application :

python run.py

Utilisation

Depuis `la source`

Exécutez l’application avec la commande suivante (la base de données se créera automatiquement lors du premier lancement) :

python run.py

Name		Name	Last commit message	Last commit date
Latest commit History 214 Commits
.github/workflows		.github/workflows
.idea		.idea
Utils		Utils
app		app
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
docker-compose.yml		docker-compose.yml
requirements.txt		requirements.txt
run.py		run.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SOFTware-Viz

Présentation du projet

Base de données de PDF

GROBID

SOFTCITE

SOFTware-Sync

SOFTware-Viz

ArangoDB

Flask

Installation

Depuis `la source`

Utilisation

Depuis `la source`

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Inria-Datalake/SOFTware-Viz

Folders and files

Latest commit

History

Repository files navigation

SOFTware-Viz

Présentation du projet

Base de données de PDF

GROBID

SOFTCITE

SOFTware-Sync

SOFTware-Viz

ArangoDB

Flask

Installation

Depuis la source

Utilisation

Depuis la source

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Depuis `la source`

Depuis `la source`

Packages