-
Notifications
You must be signed in to change notification settings - Fork 0
Open
Description
Il s'agirait d'utiliser Aspyre pour créer un système de conversion pour passer des ALTO XML (3) produits par le script pdfalto en intégrant les modifications nécessaires (schéma, filename, ...) et la question de l'homothétie (qui se pose aussi pour les ALTO de Limb (#15).
<?xml version="1.0" encoding="UTF-8"?>
<!-- added manually for compatibility with eScriptorium -->
<alto xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns="http://www.loc.gov/standards/alto/ns-v2#"
xmlns:page="http://schema.primaresearch.org/PAGE/gts/pagecontent/2013-07-15"
xsi:schemaLocation="http://www.loc.gov/standards/alto/ns-v2# http://www.loc.gov/standards/alto/alto.xsd">
<!-- end of added -->
<!--<alto xmlns="http://www.loc.gov/standards/alto/ns-v3#">-->
<Description>
<MeasurementUnit>pixel</MeasurementUnit>
<sourceImageInformation>
<!-- <fileName>test_aspyre/1903 159_258 3.pdf</fileName> -->
<!-- added manually for compatibility with eScriptorium -->
<fileName>Annuaire_1903 161.tif</fileName>
<!-- end of added -->
</sourceImageInformation>
<OCRProcessing ID="IdOcr">
...
Autre modification: pdfalto met des float dans les attributs comme "HEIGHT", "WIDTH", "HPOS" etc, au lieu de int.
Cette feature est une solution pour répondre à https://gitlab.inria.fr/scripta/escriptorium/-/issues/331
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels