André-Jacob ROUBO - Le Forum

Le mieux qu'il est possible.

Vous n'êtes pas identifié(e).

#1 Re : Présentation des nouveaux membres. » Un nouveau à bord » 17/03/2019 14:54

 

Bien cher Asymétrix,


Un peu vraiment (beaucoup...) ailleurs en ce moment, je ne découvre votre message qu’aujourd’hui... Pardonnez-moi.

Merci beaucoup pour vos gentillesses, mais notez bien que le design ne m’a pas demandé beaucoup d’effort ; juste un peu d’attention (et de connaissance en CSS dont le Web regorge de documentation) pour partir de ça, et arriver à ça. Soit ... strictement la même chose ; ou presque... Il est exact que c’est du « tricoté main », parce que ne pas pouvoir corriger la moindre chose sans doubler la taille d’un fichier de code inutile m’exaspère... Je n’ai jamais trouvé un logiciel qui me fasse ce que je veux ; alors j’en reste à l’éditeur de texte ; « Small is beautiful »... La partie Forum n’est pas de mon fait ; j’ai porté une attention particulière à prendre un forum très léger (Fluxbb) qui fait juste ce dont j’ai envie qu’il fasse (et pas le café, les hot-dogs et j’en passe, façon usine à gaz).

L’OCR auquel s’est très courageusement attaqué l’ami Jean-René Bastien aura, en un temps qui viendra, besoin de relecteurs autres que lui-même. Cela, c’est un incontournable que mon expérience de ces choses peut vous assurer. Il n’en faut pas un, il n’en faut pas deux, il en faut une bonne dizaine. Et encore une fois, en bon praticien de cet exercice, je dis, je répète et je rabâche que leurs dispositions soient du genre sodomite de diptères. C’est épouvantablement laborieux et fort peu gratifiant. C’est extrêmement chronophage si on veut obtenir une copie numérique correcte. Pour vous décevoir encore un peu plus, sachez que très récemment, alors que je pensais être à-peu-près bon sur la transcription des seules tables des matières (il y en a six, ce n’est quand même pas la mer à boire !), j’avais oublié de poser le mot « Page » dans la première entrée de toutes les tables, la première exceptée (par exemple, « Page 154 » dans la deuxième table). Et cela depuis plus d’un an de mise en ligne !

Vous me direz que ça ne vous empêche pas de dormir ; pour vous rassurer sur l’ampleur de mes névroses, je vous confesse que moi non plus (Ouf!)... Mais il n’empêche ; sachant à quel point je me suis attaché à la minutie de la transcription, ce genre d’énormités laisse quand même rêveur ! Ou l’on se fixe une rigueur, ou l’on se vautre dans cette prétendue modernité qui n’en a que le nom. Quand on voit la qualité du travail de publication de Roubo (et de sa joyeuse bande) avec les moyens qui étaient les leurs, ça me laisse encore songeur d’humilité dont j’aimerai bien ne pas me défaire (pas toujours simple ce truc-là).

Votre intervention me fait aussi et quand même me botter le train pour mettre en ligne sous Wikisource les planches assez nombreuses maintenant disponibles sur mon disque dur mais, que je n’ai pas pris le temps de mettre en forme pour ce média... Même si j’ai eu beaucoup de travail personnel à régler dans l’année qui vient de s’écouler (ce dont je me doutais un peu...), il reste que la totalité des planches devrait quand même finir par se faire. Nous sommes tous pris par une infinité de choses à faire, ce qui m’oblige à constater que, si ce site végète, c’est quand même un tantinet de ma faute... En même temps, j’ai en horreur absolue (et de plus en plus avec l’âge...) le superficiel et le strictement productif. Je dois aussi (enfin) changer de machine pour une plus puissante, ce qui ne sera pas du luxe même si je fais TOUJOURS avec de la récupération (j’aime bien la décroissance).

Je suis aussi à la recherche de tout ce qui peut être considéré comme « textes princeps » évoquant Roubo. Les « Notes et références. » de la page de Wikipedia sont, à quelques exceptions près, toutes de moi. Il n’empêche, c’est épouvantablement court... Les dix-sept pages de l’article en anglais de Hans-Ulrich Thamer demanderaient, à mon sens, à être traduites en français. Mais rien que le parcours de ce texte montre à quel point les « sources » ne proviennent quasiment que de Roubo lui-même ! L’auteur est historien allemand mais a publié chez Gallimard. On pourrait donc peut-être prendre langue avec lui par le biais de l’éditeur, en imaginant plausible que lire Molière ne lui soit pas trop himalayesque (il aime bien les französen du XVIIIe), pour lui demander une autorisation de traduction.

J’aimerais aussi résoudre l’énigme de la signature de la gravure évoquée en note 1 de la page de Wikipedia. On n’a finallement que très peu de choses sur les graveurs français ; d’ailleurs, on sait tellement peu de choses de ces gens... Toutefois, lorsque la numérisation du texte aura eu lieu en totalité, il sera aisé d’en extraire exhaustivement les passages et commentaires à connotation « sociales » (plus que strictement « techniques » qui fait le corps général de l’ouvrage). Ne serait-ce qu’en notes de bas de pages, c’est juste énorme ! Et cela pourrait faire beaucoup pour accréditer l’idée que la modernité ne peut PAS se passer de philosophie et de conscience politique. Donc cela dépasse notre seul « coup de rabot » (dont je ne renie pas le but premier de cette publication) en donnant une sorte de porte-voix sur un point qui m’est cher : il n’y a pas, selon moi, de possible « Main » sans accompagnement de l’« Esprit ». Cela me fait, aussi vous répondre sur votre désir de « proposer des versions numériques dans un français plus lisible ». Je n’ai personnellement rien contre ; mais ce n’est, simplement, pas mon but premier d’une part, et je pense encore que ce n’est facilement possible qu’à partir d’une version que l’on sait pouvoir juger « de référence ».

Il y a, dans l’Esprit des Lumières dont Roubo est un « acteur praticien », cette idée de l’accomplissement humain par le truchement de la Raison. Cette dernière est aussi modérée, par la retenue de la langue de notre Menuiſier, qu’extrêmement ciselée, présente, en arrière plan comme en premier, toujours comme à l’affût. En n’étant qu’amateur mais déjà possesseur de cinquante gouges, vous montrez, vous-même, ce désir d’étendre la conscience de vos possibles puisque j’imagine encore que les langages informatiques que vous évoquez sont de cette même veine d’ama-teurisme, qui, étymologiquement, évoquent le désir d’aimer. Rien n’est jamais acquis dans le modelage de nos matières humaines ; jusqu’au dernier instant, jusqu’au dernier souffle, sans doute est-ce même un des plus beaux accomplissements de la Vie que celui de s’attacher à se sculpter soi-même.

Et je gage encore, à vous lire pour le moins aisément, que ce n’est pas le dernier de vos soucis...


Sans le moindre désir de ma part de symétrie normative, soyez donc le bien-venu heureux Gaulois !
wink

#2 Re : Version actuelle de ROUBO.ART » OCR de l'Art du Menuisier » 05/05/2018 14:30

Mon expérience en matière d’OCR n’est pas référentielle ; la tienne est supérieure. J’ai besoin, pour ce genre de choses, de m’y plonger complètement, ce qui n’est pas le cas. Mais Gallica n’a fait d’OCR sur le texte de Roubo que pour la Première Section de la Troisième Partie, donc que pour le Menuisier en Carrosses ! Donc, de toutes façons, les autres restent à faire...

À partir du moment où tu te lances là-dedans, de manière très spécialisée puisqu’il est entendu que c’est « une niche », tu finiras par forcément dépasser les résultats de Gallica. Tu as, dans le présent fil de forum, très bien expliqué que l’axe principal du problème tourne autour de la fonte, dont il est, je crois, acquis que c’est le Romain du Roi. Se plonger dans l’étude de cette fonte, c’est commencer par lire des choses sur l’excellent site de Jacques André au sujet de Sébastien Truchet, comprendre comment sont construite les Planches publiée (et parfois réinterprétées) par le tout aussi prolixe Rocbo.  J’en passe et forcément des meilleures, juste parce que je sais bien que je dois me concentrer sur autres choses actuellement. Par exemple, même la bibliographie de Jacques André ne donne pas accès au texte de la description des Planches de Truchet. Il permettrait, pourtant, d’aider énormément à la re-conception d’une fonte libre...

Par ailleurs...

smcj a écrit :

Les navigateurs Web actuels ne sont pas capables de gérer ce genre de choses, plutôt de l’ordre du traitement de texte.

Correction votre honneur... Je vous dis des bêtises ; profondément, sûrement, certainement, sans le moindre doute, du genre monstrueuses et pas du tout fondées... En regardant cette page, il m’a sauté aux yeux que les chiffres des années (1769-1775) n’étaient pas alignés. Je sais que Wikimedia utilise Linux Libertine, à fortiori parce que leur logo est inclus dans la zone UTF-8 à usage privatif. J’ai cherché un peu plus de deux minutes et suis tombé sur cette page que je te communique, tant je crois que le CSS d’un e-book peut en retirer les fruits... Pour une page Web, c’est évidemment la même chose, étant bien entendu que « Linux Libertine G » soit bien présente sur ton système d’exploitation. Démonstration ici dont la lecture du HTML et de sa partie CSS incluse peut être quelque peu instructive...

#3 Re : Version actuelle de ROUBO.ART » OCR de l'Art du Menuisier » 04/05/2018 13:36

jrbastien a écrit :

Faire revivre cette police en version libre est un autre projet auquel je m'attaquerai peut-être un jour...

Je n’ai fait aucune recherche sur le sujet, mais je suis surpris que ça n’ait pas été déjà au moins projeté. Je ne te dis pas à quel point je juge ce genre de choses utile à la communauté... À fortiori pour quelqu’un qui a, ici ou , largement prouvé son intérêt pour la typographie...

jrbastien a écrit :

La raison pour laquelle je me suis attardé à préserver les ligatures originales n'est pas que je voulais préserver à tout prix la forme d'écriture en usage à l'époque mais plutôt que Tesseract voit ces ligatures comme un seul caractère.

C’est nettement plus clair pour moi maintenant et parfaitement compréhensible d’un point de vue technique. Merci à toi de cette explication.

jrbastien a écrit :

Et je n'avais pas pensé à cela mais oui tout vieil ouvrage utilisant le Romain du Roi pourra être reconnu facilement par la suite.

Eeeuuhhh ; là c’est juste énÂÛrme. Je ne sais pas si tu te rends compte de ce que tu apportes à la communauté, mais le contenu de la « Description des Arts et Métiers », ce n’est quand même pas un détail... Quand on voit comment Gallica, avec les moyens qui sont les siens, traite, par exemple et pour ne citer qu’elles, les ligatures c-t dans son OCR sur le seul Menuisier en Carrosses, on se dit qu’ils feraient bien de te lire sur le présent forum...

jrbastien a écrit :

Pour ce qui est de ton truc pour afficher les ligatures dans LibreOffice, je ne le connaissais pas. C'est fantastique !

Quelquefois au-delà... Prendre une Planche de ce type, bourrée de fractions et se servir du tableur Calc de LibreOffice pour en faire la transcription, en Linux Libertine et ses options-« frac »-et« onum »-qui-vont-bien pour obtenir, au final, cette petite merveille qui ne fait pas 60 kilo-octets, c’est juste... épanouissant...

#4 Re : Version actuelle de ROUBO.ART » OCR de l'Art du Menuisier » 03/05/2018 18:59

Bonjour Jean René,

Si le fait de procéder à cet OCR semble pour le moins fructueux, c’est, je crois plus encore, que tu en fasses ici le témoignage qui me paraît on ne peut plus notable. Par là, tu permets à d’autres, par exemple pour d’autres ouvrages de la même collection (la « Descriptions des Arts et Métiers ») de récupérer ton travail, et donc, de s’économiser la réinvention de la roue. Je suis évidemment mille fois preneur de toutes tes expériences et ne te remercierai jamais assez pour cela !

Même si j’entends sans soucis que le type de Caslon convienne très bien pour cet OCR, je doute assez fort qu’il ait été celui employé par les imprimeurs de l’Académie Royale des Sciences (Jean Desaint & Charles Saillant) pour la « Descriptions des Arts et Métiers ». Il est clairement établit que l’on utilise encore à cette époque, et jusqu’à La Révolution, le « Romain du Roi », même si, encore, il est tout aussi acquis qu’il n’évolue plus après 1745. Ceci me semble corroboré par le fait que cette typographie a, précisément, été élaborée sous l’égide de l’Académie.

Même si c’est très simplement réversible, je ne suis pas certain qu’il faille se contraindre à utiliser de UTF8  dans la « Zone à usage privé » et ceci pour deux raisons principales :

  • Cela contraint à n’utiliser le texte qu’avec une seule police de caractères.

  • Cela réduit considérablement la facilité d’indexation sémantique, alors que c’est le but premier d’une version numérique textuelle. Si je cherche un mot dans tout le texte et que celui-ci contient un caractère spécifique à une ligature, je suis obligé de le taper dans ma zone de recherche, donc d’en connaître le code ou de jouer avec du copier-coller.

Le s long, les o-e ou a-e liés, minuscules ou majuscules, sont standardisés par UTF8 depuis des lustres et ne posent pas de problème.

Il y a encore des différences de recherche sémantique selon les logiciels. Par exemple, si je prends cette page et que je cherche, avec le navigateur Web Firefox, le mot « Menuisier », il ne le trouvera qu’une seule fois, naturellement dans le titre. Dans le même contexte, si je cherche le mot « Menuiſier », donc avec s long, il le trouvera sept fois ; et s’évitera le titre. Mais certains logiciels sont plus évolués. Copions-collons ce texte dans LibreOffice et cherchons le mot « Menuisier » OU « Menuiſier » ; il le trouvera huit fois, étant bien entendu qu’il soit spécifié de ne pas prendre la casse en compte...

Il y a encore des polices de caractères qui gèrent très bien, dans un certain contexte, les ligatures ou les styles de chiffres, par exemple anciens... Exemple : avec LibreOffice et, bien sûr installée, la police de caractères « Linux Libertine G », taper, en gros caractères, les mots « La perfection des Menuiſiers en 1769. ». La ligature entre le s long et le i se fait normalement ; mais pas celle entre le c et le t de « perfection ». De même, « 1769 » est écrit de manière moderne, avec des chiffres de mêmes hauteurs et alignés sur la même base.

Sélectionner cette même phrase et la copier-coller juste en dessous pour comparaison. Réopérer une sélection et RAJOUTER au nom de police de caractère la mention « :hlig=1&onum=1 »

linuxLibertineHligOnum.png

Étonnant non ??? Voilà ; on demande à une police de faire son travail, et elle le fait, je le crois, franchement plutôt bien. Les navigateurs Web actuels ne sont pas capables de gérer ce genre de choses, plutôt de l’ordre du traitement de texte [correction plus bas]. Mais nous aurions à sortir un PDF, il serait tout à fait à la hauteur typographique de ce que je crois que l’on peut demander à un texte qui reste contemporain dans sa production. J’ignore ce qu’il en est des lecteurs d’e-books, mais je ne serais pas surpris qu’il en aille ici comme pour les navigateurs Web tant le format qu’ils utilisent est proche. On trouve les spécifications d’utilisation de Linux Libertine dans ce fichier PDF. Pour ma part, je ne crois pas une bonne chose d’aller trop loin dans le détail « codé en dur » et il en va de même, par exemple et en illustration, pour les petites capitales. J’aurai tendance à les écrire, en minuscules normales, sachant qu’au même titre que l’italique, il s’agit bien là d’un enrichissement de caractères et non pas d’un codage particulier, forcément plus ou moins spécifique à une fonte. Que le s long soit codé en dur est normal ; c’est un caractère spécifique presque au même titre que les signes diacritiques. Les ligatures me semblent nettement plus relever de l’enrichissement typographique, à fortiori parce que les coder en dur va perturber considérablement l’indexation sémantique (typiquement [Ctrl] + [F]) déjà assez secouée par le seul s long...

Tu notes encore que je ne jure pas que par Linux Libertine... Qu’on me donne une autre police TTF, libre, plus proche du Romain du Roi et je l’adopterai immédiatement. Simplement, je n’ai fait que peu de recherche sur le sujet, étant, à l’heure actuelle, et tu le sais bien, plutôt focalisé sur les Planches.

Dans tous les cas, reçois encore toute ma gratitude pour témoigner en ce lieu de tes recherches, étant bien entendu que mes propres choix ne seront sont pas forcément les tiens en fonction de tes aspirations propres.

#5 Re : Version actuelle de ROUBO.ART » Normes de reproduction des planches » 26/04/2018 00:47

Bonsoir Jean-René (car même au Québec il commence à noircir ; en Europe, « il n’y a plus d’espoir »),

Puisque la coutume nord-américaine est plutôt au tutoiement et que les présentations d’usage de la vieille Europe (dont j’aime assez à conserver, un temps, certains de ses archaïsmes...) sont maintenant acquises, je n’ai rien contre le fait de céder à sa requête faite de manière privative. Mais comme tout à un prix dans ce monde misérablement consumériste, il ne faudra pas t’étonner, en retour, qu’une petite fée magique (ou, au choix, une vieille sorcière boutonneuse et velue) vienne corriger — et sans t’en faire le moins du monde la demande — les multiples fautes d’orthographe ou de typographie dont tes posts sont truffés. Il s’entend que les miens puissent en être émaillés ; peut-être et toutefois dans une moindre proportion...

J’ai bien conscience que le post était très long et évidemment, très circonstancié. Mais tes questions ont le mérite de dépasser tes propres demande d’éclaircissements ; en développer ici les réponses, c’est m’économiser, à terme, d’avoir à expliquer à autrui le fondement de mes choix. Cela a, aussi, le mérite, de démontrer à d’aucun que je ne suis pas exactement parti dans cette aventure à l’aveuglette ; j’ai une idée tout de même assez précise de ce vers quoi je me dirige, mais aussi du pourquoi. Je pense qu’un post de la longueur de celui qui précède témoigne assez bien une démarche de pensée, chose pour laquelle on n’a que trop tendance à passer à côté aujourd’hui, selon moi.

Tu utilises la « visionneuse de médias » qui n’est peut-être pas la façon la plus professionnelle de se rendre compte des caractéristiques graphiques d’un fichier à télécharger... Donc effectivement, le bouton « More details » ou, « Plus de détails » (in Französisch, natürlich) me semblait acquis... C’est aussi à cet endroit que l’on peut se rendre compte que WikiMedia, outre de donner à télécharger le fichier dans sa résolution d’origine, propose aussi, en direct ou presque, de le retravailler. Donc si 7858 × 4175 pixels sont excessifs pour l’usage que tu veux en faire tu choisiras autre chose, soit de ce qu’il t’est proposé, soit redimensionné à ton goût, par exemple avec Gimp. « Servez-vous et soyez heureux » ; cette deuxième personne restera toujours dans sa forme plurielle et ne me fait pas l’effet du moindre archaïsme...

Si la méthode de Ryan Moulton est passionnante à lire et m’apprend des choses, il reste qu’elle est très loin du travail que je fais. Au risque de me répéter, fais un zoom (de 500 % minimum) sur les fonds blancs que je produis et tu verras que blanc, chez moi, ce n’est pas des points gris ; c’est BLANC (de blanc, enfin blanc ; je veux dire blanc), le genre de choses qui se dit « #FFFFFF » en HTML... Et pas pour un seul pixel par-ci par-là ; mais pour tous ceux qui ne sont pas signifiants au regard du propos graphique. Donc évidemment sans tâches aucune. Donc pas le moindre risque de cadre grisé si tu copies-colle une Figure dans un texte quelconque (Cf., plus haut, démonstration Lost Art Press). Et comme le tout s’étale sur une échelle de seize niveaux de gris, c’est extrêmement imprimable, même sur des imprimantes antédiluviennes. Et cela implique aussi une facilité de compression PNG qui, dans ces conditions éminemment favorables, fait exploser des records de compressions, même au pesé de l’habituel JPeG, normalement constitué (entendu par une compression que l’on puisse qualifier de raisonnable). Ce qui revient encore à une décroissance de moyens, même pour le simple affichage sur un écran, dont je ne suis pas exactement mécontent. Si tu prends cette extraction de la Planche 50 (qui clos celles de la Première Partie), affichée évidemment en tête de site, tu notes qu’il lui a été rajouté, entre autres, une transparence, pour s’inclure sur ce fond. Ce genre de choses est quand même extrêmement simple à faire une fois que l’on sait ne pas avoir à se préoccuper, précisément, du fond. Même si je ne ferai pas le test moi-même, je suis aussi convaincu que le résultat sur un Kindle d’AmaSchtroumpf doit être présentable. Le fait d’avoir des blancs purs, dans le contexte d’une « encre numérique » et de tout petits fichiers PNG doit lui simplifier hautement la tâche. Et comme la taille en pixels donnée à télécharger sur WikiCommons est de l’ordre du raisonnable, libre à toi de la réduire si AmaSchtroumpf est dépassé par le traitement de fichiers qui n’atteignent pas six mégaoctets (Planche 94)... Small is beautiful ; c’est bien connu et ce sera toujours ma ligne de conduite.

Le fait d’avoir du blanc pur, c’est, aussi, s’essayer de conserver un des intérêts de l’édition de Léonce Laget (1976-77) qui n’avait pas la qualité de détails de ce que nous pouvons produire aujourd’hui, mais un contraste général qui témoignait plus d’une ré-édition, au sens propre, que d’une photographie. Mon but est, précisément, de donner la possibilité de se « faire son propre Roubo », un peu comme on le faisait au XVIIIe siècle (et l’exemple le plus marquant reste la différence de reliure des trois bibliothèques retenues évoquée dans la présentation de Wikipedia) mais avec les moyens — libres — qui nous sont offerts aujourd’hui, en abondance. C’est pour cela que j’ai opté pour déclarer les PDFs produits en A3 parce que, même dans un petit village comme le plus proche du hameau qui m’héberge, dans une France on ne peut plus profonde donc, il est possible de faire un tirage correct des Planches, sur un papier acceptable. Et je suis encore certain que, cherchant un peu plus loin, je trouverais beaucoup mieux à moins cher. Je ferai sans doute un didacticiel, éventuellement vidéo, autant pour le tirage que pour la reliure. Mais c’est beaucoup de temps et ce n’est pas le plus urgent. Je crois aussi nécessaire de détailler un jour, cette fois de manière beaucoup plus approfondie que dans le cadre du présent forum, l’intérêt de fabriquer de ses mains, ou presque, ce genre d’objet qu’est un livre. Une fois encore, sortir du « principe consumériste » pour « reconquérir le temps », c’est, pour moi (et quelques autres, on se rassure...), rentrer dans une conscience historisante et culturelle pétrie d’Humanité. Passer à côté de ça, c’est digne de faire des meubles en matériaux composites et les plaquer de deux dixièmes de millimètres de noyer, tout en les vendant comme vrais. Viollet-le-Duc n’a pas fait mieux en vendant son Moyen-Âge de pacotille à Pierrefond ; on est donc, encore, au XIXe dans l’esprit. Mais moi, j’aimerais bien aborder (enfin) la modernité du XXIe, non pour « revenir au XVIIIe », mais pour en posséder la conscience de l’Esprit ; jusqu’à l’extrémité de ma Main. C’est exactement ce qui me fait encore soutenir que maîtriser le HTML (et autres PHP ou JavaScript) plutôt que de, toujours, céder aux CMS est un frein au rouleau compresseur uni-formiste et déshumanisant.

Je vais évidemment te décevoir mais les tests que j’ai faits pour redresser les coins furent tous infructueux, principalement parce que Gimp plante allègrement chez moi. Il faut deux choses pour cette fin : du temps pour des myriades de tests et une machine qui encaisse une demande de calcul tout de même plus élevée que de coutume. Je n’ai, pour cela et pour le moment, ni l’un ni l’autre ; j’ai donc reporté cette chose pour l’avoir plus considérée esthétique plutôt que strictement fonctionnelle. Mais je suis très preneur de tous les témoignages de tests de tous les greffons de la création pour le jour où je m’y mettrai.

Merci pour la définition du « cisaillement » ; cela me donne suffisamment de pistes pour pouvoir développer ma recherche. Ceci acquis, les photographies d’E|rara me semblent quand même prises de manière très « faciale » au papier de l’ouvrage. Aurais-tu un exemple de choses qui te choquent ?

À bientôt
wink

#6 Re : Version actuelle de ROUBO.ART » Normes de reproduction des planches » 11/04/2018 21:00

Bonjour à vous Jean-René ; bonjour à tous,

Merci d’avoir ouvert ce fil ici. Il me permet, idéalement, d’écrire dans cet endroit des choses que je n’ai pas envie d’expliquer ailleurs (par exemple sous forme de page Web).

Partez bien du principe qu’il n’est je crois pas chez moi de « terrain glissant ». Je fais des choix pour le présent site, je les assume complètement. Si vous voulez faire votre propre miroir, je n’y vois pas le moindre inconvénient. Mais j’irai jusqu’au bout de mes choix, aussi parce qu’une fois déterminés, il est important d’aller jusqu’au bout.

Votre post ci-dessus entraîne une réponse circonstanciée pour chacune des questions qu’il pose. Ma réponse est à proportion et j’entends bien qu’elle est énorme, peu en usage sur la forme forum. Mais vos questions me permettent, aussi, de témoigner de choix faits « en conscience » et je suis maître des lieux ; ici comme ailleurs, je n’ai aucune peine à assumer.

Il est, pour commencer, sans doute beaucoup moins pour vous (loin s’en faut) que pour d’autres qui peuvent nous lire, nécessaire de rappeler ici deux concepts fondamentaux, à savoir ce qu’est « la définition » d’une image numérique ainsi que sont « les images natives » d’une production.

La définition.

La définition (exprimée en DPI) n’est jamais rien d’autre qu’une déclaration adjointe à une image matricielle en deux dimensions. DPI, cela veut dire Dot Per Inch, soit nombre de points par pouces. Un pouce (américain et contemporain), c’est 2,54 centimètres. Donc si votre image fait 1000 points de large et qu’elle est déclarée à 100 DPI, alors elle sera IMPRIMÉE sur du papier avec 254 millimètres de large. Divisez la déclaration en question par deux, l’image aura TOUJOURS 1000 points de large mais l’impression sur papier passera à 508 millimètres de large (254 × 2). À l’inverse multipliez la déclaration en question par deux, l’image aura TOUJOURS 1000 points de large mais l’impression sur papier passera à 127 millimètres de large (254 ÷ 2). J’insiste lourdement sur ce point parce que c’est encore très rarement compris comme tel : Dot Per Inch très bien ; mais les pouces ce sont des pouces mesurés sur du papier, pas sur un écran. Cela veut aussi dire que les imprimantes sont capables de concentrer très facilement les points. C’est infiniment plus compliqué pour les écrans (le réglage se fait au niveau de la carte graphique et par le système d’exploitation ; et vous ne jouez pas à cela tous les jours).

Toutefois, sur un écran, on fait apparement quasiment ce que l’on veut... Un fichier graphique bitmap, il a X points de large et Y de haut. C’est tout. Maintenant je ne connais pas un logiciel qui ne soit pas capable de bidouiller tout ça pour vous l’afficher plus petit (il fera sauter des points) ou plus grand (il en extrapolera). La moindre balise <img> en HTML possède les attributs « width » et « height » avec lesquels vous pouvez faire ce que vous voulez y compris les anamorphoses les plus crasses. Ça ne modifie en RIEN l’état de votre fichier qui fait toujours X points de large et Y de haut (et le poids-octets qui va avec) ; c’est juste une question d’affichage. Afficher à 100 % dans Gimp (ou dans n’importe quel logiciel graphique, navigateur Web compris) c’est afficher UN point de l’image (fichier) sur UN point de l’écran. Point barre...


Les images natives.

Comme je le spécifie dans la note de bas de page numérotée 2 de ma présentation, si Internet Archive permet (admirablement) de rapatrier très simplement les images natives dans un fichier ZIP pour chaque volume scanné, c’est TRÈS loin d’être le cas tant de Gallica que (surtout), d’E|rara. Zoomer à fond dans les deux visualiseurs de ces deux bibliothèques distinctes est aisé ; on est bien content d’avoir les détails... Et-c’est-TOUT. Hors de la maison-mère, point de salut, pas de clic droit pour « Enregistrer l’image sous... ». Chez Gallica, vous aurez l’état affiché dans un PNG URL-encodé en base 64 (mais juste le bout affiché) et E|rara vous donnera un carré de 512 × 512 pixels du lieu où vous aurez cliqué, zoom à fond pour les deux visualiseurs des deux bibliothèques en question.

C’est exactement le genre de choses, à l’exact contraire de ce que vous semblez croire pour ma propre personne, qui, comme on dit en France, me les brise menu... Ce site répond à cette exaspération ; et nous aurons, vous et moi, et dans le présent fil, à y revenir. Pour l’heure, notez juste que mon niveau informatique est suffisant pour avoir, de manière privative, parfaitement rapatrié, sous forme de fichiers, les versions natives usitées par ces bibliothèques.

____________________________________________________


Dans les fichiers PNG déposés chez Wikipedia Commons, je me suis attaché à ne surtout pas déclarer la moindre déclaration de définition DPI. Pourquoi ? Simplement parce que je n’ai aucune idée réelle et précise des dimensions originales du papier. Je connais une personne qui possède un exemplaire de l’édition originale ; nous pourrions, aussi, prendre les mesures en bibliothèque. Mais nous savons encore que le retrait du papier, lors du mouillage à l’impression, fut quelquefois problématique, pas forcément pour cette édition-là, mais pour d’autres, de l’Académie Royale des Sciences qui demandaient des Planches d’une grande précision (visibles sur Gallica) puisqu’elles se fixent le but de communiquer des mesures à l’échelle 1. En fait, je ne suis pas certain qu’il se trouve un seul exemplaire ancien dont le tirage soit identique en taille. Et puis, cela n’a aucune importance ; le fait de ne rien déclarer vous laisse totalement libre de télécharger le PNG depuis Wikimedia Common et d’en faire ce que vous voulez, de le découper, de le triturer, d’en extraire un bout avec Gimp si ça vous chante ou PhotoProut si c’est vot’ truc...

La Planche 12 que vous nous donnez à télécharger aujourd’hui fait exactement 1640 pixels de large sur 2320 de haut. Le fichier fait 2203 ko et la colorimétrie de l’image est établie en niveaux de gris, soit une indexation de 256 niveaux (8 bits par pixels).

Expérience amusante et quelque peu digressive pour l’heure : avec Gimp, changez le mode de l’image en couleurs indexées et choisissez de générer une palette optimale avec un nombre maximal de couleur de 16. Observez la différence au pesé du poids-octet du nouvel export en PNG...

La Planche 12 que je donne à télécharger fait exactement 2684 pixels de large sur 3993 de haut. Le fichier fait 1085 ko et la colorimétrie de l’image est établie en 16 niveaux de gris (4 bits par pixels).

On arrive à cet exploit (dont je ne suis pas exactement mécontent...) en supprimant purement et simplement TOUT point qui n’est pas signifiant graphiquement parlant. Zoomez votre propre version dans les blancs ; elle est encore pleine de points gris... Ce n’est PAS blanc. Donc cela gène la compression PNG ; donc cela alourdit le poids-octets.

Mais il y a, selon moi, beaucoup plus... Par exemple, vous n’ignorez évidemment pas le travail tout à fait remarquable de traduction de Roubo en anglais par Lost Art Press. Il ne s’agit que d’une petite partie, mais c’est évidemment déjà beaucoup pour nos amis américains. Surtout, ils ont eu la bonne idée d’utiliser une technique, aujourd’hui complètement évidente, d’incorporer l’iconographie au texte, et même de rajouter des encadrés de commentaires pour éclairer un propos qui reste historisant. Dans le cadre d’une traduction, c’est évidemment remarquable. Un exemple de quelques pages est donné dans ce PDF. Portez votre attention sur la page numérotée 35 (page 4 du PDF). Nous avons là du texte (avec une très laide orpheline qu’une espace insécable aurait évité s’il avait été porté une attention à son systématisme occurrentiel...) et trois illustrations issues de la Planche 278. Celles-ci sont extraites par un vulgaire couper-coller de leurs propres fichiers de Planches. Comme ils n’ont pas fait disparaître le papier, l’extraction est forcément rectangulaire (ou alors, ce serait ridicule et très laid). On est donc gratifié d’un petit bout d’arrière-train de scieur de long en Figure 11 et d’un bout de presse en Figure 10. Je trouve ça très ... moche. Je vous donne à voir la même page (j’espère qu’ils ne m’en voudront pas trop...) mais pourvue des Figures de la version publiée sur Wikimedia Commons. Selon ma propre perception des choses, les images se mettent à faire corps avec le texte ; j’y vois là une french touch pour laquelle je poursuis la souscription... Et si vous zoomez sur les Figures, sachant que je n’ai pas enlevé un seul pixel, nous sommes là dans une version numérique qui s’économise l’artefact Jpeg et qui, donc, même si elle le paie chèrement en poids-octets, n’est pas exactement du même ordre qualitatif. Ma propre extraction s’est faite en deux minutes à partir du PNG de Wikimedia Commons. Un professeur de menuiserie peut faire la même chose pour son propre cours. Vous pouvez faire tous les eBooks de la création si cela vous chante, rajouter une déclaration de transparence sur le blanc pour le passer sur votre site Web dont le fond est de couleur fuchsia (mais non Jean-René, je plaisante !) : prenez et mangez en tous ; ceci n’est pas mon corps, mais c’est livré pour vous... Le format PNG ne compresse pas de façon destructive ; on peut presque considérer les Commons comme natives. Mais si quelqu’un me demande mes propres natives utilisées dans Gimp, même si c’est beaucoup trop lourd à mettre en ligne, je reste privativement à sa disposition.

Il nous faut maintenant évoquer les différences graphiques entre les versions des trois bibliothèques retenues dans ce projet. Pour avoir fait un essai, je ne pense PAS que le présent forum redimensionnera les images qui suivent pourvu que votre écran soit assez grand (évitez-vous le smartPhone, c’est mauvais, de toutes façons)... Ma démonstration porte sur un détail de la Planche 12, non retouché mais dans les dimensions des versions natives ; un point de votre écran, dans votre navigateur Web, c’est un point de l’image-fichier :

Voici la version native d’Internet Archive :
exemplePl12NativeIA.png

Voici celle d’E|rara :
exemplePl12NativeE-rara.png

Et enfin celle de Gallica :
exemplePl12NativeGallica.png

Vous saisissez ??? Il n’y a pas que mon côté bouddhiste et sa voie du juste milieu qui m’a fait choisir E|rara... Regardez les traits supérieurs de la culotte de ce brave garçon, voire les traits verticaux de l’ombre de son mollet gauche ou les horizontaux de son droit. C’est typique et ça se retrouve partout ; Gallica est puissant, scanne comme un malade et montre ses muscles. On s’extasie ; forcément... Mais les petits suisses ont une précision de trait qui frise la qualité de leur horlogerie. Ça tombait bien, ma machine actuelle pédale un peu dans la choucroute alsacienne avec les natives gallicanes. Je ne dis pas ne pas y avoir recours, par exemple dans la problématique évoquée dans la présentation du site au sujet de la Planche 367 ; mais c’est occasionnel, rien de plus. E|rara donne aussi des Planches un peu sombres ; ça se résout en une commande Gimp. Inutile de vous dire que les images natives d’Internet Archive sont hors-jeu dans cette petite compétition. Et croyez bien encore que, philosophiquement parlant, il me soit donné de le regretter... Mais le résultat des courses, au pesé de mes choix assumés, c’est quand même ça :
exemplePl12Commons.png

Et bien le voila mon compromis Jean-René ! J’ai effectivement généralement préféré une courbure à gauche des Planches pour une précision de trait quand bien même cela atteignait, parfois, un peu les Figures et débordait du simple cadre. Si je peux corriger, je le fais ; mais c’est généralement un travail fastidieux. C’est principalement dû parce que je suis, d’abord, un praticien ; ce qui m’intéresse avant toute chose, c’est le détail du trait qui guidera mon geste de métier. Or cette précision de trait, sur écran, par la facilité très aisément acquise de l’usage du zoom, elle est infiniment plus efficace que sur papier. Par exemple, dans le cas de la Planche 187, aussi tordue sur la gauche que soit la version d’E|rara, j’ai choisi volontairement de laisser le dessin en l’état, d’abord parce que, même déformées, les lettres de références des Figures étaient plus lisibles qu’ailleurs (lettre C et U, en haut à gauche de la Figure 1). Gimp est capable de modifier la forme de cette partie du dessin en opérant une distorsion locale, mais cela demande une machine plus puissante que celle actuellement en ma possession. La Planche en question (et celles dans le même cas) attendra donc un peu une publication ultérieure, même si l’actuelle donne cette impression bizarre à la Berline de posséder un toit arrière relevé vers le haut alors qu’il est évident qu’il est, en fait, cintré vers le bas, au même titre que l’avant du véhicule auquel il fait pendant... Je décevrai donc sans doute les bibliophiles qui apprécient plus les vues générales sur papier glacé que les ouvriers ordinaires qui portent une attention plus soutenue à s’attacher au réel. C’est bien connu, on ne peut pas plaire à tout le monde et il n’est pas de choix assumé qui ne reflète une personnalité...

Vous imaginez bien, je suppose, qu’il m’a été, autant que vous, donné d’établir une méthodologie de travail pour le traitement des Planches. Je vous la livre ici telle que je l’ai noté pour moi-même afin de garder une homogénéité de traitement. Et je vous rajoute un commentaire si je le juge nécessaire.

  • « Vérifier s’il est nécessaire de procéder à une rotation et si oui, y procéder. »

  • « Sélectionner au plus près de la marque du cuivre et « Rogner selon la sélection. »

  • « Menu Couleurs / Luminosité-Contraste → environ 40 / 40. »

  • « Menu Couleurs / Désaturer. »

  • « Menu Filtres / Amélioration / Renforcer la netteté → 5,0 - 0,50 - 0 »
     

  • « Pot de peinture avec remplissage d’arrière-plan (Blanc) dans TOUS les trous du dessin. Le seuil à 20. »
    Je ne vais que très rarement au-delà de ce seuil, avec toujours l’idée de préserver le trait. Il m’arrive de faire des parties entièrement à la main (lasso) jugeant que l’automatisme est par trop destructeur. Dans l’ensemble, ce traitement possède l’avantage de bien reconnaître les traits mais juste ceux que l’on choisit. Une texture de bois, par exemple, même à la tonalité très proche de l’arrière-plan, ne sera pas concernée.
     

  • « Menu Image / Mode / Niveau de gris. »

  • « Menu Image / Mode / couleurs indexées. »

  • « Menu Calque / Transparence → Vérifier qu’il n’y a pas de canal alpha ; sinon, le supprimer. »

  • « Enregistrer sur le motif [pl_000_R.xcf] »
     

  • « Blanc en arrière-plan pour nettoyage, à la main, de ce qu’il reste de crasses. »
    C’est un travail très long pour éliminer l’équivalent de vos points gris évoqués plus haut. Dans le meilleur des cas, cela dure au moins une bonne heure. Mais c’est aussi à ce moment-là que je procède quasiment systématiquement à de la restauration, qui demande une certaine réflexion pour ne pas trop « lisser » l’ensemble. Il m’arrive de supprimer des taches en plein « grisé de lignes », reprenant des motifs proches pour les copier-coller quand c’est possible. Il arrive aussi que cela ne le soit pas. Le bas de la Figure 2 de la Planche 335 est ainsi abîmé dans l’exemplaire d’E|rara ; là, j’ai procédé à une restauration, très locale, avec celui de Gallica. Mais cette même Figure 2 de la Planche 335 possédait, après le passage en pot de peinture blanc, encore beaucoup trop de points noirs qui n’avaient pas de sens graphique. Des taches, aussi, sur les rayures horizontales du gris figurant le bois. Tout cela se fait à la main ; tout cela se fait avec réflexion et pesé de choix conscients. Et je suis content du résultat dont je ne suis, pour ce cas précis, plus vraiment capable de savoir où se trouvent les raccords dont j’ai oublié la place exacte.
     

  • « Exporter sur le motif [pl_000_R.png] »

J’ai, bien entendu, établit des raccourcis claviers pour chacune de ces opérations. Mais chacune est aussi faite « en conscience », c’est-à-dire avec une réflexion assumée sur le « trop » ou le « trop peu ». Je vous laisse imaginer que j’ai, quand même, une très grande maîtrise du clavier... Je dois aussi vous dire qu’à la manière des restaurateurs de tableaux, — et même s’il ne s’agit, ici, que d’une version numérique d’une reproduction anastatique — je porte une attention particulière à ne pas « trop » restaurer. Nous avons, sans doute plus de ce côté-ci de l’Atlantique que du vôtre, une grande connaissance et une grande conscience de l’excès restauratoire, souvent inspiré par une productique dont, précisément, l’automatisme détruit la qualité humaine, dans toutes ces imperfections, celles qui, encore, sont si constituantes de ce que l’on appelle le charme... Si le prix à payer pour cette préservation est de devoir passer plus d’un an à la mise en ligne de quatre-cent Planches de l’œuvre d’une vie qui fut si riche en don puisque nos générations en récoltent encore les fruits, c’est pour moi un honneur de me plier à tant de Grâces ! Et c’est encore une force de maîtriser la machine plutôt que de devoir subir ses affres, me laissant devenir son esclave en acceptant, comme c’est encore si souvent le cas, ses prétendues perfections qui ne sont, en fait, que travail bâclé pour gagner sur l’horloge. Cette vision du gain est tout à fait dans l’esprit du XXe siècle ; j’ai pourtant ouï-dire récemment que cela fait dix-huit ans que l’on vient d’en changer. Aussi n’est-ce pas sans plaisir (et pour une fois) qu’il m’est donné d’être à l’heure de ce que je crois définir comme la modernité...

Je vais maintenant reprendre votre propre spécifications et les commenter.

  • Points 1 et 2 : « Reconnaître le cadre » et « Corriger l'orientation »
    C’est une chose dont je vois mal l’utilité parce que Gimp le fait très bien et qu’il arrive souvent que les côtés opposés ne soient pas parallèles. J’aime énormément maîtriser ce genre de chose et ne pas dédier ce travail à un algorithme... Ici comme souvent ailleurs, cela me permet de faire des choix éditoriaux justifiés et assumés.
     

  • Points 3 : « Corriger le cisaillement »
    Vous m’expliquerez ce que vous entendez par là. Une recherche (trop rapide) sur le Web ne m’a pas permis de comprendre.
     

  • Points 4 : « Appliquer un filtre antiparasite correspondant au niveau de noir maximum de l'arrière-plan. »
    C’est un petit peu l’effet de mon pot de peinture blanche. Mais il y a une différence : si une Figure, parce que trop claire, doit être protégée de ce traitement pour en conserver la texture, une simple sélection d’icelle, suivie de l’inversion de la sélection permet, très simplement, de ne pas opérer sur l’endroit en question. Vous trouvez cet exemple sur le « parchemin » de la Figure 1 de la Planche 299 dont les traits d’ombres, très légers, ont été non seulement préservés de tous traitements d’éclairage mais dont j’ai, aussi, légèrement renforcé la profondeur.
     
    Par cet exemple (et, je vous le concède, un peu terriblement), vous trouvez aussi là une très bonne illustration des limites de l’automatisme. Un travail éditorial, pour moi, c’est un travail humain, conscient, responsable. J’y vois, pour ma part, non pas un exercice d’humilité stérile, mais, presque à contrario, une extraordinaire opportunité d’apprendre, de découvrir, de relayer un savoir. Je suis très heureux de ne pas avoir abîmé la Rose de la Figure 1 de la Planche 299 de L’Art du Menuisier d’André-Jacob Roubo ; c’est important les Roses, vous savez...
     

  • Points 5 : « Appliquer ce filtre en mode division »
    Même méconnaissance de ma part que pour le point 3 ; vous saurez m’expliquer plus avant.
     

  • Points 6 et 7 : « Mettre le cadre à dimension fixe pour que toutes les planches soit pareilles au pixel près. » et « Centrer le cadre dans le format voulu afin d’obtenir des marges constantes. »
    Vous soulevez un point énorme qu’il me faut expliquer longuement. Les Planches posées sur Wikimedia Commons ne sont, à l’heure actuelle, absolument pas standardisées dans leur taille en pixels. On a vu plus haut que je me suis attaché à garder scrupuleusement les pixels, à quelques exceptions près, dans la dimension générale donnée par E|rara. Même quand une Planche (comme la 255) présentait de gros défauts j’ai rattrapé le coup en me servant de la version de la version de Gallica (et je laisse votre perspicacité trouver les lieux de collages...), mais toujours en me basant sur la base dimensionnelle des versions d’E|rara, évidement pour garder une cohésion homogène à l’ensemble des 383 Planches. Ne vous y trompez pas ; sur une Planche comme la numérotée 255, il y a plus de deux dimanches après-midi de travail, il n’y a aucun automatisme, mais c’est juste pas-sion-nant... Parce que c’était ici possible relativement facilement, les mauvaises courbures d’E|rara ont disparu sans jamais céder à la version coupée de Gallica. Et le PNG final ne fait qu’un peu plus de 2 mega octets, ce qui est franchement plutôt honnête pour 5203 × 3987 pixels.
     
    Je vous explique tout cela pour vous dire que je ne crois pas une bonne chose de « Mettre le cadre à dimension fixe pour que toutes les planches soit pareilles au pixel près. », tout simplement parce qu’il se trouve quarante-cinq Planches qui dépassent allègrement l’in-folio et que standardiser ce point impliquerait que l’on réduise la qualité graphique des Planches pliées. C’est, chez moi, bien entendu hors de question. « Centrer le cadre dans le format voulu afin d’obtenir des marges constantes. » est de la même eau : cela veut dire redimensionner des proportions différentes des Planches originales alors qu’il est acquis qu’elles sont plutôt hétérogènes. J’ai en horreur absolue ce « passage au moule », cette chose qui fait que les Américains ne sont pas foutus de trouver un éditeur qui puisse faire des Planches pliées à un prix abordable (on est quand même déjà à 120 US-dollars l’exemplaire) alors qu’on est en plein XXIe siècle (expliqué à 07:20 de cette vidéo)... Couper en trois, en pleine reliure et sur un verso, une beauté pareille pour la caser dans un A3, cela me semble le juste reflet de notre lobotomie aux machines. Et, pour moi, les Lumières nous portent exactement à l’inverse de cette prétendue modernité ; jamais je ne céderai ce point focal, même avec leur explication gentillette de la gouttière centrale qui évite la perte d’information. Même si ce brave Léonce Laget, en 1976-77, était loin d’avoir nos moyens techniques, jamais il ne s’est permis ce genre de « crime » éditorial !
     
    Mais je vous concède qu’il peut être utile, dans un cas précis, de rajouter des marges à un multiple entier d’un nombre, pour une raison strictement technique et sans jamais altérer les proportions, ni faire de coupe d’une laideur sans nom. C’est évidemment un essai, les lignes rouges ne sont là que pour visualiser des fichiers graphiques individuels mis en place dans un strict tableau HTML dont le code ne présente pas le moindre secret à la connaissance que vous pouvez en avoir. Elle seront évidemment amenées à disparaître. Chaque carré contient un PNG de 512 × 512 pixels ; précisément. Et là, il a bien fallu rajouter des marges extérieures pour arriver au multiple entier le plus proche du PNG original, tant en X qu’en Y. Je note évidement dans une base tabulaire les dimensions en pixels de chaque Planche. La numérotée 1 fait par exemple 2768 × 4056 pixels. Une bête formule de tableur m’arrondit tout cela :
    =ARRONDI.SUP(2768 / 512) * 512 donne 3072.
    =ARRONDI.SUP(4056 / 512) * 512 donne 4096.
    Plus loin, en colonne, on reconstituera par formule la phrase très « magick » du genre :
    convert ./pl_001_R.png -gravity center -extent 3072x4096 ./pl_001_E.png
    Le tout copié-collé dans un exécutable en fin de course et le tour est joué. La division en carré est de la même eau, toute aussi « magick » :
    convert ./pl_001_E.png -colors 16 -depth 4 -crop 512x512 +repage ./pl_001_%03d.png
    Il y a renommage ultérieur, évidemment automatisé, pour signifier, dans les noms-mêmes des fichiers, les lignes et les colonnes ; j’aime bien l’human readable...
     
    Bref, vous qui lisez le code HTML, vous savez ce qu’est une ancre.
    Donc, en plein tableau, <A name="fig.13"></A> ; donc :
    http://roubo.art/planches/001/index.htm#fig.13
     
    Je ne dis pas que ce sera cela ; c’est un essai, et il est encore tout à fait possible que je décide de fabriquer vraiment des fichiers de Figures indépendants, comme je le faisais, jadis. En vérité, je ne sais pas vraiment où je vais sur ce point précis et je me laisse, aussi, le temps d’y réfléchir. Dans tous les cas, j’ai bien l’idée d’aller à la Figure directement depuis le texte. C’est une autre étape, d’ailleurs passée l’OCR. Mais c’est aussi un des très rares cas où je vois un intérêt à standardiser un peu une dimension parce que cela simplifie énormément le codage. Et encore, même là, on pourrait s’en passer...
     

  • Points 8 : « La résolution devrait être idéalement de 300 dpi. »
    Encore une fois, si votre but est de faire un eBook, alors je suppose que sa destination est infiniment plus destinée à un écran qu’au papier. Définir la résolution dans ce contexte ne me semble pas primordial.

Pour revenir à votre scanner DIY, je suis en train d’en faire un depuis que j’ai commencé à utiliser, pour d’autres projets, le logiciel ScanTailor. C’est malheureusement en panne de développement mais rend quand même d’énormes services, notamment pour les réductions en noir et blanc (purs, format Tiff) à partir de photographies de blocs de texte. Je n’ai jamais trouvé mieux pour faire ce travail en cascade.

Mais je voudrais, pour achever ce post très long, revenir sur votre mention tout aussi finale : « [...] je me demande si vous m'autorisiez à utiliser les vôtres [les Planches] ». Vous n’imaginez pas, je crois, la chance qu’il vous est donné d’avoir un océan qui nous sépare... Avez-vous vraiment lu mon paragraphe sur la licence évoqué dans mon texte de présentation ??? Allez encore voir ce qui est écrit en commentaire au début du code HTML de chaque page du site roubo.art. Allez cliquer, en fin de page, sur le lien de la licence dans le blog que je vais peut-être arriver à tenir sur le présent nom de domaine. Allez encore lire cet article qui ne parle pas d’Orgue (chez moi, pure folie !) mais dont le HTML (mais peut-être pas que...) vous amusera sans doute.

Croyez-vous encore vous trouver en un terrain si « glissant » qu’il puisse déjà mettre fin à notre dialogue naissant ? Croyez-vous encore que mon esprit ne soit pas à ce lâcher-prise, si nécessaire à l’échange, le vrai, celui qui ne compte pas, à fortiori parce qu’il est chez moi si conscient de sa surabondance qu’il n’a pas la moindre malchance de s’affaiblir à l’égratignure égotique ? « Servez-vous et soyez heureux » ; faites quelque chose de cela, reprenez-le à votre compte, diffusez Roubo, ne gardez rien à votre tour ; donnez et donnez encore et vous recevrez, comme j’ai tant reçu, et comme je recevrai toujours davantage, avec ou sans vous Jean-René, toujours au centuple. Vous arriverez à me froisser si vous doutez que je ne puisse m’appliquer à moi-même cette Liberté que j’impose aux autres... Notre société occidentale a tellement perdu cette évidence... Ce « capital » Jean-René, celui qui s’approprie le bien commun au profit du marchand, forcément minoritaire, égotique, je lui pisse à la raie et je lui chie dessus, parce que, jamais, au grand jamais, il n’atteindra mon Verbe, le geste de ma Main, pas plus que mon Esprit.

Avec toute ma gratitude ; à vous tout particulièrement bien sûr, mais aussi à ceux qui nous lisent ou qui y seront amenés.
smile
Sébastien.

#7 Re : Version actuelle de ROUBO.ART » OCR de l'Art du Menuisier » 09/04/2018 19:32

Je trouve cela très curieux, mais j’admets sans problème que l’API de LibreOffice, héritée d’OpenOffice, elle-même de StarOffice a quelque peu tendance à confondre les méthodes et les propriétés... Je suppose que votre version est spécifique à votre système d’exploitation, que j’imagine être une distribution Linux qui, comme c’est déjà arrivé, tente « d’arranger le coup » ou a peut-être compilé le logiciel en éliminant le superflu... Merci de ce signalement ; je viens de mettre le fichier à jour en ligne qui, avec la méthode getComponents plutôt que la propriété components a la gentillesse de fonctionner plus globalement...

Et si je puis me permettre, je sais bien que Python fonction sur vous-savez-qui ; mais de votre côté, vous ne semblez pas imaginer l’antiquité avec laquelle je travaille actuellement...

Bien à vous !
wink

#8 Re : Version actuelle de ROUBO.ART » OCR de l'Art du Menuisier » 09/04/2018 14:32

Bien cher Jean-René.

Un tout grand merci à vous pour vous être penché sur mon propre travail.

Je n’ai pas encore utilisé votre programme. Je dois installer un Linux correct, sur une machine acceptable ; ce qui demande ... un certain temps. Mais je me suis, évidemment, précipité sur votre OCR, pour en faire le comparatif avec celui d’Internet Archive. Pour l’instant (et notez le bien : pour l’instant seulement), je juge l’un et l’autre avec des avantages et des inconvénients des deux côtés. Il est aussi indéniable que ma liste de remplacements est très adaptée au passage choisi. J’ai établi une méthodologie pour cela et je suis en train de la rédiger. Ma macro fonctionne donc mieux pour le passage choisi dans l’OCR d’Internet Archive que pour le vôtre, non pour une question de programmation proprement dite, mais simplement d’entrées de liste. Mais vous devriez, quand même et sans doute, apprécier la présence des expressions régulières de LibreOffice pour ce qui regarde la gestion des fins de paragraphes...

Le Web REGORGE d’aide pour les macros de LibreOffice ou OpenOffice, à fortiori quand on accède à l’anglais. Le forum francophone est modéré par des gens au comportement qui frise l’abject ; l’anglophone est juste tenu par des gens normaux. J’ai déserté le premier depuis des lustres et j’intervenais encore récemment sur le second au sujet ... de choses que je pouvais aisément adapter d’un travail actuel... Je vous dis cela parce qu’il arrive, aussi, à mes petites crottes de se prémunir de styles... Dans tous les cas, la FAQ de developpez.com est encore une bonne source de solutions. Je reste évidemment et pour ma part votre serviteur pour la moindre de vos questions !

Partez du principe qu’un fichier ODF peut contenir ses propres macros mais que le programme lui-même possède aussi des bibliothèques qui lui sont propres. On peut donc avoir des macros à utiliser occasionnellement, ou inclues de manière permanente dans la suite bureautique.

On accède à la boite de dialogue ci-dessous par les menus :
« Outils » ► « Macros » ► « Gérer les macros » ► « LibreOffice Basic », ou, plus simplement, par le raccourci clavier [Alt] + [F11].

Toujours dans l’exemple ci-dessous, on voit que la bibliothèque « Standard » du fichier « rechercherRemplacer.Roubo.ods » (bibliothèque par défaut) ne contient qu’un module (« Module1 ») et que celui-ci possède à son tour deux procédures (macros), respectivement nommées « rechercherRemplacerParLot » et « listeFichiersOuverts ». Cliquez sur le bouton « Éditer » pour accéder au code.

Boite de dialogue de la gestion des macros.

L’API de LibreOffice/OpenOffice est tout à fait spécifique à ce logiciel et n’a rien à voir avec celui de la suite propriétaire. Le strict Basic est, par contre, tout ce qu’il y a de plus classique. En général, j’essaie d’écrire du code qui soit lisible même par des gens qui ni connaissent que peu... Je veux dire que je ne crois pas être économe, tant en commentaires qu’en clarté de la présentation de mes encodages.

_________________________________


Il est, je suppose, acquis que vous ouvrez ce fichier comme pouvant exécuter les macros qu’il contient de façon sécuritaire. On passe pour cela par les menus : « Outils » ► « Options... ».

On clique ensuite sur les choix « LibreOffice » / « Sécurité » dans l’arborescence située à gauche de la boite de dialogue. Cliquer enfin sur le bouton « Sécurité des macros... » et opérer un choix (intuitif) en fonction de vos propres exigences. J’ai, pour ma part, tendance à choisir « Moyen » étant tout à fait entendu que je n’ouvre pas n’importe quoi de n’importe qui.

Les cellules B6 et C6 sont liées en une seule. Il est posé une « Validité » sur cette cellule. Les critères de celle-ci sont une plage de cellules, en l’occurrence la plage « rechercherRemplacerParLot.K2:K108 ». La colonne « K », qui, comme ses voisines, est masquée, contient la Liste des fichiers ouverts.

En sélectionnant la cellule B6, vous devez voir apparaître, sur la droite, une flèche vers le bas naturellement propre à indiquer une liste déroulante. Celle-ci contient toutes les URL des fichiers Writer présentement ouverts. L’endroit rêvé pour stipuler de manière très claire le fichier ciblé, en somme... L’endroit aussi où l’on se rend compte que les cibles peuvent être extrêmemement variées pourvue qu’elle soient ouvertes. Bonne découverte à vous.

Liste déroulante sur cellule B6


Vous aurez bien compris que si j’insiste sur ce type d’utilisation c’est parce que je suis convaincu que tout le monde n’a pas, comme vous et moi, des connaissances de programmation. Cette utilisation d’un tableur comme d’une énorme boite de dialogue, sans passer par l’utilisation, plus compliquée, d’une base de données, résout, il me semble, un grand nombre de problèmes pour des utilisateurs (tout aussi nombreux) qui claqueraient la porte à la vue d’une simple ligne de code...

Il est, de même, tout à fait acquis qu’il est nécessaire de faire une relecture humaine. Mais je suis même convaincu qu’elle doit même être plurielle et dépasser encore les simples deux correcteurs que nous sommes. Toutefois, nos deux efforts conjugués montrent déjà à nos potentiels lecteurs que nous avons une volonté commune d’aller dans un sens profitable à tous. J’aimerais, pour ma part, aller peut-être un tout petit peu au-delà de « quelque chose de très potable »... Mais notez encore que je n’ignore, en rien, le prix humain de ce désir ; il est aussi important que nos lecteurs potentiels sachent bien qu’à aucun moment, je ne ferai l’effort de me retourner pour leur donner une main secourable à une ascension que je sais longue et ardue. Si Rome ne s’est pas faite en un jour, on n’attaque pas, non plus, l’Everest en petite chemise. « Le mieux qu’il est possible » ; vous l’avez vous-même noté : même les Américains nous l’envient !

lol

#9 Version actuelle de ROUBO.ART » Mise à jour et nouveautés » 09/04/2018 00:23

smcj
Réponses : 0

Dans le présent forum, il est évoqué la possibilité de télécharger certains fichiers de programmes ou de fichiers de référence. Or, ceux-ci sont susceptibles d’êtres mis à jour régulièrement. Ce fil n’est donc pas éditable et sert seulement à connaître la date de la dernière mise à jour des divers éléments évoqués sur le forum.

Fichiers :

#10 Re : Version actuelle de ROUBO.ART » OCR de l'Art du Menuisier » 08/04/2018 11:57

Bonjour Jean-René !

Merci pour votre texte de blog ! C’est aussi très gentil !

Avant de vous assommer de mes commentaires, je vais, moi aussi, prendre le temps d’étudier et de lire votre travail, qu’encore une fois, je sais approfondi pour en avoir eu un aperçu déjà très précis et connaître parfaitement de quelles peines il relève. Nos deux approches sont différentes ; cela les rend que plus intéressantes de par l’émulation qui en résulte.

Je vais faire un tutoriel détaillé pour l’usage de ce qui suit mais votre niveau d’informatique est largement suffisant pour pouvoir s’en passer. C’est aussi ce qui me pousse à vous montrer, un peu en avant première, un petit travail, en fait incité par vous...

Voilà, j’ai pris l’OCR d’Internet Archive et je l’ai, simplement, copié-collé dans un fichier Writer. J’ai choisi de ne travailler, à titre d’exemple, que sur les deux premiers Chapitres de la Seconde Partie et les deux premières Sections du troisième Chapitre. J’ai choisi ce texte parce qu’il fait environ cinquante pages, un peu plus avant traitement, un peu moins après. Le fichier en question est disponible ici. Il est exempt de macro.

J’ai repris la macro dont je vous ai parlé ailleurs et l’ai, cette fois, parfaitement adaptée à l’usage du sieur Roubo. Je ne saurai, quand même, que trop vous inciter de faire un essai... Vous devez d’abord ouvrir le fichier Writer qui contient l’OCR d’Internet Archive. Si vous le faites après, alors cliquez sur le bouton « Rafraîchir la liste des fichiers texte (Writer) » pour qu’il apparaisse bien en cellule B6-C6. Une fois le fichier spécifié le fichier dans cette cellule (une liste déroulante est à votre disposition), un petit clic sur le bouton « Action ! » et, selon la rapidité de votre machine (la mienne est antédiluvienne mais fait le travail en moins de trente secondes), vous attendrez quelques instants que la boite de dialogue nommée « Macro exécutée. » vous spécifie que le travail de remplacement est terminé. Vous n’avez rien à faire pendant les plus de quatre cents rechercher-remplacer que fait la macro. Juste regarder.

Le résultat n’est pas extraordinaire au début du texte ; vous me direz ce que vous en pensez pour la suite... Il n’y a, par définition, pas la moindre relecture puisque l’on part d’un texte brut d’OCR. Surtout, j’imagine que ce que j’ai lu, pour l’instant beaucoup trop en diagonale sur votre blog au sujet des « ſur-tout » puisse être résolu, même dans le cas d’une présence en fin de ligne. Ce cas spécifique n’est pas encore inséré dans le fichier Calc. Serez-vous de ceux qui lui apprendront ?

Voilà, c’était une petite avant première pour vous remercier encore de vous intéresser à ce merveilleux texte qu’est celui d’André Jacob Roubo. Je vais vraiment lire votre texte et passer du temps sur vos programmations pour en saisir la finalité. Je commenterai et vous répondrai véritablement après.

À très bientôt,
smile

[editionAddition]
L’OCR fourni par Internet Archive est évidement automatique et, partant, est à l’image de la division des volumes et de leur reliure. Comme il est déjà spécifié dans Wikipedia, les fichiers PDF que les bibliothèques donnent à télécharger sont l’exact reflet de la reliure primitive de l’exemplaire photographié. Pour le cas d’Internet Archive le deuxième volume de cette reliure ne donne de texte intéressant que les deux pages de l’« Avertissement de l’Auteur » (1770) de le Seconde Partie. J’ai trouvé intéressant de remettre en fichier texte l’OCR brut de décoffrage d’Internet Archive divisé en parties et non en volumes. L’accès au répertoire de ces six fichiers est ouvert au public via le protocole HTTP, ce qui ne pose aucun problème au pesé de leur légèreté.
[/editionAddition]

#11 Re : Version actuelle de ROUBO.ART » De l'utilisation du S long (ſ) » 26/03/2018 00:00

Sachant que je pense, comme vous et pour ce sujet précis, sensiblement de la même façon, je vais vous répondre ... complètement à côté de la plaque...

Oui, les expressions régulières sont très élégantes et résolvent souvent des choses de manière très concise avec un effet quasi-magique. Le schéma que vous nous donnez à voir me semble très satisfaisant et doit pouvoir, sans le moindre souci, être appliqué à votre version actuelle. Le problème n’est pas, il me semble dans le retour d’une version du XXIe siècle à l’originale puisque l’orthographe de « L’Art du Menuisier » est tout de même très stable par rapport, par exemple, à des textes publiés juste un siècle plus tôt. La problématique est complexe de par la pauvreté des résultats OCR actuels. Je vais essayer de développer cela dans votre autre fil que vous avez posté ici mais je voudrais, dans celui-ci, développer la partie strictement technique ou, plus exactement, et de mon point de vue, terriblement pragmatique.

Car si parler d’expressions régulières pour résoudre certaines problématiques d’OCR est une chose parfaitement limpide à votre humble serviteur, il reste que j’accorde encore à la très large majorité de nos lecteurs le droit d’être ignorants de ces choses : on peut être amateur de copeaux sans pour autant gosser les octets ... si ce n’est, la réciproque... Ceux qui, comme vous et moi je crois, se vautrent dans cet universalisme, ont hérité de cet ADN des Lumières où un Duhamel du Monceau (entre autres) passait de l’Agriculture à la Marine sans oublier de signer de sa plume l’éloge fort grassouillet de notre Menuisier...

Vous lancez sans doute aussi ce fil, suite à ma réponse à votre présentation sur le présent forum vous titillant le JavaScript pour vous mieux connaître... Et c’est justice parce que, justement, le code proposé à une personne dont j’avais bien idée que les octets ne lui étaient pas étrangers, pouvait s’amuser de mes petits essais et autres plaisanteries du moment, mais qui ne sont, forcément, qu’apéritives. Donc il est acquis qu’il ne me pose, en général, pas de problème d’utiliser les expressions régulières. JavaScript les utilise, mais, bien avant de procéder par un langage de programmation, un logiciel comme LibreOffice en fait clairement usage, avec toute la puissance qu’elles apportent. Mon petit doigt m’a dit que le logiciel libre ne vous provoque pas d’urticaire puisque vous forgez des fontes comme d’autres des tuyaux d’orgues ; ça tombe bien, moi non plus. Figurez-vous que le langage des macros de LibreOffice (car OpenOffice, hein, bon) m’est, aussi, plutôt sympathique. Alors il m’arrive de pondre çà et là des petites crottes, souvent pour aider les gens. À la suite d’une demande faite par un individu dont je n’ai plus la moindre coordonnée, j’avais primitivement pondu celle-là dans un français rigoureux et sur un forum où on pouvait publier sans subir les foudres de la modération à la moindre faute de majuscule oubliée en tête de fil... Mais ce forum francophone est mort (et enterré, je le pleure encore) et j’ai dû me rabattre sur une mauvaise traduction, de mon pauvre cru, en anglais, juste parce que je trouvais que ma crotte sentait plutôt bon. Il vous faut aussi savoir que le but premier était d’anonymiser un texte et de pouvoir retourner, dans la mesure du possible, à l’original en un clic ou presque. En fait, cette broutille s’avère extrêmement puissante à l’usage dans son simple concept et va, sans doute, nous être très utile pour remettre en place les erreurs systématiques de l’OCR, par exemple d’Internet Archive (typiquement « eft » pour « eſt »). Tout réside dans la simple idée d’utiliser un tableur comme d’une énÂÛrme boite de dialogue et à faire discuter les modules distincts d’une suite bureautique (ici Calc et Writer) qui ne demandent que ça.

Nord-Américain vous êtes, vous n’avez pas, comme nous-autres, toutes les peines du monde à prononcer : « il eut fallu que vous ſpokaſſiez ». Mais comme nous ne sommes pas (forcément) entre nous, je vous donne, quand même, ici, la possibilité de télécharger dans la langue de Jean-Baptiste Poquelin le fichier « rechercherRemplacerParLot.ods » et son corrolaire « LesDupontDurand.odt », évidemment destiné à LibreOffice, avec macros (que vous devrez accepter, c’est-codé-par moi,-non-il-n’y-a-pas-de-virus-dedans), le premier étant évidemment un fichier de tableur (Calc) et l’autre de traitement de texte (Writer). Comme j’aime quand même énormément me faire bien comprendre, j’ai traduit jusqu’aux noms de variables d’une version à l’autre. Si vous n’êtes pas à l’aise dans ces choses, préférez la version francophone. Une fois que vous aurez compris toutes les vicissitudes de Monsieur Dupont de Paris et Madame Durand de Lyon, on pourra faire évoluer ce point, par exemple dans le présent fil de forum. Mais commencez d’abord par vous instruire et nous en reparlerons. Surtout, sachez que, dans notre cas, cette petite crotte décuple la puissance des expressions régulières parce qu’elle permet, sans programmation de l’utilisateur (juste de la saisie), de les faire défiler en cascade. À terme, nous allons arriver à un fichier qui aura « appris » toutes les erreurs systématiques d’Internet Archive. Le travail que cela mâche est, selon moi, quand même assez énorme.

Mais en attendant que vous vous instruisiez de mes crottes, permettez-moi de vous ramener à votre demande :

Comme vous aurez noté toutes les méchancetés que je vous dis par ailleurs, prenons comme exemple le fichier « exempleAvantPropos » qui contient aussi une macro, que vous pourrez installer durablement (et hors ce fichiers spécifique donc) dans votre machine si le cœur vous en dit. Je pars évidemment du principe que vous ayez, au moins OpenOffice, même s’il serait plus simple que vous opériez avec LibreOffice. Une fois le texte devant vos yeux appelez la boite de dialogue de « Rechercher & remplacer », soit par le menu « Édition », soit (plus rapide) par le raccourci clavier [ Ctrl ] + [ H ].

  • Dans « Rechercher », posez la lettre « s » en minuscule.

  • Dans « Remplacer », posez la lettre « ſ ».

  • Cochez la case « Respecter la casse ».

  • Cliquer sur le bouton « Tout remplacer ».

Tout cela est très joli, mais, comme vous le dites très bien en substance ailleurs, il n’y a jamais de s long en fin de mot. Donc, on est reparti pour corriger ce détail, et cette fois, ce sont les expressions régulières (dont l’aide est en ligne) qui vont nous le permettre.

  • Appelez la boite de dialogue de « Rechercher & remplacer ».

  • Cliquez sur « Autre option » et validez la case à cocher « Expressions régulières » si ce n’est pas le cas.

  • Dans « Rechercher », posez l’expression « « ſ\b », soit un s long, juste s’il est en fin de mot.

  • Cliquer sur le bouton « Tout remplacer ».

Il reste encore à corriger, sans expressions régulières, la problématique des s longs qui ne précèdent jamais une apostrophe. Et puis les signes doubles précédés d’une espace insécable. Et puis... et puis... Vous ne trouvez pas ça un peu longuet vous ? Allez : fermez le fichier et rouvrez-le, sans oublier d’accepter les macros. Pour ce fichier (et lui seul, juste pour la démonstration, nous verrons plus tard comment faire pour que ce soit général à Writer), vous devriez aller voir au bas du menu « Outils », l’option « Traitement pour A.-J. Roubo. » (étonnant non ?). La chose fait TOUT le travail, de manière procédurale, de choses évidentes et que l’on refait à chaque fois. Le code est le suivant :

' ╔══════════════════════════════════════════════════════════════════════════════╗
' ║ Démonstration pour Roubo (perfectible).                                      ║█
' ╚══════════════════════════════════════════════════════════════════════════════╝█
'  ▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀

Sub monRoubo()
 Dim      monReplace As Object
 Dim RechRemp(1, 10) As String, chaineImpossible As String
 Dim               i As Integer

 chaineImpossible = "ireazfdnqsbfjqsghk"

 ' Marquer tous les ESPACES NORMAUX devant les caractères "!", "?", ":" et ";".
 RechRemp(0,  0) = "(" & chr(32) & ")([!?:;])"          : RechRemp(1,  0) = chaineImpossible & "&"

 ' Marquer tous les ESPACES INSÉCABLES devant les caractères "!", "?", ":" et ";".
 RechRemp(0,  1) = "(" & chr(160) & ")([!?:;])"         : RechRemp(1,  1) = chaineImpossible & "&"

 ' Supprimer tous les ESPACES MARQUÉS devant les caractères "!", "?", ":" et ";".
 RechRemp(0,  2) = chaineImpossible & "."               : RechRemp(1,  2) = ""

 ' RAJOUTER un espace insécable devant les caractères "!", "?", ":" et ";".
 RechRemp(0,  3) = "([!?:;])"                           : RechRemp(1,  3) = chr(160) & "&"

 ' Apostrophe américaine par apostrophe typographique.
 RechRemp(0,  4) = "'"                                  : RechRemp(1,  4) = "’"

 ' Tous les "s" en "s longs".
 RechRemp(0,  5) = "s"                                  : RechRemp(1,  5) = "ſ"

 ' Tous les "s longs" finaux en "s".
 RechRemp(0,  6) = "ſ\b"                                : RechRemp(1,  6) = "s"

 ' Tous les "s longs" précédant une apostrophe en "s".
 RechRemp(0,  7) = "ſ’"                                 : RechRemp(1,  7) = "s’"

 monReplace = thisComponent.createReplaceDescriptor()

 For i = 0 to 7
  monReplace.SearchCaseSensitive     = True
  monReplace.SearchRegularExpression = True
  monReplace.SearchString            = RechRemp(0, i)
  monReplace.ReplaceString           = RechRemp(1, i)

  thisComponent.replaceAll (monReplace ())
 Next i
End Sub

J’ai encore évité les s qui font appel aux parties de Figures, juste parce que cet exemple est une introduction. L’ajout ne poserait évidemment pas de problème puisque ces s sont entourés d’espaces. Je sais bien que ma manière de faire est, par son côté procédural, beaucoup moins « chic » qu’une expression régulière qui a « de la gueule » informatiquement parlant. Mais la correction pour obtenir une transcription digne de ce nom ne se fait qu’une seule fois non ? Pour information (et exemple), toutes les pages de ce site ont été produites avec un simple éditeur de texte (Geany) ET les macros de LibreOffice, allant piocher dans la base tabulaire de Calc. C’était parfois franchement codé avec les pieds mais toujours en sachant que le résultat était (très) propre en HTML, « human-readable », et qu’une porte de sortie devait pouvoir voir rapidement le jour si une ou plusieurs bibliothèques retenues avaient la mauvaise idée de changer son API d’accès direct aux pages qu’elles hébergent. Donc, si les expressions régulières peuvent faire un travail certain, utilisons-les ; mais gardons à l’esprit qu’elles ne sont pas les seules et que nous possédons des outils, souvent beaucoup plus prosaïques, mais qui font le même travail et qui sont, souvent, plus simples à mettre en œuvre et à comprendre par des gens qui n’ont pas le goût de ces choses...

Dans ma transcription, et dans la macro de LibreOffice qui précède, j’ai effectivement normalisé en typographie française tout ce qui regarde les ponctuations. La raison principale est qu’il est quasi impossible d’évaluer la largeur des espaces dont les typographes du XVIIIe se servent avec beaucoup moins de rigueur que ce qu’il est advenu par la suite. Donc pas d’espace avant les signes simples (le point, la virgule) et une espace insécable précédant les quatre signes doubles, soit : le point d’interrogation, le point d’exclamation, les deux points et le point-virgule.

Et la macro qui précède traite assez correctement les espaces insécables qui sont, en fin de traitement, bien présentes avant les signes doubles ; et les apostrophes sont typographiques et on peut en rajouter autant que vous voudrez...

Ou se servir des Dupont-Durand.

C’est « convenable », vous ne trouvez pas ? Allez, je vous laisse respirer un moment pour déglutir ma prose et si votre masochisme n’est pas en peine, alors mon sadisme sera toujours à votre disposition.

Signé : L’horrible satyre pervers.
Duhamel du Monceau.
S.M.C.J. (Ouiiiii !!! Il y est arrivé !!!)
lol  devil  monkey

#12 Re : Version actuelle de ROUBO.ART » OCR de l'Art du Menuisier » 26/03/2018 00:00

Vous n’ignorez certainement pas qu’un fichier e-pub n’est rien d’autre qu’un fichier zip dont on a simplement changé l’extension « .zip » pour « .epub ». Si votre système d’exploitation le permet simplement sans trop râler, faite le renommage inverse et vous pourrez extraire tous les fichiers contenus dans cette archive. Cette extraction faite, vous pourrez jouer les curieux, par exemple aller dans le dossier (répertoire) nommé « OEBPS/Text ». Et vous rendre compte, là, que ce ne sont que de SIMPLES fichiers (x)HTML, tout ce qu’il y a de plus courants. Donc ce n’est rien d’autre qu’un site Web, tel que le présent, avec des liens, des fichiers de style (CSS), soit une version très proche de ce genre de page !

Par courriel, vous me citiez trois avantages de l’e-pub, à savoir :

  • Navigation grâce à la table des matières.

  • Utilisation d'italique comme dans l'ouvrage original

  • Utilisation de petites capitales comme dans l'ouvrage original.

Tout cela est évidement présent en HTML le plus cru.

Maintenant il me semble qu’on est (très) loin de devoir s’occuper de mise en place d’un e-pub, au pesé, non seulement du texte disponible, mais de l’abondance de ses correcteurs.  Comme je suis une personne pleine de vices, perverse et méchante, je vais, forcément, illustrer mon propos. Il ne s’agit que de votre transcription des trois pages de l’« Avant-propos », parce que je n’ai pas pris le temps de relire le reste. Ce fichier PDF est d’une méchanceté crasse ; le genre qui vous mettra le moral à zéro. Vous allez détester la couleur orange, à fortiori parce que, de votre version passée de manière privative, je n’ai volontairement corrigé aucun s long, uniquement quelques espaces insécables (typiquement Louis_XIII), aucune apostrophe (vous utilisez la très laide apostrophe dactylographique, petite crotte américaine, alors que la typographique, toute en rondeur, est juste ... aussi élégante que l’époque de notre auteur) et d’autres bricoles... Tout cela fait que ce texte n’est, à mes yeux, aussi déjà fortement avancé dans son traitement qu’encore loin d’être prêt pour être fixé dans le marbre (toutefois toujours corrigeable) HTML.

Vous me lisez toujours ? Vous n’avez pas défoncé votre écran, de rage, au pointage de mes sodomies de diptères ? Beatus Vir ! D’abord sachez que je ne prends JAMAIS le temps d’expliquer à quelqu’un ses erreurs si je ne suis pas, aussi, en mesure d’apprécier son travail par ailleurs. Il vous faut savoir que tout cela est PARFAITEMENT NORMAL pour un texte dont la relecture n’a eu lieu que par UNE personne et, sans doute, pas assez de fois. Rassurez vous aussi sur le fait que je suis quasiment sûr qu’il y a moins de fautes de retranscription au fur et à mesure de l’avancement de vos chapitres même si je n’ai pas pris le temps de vérifier ce point précis. Le regard s’aiguise et se forme ; comme le reste, c’est normal.

Ainsi, je crois pour ma part, que bien avant de produire un e-pub, il faut que le texte soit considéré irréprochable et, pour cela, être modifiable facilement, par exemple dans un traitement de texte. Vous aurez compris que je suis particulièrement à l’aise, depuis des années maintenant, dans le langage des macros de LibreOffice/OpenOffice. Mon niveau est suffisant pour nager dans des eaux comme le  D.O.M., même utilisé par le simple Basic de la suite bureautique. C’est au-delà de ce que peut nous offrir la suite propriétaire (celle de « vous savez qui »).

Vous semblez très attaché à faire en sorte de rendre ce travail collaboratif. Vous aurez compris, je l’espère, que je suis, sinon dans vos pas, sans doute vous précédant dans ce chemin qui reste ardu. Mais je suis, aussi, très instruit d’expérience de la niche dans laquelle nous nous trouvons. Les éditeurs collaboratifs existent ; je ne citerai qu’Etherpad mais nous pouvons en trouver d’autres. J’aime assez et quand même, maîtriser ma petite chaîne éditoriale... Je veux dire que si on prend par exemple Framapad (qui est un Etherpad light), il faut quand même noter qu’il est dans les choux depuis un certain temps... roubo.art est hébergé chez Ouvaton ; actuellement, c’est très difficile de mettre ça en place sur un hébergement mutualisé. Donc j’y pense (à cela précisément ou une solution du même genre), mais je n’ai sérieusement pas assez d’arguments pour me convaincre qu’il y ait, ici, urgence.

Je me dois maintenant de répondre ENFIN à vos questions...

  1. Le plus simple est, pour le moment, de produire des fichiers Writer (.odt), soit dans le format ODF. Vous notez que la mise en page est, dans une page Web comme dans un e-pub, totalement dynamique (au contraire d’un PDF). Un exemple peut se faire jour si vous affichez cette page et que vous réduisez votre fenêtre de navigateur Web en largeur. Jusqu’à un certain point, vous n’aurez pas besoin de vous servir de l’« ascenseur horizontal » puisque c’est la mise en page même des deux colonnes qui s’adaptera systématiquement à la largeur de votre fenêtre. Il n’est donc pas nécessaire, pour le moment, de s’attacher trop à la mise en page, excepté, peut être, les centrés (mais ils ne sont en usage que dans les titres). C’est bien entendu tout le contraire pour ce qui regarde les enrichissements (gras, italique souligné). Roubo ne connaît quasiment que l’italique et, parfois, certaines mises en exposant. Tout cela me semble secondaire, dans l’état actuel des choses étant quand même donné que le travail le plus difficile relève de la relecture et d’une méthodologie extrêmement rigoureuse entre les personnes, de façon à ce qu’une opération ne soit pas faite deux fois pour rien.
     

  2. Je  connais mal ces éditeurs mainstream dont je me méfie comme de La Peste. J’entends bien que si nous étions ne serait-ce que trois ou quatre dans cette aventure, l’évolution sur ce type de plateforme puisse s’imposer. Mais nous n’y sommes évidement pas et ma todo-list-à-moi, c’est de nettoyer les Planches de L’Art du Menuisier dans l’année qui vient, sans doute en débordant un peu sur la suivante. Le présent forum est là pour afficher les questions qui se posent à nous de façon à montrer au public nos interrogations et nos difficultés. Il nous faut, il me semble, être plus que seulement deux personnes pour envisager cette évolution-là. Cela me fait vous répéter ici ce que je vous ai déjà écrit en privé : Rome ne s’est pas faite en un jour... Donc s’il advenait, dans l’année, qu’un autre relecteur se mette dans la compagnie alors on penserait évidement à une méthodologie communautaire. Mais pour l’instant, je m’occupe des Planches... Par contre, prenez bien conscience que votre travail, dans l’état actuel et pour m’y être penché dessus un peu au-delà du simple « Avant-propos » reste, tout de même, ce qui se fait de mieux actuellement. Nous pouvons le mettre en ligne sur le présent site dans son état actuel sous forme de fichiers Writer, téléchargeables directement, voire sous GitHub si vous le préférez. J’aurai, pour ma part, évidemment tendance à largement préférer Wikisource qui possède, aussi, un système d’archivage. Mais je n’y suis pas et les journées n’ont que 24 heures !
     

  3. Au pesé des spécificités des textes du XVIIIe siècle, je ne crois pas qu’un correcteur orthographique puisse vous être vraiment utile ; je pense même qu’il induit en erreur. Nous avons vu ailleurs qu’il est effectivement assez simple de revenir aux s longs et que ce n’est finalement qu’une simple manipulation technique. J’utilise pour ma part l’excellente extension Grammalecte sans jamais m’être préoccupé de l’adapter au Français de l’Ancien Régime. C’est peut-être possible, mais cette extension est principalement codée en Python, qui m’est (malheureusement) encore trop une « terra incognita » pour que je prenne le temps d’aller m’y perdre...

Merci beaucoup à vous de m’avoir fait découvrir « Tesseract » dont j’ignorais jusqu’à l’existence et de nous témoigner de l’existence de l’option de langage frm et de son efficience par vous constatée. C’est toujours autant de temps gagné pour ceux qui iront dans votre sens et le fait que ce soit écrit en ce lieu, fait, forcément, avancer les choses.

Dans tous les cas, le maître-mot qu’il est capital de retenir c’est cette morale de La Fontaine : « Patience et longueur de temps font plus que force ni que rage »...

#13 Re : Version actuelle de ROUBO.ART » Comment mousser la visibilité de ce site? » 26/03/2018 00:00

jrbastien a écrit :

Il n'y a peu de membres pour l'instant et je crois que ça provient du fait qu'on ne retrouve pas ce site sur les engins de recherche (en particulier le diabolique Google).

Il viendra un temps ou le monstre Glouglou s’énervera. Je suis moins pressé de cela que de prendre garde à la page de Wikipédia sur laquelle j’ai posé, sobrement je crois, une notification de ce projet, largement profitable aux gens qui savent plus lire que cliquer convulsivement... Si je vous disais qu’en mettant en place ces pages, il m’est arrivé de trouver des versions de notre menuisier vendues avec un OCR gravé sur DVD et que, ayant eu accès à un exemplaire d’icelui par l’intermédiaire de la Providence (l’Esprit souffle où il veut, c’est bien connu), ma déglutition en fut quelque peu perturbée, alors sans doute Jean-René vous seriez susceptible de comprendre mon absence d’empressement à rameuter ici la planète des cliqueurs. En d’autres termes un tant soit peu plus crus : imaginer devoir répondre poliment sur le présent forum à des gens qui, à votre différence, ne tendent pas vers le haut, m’emmerde ; outrageusement.

jrbastien a écrit :

Mes quelques cours d'HTML m'ont permis de savoir qu'il est important que d'autres site y réfère donc je vais écrire un petit article sur mon blog.

C’est aussi extrêmement gentil à vous que cela fait effectivement partie des choses constatée comme les plus efficaces. J’en ai eu, depuis très longtemps l’expérience avec L’Hydraule qui est archi répertoriée et connue dans la niche qui est la mienne. Il est aussi exact que ma balise META du HTML ne comporte, pour le moment, que les mots clés « roubo », « menuiserie » et « ébénisterie », c’est vous dire que je n’ai pas poussé le bouchon très loin... Et je ne me suis même pas préoccupé de ce fait sur les pages spécifiques du forum. Il faut quand même vous rendre compte que si l’on compte le nombre de liens mis en place, en douze pages HTML (six parties réelles, car la troisième se distribue en trois sections, tout cela multiplié par deux, car il y a des tables des matières et des tables de Planches), on est quand même à 8592 balises <a>, gérées quasiment toutes « à la main ». Cela demande d’évacuer un peu le superflu pour se concentrer sur l’essentiel...

jrbastien a écrit :

D'autres suggestions?

Oui Jean-René : il nous faut, je crois ici comme ailleurs, faire preuve de patience et de continuité. Lire vos propres lignes, c’est savoir, déjà, que l’on aura sans doute à vous rappeler de vous inscrire dans le temps. Le Web m’apprend que vous n’avez pas encore 99 ans et demi. Et comme je sais aussi (un peu) calculer, il vous reste donc plus que votre âge actuel pour participer à ce travail ; c’est chouette non ? Ces pages ont a peine trois mois et le sujet qu’elles traitent et auxquelles elles font référence est tout sauf porteur, à fortiori et sans doute aussi, parce que je refuse que ce lieu ne soit pas, tout de même, un tant soit peu « léché ». Il n’y a qu’aux Québécois (pour l’instant...) que cela ne fasse pas peur ! Je ne saurai jamais que trop vous inciter à continuer à produire au mieux de ce que vous pouvez, même si vous savez bien que votre travail n’est pas parfait : il reste, quand même actuellement, celui qui est le plus accompli et, par là, le plus référentiel. Il viendra, forcément, un jour où cela se saura et, ce jour-là, j’aimerais que cela se fasse sous un signe de qualité ; pas de production. C’est là, pour moi, l’exact corollaire de ma modernité en répond au très grand respect que je porte autant à ce texte qu’à la mémoire de son auteur.

#14 Re : Présentation des nouveaux membres. » Bonjour du Québec » 19/03/2018 23:34

 

          Cher Jean-René,

 

          Depuis que ces pages sont en ligne (un peu plus de deux mois), vous êtes le premier ! Vous n’imaginez pas, je crois, comme c’est gratifiant pour moi... Et savoir que c’est de du côté de « La Belle Province » que me vient cette première attention, c’est juste m’offrir ce supplément de sens et d’altérité, tant désiré, comme si l’intérêt à ce texte et ces publications nous était ravivé par ceux qui, de l’autre côté de l’Atlantique et dans des langues qui ont même et avec brio quitté la nôtre commune nous soulignent la beauté de nos trésors nationaux, « qu’on ne regarde plus, et auxquels on a substitué d’élégantes superfluités, qui n’ont d’autres mérites que celui d’une mode passagère, qui est bientôt effacée par une autre, qui elle-même n’existe pas plus longtemps que le caprice de ceux qui l’ont inventée ».

          Et passant par le forum au lieu de m’écrire en privé, vous participez, aussi, à la création d’une possible émulation. Là est encore une chose pour laquelle je ne saurai que trop vous remercier ! Il n’est, enfin, pas une once de votre travail qui ne puisse être utile à la communauté ! Car si le présent site est effectivement mis en place pour, comme vous le dites, « faciliter la recherche », il reste que TOUT OCR est bon à prendre ! Les versions graphiques permettent des choses, mais certainement pas la recherche sémantique de texte à la manière d’une concordance biblique. Et le fait de pouvoir jongler entre des versions de référence (les photographies) et des versions textuelles est un plus qu’aucun siècle avant le nôtre n’a jamais pu profiter de l’efficacité !

          Par exemple, il y a un peu plus de quatre ans, un blogueur américain a fait une traduction d’un passage du texte à propos du tour. Avec un scrupule qui l’honore, il a ajouté la version française. Aussi petit que soit ce passage au pesé de la totalité, c’est toujours beaucoup mieux de repartir d’une version de ce type que de la version automatique, même relativement correcte, d’Internet Archive ! Donc oui, oui, oui, archi-OUI, tout OCR déjà relu une ou plusieurs fois, même sans s long, m’intéresse ; éminemment, beaucoup, sehr viel, so much ! Qu’importe le format ; j’en ferai notre ivresse ; et croyez-moi, elle sera partagée !

          Même si cela vient de sortir, ça n’a rien de nouveau : si l’on prend la Table des Matières de la Première Partie (c’est valable partout), on se rend compte que chaque lien comporte un menu. Mais aucun lien-même de la table ne débouche sur quoi que ce soit et c’est bien normal, pour l’instant je suis j’étais SEUL. C’est évidement fait pour montrer l’exemple, il y a toutefois UNE exception... Remontez la page pour aller en haut et regardez le lien fait sur « EXTRAIT DES REGISTRES de l’Académie Royale des Sciences du 17 décembre 1768. » Ne cliquez PAS sur un des choix du menu qui apparaît ; cliquez SUR LE LIEN LUI-MÊME. Et appréciez, peut-être, une vraie reconnaissance de caractères.

          Je vous montre cet exemple pour bien vous faire comprendre (à vous et à ceux qui nous lisent) qu’il est bien évident qu’un OCR digne de ce nom fait vraiment partie de ce projet. Dans la mesure du possible, je me suis arrangé à ce que des liens prévus, ne débouchent pas sur l’exaspérante 404 (Oooops ! j’ai cliqué de travers ! Ostie !!!)... Ce n’est pas le cas dans les tables de Planches (sauf la première, en cours de programmation) mais c’est pour une raison strictement technique et d’essai.

          Maintenant, vous pourrez évidemment me dire que les s longs gênent votre lecture d’individu normalement constitué vivant au XXIe siècle. Avec difficulté (je suis un peu brise gosses comme on ne dit certainement pas dans vos contrées), je serais évidemment obligé de vous donner raison... Alors je vous montre autre chose... Elle n’est encore à l’état actuel que sous forme de prototype (votre serviteur doit comprendre comment JavaScript gère les cookies, ce qu’il s’est toujours refusé à faire pour des raisons éthiques), mais voici l’expérience :

          Soit la page en question rapatriée normalement ; jusqu’ici, rien de notable si ce n’est que les s longs ont été, le plus scrupuleusement qu’il m’est possible, respectés et dont vous pouvez, visuellement, noter quelques emplacements. Les ligatures typographiques que vous citez (« ſſ », « ſt ») sont gérées automatiquement par la police de caractère choisie (en l’occurrence, Linux Libertine, et, si je puis me permettre, il n’y a JAMAIS de ligature entre un s long et une majuscule). Notez encore (et surtout) l’adresse URL dans votre navigateur Web.

          Soit maintenant, la même page, mais avec une mention « ?slong=1 » rajoutée en fin d’URL. Comme par magie, ils ont été supprimés ; en d’autres termes, ce travail-là s’exprime, en JavaScript, en trois lignes de code :

   var maChaine =  document.getElementsByTagName("body")[0].innerHTML
   var remplace = /ſ/gi;
   document.getElementsByTagName("body")[0].innerHTML = maChaine.replace(remplace, "s");

L’inverse, c’est-à-dire passer des s longs à partir d’une version uniquement dotée de s courts est nettement plus compliqué à exprimer informatiquement parlant, tout simplement parce qu’il faudrait programmer les règles en usage au XVIIIe siècle. Le systématisme va dans un sens ; pas dans l’autre. Nous ne résoudrions pas, non plus, le cas laborieux des quelques erreurs d’origine que le texte princeps possède peut-être aussi. C’est donc, entre autres, la raison pour laquelle, je crois nécessaire de faire un OCR pur, sachant que le caractère des s longs est maintenant parfaitement répertorié en UTF8, et que certaines polices de caractères en figurent la graphie de façon très rigoureusement identique à celle usitée au XVIIIe siècle, soit un s très long graphiquement en italique et un s court effectivement en forme de « f », sauf que la barre horizontale du caractère n’est PAS traversante et n’est présente que sur la moitié gauche du glyphe.

          Cette simple petite expérience possède un mérite : celui de démontrer que les textes réellement numériques, au contraire des photographies, sont extraordinairement malléables pour peu que l’on se donne autant la peine de comprendre le fondement de leur nature que celle de se les approprier. Pour moi, ce jeu-là est similaire à un arbre qui puise son essence au tréfonds du sol, ici le passé, pour s’élever vers un ciel plus élevé, par un acte typiquement contemporain. Cela va bien au-delà que cette antienne, mille fois rabâchée entre les XIXe et XXe siècles, de la simple notion de « Progrès » ; par l’industrie, on a vu quelles impasses il est capable de produire : affinons-en donc le concept par la conscience de ses limites, nous irons bien plus haut.

          Je ne suis, actuellement, pas du tout à la relecture d’une version numérique mais bien dans le nettoyage graphique des Planches, généralement en provenance de la Bibliothèque Nationale Suisse (E-rara) qui, selon moi, reste quand même la plus qualitative des trois retenues. Pour ce seul travail, j’en ai objectivement pour plus d’un an, aussi parce que je crois qu’il est bon que ce soit la même personne qui fasse ce travail-là, pour obtenir un rendu graphique le plus homogène possible (ou alors il faut être très clair sur la méthodologie employée pour qu’elle ne soit pas signée d’une personne plutôt que d’une autre). Nous sommes d’accord que le but est de partir de ça et d’arriver à ça ... dans le plus simple des cas. Mais le traitement d’une Planche peut me prendre plusieurs jours, ou par le fait de sa taille, ou par la cause de sa complexité-même. Et, vous allez rire, mais mes journées font exactement le même temps que celles de Dédé-Jaja et, comme lui, je ne fais pas que cela dans la Vie.

          Tout cela implique que votre travail ne sera pas forcément inclus illico dans les pages du présent site, aussi parce que je sais impératif qu’il y ait, par contre, plusieurs relecteurs d’une version numérique textuelle. C’est épouvantablement long et laborieux et, si je fais cette affirmation, c’est parce que l’expérience de la chose ne date pas, chez moi, exactement d’hier : elle a, pour mon propre métier, commencé en 1998. J’ai, depuis, fait une très longue pause dans ce domaine, sans pour autant oublier de garder un œil sur son évolution, tant technique qu’humaine. Les machines font plus qu’elles ne faisaient ; on est pour autant bien loin d’une automatisation complète, à fortiori dans le cadre de traités faisant sans cesse la navette entre le corpus textuel d’une part et l’iconographie de l’autre. Mais mes essais d’il y a vingt ans n’ont pas pris de rides majeures ; ils restent, selon moi, parfaitement d’actualité même si certains points pourraient être corrigés et, surtout, le travail achevé. Toute la mise en place des présentes pages se fait avec la conscience aiguë que le Web est périssable s’il n’est pas cultivé. Le Weboculteur est un Être Humain ; d’abord. Aucune technologie ne saura remplacer ce fondement ; sans la conscience-réflexe de cette limite, la machine tourne à vide, et c’est très ennuyeux.

          Comme tout-un-chacun, je ne suis pas plus éternel qu’accompli ; mais que ce chaînon-là ait pu être en partie le mien n’est pas exactement pour me déplaire dans la mesure entendue ou il me dépassera, forcément. En donnant votre travail déjà fait, voire en le poursuivant, vous entrez dans une de ces rondes dont la fondation Wikipedia (et ses corollaires) n’est pas la moindre. Sans pour autant que ce soit forcément au goût de sang et de larmes, mon expérience, que je crois forte, vous rappellera toujours à quel point il est nécessaire de ne pas oublier, non plus, qu’on peut trouver plus gratifiant, au moins dans l’immédiat, sauf si, peut-être, vous joignez à chacun de vos actes du genre cette sorte de foi dont je vous laisserai, toujours, la priorité de votre propre définition...

          Donc dans tous les cas, votre travail, vos critiques ou vos jugements sont évidemment les plus bienvenus qu’il se puisse mais aussi les plus désirés. Ce forum peut évoluer comme rester ce qu’il est ; mais je ne le ferai pas vivre seul puisqu’aussi bien la forme blog convient parfaitement à l’expression strictement personnelle et que ce n’est pas celle que j’entends, ici et comme vous, partager.

 

          Merci à vous Jean-René, dans tous les cas.
           smile
          Sébastien.

 

#15 Présentation des nouveaux membres. » Un nouveau site, un nouveau forum, un nouveau blog. » 15/02/2018 01:51

smcj
Réponses : 0

J’aurais bien envie de me présenter ici, mais j’ai, aussi, peut-être autre choses à faire... Et puis envie d’écrire, aussi, de manière plus approfondie que sur un forum (où l’on attend l’échange et une certaine réciprocité), dans doute de manière plus régulière même si je suis loin d’être assuré de tenir dans la durée. L’âge aidant, viennent toutefois et parfois les apaisements... Et puis je n’ai jamais essayé ce type de publications, même si le Web et toutes les techniques qui vont avec, sont loin de m’être étrangères pour les pratiquer depuis 1998.

Donc un forum est un forum ; un blog est un blog. Ici, nous sommes potentiellement plusieurs sur ce forum (non, non, on ne rit pas). Mais là, je suis plus à l’aise pour parler juste en mon nom, sans plus de considérations de point de vue extérieurs, pouvant dire (et assumer), toutes les bêtises qui me passent par la tête.

Et ça fera office de présentation.

Rien de bien sérieux, en somme.
angel

----------------------------------------------------
                         _
                        | | _
        Sébastien       | || | _
        Matthieu        | || || | _
        Cosson          | || || || | _
        Jacquet         | || || || || | _
                        | || || || || || | _
                        | || || || || || || |
                        | || || || || || || |
        ,-~~-.___.      | || || || || || || |___
       /  | .     \     |_||_||_||_||_||_||_|  /|
      (   )        O    |_||_||_||_||_||_||_| / |
       \_/-. ,----'    / V  V  V  V  V  V  V /  |
           ====      _/____________________ /  /
          /  \-'~;  /|  The Organbuilder   |  /
         /  __/~|  /_|   and his organ     | /
      o=(_______|  |_|_____________________|/

 ----------------------------------------------------
    Site web : http://www.hydraule.org/
      E-mail : smcj@hydraule.org
 ----------------------------------------------------

#16 Version actuelle de ROUBO.ART » Téléchargement et rapatriement des données. » 18/01/2018 07:08

smcj
Réponses : 0

Tant les pages HTML de référencement des Planches que celles de la traduction numérique des tables des matières sont conçues pour être rapatriées sur n’importe quel ordinateur personnel et pouvoir, ainsi, être utilisées sans connexion Internet. Ces pages ne sont pas dynamiques, c’est-à-dire crées à la volée, à partir d’une base de données tabulaire. Il est donc très aisé de les utiliser en local. Il est parfaitement acquis que cet avantage n’est pour le moment que minime puisqu’il n’y a quasiment aucune données textuelles (OCR) disponibles et que tout ou presque se réfère à des données mises en ligne. Mais le but de l’opération est quand même d’arriver à ce point de pouvoir utiliser Roubo sans connexion, avec la possibilité de posséder soi-même et sur son propre ordinateur, tant les fichiers de Planches mis en ligne sur Wikimedia Commons que le texte à venir sur Wikisource.

Il n’est pas impossible, non plus, d’imaginer faire rapatrier les fichiers PDF qu’offrent les trois bibliothèques de référence retenues pour permettre à ce qu’une page statique pointe dessus. Les navigateurs Web traitent maintenant assez correctement nativement les fichiers PDF, c’est donc l’affaire de quelques lignes de code à concevoir pour arriver sur les bonnes pages ciblées. Et cela ne demande pas un niveau informatique démesuré.

À discuter entre intéressés, par exemple sur le présent forum.
glasses

#17 Discussions d'établi ; travail manuel. » Présentation et bienvenue. » 17/01/2018 23:14

smcj
Réponses : 0

Bonjour à tous et bienvenue.

Point n’est besoin de faire ici un long discours sur la réalité de ce forum Web qui n’est, pour l’instant, mis en place qu’à titre d’essai. S’il a un peu de succès, nous l’affinerons. S’il se contente de parler des ouvrages en contreplaqué débités à la scie sauteuse « blanche et droite », on s’économisera, alors, d’en poursuivre la charge. J’ai, du reste, fait une présentation assez circonstanciée sur roubo.art pour ne pas avoir à m’étendre plus ici-même.

Plein de choses à tous !
cool
S.M.C.J.

#18 André Jacob Roubo, sa vie, son œuvre. » Présentation et bienvenue. » 17/01/2018 23:13

smcj
Réponses : 0

Bonjour à tous et bienvenue.

Point n’est besoin de faire ici un long discours sur la réalité de ce forum Web qui n’est, pour l’instant, mis en place qu’à titre d’essai. S’il a un peu de succès, nous l’affinerons. S’il se contente de parler des ouvrages en contreplaqué débités à la scie sauteuse « blanche et droite », on s’économisera, alors, d’en poursuivre la charge. J’ai, du reste, fait une présentation assez circonstanciée sur roubo.art pour ne pas avoir à m’étendre plus ici-même.

Plein de choses à tous !
cool
S.M.C.J.

#19 Version actuelle de ROUBO.ART » Présentation et bienvenue. » 17/01/2018 23:11

smcj
Réponses : 0

Bonjour à tous et bienvenue.

Point n’est besoin de faire ici un long discours sur la réalité de ce forum Web qui n’est, pour l’instant, mis en place qu’à titre d’essai. S’il a un peu de succès, nous l’affinerons. S’il se contente de parler des ouvrages en contreplaqué débités à la scie sauteuse « blanche et droite », on s’économisera, alors, d’en poursuivre la charge. J’ai, du reste, fait une présentation assez circonstanciée sur roubo.art pour ne pas avoir à m’étendre plus ici-même.

Plein de choses à tous !
cool
S.M.C.J.

#20 L'art du trait, chez Roubo » Présentation et bienvenue. » 17/01/2018 21:06

smcj
Réponses : 0

Bonjour à tous et bienvenue.

Point n’est besoin de faire ici un long discours sur la réalité de ce forum Web qui n’est, pour l’instant, mis en place qu’à titre d’essai. S’il a un peu de succès, nous l’affinerons. S’il se contente de parler des ouvrages en contreplaqué débités à la scie sauteuse « blanche et droite », on s’économisera, alors, d’en poursuivre la charge. J’ai, du reste, fait une présentation assez circonstanciée sur roubo.art pour ne pas avoir à m’étendre plus ici-même.

Plein de choses à tous !
cool
S.M.C.J.

Pied de page des forums

Propulsé par FluxBB