André-Jacob ROUBO - Le Forum

Le mieux qu'il est possible.

Vous n'êtes pas identifié(e).

#1 19/03/2018 17:35

jrbastien
Membre
Inscription : 19/03/2018
Messages : 18

Bonjour du Québec

Bonjour,

Merci pour ce fantastique projet!  Menuisier amateur et passionné d'histoire, je m'intéresse depuis peu à l'ouvrage de Roubo.  À l'heure des outils modernes électriques et de la trop peu nombreuse documentation francophone existant sur la menuiserie traditionnelle en ligne, la préservation de l'ouvrage de Roubo est essentielle.

J'avais d'ailleurs entrepris de produire une version électronique corrigée de Roubo car il est difficile de chercher sur Internet étant donné que la reconnoissance (une trop grande influence de Roubo ici  smile ) de caractères donne plusieurs formes aux "S" longs telles que "lT", "ff", "ft", etc.

Bref, j'en étais au chapitre 5 (formaté au format epub) de la première partie (version Internet Archive) lorsque je me suis aperçu que ce site merveilleux existe.  Je ne sais si j'aurai la détermination de compléter puisque votre site facilite beaucoup la recherche et la lecture de l'ouvrage. Si jamais ce texte vous intéresse, laissez-le moi savoir. 

Jean-René

Hors ligne

#2 19/03/2018 23:34

smcj
Administrator
Lieu : Celle - Plateau de Millevaches
Inscription : 16/01/2018
Messages : 21
Site Web

Re : Bonjour du Québec

 

          Cher Jean-René,

 

          Depuis que ces pages sont en ligne (un peu plus de deux mois), vous êtes le premier ! Vous n’imaginez pas, je crois, comme c’est gratifiant pour moi... Et savoir que c’est de du côté de « La Belle Province » que me vient cette première attention, c’est juste m’offrir ce supplément de sens et d’altérité, tant désiré, comme si l’intérêt à ce texte et ces publications nous était ravivé par ceux qui, de l’autre côté de l’Atlantique et dans des langues qui ont même et avec brio quitté la nôtre commune nous soulignent la beauté de nos trésors nationaux, « qu’on ne regarde plus, et auxquels on a substitué d’élégantes superfluités, qui n’ont d’autres mérites que celui d’une mode passagère, qui est bientôt effacée par une autre, qui elle-même n’existe pas plus longtemps que le caprice de ceux qui l’ont inventée ».

          Et passant par le forum au lieu de m’écrire en privé, vous participez, aussi, à la création d’une possible émulation. Là est encore une chose pour laquelle je ne saurai que trop vous remercier ! Il n’est, enfin, pas une once de votre travail qui ne puisse être utile à la communauté ! Car si le présent site est effectivement mis en place pour, comme vous le dites, « faciliter la recherche », il reste que TOUT OCR est bon à prendre ! Les versions graphiques permettent des choses, mais certainement pas la recherche sémantique de texte à la manière d’une concordance biblique. Et le fait de pouvoir jongler entre des versions de référence (les photographies) et des versions textuelles est un plus qu’aucun siècle avant le nôtre n’a jamais pu profiter de l’efficacité !

          Par exemple, il y a un peu plus de quatre ans, un blogueur américain a fait une traduction d’un passage du texte à propos du tour. Avec un scrupule qui l’honore, il a ajouté la version française. Aussi petit que soit ce passage au pesé de la totalité, c’est toujours beaucoup mieux de repartir d’une version de ce type que de la version automatique, même relativement correcte, d’Internet Archive ! Donc oui, oui, oui, archi-OUI, tout OCR déjà relu une ou plusieurs fois, même sans s long, m’intéresse ; éminemment, beaucoup, sehr viel, so much ! Qu’importe le format ; j’en ferai notre ivresse ; et croyez-moi, elle sera partagée !

          Même si cela vient de sortir, ça n’a rien de nouveau : si l’on prend la Table des Matières de la Première Partie (c’est valable partout), on se rend compte que chaque lien comporte un menu. Mais aucun lien-même de la table ne débouche sur quoi que ce soit et c’est bien normal, pour l’instant je suis j’étais SEUL. C’est évidement fait pour montrer l’exemple, il y a toutefois UNE exception... Remontez la page pour aller en haut et regardez le lien fait sur « EXTRAIT DES REGISTRES de l’Académie Royale des Sciences du 17 décembre 1768. » Ne cliquez PAS sur un des choix du menu qui apparaît ; cliquez SUR LE LIEN LUI-MÊME. Et appréciez, peut-être, une vraie reconnaissance de caractères.

          Je vous montre cet exemple pour bien vous faire comprendre (à vous et à ceux qui nous lisent) qu’il est bien évident qu’un OCR digne de ce nom fait vraiment partie de ce projet. Dans la mesure du possible, je me suis arrangé à ce que des liens prévus, ne débouchent pas sur l’exaspérante 404 (Oooops ! j’ai cliqué de travers ! Ostie !!!)... Ce n’est pas le cas dans les tables de Planches (sauf la première, en cours de programmation) mais c’est pour une raison strictement technique et d’essai.

          Maintenant, vous pourrez évidemment me dire que les s longs gênent votre lecture d’individu normalement constitué vivant au XXIe siècle. Avec difficulté (je suis un peu brise gosses comme on ne dit certainement pas dans vos contrées), je serais évidemment obligé de vous donner raison... Alors je vous montre autre chose... Elle n’est encore à l’état actuel que sous forme de prototype (votre serviteur doit comprendre comment JavaScript gère les cookies, ce qu’il s’est toujours refusé à faire pour des raisons éthiques), mais voici l’expérience :

          Soit la page en question rapatriée normalement ; jusqu’ici, rien de notable si ce n’est que les s longs ont été, le plus scrupuleusement qu’il m’est possible, respectés et dont vous pouvez, visuellement, noter quelques emplacements. Les ligatures typographiques que vous citez (« ſſ », « ſt ») sont gérées automatiquement par la police de caractère choisie (en l’occurrence, Linux Libertine, et, si je puis me permettre, il n’y a JAMAIS de ligature entre un s long et une majuscule). Notez encore (et surtout) l’adresse URL dans votre navigateur Web.

          Soit maintenant, la même page, mais avec une mention « ?slong=1 » rajoutée en fin d’URL. Comme par magie, ils ont été supprimés ; en d’autres termes, ce travail-là s’exprime, en JavaScript, en trois lignes de code :

   var maChaine =  document.getElementsByTagName("body")[0].innerHTML
   var remplace = /ſ/gi;
   document.getElementsByTagName("body")[0].innerHTML = maChaine.replace(remplace, "s");

L’inverse, c’est-à-dire passer des s longs à partir d’une version uniquement dotée de s courts est nettement plus compliqué à exprimer informatiquement parlant, tout simplement parce qu’il faudrait programmer les règles en usage au XVIIIe siècle. Le systématisme va dans un sens ; pas dans l’autre. Nous ne résoudrions pas, non plus, le cas laborieux des quelques erreurs d’origine que le texte princeps possède peut-être aussi. C’est donc, entre autres, la raison pour laquelle, je crois nécessaire de faire un OCR pur, sachant que le caractère des s longs est maintenant parfaitement répertorié en UTF8, et que certaines polices de caractères en figurent la graphie de façon très rigoureusement identique à celle usitée au XVIIIe siècle, soit un s très long graphiquement en italique et un s court effectivement en forme de « f », sauf que la barre horizontale du caractère n’est PAS traversante et n’est présente que sur la moitié gauche du glyphe.

          Cette simple petite expérience possède un mérite : celui de démontrer que les textes réellement numériques, au contraire des photographies, sont extraordinairement malléables pour peu que l’on se donne autant la peine de comprendre le fondement de leur nature que celle de se les approprier. Pour moi, ce jeu-là est similaire à un arbre qui puise son essence au tréfonds du sol, ici le passé, pour s’élever vers un ciel plus élevé, par un acte typiquement contemporain. Cela va bien au-delà que cette antienne, mille fois rabâchée entre les XIXe et XXe siècles, de la simple notion de « Progrès » ; par l’industrie, on a vu quelles impasses il est capable de produire : affinons-en donc le concept par la conscience de ses limites, nous irons bien plus haut.

          Je ne suis, actuellement, pas du tout à la relecture d’une version numérique mais bien dans le nettoyage graphique des Planches, généralement en provenance de la Bibliothèque Nationale Suisse (E-rara) qui, selon moi, reste quand même la plus qualitative des trois retenues. Pour ce seul travail, j’en ai objectivement pour plus d’un an, aussi parce que je crois qu’il est bon que ce soit la même personne qui fasse ce travail-là, pour obtenir un rendu graphique le plus homogène possible (ou alors il faut être très clair sur la méthodologie employée pour qu’elle ne soit pas signée d’une personne plutôt que d’une autre). Nous sommes d’accord que le but est de partir de ça et d’arriver à ça ... dans le plus simple des cas. Mais le traitement d’une Planche peut me prendre plusieurs jours, ou par le fait de sa taille, ou par la cause de sa complexité-même. Et, vous allez rire, mais mes journées font exactement le même temps que celles de Dédé-Jaja et, comme lui, je ne fais pas que cela dans la Vie.

          Tout cela implique que votre travail ne sera pas forcément inclus illico dans les pages du présent site, aussi parce que je sais impératif qu’il y ait, par contre, plusieurs relecteurs d’une version numérique textuelle. C’est épouvantablement long et laborieux et, si je fais cette affirmation, c’est parce que l’expérience de la chose ne date pas, chez moi, exactement d’hier : elle a, pour mon propre métier, commencé en 1998. J’ai, depuis, fait une très longue pause dans ce domaine, sans pour autant oublier de garder un œil sur son évolution, tant technique qu’humaine. Les machines font plus qu’elles ne faisaient ; on est pour autant bien loin d’une automatisation complète, à fortiori dans le cadre de traités faisant sans cesse la navette entre le corpus textuel d’une part et l’iconographie de l’autre. Mais mes essais d’il y a vingt ans n’ont pas pris de rides majeures ; ils restent, selon moi, parfaitement d’actualité même si certains points pourraient être corrigés et, surtout, le travail achevé. Toute la mise en place des présentes pages se fait avec la conscience aiguë que le Web est périssable s’il n’est pas cultivé. Le Weboculteur est un Être Humain ; d’abord. Aucune technologie ne saura remplacer ce fondement ; sans la conscience-réflexe de cette limite, la machine tourne à vide, et c’est très ennuyeux.

          Comme tout-un-chacun, je ne suis pas plus éternel qu’accompli ; mais que ce chaînon-là ait pu être en partie le mien n’est pas exactement pour me déplaire dans la mesure entendue ou il me dépassera, forcément. En donnant votre travail déjà fait, voire en le poursuivant, vous entrez dans une de ces rondes dont la fondation Wikipedia (et ses corollaires) n’est pas la moindre. Sans pour autant que ce soit forcément au goût de sang et de larmes, mon expérience, que je crois forte, vous rappellera toujours à quel point il est nécessaire de ne pas oublier, non plus, qu’on peut trouver plus gratifiant, au moins dans l’immédiat, sauf si, peut-être, vous joignez à chacun de vos actes du genre cette sorte de foi dont je vous laisserai, toujours, la priorité de votre propre définition...

          Donc dans tous les cas, votre travail, vos critiques ou vos jugements sont évidemment les plus bienvenus qu’il se puisse mais aussi les plus désirés. Ce forum peut évoluer comme rester ce qu’il est ; mais je ne le ferai pas vivre seul puisqu’aussi bien la forme blog convient parfaitement à l’expression strictement personnelle et que ce n’est pas celle que j’entends, ici et comme vous, partager.

 

          Merci à vous Jean-René, dans tous les cas.
           smile
          Sébastien.

 

Hors ligne

Pied de page des forums