Partager l'article ! Traitement de formules mathématiques en édition électronique: Le titre de ce billet est imprécis à dessein. Il vise à ouvrir la discussion ...
Avril 2009, pour l'Année mondiale de l'Astronomie, sortie de mon livre "Les Indispensables astronomiques et astrophysiques pour tous" (éditions Odile Jacob). Comme mon premier livre
(2006, colonne de gauche ci-contre), c'est un livre de notions de base illustrées avec des exemples concrets, s'appuyant sur les mathématiques (géométrie notamment) pour l'astronomie, et sur la physique pour
l'astrophysique.
Le titre de ce billet est imprécis à dessein. Il vise à ouvrir la discussion (sur mon blog Indispensables mathématiques, sur mon blog Bibliothèques numériques et édition scientifique, sur le blog Autour de BibNum – ces divers publics sont concernés) sur deux sujets auxquels je suis confronté dans plusieurs de mes travaux d’édition électronique, dans BibNum notamment.
Le premier sujet est la façon dont on peut faire figurer les formules de mathématiques dans une page HTML, si possible dans la même graphie que la page HTML. Par exemple, voir l’onglet analyse de ce dossier BibNum, il n’est pas facile d’harmoniser les formules avec le reste du texte. Certes, existe MathML – mais j’aimerais voir concrètement ce que sont des pages avec du MathML.
Le deuxième sujet (qui m’est plus proche) concerne les formats d’édition avec des formules mathématiques. Les mathématiciens professionnels utilisent LaTex (les physiciens très rarement). Or, dans BibNum, nous avons une mise en forme (vers Verdana + logos en bas de page + divers formats d’intertitres) et des corrections (de forme, ou de fond à proposer à l’auteur) – bref le travail que tout éditeur est en droit et en devoir de faire. C’est pourquoi j’ai longtemps cherché des convertisseurs PDF vers Word – puisque le LaTeX a pour format d’affichage le PDF. Je n’ai trouvé aucun convertisseur qui traite correctement les formules mathématiques (vers MS Equation ou MathType sous Word) – tous ne font que d’horribles pâtés quand ils voient des formules de mathématiques. En revanche, si l’on prend les fichiers de compilation du LaTeX (avant l’affichage en PDF), ce sont des .tex et je viens de trouver un convertisseur TEX vers Word qui a l’air correct pour les formules mathématiques (GrindeQ).
Je serais heureux de vos commentaires sur ces deux sujets.

Une remarque complémentaire de l’éditeur électronique que je suis, sur le second sujet. Certains mathématiciens s’offusquent auprès de moi que "l’État" (le ministère qui a le site BibNum en tutelle – encore que les liens soient un peu lâches – on pourrait dire pareil d’un labo de recherche) utilise des formats Word, Microsoft, etc. au détriment des logiciels gratuits. D'abord, je m'identifie assez peu à "l’État" , et travaille avec des outils que je m'achète moi-même. Ensuite, comme me le fait remarquer judicieusement un auteur BibNum (un autre mathématicien), les formats DOC ne sont pas réservés à Microsoft – beaucoup de suites gratuites, telles OpenOffice, utilisent ce format – donc on a quand même le deuxième problème. Toujours suivant ce même auteur, et c'est aussi mon avis, ce qui est scandaleux, c’est que les suites MS Office soient proposées à prix très bas au monde de l’éducation nationale, l’État complétant lui-même la différence par un abondement ! D’un autre côté y a-t-il beaucoup d’entre nous qui se sont réellement mis à travailler avec OpenOffice, sans continuer par paresse à travailler avec MS Office qu’ils ont déjà sur leur ordinateur ?
Autre remarque sur LaTeX et les mathématiciens. C’est évidemment un logiciel magnifique. Mais existe-t-il des éditeurs (au sens humain
donné plus haut à ce terme) qui entrent dans le LaTeX de leurs auteurs pour faire les changements de fond et de forme mentionnés plus haut ? S’il en existe, qu’ils se dénoncent ! Je
pousse même plus loin mon hypothèse heuristique : certes LaTeX est un logiciel extraordinaire pour gérer les maths (d’où son succès), mais n’est-ce pas aussi un moyen pour son utilisateur
d’éviter d’avoir à subir toutes corrections (ou du moins les gérer soi-même en tant qu’auteur) que d’envoyer le PDF produit sous LaTeX ? Manière de dire "Voici mon fichier, à prendre ou
à laisser" ...Peut-être y a-t-il de cela, aussi, non ?![]()
Mon dernier ouvrage est sorti le 14 octobre 2010 : Récréations mathéphysiques (éditions Le Pommier) (détails sur ce blog)
J'ai aussi un thème de recherche, l'alterscience, faisant l'objet d'un cours que j'ai professé à l'EHESS en
2008-2009 et 2009-2010. Il était en
partie fondé sur mon second livre, "Einstein, un siècle contre lui", Odile Jacob, octobre 2007, livre d'histoire des sciences (voir billet sur ce blog, et notamment ses savoureux commentaires).
Pour les pages web, MathJax donne des résultats fabuleux.
@H je ne crois que ce que je vois : pouvez-vous me donner l'exemple sur Internet d'une page dont vous savez qu'elle est écrite avec cela ? Merci ! A.M.
La plupart des éditeurs scientifiques (ceux qui génèrent de la littérature primaire, type UCP, AMS, ACS, Royal Society, dans une moindre mesure Elsevier, Springer et consorts) ont une possibilité de soumettre en LaTeX. Ce qu'il faut savoir, c'est qu'on soumet les PDF pour la version des referees, mais que la prod se fait sur le fichier tex, ce qui permet de faire les ajustements de fond/forme, justement.
Réduire LaTeX aux maths, ça serait injuste. Ce serait passer à côté de la puissance de gestion de la biblio, des renvois multiples, de l'indexation, et surtout de ses capacités microtypographiques qui font que Word (et encore plus open office), c'est nul.
Excusez-moi, mais qui fait la prod. sur les fichiers TEX ? L'auteur lui-même ? Ou est-ce l'éditeur qui modifie le TEX ? A.M.
Quand on publie un papier, les auteurs font les corrections de grammaire & co, et la prod. est assurée par l'éditeur.
Mais existe-t-il des éditeurs (au sens humain donné plus haut à ce terme) qui entrent dans le LaTeX de leurs auteurs pour faire les changements de fond et de forme mentionnés plus haut ? S’il en existe, qu’ils se dénoncent !
En fait, toutes les revues mathématiques et de nombreuses revues scientifiques en général fonctionnent de la même manière:
Merci cher RM, comme vous me l'aviez aooncé, de votre commentaire. Mon propos n'est bien évidemment pas contre LaTeX : vous m'avez fait une billante démonstration de la rapidité avec lauqlle on peut changer le style ou la présentation sous LaTeX. A.M.
En outre, il est bien plus aisé de comparer deux fichiers .tex, car ce sont des fichiers de texte du type .txt, que des fichiers Word. Les outils comme WinMerge (Win pour Windows) prennent tout leur sens ici.
Et des outils comme LyX ou TexMaker rendent l'écriture aussi simple que Word.
Qu'il soit calir que je ne dis pas que Word est mieux que LaTeX ! Je fais simplement part de mon expérience face à la manipulation (nécessaire pour moi - pas pour d'autres qui travaillenet uniquement en LaTeX, ce que je comprends) de ces deux formats. A.M.
Les mathématiciens professionnels utilisent LaTex (les physiciens très rarement)
Juste pour réagir là-dessus : non, les physiciens théoriciens utilisent tout autant Latex que les mathématiciens. Je ne vois d'ailleurs pas comment ils pourraient faire autrement; il suffit de faire un tour sur l'arXiv pour reconnaître la "patte" Latex. J'ai pour ma part rédigé tous mes papiers d'abord en Latex, même s'il m'est arrivé quelques fois de devoir les "convertir" en word pour des soumissions. Mais de plus en plus, les revues acceptent directement les pdf, ce qui est très utile.
Le problème majeur de Latex par rapport à d'autres formats comme Word (par exemple) est qu'il est très difficile je trouve d'écrire un papier à plusieurs. Plusieurs raisons :
- tout le monde n'a pas les mêmes packages ni les mêmes macros, du coup ça peut créer des problèmes
- il n'y a tout simplement pas de façon simple de gérer l'édition simultanée du même papier
- il n'y a pas d'éditeur standard qui s'est imposé. A titre d'exemple, il m'est arrivé d'ouvrir avec emacs des fichiers Latex écrits avec d'autres éditeurs, et de me retrouver avec des tas de caractères illisibles "retour chariot" qui avaient été "ajoutés" involontairement
Ces problèmes vont se poser tout autant lorsqu'un éditeur de revue va ouvrir un fichier Latex, c'est pour ça que les éditeurs des revues de physique essaient de fournir des classes, des macros et des templates spécifiques pour leurs revues. Mais du coup, cela joue aussi contre l'homogénéisation du software, car chaque revue va proposer ses propres macros, etc... Word n'a pas ces problèmes.
Une solution concernant l'édition par les revues est aussi, via le site de soumission du papier, de faire soumettre le fichier source .tex uniquement et de compiler sur les serveurs de la revue, afin que les auteurs vérifient par eux-mêmes si ce qu'ils ont fait est compatible avec les styles de la revue.
Les physiicens auxquels j'ai affaire pour BibNum, en tout cas. Merci de ta précision. A.M.
Toutes les pages d’Images des Maths, par exemple http://images.math.cnrs.fr/Geometrie-Anamorphique-II.html sont en MathJax. Au début on voit du code tex, comme $x$, après quelques secondes le moteur javascript y substitue le résultat « graphique ».
Merci beaucoup. Je connais bien évidemment ce site. Je vais rearder cela attentivement. A.M.
Un outil comme SVN utilisé par les programmeurs est très utile pour l'édition d'un fichier .tex à plusieurs.
Rien n'interdit non plus de gérer un fichier par section et un fichier principal qui les inclut, chacun travaillant sur sa section.
Pour les caractères illisibles, il suffit de préciser que l'on travaille en utf8 plutôt que latin9. Quant au retour chariot, c'est plutôt lié au passage de Windows à Linux et vice versa, qu'à LaTeX. Cela se produirait avec n'importe quel fichier .txt.
Et il y a un éditeur standard pour TeX, c'est vim
Pour répondre au commentaire de Tom sur les difficultés d'édition à plusieurs…
On est en train de collaborer à pas mal de monde sur un papier, et le coup de SVN + FileMerge (sur mac, diff ou WinMerge chez les autres) marche bien. L'avantage d'avoir un SVN, c'est qu'on peut mettre tous les packages non standard dans le dossier principal, et quand on checkout, on peut compiler sans difficulté. La classe AASTeX est géniale pour éditer les papiers.
En ce qui concerne les problèmes de fins de ligne, un petit script perl doit faire l'affaire, non?
- tout le monde n'a pas les mêmes packages ni les mêmes macros, du coup ça peut créer des problèmes
Je ne vois pas le souci. Il suffit de se fixer au préalable la liste des packages à utiliser (en général fixée par l'éditeur). Personnellement, je pense que si la revue a bien prévu sa classe, cette situation ne devrait pas se présenter.
- il n'y a tout simplement pas de façon simple de gérer l'édition simultanée du même papier
Est ce vraiment plus simple avec Word?
- il n'y a pas d'éditeur standard qui s'est imposé. A titre d'exemple, il m'est arrivé d'ouvrir avec emacs des fichiers Latex écrits avec d'autres éditeurs, et de me retrouver avec des tas de caractères illisibles "retour chariot" qui avaient été "ajoutés" involontairement
Ce n'est pas un problème d'éditeur mais de codage (comme pour tous les fichiers). La plupart des éditeurs Windows fonctionne en Latin1 alors que le codage le plus fréquent (hors mac) ailleurs semble désormais être l'UTF8.
Et bien avec LibreOffice (successeur d'OpenOffice développé par une communauté indépendante de Oracle) Il est possible de générer des pdf "hybrides", dans lequel le fichier original est incorpporé de manière transparente au pdf.
Doc à priori on a un fichier pdf standard, mais i on l'ouvre avec LibreOffice, on a acces au fichier odt, dans lequel on peu faire des modifications (et en loccurence sur les formules mathématiques). Il suffit ensuite de réenregistrer le fichier et de faire un nouvel export en pdf hybride.
Bonjour,
J'en rajoute une couche : LateX est très utilisé dans le monde des physiciens, en particulier en physique des particules et astrophysique. J'ai rédigé ma thèse avec ainsi que mes articles, les revues d'astrophysique acceptent le format tex (historiquement bien avant le format doc). Les seules fois où je dois utiliser word, c'est en général pour des rapports ou des demandes de financement : je ne sais combien de cheveux je me suis arraché en rédigeant une demande ANR sous word. L'horreur ! En plus le rendu final est moche comparé à ce qu'on peut faire avec latex.
Ceci étant, je voulais pouvoir utiliser des formules mathématiques sur mon site web. C'est pourquoi je suis passé sous SPIP (http://www.spip.net/fr), qui permet d'utiliser du latex dans les articles. Cela donne des choses comme ça : http://snovae.free.fr/spip.php?article57 ; en revanche je ne sais pas trop quelle recette utilise ce gestionnaire de sites web pour parvenir à ses fins !
Guillaume
Je ne sais pas si je l'ai déjà écrit, mais mon billet n'avait pas pour objectif de mettre en compétition LaTeX et Word ! Que plus de physiciens que je ne pensais travaillent ous LaTeX, je vous en donne bien volontiers acte. A.M.
Je sais bien que j’arrive après la bataille et que deux autres contributeurs ont déjà évoqué ce point, mais m’étant insurgé en cours de lecture de l’article, j’y vais de ma petite prose
: je m’insurge contre l’affirmation selon laquelle les physiciens utiliseraient très rarement LaTeX.
J’ai bien lu la réponse en commentaire comme quoi il fallait lire « (les physiciens auxquels j’ai affaire pour BibNum, très rarement) », mais je ne l’ai pas lu dans le corps du texte, d’où vitupération
.
Sans revenir sur le cas d’arXiv qui a déjà été mentionné, je me contenterai de ma propre expérience en disant que, dans le labo où j’étais, c’était LaTeX à tous les étages !
Commentaire inutile du jour : ça, c’est fait
!