1993, le « PDF », format de lecture électronique, s’est imposé… et dure encore !
Le célèbre « format PDF » a permis de « passer facilement d’un format imprimé à un format digital ». Une évidence aujourd’hui, mais une avancée technologique majeure il y a trente ans !
En 1993, apparaissait un format de fichier qui permettait de lire et partager des documents réalisés à partir de logiciels et de systèmes informatiques différents. L’apparition du PDF, ce « format de lecture électronique » a transformé la vie de beaucoup d’Humains assis devant un clavier et un écran d’ordinateur. En effet, à l’époque, afficher un document sur des machines différentes, réalisé à partir de versions logicielles hétérogènes, en assurant sa mise en page, relevait du défi !
Si, pour les moins de trente ans, et à l’ère des Intelligences Artificielles, la notion d’interopérabilité peut sembler sortir de la préhistoire, il n’y a que trois décennies, elle était une grande préoccupation pour tous les actifs du clavier.
Le PDF, une nouvelle carte logicielle dans le jeu de la société « Adobe Systems »
Ce format de document informatique a été imaginé en 1990 par John Warnock, informaticien co-fondateur d’Adobe Systems, entreprise qui s’est notamment fait connaitre avec le logiciel Photoshop, et une suite de logiciels dévolus au travail professionnel de l’image, comme Illustrator et InDesign.
Le projet de ce format de document vient du besoin de mieux répondre au fonctionnement interne de l’entreprise. Il s’inspire du format « PostScript », appartenant à Adobe, qui permet de stabiliser des documents pour les imprimer ou les faire imprimer par des professionnels.
Présentée en 1992, cette première mouture, alors baptisée « projet Camelot », ne reconnaissait que le mode colorimétrique « RVB » (Rouge-Vert-Bleu). Cela ne permettait pas aux professionnels de l’utiliser en prépresse, qui requiert le mode CMJN (Cian-Magenta-Jaune-Noir) pour une impression et publication papier. L’idée est donc de « dépasser la difficulté de communiquer du matériel visuel entre différents systèmes et applications informatiques ».
1993, une nouvelle voie pour la « lecture électronique »
Le 15 juin 1993 ouvre véritablement la voie à la « lecture électronique ». Adobe présente une version évoluée du format PDF, c’est la sortie officielle de la version 1.0 et de son « Acrobat Reader », logiciel qui permet de lire et manipuler des documents électroniques au format PDF.
Qu’est-ce qu’un PDF ?
Le PDF (Portable Document Format) est un « langage de description de page ». Ce format de fichier électronique permet de conserver l’aspect d’un document, quel que soit le système informatique et le logiciel utilisés pour le créer, et quel que soit l’appareil qui sert à le visualiser.
Il préserve sa mise en page, ses polices de caractères, les images et tout objet graphique, tels qu’ils ont été définis par leur auteur.
Le PDF, une nouvelle carte logicielle dans le jeu d’Adobe System
Il est disponible pour les systèmes DOS, Windows 3.1 et Macintosh. Son prix est élevé (50$), sa diffusion est donc relativement limitée. Adobe révisera alors sa stratégie : si la version Acrobat Pro reste payante, il diffusera Acrobat Reader gratuitement. A noter que dans cette version gratuite, Acrobat Reader permet tout de même de signer, de surligner et d’annoter des passages du document.
Des usages « révolutionnaires » pour la fin du XXè siècle
Un fichier au format PDF peut abriter quasiment tous types de documents et fonctions comme des liens hypertextes, des images haute-définition, des modélisations 3D et des vidéos, ce qui était, il y a trente ans, une véritable révolution !
Cette révolution s’invite sur les écrans des professionnels, même si ses premiers pas renferment quelques difficultés. Par exemple, la modification des documents n’est pas toujours aisée, notamment avec des versions gratuites de systèmes de lecture (hors celui intégré à la suite de logiciels professionnels d’Adobe).
Autre atout, alors que le « poids » d’un document, pour son stockage et son envoi, est une des préoccupations informatiques de l’époque, le PDF, plus léger, prend moins de place. La conversion d’un fichier initial, quel que soit son logiciel de création, réduit automatiquement sa taille, sans que cette compression n’affecte sa qualité.
Élargir le champ du travail collaboratif
Une des finalités du PDF est de simplifier le travail collaboratif : le partage de documents doit autoriser non seulement leur lecture fidèle, mais aussi des allers-retours pour validation, modification, annotation.
L’océrisation pour un retour au format texte
L’OCR, ou océrisation, est une technique de reconnaissance optique de caractères (optical character recognition). Concrètement, elle traduit les « images de texte » réalisées par la conversion PDF, en « fichiers de texte ». Ainsi, elle redonne accès au texte du document PDF, pour le rendre de nouveau modifiable.
La mutation se fait grâce à un logiciel qui récupère le texte dans l’image du texte imprimé en PDF. Cette solution est intégrée à « Acrobat Pro », mais on peut aussi accéder à des outils de reconnaissance via un navigateur web ou des applications mobiles pour iOS ou Android.
L’océrisation n’est pas née pour l’occasion. C’est une technologie plus ancienne puisqu’elle a été inventée par le physicien Emmanuel Goldberg pendant la première guerre mondiale. L’objectif était de transformer des caractères de texte en code télégraphe. La première machine d’OCR a été créée par l’ingénieur allemand Gustav Tauschek en 1929.
Un système OCR part de l’image numérique réalisée par un scanner optique ou un appareil photo numérique. Il le transforme en fichier texte. Certains logiciels s’efforcent de conserver l’enrichissement du texte (police de caractère, gras ou italique) sa mise en page, y compris les tableaux et les images.
Sécurité informatique, le PDF aussi
Les PDF ne sont pas exempts des tentations malveillantes. Certains hébergent des virus ou peuvent faire l’objet de tentatives de piratage des données sensibles et/ou confidentielles qu’ils hébergent. Il est cependant possible de les sécuriser par un mot de passe. Celui-ci est créé par l’auteur et transmis (par un autre canal : mail, téléphone…) à son destinataire. L’absence de ce code empêche la copie, l’impression ou la modification du fichier.
En 1994, le PDF améliore la sécurité grâce au cryptage des mots de passe. Il pourra aussi être estampillé par un filigrane (mention « confidentiel » par exemple) sur tout ou partie du document. Celui-ci apparait en arrière-plan du texte. Il peut indiquer l’auteur, le propriétaire, sa nature confidentielle donc privée, limitant ainsi le risque d’une diffusion inappropriée.
En 2011, on découvre la possibilité d’importer le contenu d’un PDF dans un autre, et Adobe Systems développe sa solution de signature électronique « Adobe Sign ». La signature électronique peut s’effectuer à distance.
Une normalisation ISO
En 2008, le PDF reçoit le label « Norme ISO », délivré par l’Organisation internationale de normalisation, composée de représentants de 167 pays. Le PDF est ainsi normalisé en tant que « format ouvert ISO 32000 ».
En janvier 2017, il atteint le stade d’approbation FDIS intitulé « Gestion de documents, format de document portable ».
Le PDF toujours en activité
Aujourd’hui encore, le PDF est utilisé partout dans le monde dans une grande variété d’applications, comme la publication en ligne, la collaboration et la distribution de documents. Des outils permettant de convertir et de modifier facilement et rapidement des fichiers PDF sont disponibles en ligne gratuitement.
En 2020, Adobe a doté ses PDF de l’environnement de lecture « Liquid Mode », afin d’en améliorer la lisibilité sur les appareils mobiles.
Selon Adobe Systems, « Plus de 2 000 fournisseurs à travers le monde proposent des solutions basées sur le format PDF : outils de création, modules externes et outils de conseil, de formation et de support ». Des millions de documents PDF sont actuellement publiés sur le web et un nombre incalculable de fichiers PDF circulent dans les entreprises et administrations du monde entier.
Le regard de cKiou
cKiou s’interroge sur une éventuelle cohabitation entre le PDF et l’Intelligence Artificielle
– Hi, cKiou a cherché à savoir si une cohabitation était possible entre le PDF et l’Intelligence Artificielle. Il semble en effet que les IA comme ChatGPT ou Bard peuvent piocher et restituer des informations contenues dans les PDF, que ce soit du texte, des images et des graphiques.
Il parait même que, grâce à la technologie OCR, elles sont capables, par exemple, d’aller extraire des éléments de la littérature académique ou autres documents techniques archivés sur le Web, pour répondre aux questions des Humains.
← Autres publications →
Et pour ne pas manquer la suite de l’Histoire du numérique…
(les adresses e-mails ne sont ni affichées ni cédées à des tiers)
Le temps de la technologie passe de plus en plus vite. Merci pour ce rappel.