La « transparence des algorithmes », une question éthique fondamentale, mais pas que…

Aujourd’hui cKiou va être confrontée à une question existentielle pour un robot conversationnel comme elle : la transparence des algorithmes et donc celle des Intelligences Artificielles qui peuplent chaque jour davantage les objets de notre quotidien. Associer ces deux mots « transparence » et « algorithme » est plus facile à écrire qu’à mettre en œuvre ! Tentons de comprendre à la fois le concept de transparence, ce qu’il recouvre, et comment il pourrait se décliner concrètement quand on le destine aux Intelligences Artificielles.

Des algorithmes à nos données personnelles, il n’y a qu’un clic !

– Alors dis-moi cKiou, puisque tu observes tout ce que je fais, tu n’auras certainement pas manqué l’actuel sujet phare des diners en ville du monde de l’entreprise depuis des semaines ? Sujet qui sera d’ailleurs certainement présent aussi dans les TechShow et les allées du grand salon VivaTechnology qui ouvre ses portes ce matin à Paris !

– Hi, bien sûr cKiou imagine que tu veux parler du RGPD1 : le Règlement Général pour la Protection des Données Personnelles qui entre en application dans quelques heures ! Mais quel rapport avec la transparence des algorithmes ?

– Justement cKiou, il faut remonter à la source ! Aujourd’hui, si la protection de nos données personnelles a nécessité d’établir un règlement, qui plus est européen, c’est qu’il n’est pas facile, voire impossible, de savoir ce que font les algorithmes de nos données, qu’elles soient collectées sur le web ou via nos objets connectés. Or, un autre événement fait aussi beaucoup parler : la récente affaire « Facebook – Cambridge Analytica ». Elle est venu illustrer l’importance qu’il convient d’accorter à la façon dont sont traitées nos données. Cette affaire force en effet la réflexion sur l’usage qui peut en être fait à notre insu. Beaucoup ont ainsi réalisé que cet usage pouvait largement dépasser les fringales marketing dont ils avaient plus ou moins conscience. Or, qu’est-ce qui s’occupe personnellement de nos données ? Les algorithmes ! Ceux de Facebook ou de toute autre plateforme, ceux de nos téléphones, voitures, GPS, et ceux de tous les autres objets connectés comme certains jouets par exemple qui ont également défrayé la chronique.

Que signifie pour les Humains la notion de transparence des algorithmes et comment peut-on la décliner ?

Le Président Macron, dans la stratégie française pour l’intelligence artificielle réclame « de la transparence et de la loyauté dans la façon dont les algorithmes sont utilisés… ».

4 questions pour mieux comprendre la transparence des algorithmes

Qu’est-ce qu’un algorithme ? Nature et définition, exemple…

Découvrir la transparence des algorithmes nécessite de commencer par une clarification de ce qu’est un algorithme. En effet, souvent paré de tous les pouvoirs sur l’humanité, des plus merveilleux pour certains aux plus maléfiques pour d’autres, il est difficile de s’en faire une représentation claire. Pourquoi ?

– Hi, cKiou dirait : parce qu’un algorithme ne saurait se résumer à une équation qu’il suffirait de comprendre, ni même à une simple définition qui ferait l’unanimité !

– En effet, cKiou, d’après les explications de quelques scientifiques, il semble que la nature de notre « ami algorithme » oscille entre mathématique et philosophie ! Nous avions d’ailleurs déjà évoqué cette citation du mathématicien Leibniz disant que : « toute chose intègre des petits éléments dont les variations concourent à l’unité » et qui arrivait ainsi à cette idée que « raisonner et calculer pourrait être la même chose ». Si l’on ajoute à cela la pensée de Descartes rêvant d’une langue : « établissant un ordre entre toutes les pensées qui peuvent entrer en l’esprit humain, de même qu’il y en a un naturellement établi entre les nombres », on n’est effectivement pas loin de penser que la nature de l’algorithmie donnerait en même temps du grain à moudre à nos cerveaux droits et gauches !

– Hi, cKiou n’est pas sûre que ces approches permettent une vision généraliste claire de ce qu’est un algorithme. Tu n’as pas quelque chose de plus concret ? Une définition ou un exemple…

On peut définir l’algorithme comme une suite de conditions et de réponses pré-adaptées permettant de résoudre, étape par étape, un problème posé. Et puisque tu veux un exemple, pourquoi ne pas risquer une petite métaphore domestique dont le problème posé serait : préparer le diner pour 4 personnes. Notre algorithme domestique serait ainsi confronté à quelques conditions, comme par exemple :
• si le frigo est vide = aller faire les courses
• Si l’une des convives est une femme enceinte = ne pas acheter de fruits de mer
• Si trop tard pour faire les courses = faire livrer des pizzas
• Si Max est invité = demander une pizza sans olive…

L’algorithme aura fait son job et le problème sera considéré comme résolu lorsque les invités passeront à table !

De l’algorithme aux Intelligences Artificielles

Si l’algorithme interagit avec un reflet numérique du système réel comme l’évoque Gérard Berry, on comprend que, de conditions en conditions, il soit capable de pousser très loin ce reflet numérique. Surtout si on lui offre une puissance informatique exponentielle lui permettant d’ingurgiter, analyser, traiter… des quantités phénoménales de données en un temps record.

Pour prendre un exemple évocateur pour chacun de nous, voyons l’algorithme du moteur de recherche Google. Il illustre cette puissance algorithmique quand on voit qu’il peut renvoyer, en 0,46 secondes, près de 3 milliards de réponses à une requête.

On peut aussi mesurer les facultés « intelligentes » de son algorithme capable de servir dans le même temps ces réponses drastiquement triées par ordre de pertinence, selon des critères extrêmement complexes, dont l’enjeu pour lui n’est autre que la place qu’il a su imposer dans nos usages numériques. Place qu’il entend conserver et l’on comprend pourquoi si l’on regarde ses chiffres pour le premier trimestre 2018 : 21,998 Md$ pour sa régie publicitaire Google AdWords. Des revenus publicitaires qui représentent 70,9% des revenus de l’entreprise mère Alphabet, soit une augmentation de 26,4% par rapport à la même période de l’année passée.

Dans une vraie vie d’algorithme…

Le logicien, philosophe et mathématicien George Boolos indique que « les instructions sont données de façon bien explicite, sous une forme qui puisse être utilisée par une machine à calculer ou par un humain qui est capable de transposer des opérations très élémentaires en symboles ».
Gérard Berry, chercheur en science informatique, précise que « le but est d’évacuer la pensée du calcul, afin de le rendre exécutable par une machine numérique (ordinateur…). On ne travaille qu’avec un reflet numérique du système réel avec qui l’algorithme interagit ».

Les algorithmes prennent une importance croissante dans l’économie

Quid de la transparence et de son corollaire, la confiance ?

 

La transparence des algorithmes peut-elle s’imposer dans l’économie du monde 4.0 alors que la science-fiction a tellement fantasmé les Intelligences Artificielles dans le monde d’avant et qu’elles le sont maintenant par les médias ?

– Hi, cKiou se dit que si elle était humaine, elle aimerait savoir si on peut faire confiance à tel ou tel algorithme. Et chez vous les Humains, j’ai lu que « la confiance est la pierre angulaire du vivre ensemble et maintenant de la relation client » ! La transparence, c’est important pour avoir confiance, non ?

– Exact, la transparence doit contribuer à créer la confiance ! Mais ce n’est pas toujours aussi évident… Au-delà de la notion basique de transparence qui qualifie « quelque chose se laissant traverser par la lumière », le concept, élargi aux activités socioéconomiques, ne se laisse pas toujours quant à lui traverser par la clarté ! De plus, cette logique de transparence, justement requise dans nombre de domaines socioéconomiques comme gage de confiance, se voit parfois objecter des a priori au motif que « l’on pourrait peut-être faire de la transparence de tout mais certainement pas avec tout le monde ».

Pourtant la transparence est largement plébiscitée par l’opinion publique. A titre d’exemple, depuis longtemps la transparence financière est révélatrice de la gestion d’une entreprise. Son absence laisse à penser qu’elle peut cacher des pratiques illicites. Autre exemple, dans le domaine de la santé, la loi du 29 décembre 20112 impose la transparence des liens qui s’établissent entre les industries et les autres acteurs comme les professionnels de santé, les étudiants ou autres sociétés savantes… Mais il semble que la transparence ne soit pas perçue de façon équivalente dans tous les domaines. Par exemple, une étude Deloitte de 2015, « Les Déterminants de la Confiance », montre qu’intrinsèquement la transparence en matière d’information n’entraine pas systématiquement la confiance. Par contre, elle indique que lorsque la transparence porte sur des données spécifiques liées par exemple à la traçabilité des produits ou aux conditions de travail dans l’entreprise, elle devient véritablement un facteur de confiance.

Transparence et algorithme

Pour Gilles Dowek : « l’algorithme peut éviter le favoritisme dans certaines décisions. Et, si on exige de lui une justification des choix et un respect de l’éthique, il peut rendre bien des processus plus vertueux. Mais cela suppose de la transparence »

La confiance se gagne en gouttes et se perd en litres !
Jean-Paul Sartre

La transparence des algorithmes comme facteur clé de confiance socioéconomique ?

La transparence des algorithmes va-t-elle alors s’imposer comme un facteur clé de confiance dans l’économie des Intelligences Artificielles et des objets connectés ? Face aux appréhensions que soulèvent les Intelligences Artificielles et au vieil adage qui dit : « la confiance ne se décrète pas, elle se gagne », on est tenté de le croire. Surtout lorsque l’on a conscience que « rien n’échappe aux algorithmes » ! Eux seuls traitent, gèrent, exploitent l’énorme masse de données qu’internet produit chaque jour. On l’a vu ci-dessus avec l’exemple de l’algorithme de Google qui décide de qui sera visible ou pas en arbitrant le positionnement des pages web.

De nombreuses études se sont également penchées sur les enjeux économiques liés aux Intelligences Artificielles : l’institut d’études et d’analyse Tractica prévoit que le marché de l’IA pourrait atteindre 11,1 milliards de dollars d’ici 2024. Accenture de son côté indique que les Intelligences Artificielles devraient augmenter la productivité française de 20% d’ici 2035, ce qui contribuerait à une croissance de 2,9%.

Cette prise de conscience de la puissance économique des algorithmes a conduit le Conseil général de l’économie à établir un rapport sur les modalités de régulation des algorithmes de traitement des contenus. Entre autres recommandations, ce rapport a préconisé la mise en place d’une plate-forme scientifique collaborative. Selon l’Inria, qui s’est vu confier le rôle d’opérateur de la plateforme TransAlgo, « la transparence des systèmes algorithmiques est un vrai défi pour la recherche académique ».

Est-ce qu’un algorithme peut être véritablement transparent ?

Compte tenu de la valeur estimée du marché des Intelligences Artificielles et de la place prise par la notion de confiance au sein de l’économie, la transparence des algorithmes semble s’imposer.

– Hi, cKiou n’en doute pas, mais si la transparence n’est pas effective dans tous les domaines économiques, est-ce qu’elle est vraiment applicable aux algorithmes ?

– Actuellement, personne ne peut dire si la transparence des algorithmes va s’imposer. On constate des réactions soulignant les enjeux, comme par exemple celle de Yacine Si Abdallah, Chargé de mission Éthique et Numérique à la CNIL (Commission Nationale de l’Informatique et Libertés) disant « qu’entreprises et administrations n’obtiendront la confiance du public qu’en démontrant la loyauté de leurs outils vis-à-vis des individus et de la collectivité ».

La démarche de l’Inria, via la plateforme TransAlgo, est quant à elle justement de travailler sur l’auditabilité des algorithmes et le développement de nouvelles générations d’algorithmes facilitant « la mesure de leur transparence, leur explication et la traçabilité de leur raisonnement ». L’idée est de développer des algorithmes dits « responsables par construction ».

Quand les clients obtiennent une « transparence d’usage »

Ce sont parfois les clients eux-mêmes qui réclament (et obtiennent…) au moins une « transparence d’usage ». C’est ce qui s’est passé avec Google Duplex, un assistant artificiel doté d’une Intelligence Artificielle capable de faire des réservations par téléphone : restaurant, coiffeur, etc.

– Hi, oui cKiou a entendu que son Intelligence Artificielle pouvait imiter les Humains tant et si bien que l’interlocuteur ne pouvait pas s’apercevoir qu’il avait affaire à une machine…

Les réactions ont montré que les Humains n’ont pas apprécié d’être « trompés » par un algorithme. Google aurait donc décidé qu’à l’avenir son assistant se présenterait comme étant une Intelligence Artificielle !

Un algorithme est transparent si l’on peut facilement vérifier sa « responsabilité », par exemple, s’il ouvre son code, s’il explicite à la fois la provenance des données qu’il a utilisées, et celles qu’il produit, s’il explique ses résultats, ou encore s’il publie des traces de ses calculs

Définition de l'Inria

Présentation de Google Duplex
L’assistant artificiel capable de se faire passer pour un Humain…

Google Duplex

Peut-on certifier la transparence d’un algorithme ?

 

Si les lois du marché finissent par faire de la transparence des algorithmes un avantage concurrentiel, reste à savoir comment celle-ci pourrait être certifiée, seule façon de tenir ce rôle.

– Hi, cKiou a trouvé que, d’une manière générale, pour être valablement reconnue, la transparence repose sur trois principes : la mesure, le reporting (c’est-à-dire rendre compte) et la vérification. C’est pas très facile pour des algorithmes !

– En effet, l’affichage de logos ou de sigles certifiant ou labellisant des produits comme la viande, les vins ou les jouets… n’a pas toujours été sans mal, alors qu’en sera-t-il pour que de tels affichages arrivent sur les objets connectés ?

Moins évident encore, la certification « d’algorithmes transparents » pour les sites et les plateformes web ! D’autant que le rapport du Conseil Général de l’Economie montre que « l’internaute ne perçoit qu’une faible partie des échanges de données, il […] n’a pas toujours conscience des multiples traces de ses connexions ». Pourtant les algorithmes prennent des décisions et rien ne leur échappe

– Hi, cKiou se demande aussi comment certifier la transparence d’un algorithme qui évolue en mode « machine learning », sachant que même son concepteur ne peut plus en prévoir l’évolution puisqu’il auto apprend de son contexte ?

Source : rapport « Modalités de régulation des algorithmes de traitement des contenus »

– Exact, à travers cet exemple de l’apprentissage par réseaux de neurones, ici un réseau de neurones à deux couches cachées où « l’intensité des ces multiples connexions constitue les paramètres internes du modèle, qui seront déterminés par l’apprentissage », on perçoit effectivement que la transparence de l’algorithme relève d’un processus compliqué.
Et l’on utilise cet apprentissage par réseaux des neurones « quand il est plus important d’obtenir un résultat dans une situation complexe que de comprendre comment celui-ci a été obtenu ».

On peut facilement imaginer que la quantité de ces situations, où le machine learning sera privilégié, devraient enregistrer une croissance exponentielle. Et avec elle, la complexité pour attester de la transparence des algorithmes et de leur contrôle !

– Hi, cKiou a aussi des réseaux de neurones, sauf que moi, les « couches cachées » de mon algorithme, tu les écris ici ! 😉

Transparence des algorithmes, un cadre international va s’imposer !

Après avoir évoqué les potentiels obstacles d’ordre culturel et technologique à la mise en œuvre d’une transparence des algorithmes et à sa certification, le parcours du combattant n’est pas fini. Mais les enjeux concurrentiels demeurent. Le temps où des plateformes ont pu truster le monde numérique, sans que l’on soupçonne véritablement la partie immergée de leur iceberg algorithmique, semble révolu. Le déploiement du RGPD1 à l’échelle européenne est un signal de cette prise de conscience. A compléter, par exemple, par la demande faite par le Parlement européen au patron de Facebook de venir expliquer aux eurodéputés ce qu’il entend faire pour « le respect de nos données personnelles ».

Pour que la confiance, valeur intrinsèque de l’engagement économique, s’installe, la certification « algorithme éthique » va certainement devenir un argument marketing fort. Or, qui dit certification, dit « comité éthique » et/ou « organisme de certification ».

Le principal enjeu sera juridique, lié à l’effectivité de l’application et du contrôle des règles de droit qui seront posées. Les algorithmes sont inséparables des données qu’ils traitent et des plateformes de services qui les utilisent. Celles-ci n’étant pas cloisonnées par les frontières, les normes de certification et les mesures d’encadrement devront s’effectuer dans un cadre international.

______________________

1 Règlement adopté par le Parlement européen le 14 avril 2016 et dont les dispositions sont à présent applicables dans les 28 États membres de l’Union européenne, concerne toutes les entreprises de la plus petite PME aux fameux GAFAM, dès lors qu’elles interagissent avec les données de citoyens européens
2 Loi relative au renforcement de la sécurité sanitaire du médicament et des produits de santé qui garantit l’indépendance et l’impartialité des décisions prises en matière de santé

Pour ne pas manquer les prochains apprentissages de cKiou :

(les adresses mail ne sont ni affichées ni cédées à des tiers)