Les IA génératives ressemblent à un véritable test de Rorschach pour les sites médias du monde entier. Certains regardent la tache d’encre et y voient une menace existentielle ou un parasite s’attaquant à leur journalisme. D’autres y voient des possibilités incroyables, utilisant des produits d’IA générative pour automatiser des tâches onéreuses, voire impossibles, ou pour créer un contenu hyperpersonnalisé à grande échelle.
Il y a probablement du vrai dans les deux approches, mais la réalité de l’IA générative n’est ni subjective ni ouverte à l’interprétation. ChatGPT, Dall-E, Bard et leurs semblables ne sont pas d’autres “gadgets à la mode” (ou “bright, shiny things” comme les qualifie Julie Posetti, chercheuse au Reuters Institute for the Study of Journalism de l’Université d’Oxford) que l’on peut facilement écarter et ignorer. Ce sont des outils extrêmement puissants qui n’en sont qu’à leurs débuts. L’IA générative a le potentiel de transformer de nombreux secteurs, en changeant la façon dont nous travaillons dans les salles de classe, les salles d’audience et, oui, même dans les salles de presse. Selon une enquête Adobe récemment publiée, 92 % des personnes interrogées déclarent que l’IA a un “impact positif sur leur travail” et plus d’un quart d’entre elles (26 %) qualifient l’IA de “miracle”.
Avec les bonnes requêtes et les bonnes directives, l’IA générative peut exceller dans des tâches telles que le résumé, l’optimisation de contenu et la transformation d’un type de contenu en un autre. Comme l’IA générative comprend très bien la syntaxe du langage, les résultats sont étonnamment bons pour transformer un long article de presse en un script de podcast ou un thread Twitter. La promesse d’une recherche conversationnelle et d’une analyse de données basée sur des requêtes est passionnante. Taboola a même cartographié une cinquantaine de tâches incombant à la rédaction de sites médias en matière de découverte, de création, d’optimisation et de distribution, et découvert que les IA génératives pouvaient potentiellement contribuer à plus de 90 % d’entre elles.
Mais les IA génératives ne sont pas conçues pour toutes les tâches. Comme cela est bien documenté, elles ne sont pas fiables en ce qui concerne les faits et les citations, et elles peuvent être sujettes à des “hallucinations“. C’est l’une des principales raisons pour lesquelles les sites médias ont des positions si différentes à l’égard des IA génératives – et c’est pourquoi il est essentiel d’adopter une approche méthodique.
Établir des règles d’engagement
Avant toute chose, il est important que vous commenciez par définir la position initiale de votre entreprise sur l’utilisation de textes, d’images, de sons et de vidéos générés par une IA. Vous disposez bien d’un manuel qui détaille ce que vous autorisez et n’autorisez pas sur les médias sociaux. L’IA générative nécessite la même attention. À quelles fins utiliserez-vous l’IA générative ? Pour quels usages ne l’utiliserez-vous jamais ? Soyez précis, pour les audiences internes et externes. Par exemple, vous autoriserez peut-être les images d’IA générative, mais uniquement dans les articles techniques ou médicaux, afin d’illustrer des concepts complexes et théoriques. Et n’oubliez pas que rien n’est gravé dans le marbre. La technologie évolue rapidement, et vous devez donc être prêt à réévaluer régulièrement votre position et vos lignes directrices.
Dans une interview accordée au Monde, Guillaume Lacroix, cofondateur de Brut, déclare avoir adopté une approche axée sur l’expérimentation et l’innovation. « C’est un formidable outil de création à condition qu’il soit au service de l’information », a-t-il déclaré, avant de confier qu’un journaliste a d’ores et déjà été missionné pour créer des contenus à l’aide de plusieurs IA. Brut prévoit également de s’appuyer sur l’intelligence artificielle pour se développer à l’international, en utilisant une IA de traduction capable de « cloner les voix et de synchroniser les mouvements de lèvres de nos journalistes ». Laurent Lucas, autre cofondateur de Brut, se veut toutefois rassurant : « Ces contenus seront très clairement identifiés pour nos audiences et validés par nos soins ».
Le Groupe Les Echos Le Parisien, quant à lui, a publié ses engagements concernant l’utilisation de l’intelligence artificielle générative au sein de ses rédactions, avec une position plus prudente : « Nous n’entendons pas publier de contenu éditorial généré en totalité ou même partiellement par une IAG sans supervision éditoriale et humaine » ou encore « Nous nous réservons le droit d’utiliser l’IAG comme un outil d’enrichissement, de recherche ou de synthèse pour aider et nourrir le travail des journalistes ».
L’AFP (Agence France-Presse) s’est montrée encore plus conservatrice, co-signant une lettre ouverte avec neuf autres organismes de presse de renommée internationale, afin de réclamer des garanties concernant leurs modèles économiques et la désinformation. « Nous, les organisations soussignées, soutenons l’avancement responsable et le déploiement de la technologie d’IA générative tout en estimant qu’un cadre juridique doit être développé pour protéger le contenu qui alimente les applications de l’IA et maintenir la confiance du public dans les médias », peut-on y lire.
Ce qui est le plus couramment admis, quand on parle d’utiliser une IA générative dans une rédaction, c’est la transparence externe. Si une vidéo ou un article est créé ou optimisé par l’IA, il doit être identifié comme tel.
Cela fait des années qu’Associated Press s’appuie sur l’IA pour convertir des données en texte et créer de courts articles basés sur des données structurées telles que des rapports financiers. Tous contiennent une mention précisant leur provenance et leur source originale : « Cet article a été généré par Automated Insights (http://automatedinsights.com/ap) à partir de données provenant de Zacks Investment Research. Accédez à un rapport de Zacks sur ATRC à l’adresse https://www.zacks.com/ap/ATRC ». Le réseau de diffusion américain Tegna, dans sa newsletter par email, inclut un avis de non-responsabilité concernant l’utilisation d’une IA générative : « L’objet de cet e-mail et tout le texte ci-dessous ont été rédigés par GPT ». Avec des messages de ce type, les lecteurs savent à quoi s’attendre, la confiance est préservée et, dans un même temps, le média se protège contre d’éventuelles erreurs. Quelques éditeurs, comme le Washington Post, ont poussé la transparence de l’IA si loin que leurs recommandations d’articles qui ne sont pas faites par des algorithmes sont étiquetées « sélectionnées à la main » ou « choisies par la rédaction ».
Aux États-Unis, les directives de la News/Media Alliance en matière d’IA appellent également à une transparence totale : « Les contenus générés par IA doivent comporter des mentions claires et bien visibles, permettant d’identifier leurs sources originales, incitant les utilisateurs à y accéder, facilement et directement, et les informant lorsqu’un contenu a été généré par une IA. »
Un autre garde-fou que les médias placent généralement autour de cette technologie naissante, est la vérification par un être humain des contenus destinés à être vus par le grand public. Dans un secteur fondé sur la confiance et l’exactitude, les outils et les workflows doivent prévoir une étape de validation afin d’éviter la diffusion d’informations erronées. A l’avenir, à mesure que la technologie s’améliorera, une automatisation de bout en bout sera absolument possible. Mais aujourd’hui, une automatisation complète représente une prise de risque.
Établir une feuille de route pour le déploiement de l’outil
Une fois votre cadre d’engagement avec l’IA générative établi, l’étape suivante consiste à expérimenter avec un objectif. Choisissez un ou deux projets visant directement à dégager de la valeur ou à résoudre un problème dans la salle de rédaction. Assurez-vous de donner à ce projet un délai de déploiement raisonnable – évitez les projets XXL pour votre première tentative. Vous devez mettre les mains dans le cambouis et en comprendre les limites.
Ensuite, fixez des objectifs très clairs et mesurables. Si vous essayez d’optimiser les titres, quelle est la définition d’un titre réussi ? Allez-vous suivre des métriques d’adoption et d’utilisation, comme l’augmentation du nombre de tests ? Ou peut-être une mesure de performance comme le CTR. Et où se trouve le produit ? S’il s’agit d’un nouvel onglet à garder ouvert dans leur navigateur, votre équipe d’audience risque de ne pas l’adopter. De plus, la formation de toute une rédaction à un nouveau produit a un coût qui va bien au-delà des heures de développement ou de réunions d’information. Assurez-vous également que l’équipe produit ou innovation qui développe des outils d’IA générative n’est pas isolée. En demandant aux utilisateurs finaux d’envoyer leurs suggestions sur l’efficacité du workflow, vous faites des personnes qui travailleront effectivement avec ce nouvel outil des parties prenantes de son succès.
Forbes est l’un des premiers à avoir adopté des initiatives en matière d’IA. Le système de gestion de contenu du média, Bertie, peut recommander des sujets d’articles aux contributeurs sur la base de leurs précédents contenus. Un rédacteur politique recevra des suggestions sur la politique, tandis qu’un rédacteur tech se verra proposer des idées sur la Silicon Valley. Bertie peut également suggérer des titres et des images afin de réduire le temps de production.
Enfin, vous n’êtes pas seul. Il y a beaucoup de choses qui sont développées au niveau mondial pour aider à l’éducation et soutenir les médias, petits et grands. Le Center for Cooperative Media a publié un excellent guide sur l’utilisation des requêtes et les cas d’usage de l’IA générative destiné spécifiquement aux médias. L’initiative JournalismAI de la London School of Economics and Political Science propose des cours et des études de cas.
Que peut faire l’IA générative pour moi ?
Lorsque Taboola s’est penché sur cette question, nous avons commencé par cartographier grossièrement le flux de production de bout en bout d’une rédaction. Bien qu’il y ait différents rôles au sein d’une rédaction, le processus est généralement le même – vous avez une idée de sujet que vous voulez couvrir, vous recueillez des informations, vous créez le contenu, vous le publiez, puis vous travaillez dur pour y amener une audience. En suivant cette progression, nous avons identifié de nombreuses tâches et de nombreux domaines dans lesquels l’IA est prometteuse.
1. Tâches de découverte
Comment l’IA générative peut-elle aider un journaliste à trouver quel article écrire aujourd’hui ? Il existe de nombreuses façons, étonnamment.
L’IA générative peut aider à l’analyse des données, à l’identification des sources, à l’analyse des sujets en vogue et au brainstorming ou suggestion d’idées, comme dans le cas de Forbes. On peut également imaginer un système dans lequel elle pourrait même aider à acheminer des conseils ou messages d’actualité. Mais ces outils ont des limites évidentes. Souvent, les articles les plus percutants, ceux qui ont un impact, nécessitent l’intelligence humaine et l’intuition d’un journaliste. L’IA générative ne contribuera pas directement au développement des sources, à l’établissement d’une relation individuelle avec les individus, même si elle peut vous aider à les trouver.
2. Tâches de création
C’est ici que l’IA générative et l’IA conditionnelle ont un grand potentiel, mais aussi des limites très claires. L’IA peut contribuer à la création d’articles à partir de données structurées, à la transcription de notes, à la recherche de sujets, à la révision du style, à la mise en forme du contenu, à la transformation du contenu en d’autres formes d’articles et au partage intelligent du contenu sur les réseaux. Avec la supervision et la vérification des faits, nous avons également vu l’IA générative aider à la recherche et créer des visualisations de données convaincantes. Mais l’IA générative ne peut pas prendre des photos ou des vidéos d’une manifestation ou mener des entretiens avec les personnes qui y sont présentes. Là encore, rien ne remplacera la présence sur le terrain.
3. Tâches d’optimisation et de diffusion
Nous avons constaté qu’il s’agit peut-être du domaine le plus riche en termes d’efficacité du workflow. L’IA générative peut aider à la traduction de contenu, au SEO/SEM, à l’optimisation des titres, au partage sur les réseaux sociaux, aux notifications de navigateurs et d’applications natives, aux alertes par email et aux newsletters, à la curation de contenu et à l’analyse des données en temps réel.
Et demain, que va-t-il se passer ?
Même si votre rédaction ne fait rien avec l’IA générative, le monde est en train de changer autour de vous.
La Search Generative Experience (SGE ou expérience de recherche générative) de Google est un chantier permanent, mais même avec les changements récents qui mettent en avant plus de sources, il est probable qu’elle réduise in fine le trafic de renvoi. Qu’est-ce que cela change ? Dans une nouvelle étude Taboola portant sur 3 700 sites actifs depuis 2019, Google représentait, au premier semestre 2023, 34 % de toutes les sessions de renvoi. Pour de nombreux médias, Google peut représenter la moitié ou plus de tous les renvois. Toute érosion de la recherche aurait une répercussion importante sur l’audience.
Plus précisément, nous pensons que les recherches d’utilité – celles qui permettent d’obtenir une réponse à une question spécifique – vont probablement chuter en premier et le plus rapidement. Des questions telles que “quand a lieu la Coupe du monde ?”, “quel est mon horoscope ?” ou “que visiter à Sydney” trouveront leur réponse sans un clic. Les recherches portant sur des marques, des auteurs et des événements d’actualité devraient être plus durables. Le e-commerce et les liens d’affiliation liés aux performances de recherche pourraient s’éroder, car des questions telles que “quel est le meilleur mixeur ?” pourraient être regroupées et affichées sans qu’il soit nécessaire de visiter un site. Toutefois, Google Bard exclut jusqu’à présent les conseils médicaux, juridiques et financiers, de sorte que ces secteurs verticaux pourraient représenter une opportunité à plus long terme. Vous ne pourrez probablement pas non plus compenser la perte de recherche en utilisant l’IA générative pour créer du contenu à grande échelle. Par définition, Google considère que les contenus créés par l’IA sont du spam, et ils sont donc déclassés ou supprimés.
Outre les défis liés à la recherche, les médias qui fonctionnent par abonnement risquent également d’être confrontés à des vents contraires. Tout d’abord, le trafic issu de recherche convertit de manière fiable, bien plus que le trafic en provenance des réseaux sociaux, par exemple. Toute baisse du trafic de recherche aura donc un impact. Deuxièmement, les interfaces SGE / IA générative isolent l’information de sa source, ce qui réduit la confiance et l’affinité à l’égard de la marque. Le monde peut être moins conscient de l’origine de ces informations et, à long terme, moins conscient de votre valeur en tant que média.
Que recommande Taboola ?
Tout d’abord, expérimentez l’utilisation de l’IA générative, que vous la développiez vous-même ou que vous utilisiez l’un des milliers d’outils disponibles. Il s’agit d’une technologie de transformation qui n’est pas près de disparaître. Utilisez-la pour faciliter le travail des journalistes et les libérer des tâches de routine. Amusez-vous aussi avec cette technologie. Voyez ce qu’elle peut faire.
Deuxièmement, une certaine perte de trafic de recherche est inévitable, probablement pas en 2023, mais bientôt. Préparez-vous en effectuant une analyse de risque de ce qui se passerait si le trafic issu de recherches vulnérables au SGE disparaissaient. Car c’est possible.
Enfin, devenez un site de destination. Soyez une source de crédibilité dans un monde au contenu chaotique. Les médias capables d’entretenir et de développer des relations directes avec leurs visiteurs connaîtront un plus grand succès. Utilisez et créez des outils qui réduisent la distance entre vous et votre audience. Ces conseils sont aussi valables aujourd’hui qu’ils le seront dans dix ans.