Intelligence artificielle et traitement de l’information
Le traitement de l’information est défini de façon un peu simpliste dans la norme
comme « l’exécution d’opérations sur des données pour obtenir ou traiter de l’information ».L’intelligence artificielle ne serait en résumé qu’un sous-ensemble automatisé du traitement de l’information.
Quels usages ?
Nous examinerons successivement dans cet article les usages de l’IA dans les activités de traitement de l’information que sont la recherche d’information, la gestion de contenus et le journalisme numérique.
Contributions de l’IA à la recherche d’information
Moteurs de recherche et chatbots
Les moteurs de recherche sont le premier outil auquel on fait appel lorsqu’on se pose une question. Ils ont progressivement remplacé les annuaires de tout genre, dont l’annuaire papier des pages jaunes, disparu en 2020.
Voici ce qu’en dit ChatGPT dans un style un peu lourd où l’on remarquera la répétition de l’expression « peuvent également » :
Les moteurs de recherche utilisent l’IA pour améliorer la qualité des résultats de recherche en utilisant des techniques telles que l’analyse sémantique et la compréhension du langage naturel pour comprendre le contenu des pages web et les relations entre elles.
Ils peuvent également utiliser des techniques d’apprentissage automatique pour classer les pages web en fonction de leur pertinence par rapport à une requête donnée, et pour identifier les concepts et les thèmes pertinents.
Les moteurs de recherche peuvent également utiliser l’IA pour comprendre les requêtes des utilisateurs et les corriger automatiquement pour éviter les erreurs d’orthographe ou les termes mal utilisés.
Les systèmes d’IA peuvent également être utilisés pour générer des réponses directes ou des extraits pertinents pour certaines requêtes, de sorte que l’utilisateur n’a pas besoin de parcourir les résultats de recherche.
Enfin, les moteurs de recherche utilisent des techniques d’IA pour détecter les sites web frauduleux, les sites web contenant des virus et autres types de contenu malveillant, pour protéger les utilisateurs contre les sites dangereux.
Google utilise au moins depuis 2015 l’IA dans son moteur de recherche, via un algorithme d’apprentissage automatique, au doux nom de Rankbrain. Celui-ci permet d’analyser et de classer les résultats de recherche des pages. Gmail détecte les spams grâce à l’IA et Google Translate est passé au deeplearning en 2016.

Copie d’écran Microsoft Start – 17 février 2023
Les autres moteurs de recherche ne sont pas à la traîne. Microsoft intègre ChatGPT à son moteur Bing. Les utilisateurs de Windows 10 et Windows 11 auront également remarqué l’apparition dans leur barre de recherche, de Microsoft Start, service d’actualités personnalisées par une IA.
Les chatbots, ou agents conversationnels, bénéficient aujourd’hui d’une notoriété sans précédent liée à la sortie de ChatGPT. Pourtant, ils existaient déjà depuis les années soixante et se sont mis à l’IA dans les années 2000.
Une-brève-histoire-des-chatbots
Les assistants vocaux de nos smartphones sont tous à base d’IA. Moteurs de recherche et chatbots sont en voie d’intégration et la saisie d’une requête de recherche devrait s’apparenter de plus en plus à un dialogue conversationnel.
Google lance Bard, un système à base d’IA comparable à ChatGPT qui devrait alimenter Google Search.
La recherche d’images ou de vidéos se dote également d’outils intelligents. L’appli Google Lens permet d’effectuer directement une recherche à partir d’une image ou d’une vidéo.
IA et gestion de contenus
Textes
Le traitement automatique du langage (TAL en français ou NLP en anglais) n’est pas une technologie nouvelle. Son premier domaine stratégique fut celui de la traduction automatique, technologie de guerre qui a occupé les chercheurs à partir de la Seconde Guerre mondiale.
On pourra lire à ce sujet le très intéressant ouvrage de Jacqueline Léon sur l’histoire de l’automatisation des sciences du langage.
La génération de texte, telle que ChatGPT, le chatbot lancé par la startup OpenAI, l’a fait découvrir au grand public, n’est pas son seul objet. Le TAL passe d’abord par l’analyse syntaxique du langage, nécessaire pour en comprendre le fonctionnement. Les chatbots tels que ChatGPT ont pu être qualifiés de « perroquets statistiques ». Leur travail consiste, en effet, à partir d’une question ou d’un premier texte, à produire le mot suivant, sur la base de l’analyse statistique de millions de textes existants.
Le traitement automatique du langage bénéficie aujourd’hui des technologies d’apprentissage profond de l’Intelligence artificielle. Les données que sont les mots sont représentées par des vecteurs soumis aux modèles. Les fonctionnalités de traitement de texte permises par l’IA sont multiples :
- correction automatique de textes ;
- traduction ;
- sous-titrage de vidéos.
Voir des exemples de cas d’usage gpt3
De nombreuses entreprises utilisent déjà les logiciels OpenAI. Vous trouverez plus d’infographies sur Statista
À titre personnel, j’utilise Deepl pour la traduction et LanguageTool pour les corrections multilingues. Le gain en temps et qualité est appréciable.
Images et vidéos
Le traitement de l’information ne traite la forme textuelle, que ce soit sous forme écrite ou orale. La génération d’images et de vidéos s’est également développée. Plusieurs IA sont capables de générer des images à partir d’un simple texte descriptif.
Voir : meilleurs-générateurs-images-IA
Nous avons quand même obtenu d’étranges résultats avec la requête « a general meeting with men and women » :
En matière de vidéo, on citera, par exemple, GEn-1 qui génère des vidéos contenant des effets spéciaux, en transformant une vidéo « à partir de quelques mots ou d’une image d’exemple ».
Tout cela permet, bien évidemment, de générer de fausses informations (fake news) et de fausses vidéos, elles-mêmes détectables via des logiciels spécialisés.
Perspectives
Les outils de traitement de l’information se multiplient aujourd’hui grâce aux possibilités de l’IA permises par la puissance de calcul et l’accumulation des données.
L’intelligence artificielle offre de nouvelles perspectives en matière de traitement de l’information, mais pose de nombreuses questions.
Est-elle une alliée pour la presse et les journalistes ? Elle les aide à rédiger plus vite des articles purement factuels (météo, bourse, résultats sportifs…). Les journalistes devraient en principe avoir plus de temps pour écrire des articles de fond et analyser les faits. L’IA est à même de leur fournir une analyse précise de leur lectorat ainsi que des outils d’investigation et de détection de fake news s’appuyant sur l’analyse de données.
Côté lecteur, difficile de savoir à qui faire confiance devant la masse d’information déversée chaque jour. Les outils conversationnels tels que ChatGPT ne citent pas forcément leurs sources et se nourrissent d’informations qu’ils recyclent sans en vérifier la véracité. Le choix est délicat entre recouper les informations à des sources multiples… ou ne plus s’informer du tout.