ChatGPT

12 mars 2023

Typologie et modèles de languages

Qu’est-ce que maîtriser le langage ? Si l’on devait faire une analogie avec la linguistique, les langues sont apprises et enseignées à partir de 4 compétences langagières de base : • Compréhension écrite (modèles de compréhension) • Compréhension orale (modèles de compréhension) • Expression écrite (modèles d’expression) • Expression orale (modèles d’expression) Comment l’ordinateur et l’humain comprennent-ils le langage ? En comparaison avec les machines, l’acquisition du langage chez les êtres humains se déroule différemment. En effet, les humains peuvent comprendre celui-ci avant même de savoir lire. Cela signifie que, dès leur plus jeune âge, ils sont capables de communiquer sans nécessairement connaître les règles grammaticales. Au fil du temps, ceux-ci apprennent à transformer leur langage oral en langage écrit, leur permettant ainsi de lire et d’écrire. Une fois qu’ils ont maîtrisé la lecture, ils peuvent apprendre à reconnaître des mots qu’ils connaissaient déjà uniquement à l’oral. Les machines, quant à elles, ne sont pas capables d’interpréter le langage de cette façon. Les chercheurs doivent donc développer des systèmes qui leur permettent de traiter le texte sans avoir la capacité, comme les humains, de relier les sons à la signification des mots. Ainsi, ces systèmes doivent être bâtis sur des méthodes qui n’ont pas de connaissance préalable du langage. Cela crée le dilemme classique de “la poule et l’œuf” : comment les machines peuvent-elles commencer à traiter du texte si elles ne connaissent rien à la grammaire, aux sons, aux mots ou aux phrases. La solution est d’utiliser ce que l’on appelle des modèles de langage. Ces modèles sont en quelque sorte des cerveaux numériques qui comprennent le langage humain et permettent aux machines de réaliser certaines tâches telles que la: • Traduction automatique • Reconnaissance de la parole • Récupération de l’information • Génération d’articles de presse Compréhension de l’ordinateur L’architecture utilisée pour que l’ordinateur apprenne et maîtrise notre langage est composée d’un encodeur et d’un décodeur. Pour mieux comprendre ce processus, il est possible de réaliser une expérience de pensée : 1. Tout d’abord, choisir un objet dans l’environnement proche et le fixer du regard pendant une dizaine de secondes 2. Ensuite, imaginer cet objet dans sa tête. 3. Finalement, prendre un crayon et essayer de dessiner cet objet. Concrètement nous venons de (1) encoder l’objet dans ta tête, (2) se l’imaginer en représentation compressée que l’on appelle aussi représentation latente, (3) décoder l’objet sur papier. Ce processus permet de comprendre comment un ordinateur apprend et utilise un modèle de langage. Lors de cette expérience de pensée, l’objet est d’abord encodé dans la tête de la personne (1), puis il est imaginé dans une représentation compressée, également appelée représentation latente (2). Enfin, l’objet est décodé sur le papier (3). C’est exactement comme ça qu’un ordinateur apprend et utilise un modèle de langage. La représentation latente représente une version compressée de l’image de l’objet. C’est à ce niveau que l’on peut puiser dans sa base de connaissances pour établir des liens avec l’information qui a été encodée. En pratique, au lieu de montrer un objet, il est possible de donner une description plus ou moins précise de ses caractéristiques. La personne essaiera alors de s’imaginer l’objet avant de le dessiner. On peut répéter cette logique avec toutes sortes de systèmes de signes. Modèles de langage La même logique peut être appliquée pour le traitement du langage naturel. Dans le cas de la traduction, l’architecture encodeur-décodeur peut être comparée à deux traducteurs humains qui parlent seulement deux langues : leur langue maternelle et une langue imaginaire qu’ils ont en commun. Par exemple, s’ils parlent l’allemand et le français, l’encodeur convertira la phrase allemande en la langue imaginaire qu’ils partagent, et le décodeur pourra alors traduire la phrase en français. Cette approche permet de traduire des phrases d’une langue à une autre en utilisant une langue intermédiaire commune. Cette méthode est utilisée dans les systèmes de traduction automatique qui sont basés sur des modèles de langage et des algorithmes d’apprentissage automatique. Il est également possible d’utiliser cette architecture encodeur-décodeur pour d’autres tâches, comme la génération de textes. Par exemple, l’encodeur pourrait fournir un contexte et le décodeur serait responsable de produire un article de presse. Transformers L’architecture Transformer a été développée par Google en 2017. Elle permet d’entraîner notre fameux modèle de langage. Cette architecture utilise un encodeur et un décodeur, comme introduit précédemment. Toutefois, elle intègre un nouveau mécanisme appelé l’attention pour permettre à l’ordinateur de mieux comprendre le contexte d’une phrase. En effet, les méthodes précédentes avaient des limites de mémoire qui ne permettaient pas de comprendre le contexte complet d’une phrase. Les Transformers ont connu un succès fulgurant en raison de leur efficacité à traiter le texte et ont établi de nouveaux standards en termes de performance. Cette architecture a permis des avancées significatives dans le domaine de la compréhension du langage naturel, notamment autour de la traduction automatique et de la génération de texte. Les modèles de compréhension et d’expression sont deux applications clés de ces modèles, Les modèles de compréhension Les modèles de compréhension utilisent la portion encodeur d’un modèle de langage. C’est comme si l’on donnait à un humain un texte et qu’on lui demandait de faire des tâches directement sur ce texte. Le modèle le plus connu est BERT. Les modèles d’expression Les modèles d’expression (ou modèles génératifs) utilisent la portion encodeur puis décodeur d’un modèle de langage. C’est comme si l’on donnait à un humain un contexte et qu’on lui demandait de créer du contenu à partir de celui-ci. Le modèle le plus connu est GPT-3 aussi utilisé par ChatGPT. Comment ces modèles sont-ils entraînés ? Les modèles de compréhension Afin de comprendre un texte, il est important de comprendre les mots qui le composent ainsi que leur contexte. C’est l’idée qui est utilisée ici pour les modèles de compréhension. Le modèle reçoit une séquence de mots et doit prédire le mot manquant dans la séquence en se basant sur le contexte fourni par les mots environnants. Exemple : Le

En savoir plus+

Enjeux pédagogiques

11 mars 2023

Les agents conversationnels et l’intelligence artificielle : une révolution pour l’expérience client

Dans cette vidéo, Sandrine Prom Tep et Claudine Bonneau, professeures à l’UQAM, discutent avec des experts du domaine des chatbots et de l’intelligence artificielle (IA) pour mieux comprendre leur fonctionnement et leurs applications. Les chatbots sont intégrés dans diverses plateformes, comme les sites Web, les applications mobiles et les services de messagerie tels que Messenger de Facebook. Ils peuvent être basés sur des règles précises et une architecture d’arbre de décision ou utiliser l’IA pour offrir une expérience plus fluide et adaptable. Simon Taille, scientifique de données chez ElligencIA, explique que les chatbots basés sur l’IA nécessitent une phase de préentrainement pour acquérir une compréhension du langage. Ils peuvent être ensuite entraînés pour effectuer des tâches spécifiques. Les chatbots de type génératif génèrent des réponses en fonction du contexte, tandis que les chatbots non génératifs puisent des réponses préexistantes dans une base de connaissances. Pour améliorer un chatbot, il est important de vérifier la qualité des données d’entraînement et d’ajouter des exemples pertinents. Les interactions avec les utilisateurs humains peuvent également être utilisées pour réentraîner le chatbot et le rendre plus précis. Pierre Rosin, chef de produit IA au Centre Collégial de transfert de technologie JACOBB, souligne l’importance du traitement automatique du langage naturel (TALN) dans le développement des chatbots. Le TALN est une sous-branche de l’IA qui traite les données textuelles non structurées. Des modèles tels que GPT-3 d’OpenAI représentent des avancées majeures dans ce domaine. En résumé, les chatbots et l’intelligence artificielle révolutionnent l’expérience client en offrant des interactions plus fluides et personnalisées. La qualité et la quantité des données d’entraînement sont essentielles pour créer des chatbots performants et adaptés aux besoins des utilisateurs.

En savoir plus+

Outils et tutoriels

8 mars 2023

Introduction à la génération de texte avec l’IA (ChatGPT)

Dans cette vidéo, nous explorons les différentes utilisations de ChatGPT, une intelligence artificielle développée par OpenAI, et comment elle peut être bénéfique dans un contexte éducatif. Nous examinons trois cas d’utilisation qui démontrent la polyvalence et les limitations de ChatGPT. 1. Génération d’idées: ChatGPT peut être utilisé pour générer des idées et des concepts à partir d’un sujet donné, par exemple proposer des recettes à base de carottes. Cette application peut être utile dans un contexte scolaire pour stimuler la créativité des élèves et les aider à surmonter le syndrome de la page blanche. 2. Vulgarisation de concepts: ChatGPT peut expliquer et vulgariser des concepts complexes comme le théorème de Pythagore, en adaptant l’explication à un public cible spécifique, par exemple, des étudiants de secondaire 2. Cependant, il est important de noter que la véracité des informations fournies par ChatGPT peut être limitée pour des domaines d’expertise moins documentés en ligne. 3. Rétroaction rapide: ChatGPT peut servir d’outil de révision pour des textes spécifiques, comme une lettre de motivation. Il peut analyser et suggérer des améliorations, ou encore aider à rendre un texte plus inclusif en proposant des modifications non genrées. Cela peut être particulièrement utile pour les enseignants qui souhaitent fournir des retours rapides à leurs élèves.

En savoir plus+

Typologie et modèles de languages

Les agents conversationnels et l’intelligence artificielle : une révolution pour l’expérience client

Introduction à la génération de texte avec l’IA (ChatGPT)

Intégrer l’IA en classe ?

Derniers articles