Comment parler à une IA

Regardez la vidéo…

ChatGPT, GPT-3, DALLE, MidJourney, Stable Diffusion

Qu'est-ce que tous ces modèles d'IA ont en commun ? Outre être beaucoup trop coûteux à créer et très compliqués à comprendre à moins que vous ne lisiez mes articles ;), ce sont tous des modèles que les gens ordinaires comme nous peuvent utiliser pour générer des résultats étonnants ou même créer des produits grâce à du texte.

Savoir écrire ce texte est à peu près la seule compétence dont vous avez maintenant besoin pour maîtriser ces nouveaux modèles génératifs volumineux et puissants, que ce soit pour générer des histoires sympas, des images étonnantes ou toute fonctionnalité intéressante comme un outil de synthèse de texte ou un éditeur vidéo automatique. Les résultats de ces modèles ne font que s'améliorer avec le temps, mais il est souvent difficile d'obtenir exactement ce que vous recherchez. Bien que cela ne fasse que s'améliorer, la meilleure façon de tirer parti du potentiel de ces grands modèles est d'être un meilleur “ingénieur de prompt”.

Mais qu'est-ce qu'un “ingénieur de prompt” ? De plus, quelle est cette chose “prompt” dont je parle depuis une minute environ et comment pouvons-nous apprendre cette compétence et nous améliorer ? ! Eh bien, c'est exactement ce que nous verrons dans cet article…

Le “prompting” est la façon dont les humains peuvent parler aux IA. C'est une façon de dire à l'IA ce que nous voulons et comment vous le voulez, généralement avec des mots. Par exemple, vous souhaiterez peut-être générer une image. Que feriez-vous? Vous feriez la même chose qu'avec un artiste que vous engageriez : essayez de décrire ce que vous voulez avec les meilleurs mots possibles et quelques croquis si vous pouvez dessiner. C'est la même chose avec les IA les plus puissantes d'aujourd'hui. Comme nous l'avons vu dans ma vidéo précédente sur les incorporations de mots (word embeddings), les IA peuvent comprendre les mots, même si elles les comprennent différemment de nous. C'est là que l'ingénierie de prompt entre en jeu. L'ingénierie de prompt consiste à trouver l'invite de texte qui obtient les meilleurs résultats de l'IA.

Un ingénieur de prompt traduira votre idée en mots compréhensibles par l'IA : c'est un traducteur entre « langage humain » et « langage IA ». Vous pouvez voir l'ingénierie de prompt comme la même chose qu'un Googleur expert. Beaucoup de gens sont embauchés parce qu'ils savent bien utiliser Google et obtenir des réponses à leurs questions (surtout les programmeurs!), contrairement à votre père, qui peut avoir du mal à trouver ce qu'il veut en ligne. C'est parce que vous savez ce que le champ de recherche de Google s’attend à recevoir et quels mots clés sont bons ou non, contrairement à votre père. Il tape comme s'il posait ses questions à un autre être humain, ce que la machine ne peut pas comprendre.

L'invite de texte est un moyen de parler aux modèles de langage. La meilleure façon de comprendre cela est de regarder un exemple simple. Demandons à GPT-3 de résoudre un problème mathématique.

Nous pouvons voir qu'il obtiendra le mauvais résultat. Cependant, on peut encore l'adapter à l'IA, par xemple, avec le simple ajout de "Réfléchissons pas à pas", et ça réussira!

Example produit avec DALLE 2.

L'invite d'image est assez similaire; nous pouvons utiliser des mots pour décrire une image à un modèle texte-image et voir ce qu'il crée. Nous voyons que lorsque nous changeons différents descripteurs, les images générées par le modèle changent en conséquence. L'objectif de l'ingénierie rapide est d'optimiser cela.

Nous pensons qu'il est important d'apprendre cette nouvelle compétence, car les grands modèles ne feront que devenir plus disponibles et plus puissants. Il est évident que les gens seront payés juste pour les utiliser et les maîtriser, et nous voulons vous aider à y parvenir. À cette fin, avec mon ami Sander et Towards AI, nous construisons un cours gratuit en ligne appelé Learn Prompting, où vous pouvez en apprendre beaucoup sur les bonnes pratiques de “prompting” et des trucs et astuces d'experts spécifiquement orientés vers le modèle de votre choix, que ce soit ChatGPT, MidJourney ou un autre. Consultez-ce nouveau cours pour en savoir plus sur les invites de texte et le l’ingénierie de prompt et obtenir des informations d'experts dans le domaine.

Il s'agit d'un travail open source en cours, et nous visons à améliorer continuellement le cours et à ajouter de nouvelles sections intéressantes au fil du temps. Nous serions ravis si vous souhaitiez contribuer et partager vos connaissances avec plus de personnes via cette plateforme. Rejoignez la communauté Learn AI Together sur Discord pour en savoir plus sur notre nouveau cours et discuter avec nous !

Merci pour la lecture,

Louis

Louis-François Bouchard

Hello! Je suis Louis-François Bouchard, de Montréal, Canada, aussi connu sous le nom de 'What's AI' et j'essaie de partager et de vulgariser tout ce qui est en lien avec l'intelligence artificielle. Mon objectif est de démystifier la «boîte noire» de l'IA pour tous et de sensibiliser les gens aux risques de son utilisation.

https://www.youtube.com/channel/UCIUgms0TE2WhQijbU-IMYyw
Précédent
Précédent

Vieillissement du visage avec l’IA

Suivant
Suivant

Qu'est-ce que ChatGPT ?