Introduction 10 min
- Présentation objectifs 2 min
- Votre mentor du jour 2min
- Présentation du plan 1 min
- Présentation de ChatGPT 5min
- Fonctionnement
- Global : Entrainement modèle vs utilisation 2min
- Technique : Prompt, contexte, embeddings, calculs 2min
- A retenir : discussion courtes, contextes riches et précis 30s
- 3.5 vs 4 : limitations utilisation 30s
- Fonctionnement
Demonstrations 20 min
- Cas n°1 : Génération de contenu 4min
- Cas n°2 : Vision et résumé de documents 6min
- Cas n°3 : Génération d'images 3min
- Cas n°4 : Apprentissage 4min
- Cas n°5 : Code no-code 3min
Exercices 50 min
- Ex. n°1 : Traduction 5
- Ex. n°2 : Génération de contenu 5
- Ex. n°3 : Assistant 5
- Ex. n°4 : Apprentissage 5
- Exercices spécifiques 30
Conclusion 8 min
- Evolutions Journalisme x AI 4min
- Evolutions techniques à venir : mémoire, compréhension, actualisation, intégration applications 1min
- Au-delà du no-code: APIs, RAG et Fine-tuning 3 min
Ressources 2 min
- Apprendre 30s
- Être à jour 30s
- Outils 1min
- Prise en main de ChatGPT
- Connaissances possibilités, limites LLMs (LargeLanguage Models)
- Compréhension globale fonctionnement LLM
- Intuitions impact IA sur métiers
- Enseignant IA et Data Science (+ 5 ans)
- Ecole ingénieur, Université, Centres de formation
- Premières certifications IA 2017 (7 ans)
- Programmation (VBA Excel, Python) il y a 7-15 ans
- Pourquoi IA me passionne ?
Global : Entrainement modèle vs utilisation (inférence) 3min
- Modèle : métaphore apprentissage humain = entraînement cerveau sur données = 5 sens
- Données :
- texte
- large partie d'internet et livres
- représentativité monde limitée (occident, faible pourcentage personnes s'expriment sur internet)
- Entrainement = beaucoup de données et de calculs (millions d'euros)
- Utilisation = peu de données et de calculs (centimes)
Technique : Prompt, contexte, embeddings, calculs 5min
- Prompt : La demande
- Contexte : La demande + demandes précédentes + fichiers
- Embeddings : Texte transformé en listes de chiffres avec notion de similarité entre les listes
- Calculs : Next token prediction, Transformers (GPT), complexité quadratique
A retenir : discussion courtes, contextes riches et précis 30s
- Discussions taille limitée car complexité quadratique + problèmes de mémoire
- Contextes très détaillés car modèles généralistes, obtenus en pratique via discussion
ChatGPT 3.5 vs 4 1min30s
Version | Usage | Capacités compréhension | Multimodal |
---|---|---|---|
3.5 | sans limite | modérées | non |
4 | limité | très bonnes | oui (accès internet, lecture de document, d'images, génération d'images) |
Mistral | variable | bonnes | non |
Cas 1 - Génération de contenu - Revivre match France-Brésil 98 3min
Pourquoi c'est impressionnant : capacité à retranscrire ce qui semble être de l'ambiance, les personages clés et idées au-delà des faits En quoi est-ce limité : très nombreux articles écrits sur le sujet, impossible d'optenir un tel résultat sur les évènements récents et moins couverts. L'IA a fait une sorte de mélange des textes sur lesquels elle s'est entraîné. Autrement dit, l'IA ne peut reformuler que ce que les journalistes ont déjà écrit.
Cas 2 - Vision et résumé de documents - Application Pompiers Anki 5min
Tâche 1 : extraction texte d'une image qui représente un tableur
- Comment : étant une image et non un tableur Excel, nécessité extraction visuelle
- Limites temps de calcul : nécessite (aujourd'hui) de passer l'image en morceaux
- Format de sortie défini précisément
- Capacité de compréhension :
- Capable de faire le lien entre les morceaux d'images
- Capable de comprendre suffisamment pour créer des questions-réponses cohérentes, intéressantes, utiles
Tâche 2 : extraction texte d'un document PDF
- Type de PDF :
- Si format texte : pas de problème
- Si format images : nécessite OCR (donc long / coûteux), ChatGPT refusera plusieurs pages
- RGPD : Attention données sensible et privées
Cas 3 - Génération d'images - Dall-e-3 via ChatGPT 3min
À savoir
- Résultats dépendent du modèle utilisé (Dall-e, Midjourney, Stable Diffusion)
- Précisions prompt : Arrière-plan, Style artistique, Focale, Point de vue, Éclairage, Couleurs, Composition, Atmosphère
- Impact : 1 image = 1 charge d'un smartphone
Exemple
- Football :
- Plusieurs itérations utiles
- Cohérence du corps et détails
Cas 4 - Apprentissage - Maths 3min
- Gain de temps
- Fluidité, agréable
- Meilleure compréhension du concept et des détails
- Davantage de connaissance de concepts liés
- Voir également GPT : enseignant SQL
Cas 5 - Code no-code - Fonctions 3min
- Formater des informations exemple simplet
Objectif : découvrir l'excellence du modèle en terme d'interprétation du langage et connaissance des formulations dans différentes langues. Il ne s'agit pas d'une traduction littérale.
Mission
- Trouver un texte en français qui est complexe et subtil
- Le traduire en anglais via ChatGPT
- Demander de reformuler les parties qui ne conviennent pas
Ojbectif : appréhender le niveau (mitigé) de créativité du modèle
Mission
- Demander à ChatGPT de générer des textes pour : un titre d'article, la description d'un sport, un poème, une blague.
- Essayez d'améliorer les résultats en conseillant ChatGPT
Objectif : comprendre la structure classique d'un prompt pour des résultats efficaces
Mission
- Générer un plan pour un entretien avec sportif : le prompt doit utiliser la structure rôle, contexte, tâche, contraintes, format
- Demander de modifier le plan pour qu'il corresponde davantage aux besoins
- Demander de développer une section du plan
Objectif : Découvrir comment apprendre efficacement et de manière personalisée
Mission
- Découvrir un nouveau sujet (sport peu connu, méthode de comptabilité, d'écriture, d'organisation, etc.)
- Demander de reformuler, d'expliquer en détail, de donner des exemples, des métaphores.
- Sois-même essayer de reformuler et demander à ChatGPT si notre compréhension est correcte
- Effectuez les exercices qui correspondent à votre métier
- Basez-vous sur les méthodes de prompt engineering recommandées par OpenAI
- Notamment exploitez la puissance de chain-of-thoughts
- Inspirez vous éventuellemnt de ces exercices pour effectuer une tâche réelle
- Clicker ce lien : Enoncé exercices spécifiques
De quel point de vue
- Basé sur ma compréhension de l'IA et ses différences avec l'humain.
- Lectures impact IA sur marché de l'emploi (Gartner, Deloitte)
- Ceci n'est pas le résultat d'une thèse scientifique mais d'une réflexion à la fois subjective et anecdotique
Hypothèses
- Récolte information (déplacement physique)
- Interprétation évènements (émotions, atmosphère vs faits)
- Volonté et désirs (choix sujet, rendu, etc.)
Détail réflexion
Avantage de l'humain, et donc complémentarité :
- Intérêt à aller sur le terrain pour récupérer des informations qui ne sont pas disponibles, et prendre des notes sur l'atmosphère, le ressenti. Ensuite demander à ChatGPT d'aider à rédiger l'article.
- Empathie, compréhension des situations humaines, subtilités, couverture plus profonde des histoires
- Guider l'IA car par défaut les articles générés seront basiques, il faut le voir comme un stagiaire
- Vérification des infos et des faits sur sources fiables, d'autant plus important dans l'ère de la désinformation
- Intuitions : sur les sujets du moment, et ce qui est vraiment important, ce qui va plaire, intéresser, etc.
- Retravailler le contenu basique généré par l'IA : utilisations des techniques littéraires et journalistiques pour engager et captiver le lecteur. L'IA est aujourd'hui très limitée dans ce domaine.
- Ajouter humour, ou ton personnel humain qui accroche et rend authentique les récits.
- Expertise spécifique d'un domaine. Bien que ChatGpt soit bon dans des domaines pointus, les journalistes possèdent des connaissances qui ne sont disponibles nulle part, ChatGpt ne peut donc pas les connaître. Des techniques, des concepts ou infos sur des sujets de niche.
- Recul sur l'impact des histoires sur le public
- Meilleure compréhension nuancée du contexte actuel
- Tout ce qui est du non dit est presque innacessible aux IAs
- Adaptabilité et créativité de l'analyse
- Auto critique des propres biais et réflexions (ChatGpt peut le faire si on pense à lui demander)
Conclusion
- Davantage outil performant que concurrent
- Certaines tâches pourraient tendre à disparaître
- D'autres seront effectuées de manière plus fréquente, large et en profondeur
- Risque de vous distraire, peut être utile de voir ce que vous pouvez créer avant de l'utiliser, car risque d'avoir notre vision enfermée dans ses propositions.
- Biais: racisme, sexisme, ne connait que la culture occidentale, et tout biais qu'on peut retrouver sur internet
- Cognition limitée : chatgpt3.5, manque de compréhension des subtilités
- Hallucinations : surtout chatgpt3.5
- Taille de contexte limitée : pre-contexte prend de plus en plus de place, en se basant sur nos préférences, etc, donc on ne peut pas donner un ensemble de livres complets en contexte
- Taille de discussions limitée : devient très lent (complexité quadratique)
- Oubli milieu de discussion : difficile à percevoir mais démontré par études
- Retard de mise à jour : informations actuellement connues jusqu'en mars 2023s
- Créativité limitée : risque de boucler, ou dire des choses étranges (sur des requêtes de blagues par exemple)
- Limité dans ses connaissances et sa compréhension si sujet nécessite expertise pointue, d'autant plus sur un domaine où très peu d'informations sont disponibles sur internet
- Oubli (majoritairement) entre chaque conversations, donc ne peut pas rivaliser avec un humain sur des discussions de plus de 50 messages (sur les versions actuelles)
- Ne peut pas apprendre en temps réel, inutile d'essayer de lui enseigner un concept pour qu'il le connaisse (surtout en espérant retrouver dans d'autres discussions)
- Confidentialité des données : RGPD (personnes, entreprise)
- Capacité limitée à interpréter les émotions : N'a pas été fine tuneé pour être psychologue ou être un ami qui remonte le moral
- Risque de contenu offensant : même si arrive surtout lorsque l'utilisateur souhaite volontairement jail breaker les gardes fous
- Bridé dans ses réponses : précisément pour éviter les problèmes (n'est pas censé donner de conseils financiers, santé, etc). Mais jail breakable facilement (méthode "imagine ...", méthode via manipulation)
- Dépendance langage d'entrée : comprend et parle mieux l'anglais que toute autre langue. Très limité dans les langues peu représentées sur internet
- Limitations en pensée abstraite : Même si deja très avancé, compliqué pour des métaphores bien adaptée (mais bon pour exemples, puisque ne nécessite pas le même degré d'abstraction)
- Prompts évoluent : à chaque mise à jour de modèle, et sont différents en fonction des modèles (Mistral, ChatGPT)
- mémoire, compréhension, actualisation, intégration applications
- Exemple analyse ensemble des articles écrits par L'Equipe
Code & Papiers
Moocs
Youtube
Newsletters
Twitter/X
- Jim Fan
- Ian Goodfellow
- François Chollet
- Sam Altman
- Kyutai
- Sebastian Thrun
- Prof. Anima Anandkumar
- Thomas G. Dietterich
- Chelsea Finn
- Allen Institute for AI
- Berkeley AI Research
- Poe
- Perplexity labs
- OpenAI Playground
- LLM Finder
- Custom ChatGPT
- Purple Llama pour evaluer la sécurité des LLMs
- Mistral AI
- Leaderboards
- Génération d'images
- Midjourney: www.midjourney.com
- Leonardo AI: leonardo.ai
- Pixlr: pixlr.com
- Yodayo: yodayo.com
- NightCafe: creator.nightcafe.studio
- Playground AI: playgroundai.com
- Visme: visme.co
- DALL-E: OpenAI ou ChatGPT
- Deep AI: deepai.org
- Runway AI: runwayml.com
- Bing Image Creator: Bing
- Génération d'images réalistes
- Midjourney V6 en ajoutant "posted on reddit in 2018" ou "posted on snapchat in 2018"
- 3D Genie : génération d'objets en 3D
- Amélioration de la définition d'une image (upscale)
- Leader mais payant : Magnific.ai
- Gratuit : Krea
- Pika labs: pika
- Elai.io: elai.io
- Runway: runwayml.com
- Filmora: filmora.wondershare.com
- DeepBrain AI: deepbrain.ai
- Veed.io: veed.io
- Synthesia: synthesia.io
- Synthesys: synthesys.io
- D-ID: d-id.com
- Pictory: pictory.ai
- Transformer la voix en musique
- Retranscription d'un fichier audio avec insanely-fast-whisper
- Modifier la voix "speech to speech" - Elevenlabs
- Google Speech-to-Text: cloud.google.com/speech-to-text
- IBM Watson Speech to Text: www.ibm.com/cloud/watson-speech-to-text
- Rev.com: www.rev.com
- Otter.ai: otter.ai
- Sonix: sonix.ai
- Trint: www.trint.com
- Amberscript: www.amberscript.com
- Descript: www.descript.com
- Happy Scribe: www.happyscribe.com