Nous avons maintenant largement dépassé le premier anniversaire de la sortie de ChatGPT. Le chatbot a reçu de nombreuses mises à jour depuis lors, qui ont ajouté des fonctionnalités comme les instructions personnalisées, les GPTs et de nouveaux modèles comme le GPT-4 Turbo. Mais la concurrence s’est également intensifiée au cours de l’année écoulée, avec Microsoft Copilot et le Gemini de Google qui parfois fournissent de meilleurs résultats que ChatGPT.
Ainsi, même si le chatbot reste populaire à ce jour, je crois que ChatGPT pourrait tirer inspiration de la concurrence. Dans cette optique, voici cinq choses que j’aimerais voir de la part de ChatGPT dans les mois à venir.
1. Recherche et vérification des faits pour tous
Les modèles de langage de grande taille, comme celui qui alimente ChatGPT, souffrent tous d’un problème majeur : les hallucinations. Ce terme fait référence à la tendance de l’IA moderne à générer du texte qui semble plausible en surface mais est rempli d’inexactitudes factuelles ou d’informations carrément fausses. Cet effet peut être considérablement atténué en « connectant » ChatGPT à internet, un peu comme vous et moi pourrions chercher une requête sur Google.
ChatGPT a acquis la capacité de rechercher sur internet début 2023, mais cette fonctionnalité a été verrouillée derrière un paywall depuis. Plus précisément, vous devez payer 20 dollars par mois pour ChatGPT Plus afin d’ajouter le support de navigation web. D’autre part, nous avons des chatbots comme Copilot, Perplexity AI et Gemini qui offrent cette fonctionnalité de manière standard et gratuite.
Avec cela à l’esprit, j’espère qu’OpenAI rendra le support de navigation web accessible à tous les utilisateurs, qu’ils aient ou non un abonnement actif. L’alternative est dangereuse car cela signifie que ChatGPT pourrait continuer à émettre des informations inexactes et ternir sa réputation à long terme. Je ne pense pas non plus demander trop — OpenAI peut continuer à garder le modèle GPT-4 nettement meilleur verrouillé derrière son abonnement.
2. Améliorations de l’art généré par IA et édition d’images
Bien que ChatGPT ait commencé uniquement comme un chatbot basé sur le texte, il a finalement acquis la capacité de créer de l’art généré par IA. Il utilise sous le capot le modèle de texte en image DALL-E d’OpenAI, ce qui signifie qu’il fournit d’excellents résultats. Cependant, il manque de nombreuses fonctionnalités que vous obtiendriez en utilisant directement le générateur d’images IA.
La seule chose que ChatGPT peut faire est de créer une image basée sur une invite textuelle. Vous ne pouvez pas demander de modifications mineures au sein d’une seule image, à moins que cela ne vous dérange pas que le chatbot crée un tout nouvel ensemble d’images. Vous ne pouvez également pas télécharger vos propres photos ou images et demander à l’IA d’effectuer des modifications dessus, même si cette fonctionnalité est disponible dans DALL-E. Enfin, ChatGPT ne peut pas augmenter la résolution de vos images préférées. Une solution de contournement consiste à utiliser l’interpréteur de code de ChatGPT pour effectuer des modifications de base (comme illustré ci-dessus) mais cela utilise simplement des outils programmatiques plutôt que l’IA.
Étant donné que ChatGPT réserve la génération d’images à un abonnement payant, j’espérerais que ces fonctionnalités liées à l’art IA se frayent un chemin vers le chatbot. Après tout, des concurrents comme Stable Diffusion et Midjourney offrent toutes ces fonctionnalités quelle que soit votre tranche d’abonnement. Même la suite logicielle IA Galaxy de Samsung vous permet maintenant d’effectuer des modifications d’images basées sur l’IA sur votre smartphone gratuitement.
3. Une expérience complète d’assistant numérique
Il y a quelques mois, j’ai longuement écrit sur la fonctionnalité de chat vocal de ChatGPT qui vous permet d’avoir de longues conversations aller-retour avec le chatbot. La fonctionnalité a finalement quitté l’abonnement payant, ce qui signifie que tout le monde peut désormais l’utiliser. Cependant, c’est encore une fonctionnalité relativement méconnue que la plupart ne connaissent même pas.
Le mode est uniquement disponible via l’application mobile et c’est actuellement juste une extension vocale du chatbot. En avançant rapidement jusqu’à plus tôt cette année, nous avons trouvé du code suggérant que ChatGPT permettrait bientôt de le définir comme assistant par défaut sur Android. Malheureusement, Google a devancé ChatGPT avec le lancement de Gemini en février, qui vous permet maintenant de remplacer l’Assistant et même d’effectuer des tâches basiques comme la mise en place de rappels.
Pour ceux d’entre nous qui préfèrent l’expérience conversationnelle de ChatGPT, cependant, j’espère que la fonctionnalité continuera de progresser. J’ai également hâte que le chatbot puisse faire des choses comme régler des minuteries, récupérer les actualités et contrôler ma maison intelligente.
Pour l’instant, vous devrez entrer dans l’application mobile ChatGPT et taper sur l’icône des écouteurs chaque fois que vous souhaiteriez poser quelques questions. Ça paraît très dépassé, je sais.
4. Une expérience moins bavarde
Vous pouvez penser que je suis fou de demander à un chatbot de produire moins de texte, mais écoutez-moi. Lorsque vous posez une question à ChatGPT, la plupart du temps, vous cherchez souvent juste un petit morceau d’information. Alors, pourquoi dois-je subir un long préambule avant d’obtenir la réponse à chaque fois que j’utilise ChatGPT ? Avec Siri et Google Assistant, je souhaitais des réponses plus longues, mais ChatGPT va à l’autre extrême.
Je crois que Microsoft Copilot a trouvé l’équilibre parfait entre être verbeux et informatif. Il propose trois différents modes de chat : Créatif, Équilibré et Précis que vous pouvez choisir à chaque fois que vous initiez une conversation. Comme vous pouvez l’attendre de leurs titres, Précis condensera la sortie du chatbot en juste quelques phrases tandis que Créatif vous donne une réponse plus semblable à ChatGPT.
ChatGPT avec des réponses moins verbeuses ou différents modes de chat me motiverait à utiliser le chatbot plus souvent, bien que j’espère que cela ne se fasse pas au détriment de la précision.
5. Intégrations natives avec des services externes
If you’ve ever used Gemini, you may have noticed that it can read your emails from Gmail and even interact with various Google services like Docs, Maps, and Flights. It’s a level of cohesiveness that you’d expect from a true digital assistant, but the experience is entirely absent when you use ChatGPT.
Even on the paid tier, you can only use the custom GPTs feature to interact with outside platforms like Wolfram Alpha and Kayak. While useful, they require you to go out of your way to enable and only last for the duration of your chat. It also doesn’t help that OpenAI has now discontinued the Plugins feature, which brought multiple external services into your chat simultaneously.
I believe that a true next-generation ChatGPT would be one that interacts with third-party services on my behalf, without prior instruction. Likewise, I think the chatbot would be a lot more useful if it could read my email and calendar (with prior consent, of course). These changes would make ChatGPT feel more personalized and give it more autonomy.
No Responses