Récemment, j’attendais que mes ongles sèchent et je ne voulais pas abîmer le vernis, quand j’ai réalisé que c’était l’occasion parfaite pour tester certaines fonctionnalités d’intelligence artificielle uniquement vocales. Les propriétaires de voitures de la Silicon Valley ont de longues conversations avec ChatGPT pendant qu’ils conduisent, et je voulais essayer de discuter sans les mains avant de rencontrer plus tard dans la journée deux responsables de produit chez OpenAI.
Même si les chatbots peuvent être utiles pour les séances de brainstorming, parler à ChatGPT était comme collaborer avec un ami trop caféiné qui ne supporte pas une seconde de silence. Je luttai vaillamment contre l’outil d’intelligence artificielle pour finir une seule pensée complète avant qu’il ne me coupe.
Moi : J’ai écrit une newsletter appelée AI Unlocked l’année dernière pour nos lecteurs. Dans cette newsletter, je…
ChatGPT : Parlez-moi davantage de votre newsletter et de la question spécifique que vous avez en tête à ce sujet.
Seulement quelques minutes après le début de l’expérience, j’ai ressenti une sorte de trac induit par la parole synthétique et j’ai supplié le chatbot de me donner plus de temps, lui demandant de me laisser une seconde pour réfléchir entre les phrases. Le chatbot m’a encouragé à ralentir, bien que la rapidité de ses réponses soit restée inchangée.
Lorsque j’ai mentionné l’anxiété que j’ai ressentie en discutant avec l’IA à Joanne Jang, une responsable du comportement modèle pour ChatGPT, elle a expliqué que c’était un aspect de l’expérience utilisateur que l’entreprise essaie de corriger dans le modèle d’IA. “Dans notre monde idéal, le modèle serait en fait un peu meilleur pour détecter quand vous avez terminé. Ainsi, si vous n’avez pas fini votre phrase, il ne vous couperait pas,” dit Jang. “C’est quelque chose que nous essayons de résoudre, et nous savons que c’est un point douloureux pour nos utilisateurs.”
Avec la mise en garde que vous ne devriez pas faire cela en conduisant, elle a suggéré une solution simple pour les utilisateurs : Tapez simplement sur l’écran. Tant que vous avez un doigt libre, vous pouvez taper et maintenir le grand cercle au centre de l’application pendant les conversations avec le ChatGPT. Gardez votre doigt là pendant que vous parlez pour éviter toute interruption du bot ; relâchez-le lorsque vous avez vraiment terminé votre invite vocale.
Alors que Nick Turley, responsable produit chez ChatGPT, a dit qu’il préfère utiliser la fonction de conversation aller-retour, disponible dans l’application en touchant l’icône du casque, il recommande une autre méthode d’interaction auditive pour les utilisateurs qui ont besoin de plus de temps et veulent ralentir un peu les choses, ou qui trouvent simplement le rythme par défaut de la conversation IA maladroit.
Dans l’application mobile, tapez sur l’icône du microphone à côté des écouteurs. Dites ce que vous souhaitez utiliser dans votre invite, puis touchez la zone bleue pour arrêter l’enregistrement une fois terminé. ChatGPT convertira l’audio en texte et l’ajoutera au champ de l’invite. Après avoir appuyé sur Envoyer, écoutez la réponse de ChatGPT en maintenant une pression longue sur la sortie, puis en sélectionnant Lire à haute voix. Ce processus ralenti est une manière agréable d’interagir vocalement avec l’outil IA à votre propre rythme, pour ceux qui pourraient être stressés par les réponses verbales rapides du service.
Malgré ses défauts, cet outil est déjà plus captivant que toute interaction que j’ai eue avec un assistant vocal de génération précédente, comme Siri ou Alexa. Depuis le lancement de Siri il y a plus d’une décennie, les assistants vocaux n’ont cessé de s’améliorer, mais ils n’ont pas réussi à transformer radicalement la façon dont les utilisateurs interagissent avec la technologie au quotidien. Je rédige toujours cet article sur un ordinateur portable, je ne dicte pas mes pensées à Alexa. De même, j’utilise mon Google Nest Mini pour écouter de la musique et régler des minuteries de cuisine, et c’est à peu près tout.
Les deux responsables produit d’OpenAI semblent impatients d’inaugurer l’ère de l’assistant vocal ChatGPT. ” Nous espérons le faire évoluer de plus en plus vers un assistant “, dit Turley. ” Cela signifie vous donner des moyens plus naturels de lui parler. ” Il est fort probable que ChatGPT sera bientôt capable de s’adapter à mon rythme de conversation et de réduire les interruptions agaçantes. L’entreprise a récemment annoncé un modèle séparé de moteur vocal qui peut recréer la voix de n’importe qui avec juste un petit extrait audio. Par exemple, un professionnel de la vente pourrait configurer un assistant vocal IA qui gère les appels entrants en utilisant leur style de parole, ou des proches endeuillés pourraient créer une imitation synthétique de la voix d’un être cher décédé.
Bien que ChatGPT soit un acteur dominant dans l’écosystème des chatbots IA, OpenAI n’est pas la seule entreprise avec un assistant vocal unique et alimenté par l’IA. Par exemple, l’Assistant Google a bénéficié d’une refonte avec IA générative l’année dernière. Rabbit et Humane explorent tous deux l’idée de matériel axé sur l’IA qui utilise les commandes vocales comme mode d’interaction principal. Une autre startup, Hume, a récemment lancé un aperçu d’un logiciel centré sur l’émotion, appelé l’Interface Vocale Empathique, qui tente d’adapter les sorties émotionnelles de l’IA au ton qu’elle détecte dans vos invites vocales ; si vous agissez de manière ridicule ou sombre, elle change d’humeur pour refléter la vôtre.
Les avancées en IA générative conduiront-elles à un autre moment révolutionnaire d’utilité accrue pour les assistants vocaux ? En 2018, Lauren Goode, reporter senior chez WIRED, écrivait à propos de l’awkwardness d’Amazon Alexa : ” Quand ces choses deviendront plus utiles, nous ne le remarquerons probablement pas. Au lieu de cela, la technologie évoluera simplement autour de nous. ” Peut-être que je ne reconnaîtrai pas l’importance des assistants vocaux tant qu’ils ne feront pas partie de ma routine quotidienne, mais je le remarquerai immédiatement chaque fois qu’ils cesseront de me couper la parole.
No Responses