Les marques deviennent curieuses de la manière dont elles sont perçues par les modèles d’IA.
Les gens se tournent de plus en plus vers les grands modèles de langage (LLMs) pour rechercher des informations sur les produits (voir : des chatbots comme ChatGPT ou des outils de recherche IA comme Perplexity). Il n’est donc pas surprenant que les entreprises soient de plus en plus préoccupées par la manière dont ces LLMs perçoivent leur marque.
Jack Smyth, directeur des solutions chez l’agence de marketing numérique Jellyfish, mène des recherches pour comprendre pourquoi certaines sollicitations des utilisateurs amènent les LLMs à mentionner des marques. Les LLMs organisent les mots et les expressions, y compris les noms de marques, dans un immense espace vectoriel selon leur signification et les contextes dans lesquels ils sont souvent utilisés. Ainsi, par exemple, un LLM pourrait associer le nom d’un produit de lotion au terme “doux”.
Mais que se passe-t-il si le modèle échoue à associer un certain terme au produit ? Ou pire encore, si le LLM associe le nom du produit à un terme négatif. Smyth dit qu’il a parlé à des entreprises financières qui essaient de s’assurer que les LLMs n’associent pas leurs noms de marque à quoi que ce soit lié à “ESG” ou “woke” pendant une année électorale.
Bien que les entreprises ne puissent pas changer ce que les modèles “savent” déjà sur la marque, elles peuvent mettre de nouveaux contenus dans l’espace d’information dans l’espoir qu’ils atteindront et influenceront les modèles d’IA. Pour l’instant, cette exposition se produit principalement lorsque un modèle est entraîné en utilisant une version compressée énorme de tout le contenu sur Internet, mais cela pourrait changer. “À mesure que ces modèles seront connectés par défaut au web ouvert, ce qui est le meilleur moyen de s’assurer qu’ils sont aussi utiles que possible, ils vont ingérer de plus en plus de contenu thématique ou récent”, me dit Smyth.
“C’est presque comme une chirurgie de modèle ou une optimisation adversariale, et c’est là que cela devient vraiment amusant car nous devons déterminer quel type de contenu aura le plus grand impact sur ce modèle”, dit-il. Smyth croit que les LLMs seront de plus en plus entraînés en regardant des vidéos sur le web. “Notre hypothèse de travail est que la vidéo — simplement parce que c’est un format plus riche ou qu’elle pourrait attirer plus de regards sur elle — sera probablement assez significative.” Il dit avoir également conseillé aux marques d’examiner tout le corpus de médias qu’elles ont publié au fil des ans, et d’éliminer tout ce qui pourrait avoir envoyé les mauvais messages.
La nouvelle recherche sur le modèle de langage d’Apple révèle une stratégie pour améliorer Siri.
Apple souhaite permettre à un modèle de langage compact sur votre iPhone de ” voir ” le contenu des applications et des sites web que vous avez ouverts sur votre écran ou qui fonctionnent en arrière-plan. Dans un nouveau document, les chercheurs en IA de l’entreprise proposent une méthode de création d’une représentation textuelle complète de ce contenu (et de sa place sur l’écran) afin que le modèle de langage puisse le comprendre et l’utiliser dans les conversations avec l’utilisateur. ” À notre connaissance, ceci est le premier travail utilisant un grand modèle de langage qui vise à encoder le contexte à partir d’un écran “, écrivent les chercheurs dans le répertoire en libre accès ArXiv.
Par exemple, si un utilisateur regarde une liste d’entreprises à proximité dans l’application Plans, il pourrait simplement demander ” Quelles sont les heures pour la dernière de la liste ? ” sans avoir à nommer l’entreprise. Ou, si un utilisateur consulte une liste de numéros de téléphone sur la page Nous contacter d’un site web, il pourrait dire à Siri de ” appeler le numéro de l’entreprise “.
L’une des histoires les plus fascinantes dans l’IA générative est l’élargissement de l’ensemble des types de données que les modèles peuvent accéder, référencer et apprendre. Les premiers LLM ne pouvaient traiter que du texte provenant d’Internet, mais les nouveaux modèles multimodaux peuvent comprendre l’audio et la vidéo. Un futur iPhone pourrait être capable de ” voir ” le contenu des applications sur votre téléphone, mais la grande opportunité pour Apple est d’informer Siri avec plus de types de données que l’iPhone peut déjà collecter, tels que l’environnement audio capté par les microphones, le monde tel qu’il est vu à travers la caméra, et le mouvement et les déplacements détectés par les capteurs.
POURQUOI OPENAI A SUPPRIMÉ L’OBLIGATION DE CONNEXION POUR CHATGPT
OpenAI n’exige plus que les personnes créent un compte avant d’utiliser ChatGPT. Les utilisateurs peuvent simplement cliquer sur l’application ou le site web et commencer à interagir. La société annonce qu’elle déploie progressivement ChatGPT sans inscription, dans le but de « rendre l’IA accessible à toute personne curieuse de ses capacités ».
Cette démarche est logique quand on pense aux raisons pour lesquelles OpenAI a rendu son chatbot public au départ. Beaucoup de ses chercheurs ont rejoint l’entreprise parce qu’ils voulaient exposer l’IA à de vrais utilisateurs au lieu de simplement rédiger des articles de recherche à son sujet. L’idée est qu’ils peuvent apprendre beaucoup sur la manière dont le chatbot peut être utilisé, et mal utilisé, par les gens dans des situations quotidiennes.
La société souhaite également utiliser les dialogues que les utilisateurs entretiennent avec ChatGPT pour former leurs modèles d’IA. Le contenu généré par les utilisateurs peut être aussi précieux pour les entreprises d’IA qu’il l’est pour les réseaux sociaux. En supprimant l’inscription, OpenAI élimine un obstacle à la collecte de données d’entraînement. (La société précise toutefois que les utilisateurs peuvent choisir de ne pas permettre l’utilisation de leurs conversations pour l’entraînement.)
Maintenant que n’importe qui peut utiliser ChatGPT, le risque que quelqu’un utilise l’outil à des fins nuisibles peut augmenter. OpenAI déclare qu’elle met en place des garanties de contenu supplémentaires pour les utilisateurs sans comptes et bloquera un éventail plus large de sollicitations.
La démarche d’OpenAI peut également être une tentative d’inciter de nouveaux utilisateurs à essayer ChatGPT plutôt que n’importe lequel de l’ensemble d’alternatives de plus en plus performantes, comme le Gemini de Google. Les données de SimilarWeb montrent que les visites du service ChatGPT sur mobile et ordinateur étaient en baisse de 2,7 % en février par rapport à janvier, et en baisse de 11 % par rapport au pic de sa popularité en mai 2023.
No Responses