ChatGPT joue à Red Dead Redemption II – Le système de vision IA a été submergé

Un groupe de chercheurs de Chine et de Singapour a récemment publié un article détaillant le défi de faire jouer une IA à Red Dead Redemption II (RDR2). Ils ont également évalué et commenté la performance de jeu de l’IA. Dans l’article intitulé “Towards General Computer Control: A Multimodal Agent for Red Dead Redemption II as a Case Study” (PDF), nous découvrons le concept de Contrôle Général de l’Ordinateur (GCC) pour les IA, ainsi qu’un cadre à six modules appelé CRADLE, utilisé pour interfacer entre GPT-4V et RDR2. Dans leur conclusion, les principaux problèmes auxquels fait face l’agent de jeu IA sont attribués au système de vision GPT-4V.

Selon le document de recherche, ce projet de jeu RDR2 offre un aperçu de la progression des IA vers l’atteinte de l’Intelligence Générale Artificielle (AGI). À cette fin, ils essaient essentiellement de faire interagir une IA, alimentée par GPT-4V d’OpenAI, avec un ordinateur – en prenant en compte les indices visuels et auditifs pour utiliser intelligemment l’ordinateur, comme le ferait un humain averti en informatique. Ainsi, ils tentent de démontrer qu’une IA peut réussir à contrôler un ordinateur de manière complexe (GCC).

Les chercheurs ont choisi RDR2 comme jeu à mettre en lumière car ils affirment qu’il possède “un système de contrôle complexe boîte noire, qui incarne les tâches informatiques les plus exigeantes et nous permet d’évaluer les limites de performance de notre cadre dans de tels environnements virtuels.” En effet, il offre des environnements riches et diverses situations que les joueurs doivent naviguer. De plus, des éléments d’interface utilisateur tels que des dialogues, des icônes uniques, des invites en jeu et des instructions garantissent qu’aucune connaissance préalable n’est présupposée – ce qui est idéal pour l’apprentissage de l’IA. Enfin, les chercheurs disent que le contrôle du jeu RDR2 via une souris et un clavier offre un meilleur entraînement pour le GCC que la plupart des autres logiciels qu’un utilisateur d’ordinateur pourrait exécuter au quotidien.

La capacité de reconnaissance spatiale-visuelle de GPT-4V est insuffisante pour un contrôle précis et détaillé

Bien que l’article publié se concentre sur RDR2, CRADLE est conçu pour être étendu dans le cadre de son objectif GCC, ” pour soutenir un spectre plus large de jeux, tels que les jeux de simulation et de stratégie, ainsi que diverses applications logicielles. ” L’innovation clé ici est l’introduction du cadre CRADLE, examinons cela de plus près maintenant.

Ci-dessus, vous pouvez voir un aperçu de la manière dont CRADLE gère le défi du jeu GCC, spécifiquement dans RDR2. Les chercheurs espéraient démontrer la capacité de CRADLE à apprendre le jeu à partir de zéro (sans accès à aucun état interne du jeu ou API) tout comme un humain. Ensuite, l’agent IA devait progresser dans le jeu en naviguant dans le monde et en accomplissant des tâches, en suivant l’intrigue principale dans RDR2.

Dans l’ensemble, CRADLE semble avoir été modérément réussi dans les jeux RDR2. Les chercheurs disent qu’ils ont évalué même des tâches représentatives de l’intrigue principale et des missions ouvertes. La conclusion principale était que ” CRADLE peut accomplir toutes les tâches de l’intrigue principale de manière cohérente. ” Quelques exceptions notables étaient : Protéger Dutch qui implique une bataille de fusillade rapide, Chercher dans la Maison qui nécessite que l’agent explore un environnement intérieur complexe, et la tâche ouverte avec un long horizon.

Vous pouvez voir l’importance de l’inférence et de la réflexion sur les tâches dans CRADLE, ci-dessus. Ces raffinements sont particulièrement importants dans le mouvement de l’agent à travers le jeu et la compréhension de quand les tâches sont complètes. Au cours de l’étude, certaines des difficultés répétées rencontrées par CRADLE ont été attribuées à GPT4-V. Plus précisément, il est affirmé que ” la capacité de reconnaissance spatiale-visuelle de GPT-4V est insuffisante pour un contrôle précis et détaillé. ” De plus, il est dit que GPT4-V a du mal avec des concepts spécifiques au domaine, tels que des icônes uniques dans le jeu, avec la compréhension des mini-cartes, ainsi qu’avec les obstacles généraux dans l’environnement de jeu.

Tags:

No Responses

Leave a Reply

Your email address will not be published. Required fields are marked *

BLOG

NARA interdit l'utilisation de ChatGPT sur les réseaux de l'agence

NARA interdit l’utilisation de ChatGPT sur les réseaux de l’agence

Les Archives nationales et l’Administration des dossiers ont été la dernière agence fédérale à interdire à ses employés d’utiliser ChatGPT à des fins professionnelles, invoquant un “risque inacceptable” pour les données de l’agence. La décision politique découle des préoccupations des responsables de l’agence selon lesquelles les données que les employés saisissent comme stimuli dans la […]

La violation continue des droits d'auteur est une douleur pour Microsoft et OpenAI

La violation continue des droits d’auteur est une douleur pour Microsoft et OpenAI

Microsoft et OpenAI ont été frappés par une poursuite déposée par huit éditeurs de journaux concernant des problèmes liés au droit d’auteur. Ce que vous devez savoir Microsoft et OpenAI ont été visés par une poursuite déposée par huit éditeurs de journaux pour des problèmes de violation du droit d’auteur. Copilot et ChatGPT ont été […]

OpenAI permet désormais de stocker l’historique de ChatGPT sans aucune condition

Auparavant, les utilisateurs de ChatGPT ne pouvaient conserver leur historique de conversation que s’ils acceptaient que OpenAI utilise leurs données à des fins de formation. Cependant, cela n’est plus le cas aujourd’hui. En avril de l’année dernière, OpenAI a dévoilé l’option de désactivation de l’historique de chat dans ChatGPT après que des préoccupations soient apparues […]

ChatGPT veut se souvenir de tout ce que vous lui avez dit

ChatGPT veut se souvenir de tout ce que vous lui avez dit

OpenAI a annoncé lundi que son populaire chatbot ChatGPT pourra désormais se souvenir des détails des utilisateurs, y compris des informations de base, des hobbies et l’historique des interactions. La mémoire améliorée du chatbot sera disponible uniquement pour les abonnés au service ChatGPT Plus à 20 $ par mois. Une vidéo de démonstration fournie par […]

Chez Moderna, les GPTs d’OpenAI changent presque tout

Moderna devrait annoncer mercredi un partenariat avec le poids lourd de l’intelligence artificielle OpenAI, un accord visant à automatiser presque tous les processus commerciaux de l’entreprise de biotechnologie et à augmenter la portée du créateur de ChatGPT dans le domaine des entreprises. Dans le cadre de la transaction, environ 3 000 employés de Moderna auront […]

Le nouveau monde audacieux de ChatGPT

L’intelligence artificielle générative a été un sujet de discussion considérable – enthousiasme, appréhension, curiosité – depuis la mise à disposition gratuite au public de ChatGPT par OpenAI en novembre 2022. Ces outils vont-ils effectuer des tâches banales pour nous, améliorer notre productivité et notre créativité, ou un jour nous remplacer ? Les dirigeants de l’UofL […]