Comment l’IA dirige ChatGPT vers le monde matériel

Des entreprises telles qu’OpenAI et Midjourney construisent des chatbots, des générateurs d’images et d’autres outils d’intelligence artificielle qui fonctionnent dans le monde numérique.

À présent, une startup fondée par trois anciens chercheurs d’OpenAI utilise les méthodes de développement technologique derrière les chatbots pour construire une technologie IA capable de naviguer dans le monde physique.

Covariant, une entreprise de robotique basée à Emeryville, en Californie, crée des moyens pour les robots de saisir, déplacer et trier des articles alors qu’ils sont transférés à travers des entrepôts et des centres de distribution. Son objectif est d’aider les robots à comprendre ce qui se passe autour d’eux et à décider de ce qu’ils devraient faire ensuite.

La technologie donne également aux robots une compréhension large de la langue anglaise, permettant aux gens de discuter avec eux comme s’ils discutaient avec ChatGPT.

La technologie, encore en développement, n’est pas parfaite. Mais c’est un signe clair que les systèmes IA qui alimentent les chatbots et les générateurs d’images en ligne alimenteront également les machines dans les entrepôts, sur les routes et dans les maisons.

Comme les chatbots et les générateurs d’images, cette technologie robotique apprend ses compétences en analysant d’énormes quantités de données numériques. Cela signifie que les ingénieurs peuvent améliorer la technologie en la nourrissant de plus en plus de données.

Covariant, soutenue par un financement de 222 millions de dollars US (1,03 milliard de RM), ne construit pas de robots. Elle construit le logiciel qui alimente les robots. L’entreprise vise à déployer sa nouvelle technologie avec des robots d’entrepôt, fournissant une feuille de route pour que d’autres fassent à peu près la même chose dans les usines de fabrication et peut-être même sur les routes avec des voitures autonomes.

Les systèmes d’IA qui pilotent les chatbots et les générateurs d’images sont appelés des réseaux neuronaux, nommés ainsi en référence au réseau de neurones dans le cerveau.

En identifiant des motifs dans d’énormes quantités de données, ces systèmes peuvent apprendre à reconnaître des mots, des sons et des images – ou même à les générer de manière autonome. C’est ainsi qu’OpenAI a construit ChatGPT, lui donnant la capacité de répondre instantanément aux questions, de rédiger des travaux de fin d’études et de générer des programmes informatiques. Il a acquis ces compétences à partir de textes collectés sur Internet. (Plusieurs médias, dont The New York Times, ont poursuivi OpenAI pour violation du droit d’auteur.)

Les entreprises construisent désormais des systèmes capables d’apprendre à partir de différents types de données en même temps. En analysant à la fois une collection de photos et les légendes décrivant ces photos, par exemple, un système peut comprendre les relations entre les deux. Il peut apprendre que le mot « banane » décrit un fruit jaune courbé.

OpenAI a utilisé ce système pour construire Sora, son nouveau générateur de vidéos. En analysant des milliers de vidéos légendées, le système a appris à générer des vidéos lorsqu’on lui donne une courte description d’une scène, comme « un monde de récif corallien magnifiquement rendu en papercraft, riche en poissons colorés et en créatures marines ».

Covariant, fondée par Pieter Abbeel, professeur à l’Université de Californie à Berkeley, et trois de ses anciens étudiants, Peter Chen, Rocky Duan et Tianhao Zhang, a utilisé des techniques similaires pour construire un système qui pilote des robots d’entrepôt.

Covariant a développé une technologie d'IA qui permet à ses robots de comprendre beaucoup plus largement le monde qui les entoure

L’entreprise aide à opérer des robots de tri dans des entrepôts partout dans le monde. Elle a passé des années à rassembler des données – issues de caméras et d’autres capteurs – qui montrent comment ces robots fonctionnent.

“Elle ingère toutes sortes de données qui importent aux robots – qui peuvent les aider à comprendre le monde physique et à interagir avec lui,” a déclaré Chen.

En combinant ces données avec les énormes quantités de texte utilisées pour entraîner des chatbots tels que ChatGPT, l’entreprise a construit une technologie IA qui donne à ses robots une compréhension bien plus large du monde qui les entoure.

Après avoir identifié des motifs dans ce mélange d’images, de données sensorielles et de texte, la technologie donne à un robot le pouvoir de gérer des situations imprévues dans le monde physique. Le robot sait comment prendre une banane, même s’il n’a jamais vu de banane auparavant.

Il peut également répondre en anglais simple, tout comme un chatbot. Si vous lui dites de “prendre une banane”, il sait ce que cela signifie. Si vous lui dites de “prendre un fruit jaune”, il comprend cela aussi.

Il peut même générer des vidéos qui prédisent ce qui est susceptible de se passer alors qu’il essaie de prendre une banane. Ces vidéos n’ont aucune utilité pratique dans un entrepôt, mais elles montrent la compréhension du robot de ce qui l’entoure.

“S’il peut prédire les images suivantes dans une vidéo, il peut identifier la bonne stratégie à suivre,” a dit Abbeel.

La technologie, appelée RFM, pour modèle fondamental en robotique, fait des erreurs, tout comme le font les chatbots. Bien qu’elle comprenne souvent ce que les gens lui demandent, il y a toujours une chance qu’elle ne le fasse pas. Elle laisse tomber des objets de temps en temps.

Gary Marcus, entrepreneur en IA et professeur émérite de psychologie et de neurosciences à l’Université de New York, a déclaré que la technologie pourrait être utile dans les entrepôts et autres situations où les erreurs sont acceptables. Mais, il a indiqué qu’il serait plus difficile et plus risqué de la déployer dans les usines de fabrication et autres situations potentiellement dangereuses.

“Cela revient au coût de l’erreur,” a-t-il dit. “Si vous avez un robot de 68 kilogrammes (150 livres) qui peut faire quelque chose de nuisible, ce coût peut être élevé.”

Alors que les entreprises forment ce type de système sur des collections de données de plus en plus grandes et variées, les chercheurs croient qu’il s’améliorera rapidement.

C’est très différent de la manière dont les robots fonctionnaient dans le passé. Typiquement, les ingénieurs programmaient les robots pour effectuer le même mouvement précis encore et encore – comme soulever une boîte d’une certaine taille ou attacher un rivet dans un endroit particulier sur le pare-chocs arrière d’une voiture. Mais les robots ne pouvaient pas gérer des situations inattendues ou aléatoires.

En apprenant à partir de données numériques – des centaines de milliers d’exemples de ce qui se passe dans le monde physique – les robots peuvent commencer à gérer l’inattendu. Et lorsque ces exemples sont associés à la langue, les robots peuvent également répondre aux suggestions textuelles et vocales, comme le ferait un chatbot.

Cela signifie que, comme les chatbots et les générateurs d’images, les robots deviendront plus agiles.

“Ce qui est dans les données numériques peut se transférer dans le monde réel,” a déclaré Chen.

Tags:

No Responses

Leave a Reply

Your email address will not be published. Required fields are marked *

BLOG

NARA interdit l'utilisation de ChatGPT sur les réseaux de l'agence

NARA interdit l’utilisation de ChatGPT sur les réseaux de l’agence

Les Archives nationales et l’Administration des dossiers ont été la dernière agence fédérale à interdire à ses employés d’utiliser ChatGPT à des fins professionnelles, invoquant un “risque inacceptable” pour les données de l’agence. La décision politique découle des préoccupations des responsables de l’agence selon lesquelles les données que les employés saisissent comme stimuli dans la […]

La violation continue des droits d'auteur est une douleur pour Microsoft et OpenAI

La violation continue des droits d’auteur est une douleur pour Microsoft et OpenAI

Microsoft et OpenAI ont été frappés par une poursuite déposée par huit éditeurs de journaux concernant des problèmes liés au droit d’auteur. Ce que vous devez savoir Microsoft et OpenAI ont été visés par une poursuite déposée par huit éditeurs de journaux pour des problèmes de violation du droit d’auteur. Copilot et ChatGPT ont été […]

OpenAI permet désormais de stocker l’historique de ChatGPT sans aucune condition

Auparavant, les utilisateurs de ChatGPT ne pouvaient conserver leur historique de conversation que s’ils acceptaient que OpenAI utilise leurs données à des fins de formation. Cependant, cela n’est plus le cas aujourd’hui. En avril de l’année dernière, OpenAI a dévoilé l’option de désactivation de l’historique de chat dans ChatGPT après que des préoccupations soient apparues […]

ChatGPT veut se souvenir de tout ce que vous lui avez dit

ChatGPT veut se souvenir de tout ce que vous lui avez dit

OpenAI a annoncé lundi que son populaire chatbot ChatGPT pourra désormais se souvenir des détails des utilisateurs, y compris des informations de base, des hobbies et l’historique des interactions. La mémoire améliorée du chatbot sera disponible uniquement pour les abonnés au service ChatGPT Plus à 20 $ par mois. Une vidéo de démonstration fournie par […]

Chez Moderna, les GPTs d’OpenAI changent presque tout

Moderna devrait annoncer mercredi un partenariat avec le poids lourd de l’intelligence artificielle OpenAI, un accord visant à automatiser presque tous les processus commerciaux de l’entreprise de biotechnologie et à augmenter la portée du créateur de ChatGPT dans le domaine des entreprises. Dans le cadre de la transaction, environ 3 000 employés de Moderna auront […]

Le nouveau monde audacieux de ChatGPT

L’intelligence artificielle générative a été un sujet de discussion considérable – enthousiasme, appréhension, curiosité – depuis la mise à disposition gratuite au public de ChatGPT par OpenAI en novembre 2022. Ces outils vont-ils effectuer des tâches banales pour nous, améliorer notre productivité et notre créativité, ou un jour nous remplacer ? Les dirigeants de l’UofL […]