Aller directement au contenu principal

🧠 Agent Principal et Capacités

CodeActAgent​

Description​

Cet agent implémente l'idée de CodeAct (article, tweet) qui consolide les actions des agents LLM dans un espace d'action de code unifié à la fois pour la simplicité et la performance.

L'idée conceptuelle est illustrée ci-dessous. À chaque tour, l'agent peut :

  1. Converser : Communiquer avec les humains en langage naturel pour demander des clarifications, des confirmations, etc.
  2. CodeAct : Choisir d'effectuer la tâche en exécutant du code
  • ExĂ©cuter n'importe quelle commande Linux bash valide
  • ExĂ©cuter n'importe quel code Python valide avec un interprĂ©teur Python interactif. Ceci est simulĂ© via une commande bash, voir le système de plugin ci-dessous pour plus de dĂ©tails.

image

Démo​

https://github.com/All-Hands-AI/OpenHands/assets/38853559/f592a192-e86c-4f48-ad31-d69282d5f6ac

Exemple de CodeActAgent avec gpt-4-turbo-2024-04-09 effectuant une tâche de science des données (régression linéaire).