Aller directement au contenu principal

🧠 Agent Principal et Capacités

CodeActAgent​

Description​

Cet agent implémente l'idée CodeAct (article, tweet) qui consolide les actions des agents LLM dans un espace d'action code unifié pour la simplicité et la performance.

L'idée conceptuelle est illustrée ci-dessous. À chaque tour, l'agent peut :

  1. Converser : Communiquer avec les humains en langage naturel pour demander des clarifications, des confirmations, etc.
  2. CodeAct : Choisir d'effectuer la tâche en exécutant du code
  • ExĂ©cuter n'importe quelle commande Linux bash valide
  • ExĂ©cuter n'importe quel code Python valide avec un interprĂ©teur Python interactif. Ceci est simulĂ© via la commande bash, voir le système de plugins ci-dessous pour plus de dĂ©tails.

image

Démo​

https://github.com/All-Hands-AI/OpenHands/assets/38853559/f592a192-e86c-4f48-ad31-d69282d5f6ac

Exemple de CodeActAgent avec gpt-4-turbo-2024-04-09 réalisant une tâche de science des données (régression linéaire).