メインコンテンツに直接移動

🤖 LLMバックエンド

メモ

このセクションは、OpenHandsを異なるLLMに接続したいユーザー向けです。

OpenHandsはLiteLLMでサポートされているあらゆるLLMに接続できます。ただし、動作するには強力なモデルが必要です。

モデルの推奨

コーディングタスク向けの言語モデル評価(SWE-benchデータセットを使用)に基づいて、モデル選択についていくつかの 推奨事項を提供できます。最新のベンチマーク結果はこのスプレッドシートで確認できます。

これらの調査結果とコミュニティからのフィードバックに基づき、以下のモデルはOpenHandsでうまく動作することが確認されています:

警告

OpenHandsは設定したLLMに多くのプロンプトを送信します。これらのLLMのほとんどは有料なので、支出制限を設定し、 使用状況を監視してください。

リストにないLLMでOpenHandsを正常に実行できた場合は、検証済みリストに追加してください。 また、同じプロバイダーとLLMを使用している他のユーザーを支援するために、セットアッププロセスを共有するPRを開くことをお勧めします!

利用可能なプロバイダーとモデルの完全なリストについては、 litellmのドキュメントを参照してください。

メモ

現在のほとんどのローカルおよびオープンソースモデルはそれほど強力ではありません。そのようなモデルを使用すると、 メッセージ間の長い待ち時間、質の低い応答、または不正なJSON形式に関するエラーが発生する可能性があります。OpenHandsは それを駆動するモデルと同じくらい強力にしかなりません。ただし、うまく動作するモデルを見つけた場合は、上記の検証済みリストに追加してください。

LLM設定

以下の設定は、OpenHandsのUI内の設定から行うことができます:

  • LLMプロバイダー
  • LLMモデル
  • APIキー
  • ベースURL詳細設定から)

一部のLLM/プロバイダーでは、UI経由で設定できない設定が必要な場合があります。これらは アプリを起動する際にdocker runコマンドに-eを使って環境変数として渡すことができます:

  • LLM_API_VERSION
  • LLM_EMBEDDING_MODEL
  • LLM_EMBEDDING_DEPLOYMENT_NAME
  • LLM_DROP_PARAMS
  • LLM_DISABLE_VISION
  • LLM_CACHING_PROMPT

特定のモデルプロバイダーでOpenHandsを実行するためのガイドがいくつかあります:

APIリトライとレート制限

LLMプロバイダーには通常レート制限があり、場合によっては非常に低く設定されていて、リトライが必要になることがあります。OpenHandsは レート制限エラー(429エラーコード)を受け取った場合、自動的にリクエストを再試行します。

使用しているプロバイダーに合わせてこれらのオプションをカスタマイズできます。プロバイダーのドキュメントを確認し、 リトライ回数とリトライ間の時間を制御するために以下の環境変数を設定してください:

  • LLM_NUM_RETRIES(デフォルトは4回)
  • LLM_RETRY_MIN_WAIT(デフォルトは5秒)
  • LLM_RETRY_MAX_WAIT(デフォルトは30秒)
  • LLM_RETRY_MULTIPLIER(デフォルトは2)

開発モードでOpenHandsを実行している場合は、config.tomlファイルでこれらのオプションを設定することもできます:

[llm]
num_retries = 4
retry_min_wait = 5
retry_max_wait = 30
retry_multiplier = 2