Stagehand MCP Server

Stagehand MCP Serverとは？

Stagehand MCP Serverは、AIアプリケーションと実際のWeb自動化タスクの間の橋渡しをします。WebブラウザのコントロールをMCPツールとして公開することで、大規模言語モデルがWebサイトをナビゲートし、タスクを実行し、データをプログラムで収集できるようにします。リモートヘッドレスブラウジングのためにBrowserbaseを活用し、Claude Desktopと直接統合します。これにより、LLMベースのワークフロー向けに高度なブラウザ自動化が可能になります。

設定方法

Stagehand MCP Serverのリポジトリを公式ソースからクローンします。
プロジェクトディレクトリ内で、次のコマンドで依存関係をインストールします:
```
npm install
npm run build
```

Claude Desktopの設定を更新し、Stagehand MCP Serverを登録します:

{
  "mcpServers": {
    "stagehand": {
      "command": "node",
      "args": ["path/to/mcp-server-browserbase/stagehand/dist/index.js"],
      "env": {
        "BROWSERBASE_API_KEY": "<YOUR_BROWSERBASE_API_KEY>",
        "BROWSERBASE_PROJECT_ID": "<YOUR_BROWSERBASE_PROJECT_ID>",
        "OPENAI_API_KEY": "<YOUR_OPENAI_API_KEY>"
      }
    }
  }
}

次のコマンドでサーバーを実行します:
```
node dist/index.js
```
新しいMCP設定を読み込むためにClaude Desktopを再起動します。そうすると、Stagehandツールが利用可能なMCPツールとして表示されます。

使用方法

設定されたMCPサーバーでClaude Desktopを起動します。
利用可能なMCPツールメニューからStagehandツールにアクセスします（ハンマーアイコンを探してください）。
適切なツールを選択し、必要なパラメータ（例：URL、アクション、指示）を入力して、サイトナビゲーション、自動化アクション、データ抽出などのツールを使用します。
必要に応じて、リソースエンドポイントを通じてコンソールログやスクリーンショットを確認します。
ビジュアルデモについては、Stagehand MCP Serverを通じてWebと対話するClaudeを示す文書やデモ動画を参照してください。

主な機能

Claude Desktop内で簡単にアクセスできる標準化されたWeb自動化ツール。
リモートのヘッドレスブラウザセッション用のBrowserbaseとの安全な統合。
実行可能なツールセット：Webサイトにナビゲートし、アクションを実行し、構造化データを抽出。
リソースエンドポイントはブラウザコンソールログおよびオンデマンドスクリーンショットを提供し、完全なトレーサビリティを実現。
敏感なタスクや安全な操作のためのカスタムクレデンシャルと環境の隔離をサポート。

使用例

最新のインサイトのためのWebページからのデータ収集の自動化。
サイトへのログイン、ダッシュボードのナビゲート、レポートのダウンロードなどのエンドツーエンドのワークフロー自動化。
LLMによって強化されたブラウザベースのエージェントワークフローの迅速なプロトタイピング。
LLM指向の自動化を通じて、公共のWebコンテンツをリアルタイムで監視およびスクレイピング。
コンプライアンスまたは報告のためのスクリーンショットや診断ログの収集。

よくある質問

Q1: Stagehand MCP Serverを使用するために、ローカルファイルやデータベースを公開する必要がありますか？

いいえ、Stagehand MCP ServerはWebリソースとのみ対話し、ブラウザセッション、スクリーンショット、およびログへのアクセスを提供します。ローカルファイルとデータベースは、他のMCPサーバーを介して明示的に統合しない限り、分離されたままです。

Q2: Browserbaseから何が必要ですか？

Browserbase APIキーとプロジェクトIDが必要です。これらのクレデンシャルは、安全なリモートブラウザセッションを確立するために必要です。

Q3: Stagehand MCP Serverが正しく動作しているかどうかはどうやって確認できますか？

サーバーを起動し、Claude Desktopを再起動すると、Stagehandツールが呼び出し可能なMCPツールとして表示されるはずです。また、接続確認やエラーのためにサーバーのコマンドライン出力を確認してください。

Q4: Stagehand MCP ServerをClaude Desktop以外の他のLLMホストで使用することはできますか？

現在のところ、主な公式統合はClaude Desktopとのものであり、MCPプロトコルとツールをサポートする任意のホストがStagehand MCP Serverを活用できる可能性があります。

Q5: スクリーンショットをプログラムでキャプチャしたり、ブラウザログにアクセスしたりすることは可能ですか？

はい、スクリーンショットとブラウザコンソールログはリソースとして公開されており、それぞれのユニークなリソース識別子を通じてアクセスできます。これにより、証拠を取得したり結果をプログラムでデバッグしたりするのが簡単です。

プロトコル名	説明
stagehand_navigate	指定されたURLにリモートブラウザインスタンス内でナビゲートします。入力：開くURL文字列。
stagehand_act	アクティブなWebページで指定されたアクションを実行します。入力：アクションの記述（文字列）、パラメータ化された対話のためのオプションの変数（オブジェクト）。
stagehand_extract	指示と提供されたJSONスキーマに従ってWebページから構造化データを抽出します。入力：抽出指示（文字列）、抽出スキーマ（オブジェクト）。
stagehand_observe	現在のWebページを観察し、オプションの指示に基づいて実行可能なアクションのリストを返します。入力：観察指示（文字列、オプション）。