Files
claude-code-best-practice/fr/.claude/skills/agent-browser/SKILL.md
T
2026-06-02 23:24:21 +02:00

7.9 KiB
Raw Blame History

name, description, allowed-tools
name description allowed-tools
agent-browser CLI dautomatisation de navigateur pour agents IA. À utiliser lorsque lutilisateur doit interagir avec des sites web, notamment naviguer dans des pages, remplir des formulaires, cliquer sur des boutons, prendre des captures d’écran, extraire des données, tester des apps web ou automatiser toute tâche navigateur. Les déclencheurs incluent les demandes de type "open a website", "fill out a form", "click a button", "take a screenshot", "scrape data from a page", "test this web app", "login to a site", "automate browser actions", ou toute tâche nécessitant une interaction web programmatique. Bash(agent-browser:*)

Automatisation de navigateur avec agent-browser

Workflow principal

Toute automatisation de navigateur suit ce schéma :

  1. Naviguer : agent-browser open <url>
  2. Capturer l’état : agent-browser snapshot -i (obtenir des références d’éléments comme @e1, @e2)
  3. Interagir : utiliser les refs pour cliquer, remplir, sélectionner
  4. Reprendre une capture d’état : après navigation ou changements DOM, obtenir de nouvelles refs
agent-browser open https://example.com/form
agent-browser snapshot -i
# Output: @e1 [input type="email"], @e2 [input type="password"], @e3 [button] "Submit"

agent-browser fill @e1 "user@example.com"
agent-browser fill @e2 "password123"
agent-browser click @e3
agent-browser wait --load networkidle
agent-browser snapshot -i  # Check result

Commandes essentielles

# Navigation
agent-browser open <url>              # Navigate (aliases: goto, navigate)
agent-browser close                   # Close browser

# Snapshot
agent-browser snapshot -i             # Interactive elements with refs (recommended)
agent-browser snapshot -i -C          # Include cursor-interactive elements (divs with onclick, cursor:pointer)
agent-browser snapshot -s "#selector" # Scope to CSS selector

# Interaction (use @refs from snapshot)
agent-browser click @e1               # Click element
agent-browser fill @e2 "text"         # Clear and type text
agent-browser type @e2 "text"         # Type without clearing
agent-browser select @e1 "option"     # Select dropdown option
agent-browser check @e1               # Check checkbox
agent-browser press Enter             # Press key
agent-browser scroll down 500         # Scroll page

# Get information
agent-browser get text @e1            # Get element text
agent-browser get url                 # Get current URL
agent-browser get title               # Get page title

# Wait
agent-browser wait @e1                # Wait for element
agent-browser wait --load networkidle # Wait for network idle
agent-browser wait --url "**/page"    # Wait for URL pattern
agent-browser wait 2000               # Wait milliseconds

# Capture
agent-browser screenshot              # Screenshot to temp dir
agent-browser screenshot --full       # Full page screenshot
agent-browser pdf output.pdf          # Save as PDF

Motifs courants

Soumission de formulaire

agent-browser open https://example.com/signup
agent-browser snapshot -i
agent-browser fill @e1 "Jane Doe"
agent-browser fill @e2 "jane@example.com"
agent-browser select @e3 "California"
agent-browser check @e4
agent-browser click @e5
agent-browser wait --load networkidle

Authentification avec persistance d’état

# Login once and save state
agent-browser open https://app.example.com/login
agent-browser snapshot -i
agent-browser fill @e1 "$USERNAME"
agent-browser fill @e2 "$PASSWORD"
agent-browser click @e3
agent-browser wait --url "**/dashboard"
agent-browser state save auth.json

# Reuse in future sessions
agent-browser state load auth.json
agent-browser open https://app.example.com/dashboard

Extraction de données

agent-browser open https://example.com/products
agent-browser snapshot -i
agent-browser get text @e5           # Get specific element text
agent-browser get text body > page.txt  # Get all page text

# JSON output for parsing
agent-browser snapshot -i --json
agent-browser get text @e1 --json

Sessions parallèles

agent-browser --session site1 open https://site-a.com
agent-browser --session site2 open https://site-b.com

agent-browser --session site1 snapshot -i
agent-browser --session site2 snapshot -i

agent-browser session list

Navigateur visuel (débogage)

agent-browser --headed open https://example.com
agent-browser highlight @e1          # Highlight element
agent-browser record start demo.webm # Record session

Fichiers locaux (PDF, HTML)

# Open local files with file:// URLs
agent-browser --allow-file-access open file:///path/to/document.pdf
agent-browser --allow-file-access open file:///path/to/page.html
agent-browser screenshot output.png

Simulateur iOS (Mobile Safari)

# List available iOS simulators
agent-browser device list

# Launch Safari on a specific device
agent-browser -p ios --device "iPhone 16 Pro" open https://example.com

# Same workflow as desktop - snapshot, interact, re-snapshot
agent-browser -p ios snapshot -i
agent-browser -p ios tap @e1          # Tap (alias for click)
agent-browser -p ios fill @e2 "text"
agent-browser -p ios swipe up         # Mobile-specific gesture

# Take screenshot
agent-browser -p ios screenshot mobile.png

# Close session (shuts down simulator)
agent-browser -p ios close

Prérequis : macOS avec Xcode, Appium (npm install -g appium && appium driver install xcuitest)

Appareils réels : fonctionne avec des appareils iOS physiques sils sont préconfigurés. Utilise --device "<UDID>", où lUDID provient de xcrun xctrace list devices.

Cycle de vie des refs (important)

Les refs (@e1, @e2, etc.) sont invalidées lorsque la page change. Reprends toujours un snapshot après :

  • Clics sur des liens ou boutons qui naviguent
  • Soumissions de formulaires
  • Chargement de contenu dynamique (menus déroulants, modales)
agent-browser click @e5              # Navigates to new page
agent-browser snapshot -i            # MUST re-snapshot
agent-browser click @e1              # Use new refs

Localisateurs sémantiques (alternative aux refs)

Lorsque les refs sont indisponibles ou peu fiables, utilise des localisateurs sémantiques :

agent-browser find text "Sign In" click
agent-browser find label "Email" fill "user@test.com"
agent-browser find role button click --name "Submit"
agent-browser find placeholder "Search" type "query"
agent-browser find testid "submit-btn" click

Documentation approfondie

Référence Quand lutiliser
references/commands.md Référence complète des commandes avec toutes les options
references/snapshot-refs.md Cycle de vie des refs, règles dinvalidation, dépannage
references/session-management.md Sessions parallèles, persistance d’état, scraping concurrent
references/authentication.md Flows de login, OAuth, gestion 2FA, réutilisation d’état
references/video-recording.md Workflows denregistrement pour débogage et documentation
references/proxy-support.md Configuration proxy, tests géographiques, rotation de proxies

Templates prêts à lemploi

Template Description
templates/form-automation.sh Remplissage de formulaire avec validation
templates/authenticated-session.sh Connexion une fois, réutilisation de l’état
templates/capture-workflow.sh Extraction de contenu avec captures d’écran
./templates/form-automation.sh https://example.com/form
./templates/authenticated-session.sh https://app.example.com/login
./templates/capture-workflow.sh https://example.com ./output