index: 自动化浏览器智能体

GitHubhttps://github.com/lmnr-ai/index

更多AI开源软件https://www.aiinn.cn/

在做浏览器自动化脚本时,我们常常需要编写大量代码来处理复杂的网页交互,不仅耗时耗力,还难以调试和优化,要是出错更是难以精准定位问题所在。

主要功能

Index 是一款先进的开源浏览器代理,能够自主地在网络上执行复杂任务。

  • 它由 Claude 3.7 Sonnet 驱动,具有扩展性思维。未来将支持更多模型。
  • Index 还提供托管 API 服务。
  • 您还可以尝试通过托管 UI 或完全自托管 UI 来使用 Index。
  • 支持由 Laminar 提供的先进浏览器代理可观察性。

安装和使用

安装 Laminar
复制代码
pip install lmnr
通过 API 使用 Index
复制代码
from lmnr import Laminar, AsyncLaminarClient
# you can also set LMNR_PROJECT_API_KEY environment variable

# Initialize tracing
Laminar.initialize(project_api_key="your_api_key")

# Initialize the client
client = AsyncLaminarClient(api_key="your_api_key")

async def main():

    # Run a task
    response = await client.agent.run(
        prompt="Navigate to news.ycombinator.com, find a post about AI, and summarize it"
    )

    # Print the result
    print(response.result)
  
if __name__ == "__main__":
    asyncio.run(main())

当您通过 API 调用 Index 时,您会自动在 Laminar 平台上获得完整的浏览器代理可观察性。详细了解 Index 浏览器可观测性

本地快速入门
安装依赖项
复制代码
pip install lmnr-index

# Install playwright
playwright install chromium
运行代理
复制代码
import asyncio
from index import Agent, AnthropicProvider

async def main():
    # Initialize the LLM provider
    llm = AnthropicProvider(
            model="claude-3-7-sonnet-20250219",
            enable_thinking=True, 
            thinking_token_budget=2048)
  
    # Create an agent with the LLM
    agent = Agent(llm=llm)
  
    # Run the agent with a task
    output = await agent.run(
        prompt="Navigate to news.ycombinator.com, find a post about AI, and summarize it"
    )
  
    # Print the result
    print(output.result)
  
if __name__ == "__main__":
    asyncio.run(main())

实战演习

场景1:流式传输代理的输出
复制代码
from index import Agent, AnthropicProvider

agent = Agent(llm=AnthropicProvider(model="claude-3-7-sonnet-20250219"))  

# Stream the agent's output
async for chunk in agent.run_stream(
    prompt="Navigate to news.ycombinator.com, find a post about AI, and summarize it"):
    print(chunk)
场景2:启用浏览器代理可观测性

要跟踪 Index 代理的作并记录浏览器会话,您只需在运行代理之前初始化 Laminar 跟踪。

复制代码
from lmnr import Laminar

Laminar.initialize(project_api_key="your_api_key")

然后,您将获得与 Laminar 平台中的浏览器会话同步的代理作的完全可观察性。

​​

场景3:使用远程 CDP URL 运行
复制代码
import asyncio
from index import Agent, AnthropicProvider, BrowserConfig

async def main():
    # Configure browser to connect to an existing Chrome DevTools Protocol endpoint
    browser_config = BrowserConfig(
        cdp_url="<cdp_url>"
    )
  
    # Initialize the LLM provider
    llm = AnthropicProvider(model="claude-3-7-sonnet-20250219", enable_thinking=True, thinking_token_budget=2048)
  
    # Create an agent with the LLM and browser
    agent = Agent(llm=llm, browser_config=browser_config)
  
    # Run the agent with a task
    output = await agent.run(
        prompt="Navigate to news.ycombinator.com and find the top story"
    )
  
    # Print the result
    print(output.result)
  
if __name__ == "__main__":
    asyncio.run(main())
场景4:自定义浏览器窗口大小
复制代码
import asyncio
from index import Agent, AnthropicProvider, BrowserConfig

async def main():
    # Configure browser with custom viewport size
    browser_config = BrowserConfig(
        viewport_size={"width": 1200, "height": 900}
    )
  
    # Initialize the LLM provider
    llm = AnthropicProvider(model="claude-3-7-sonnet-20250219")
  
    # Create an agent with the LLM and browser
    agent = Agent(llm=llm, browser_config=browser_config)
  
    # Run the agent with a task
    output = await agent.run(
        "Navigate to a responsive website and capture how it looks in full HD resolution"
    )
  
    # Print the result
    print(output.result)
  
if __name__ == "__main__":
    asyncio.run(main())
相关推荐
新知图书4 小时前
会议音视频速读(使用千问)
人工智能·ai助手·千问·高效办公
Peter·Pan爱编程4 小时前
第十篇:Trae:字节跳动的国产 AI 原生 IDE 崛起与特色功能
ide·人工智能
程序边界4 小时前
凌晨两点半的数据库:一个DBA的踩坑全景实录
人工智能
网络工程小王4 小时前
【LangGraph的工作流编排能力】学习笔记
java·服务器·数据库·人工智能·langchain
j_xxx404_4 小时前
【Linux进程间通信】硬核剖析:消息队列、信号量、内核IPC资源统一管理与mmap加餐
linux·运维·开发语言·c++·人工智能·ai
深度学习lover4 小时前
<数据集>yolo 货车识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·货车识别
金玉满堂@bj4 小时前
大模型(AI应用开发)完整学习路线|零基础可落地版
人工智能·学习
霍格沃兹测试学院-小舟畅学4 小时前
Skill技术正在瓦解传统自动化框架的地位
运维·自动化
XM_jhxx4 小时前
AI图纸识别 vs 传统OCR:差距在哪里?
人工智能·ocr
YJlio4 小时前
2023-09-25:ChatGPT 开始支持“看、听、说”,从纯文本正式迈向多模态交互
人工智能·python·科技·chatgpt·django·交互·pygame