index: 自动化浏览器智能体

GitHubhttps://github.com/lmnr-ai/index

更多AI开源软件https://www.aiinn.cn/

在做浏览器自动化脚本时,我们常常需要编写大量代码来处理复杂的网页交互,不仅耗时耗力,还难以调试和优化,要是出错更是难以精准定位问题所在。

主要功能

Index 是一款先进的开源浏览器代理,能够自主地在网络上执行复杂任务。

  • 它由 Claude 3.7 Sonnet 驱动,具有扩展性思维。未来将支持更多模型。
  • Index 还提供托管 API 服务。
  • 您还可以尝试通过托管 UI 或完全自托管 UI 来使用 Index。
  • 支持由 Laminar 提供的先进浏览器代理可观察性。

安装和使用

安装 Laminar
复制代码
pip install lmnr
通过 API 使用 Index
复制代码
from lmnr import Laminar, AsyncLaminarClient
# you can also set LMNR_PROJECT_API_KEY environment variable

# Initialize tracing
Laminar.initialize(project_api_key="your_api_key")

# Initialize the client
client = AsyncLaminarClient(api_key="your_api_key")

async def main():

    # Run a task
    response = await client.agent.run(
        prompt="Navigate to news.ycombinator.com, find a post about AI, and summarize it"
    )

    # Print the result
    print(response.result)
  
if __name__ == "__main__":
    asyncio.run(main())

当您通过 API 调用 Index 时,您会自动在 Laminar 平台上获得完整的浏览器代理可观察性。详细了解 Index 浏览器可观测性

本地快速入门
安装依赖项
复制代码
pip install lmnr-index

# Install playwright
playwright install chromium
运行代理
复制代码
import asyncio
from index import Agent, AnthropicProvider

async def main():
    # Initialize the LLM provider
    llm = AnthropicProvider(
            model="claude-3-7-sonnet-20250219",
            enable_thinking=True, 
            thinking_token_budget=2048)
  
    # Create an agent with the LLM
    agent = Agent(llm=llm)
  
    # Run the agent with a task
    output = await agent.run(
        prompt="Navigate to news.ycombinator.com, find a post about AI, and summarize it"
    )
  
    # Print the result
    print(output.result)
  
if __name__ == "__main__":
    asyncio.run(main())

实战演习

场景1:流式传输代理的输出
复制代码
from index import Agent, AnthropicProvider

agent = Agent(llm=AnthropicProvider(model="claude-3-7-sonnet-20250219"))  

# Stream the agent's output
async for chunk in agent.run_stream(
    prompt="Navigate to news.ycombinator.com, find a post about AI, and summarize it"):
    print(chunk)
场景2:启用浏览器代理可观测性

要跟踪 Index 代理的作并记录浏览器会话,您只需在运行代理之前初始化 Laminar 跟踪。

复制代码
from lmnr import Laminar

Laminar.initialize(project_api_key="your_api_key")

然后,您将获得与 Laminar 平台中的浏览器会话同步的代理作的完全可观察性。

​​

场景3:使用远程 CDP URL 运行
复制代码
import asyncio
from index import Agent, AnthropicProvider, BrowserConfig

async def main():
    # Configure browser to connect to an existing Chrome DevTools Protocol endpoint
    browser_config = BrowserConfig(
        cdp_url="<cdp_url>"
    )
  
    # Initialize the LLM provider
    llm = AnthropicProvider(model="claude-3-7-sonnet-20250219", enable_thinking=True, thinking_token_budget=2048)
  
    # Create an agent with the LLM and browser
    agent = Agent(llm=llm, browser_config=browser_config)
  
    # Run the agent with a task
    output = await agent.run(
        prompt="Navigate to news.ycombinator.com and find the top story"
    )
  
    # Print the result
    print(output.result)
  
if __name__ == "__main__":
    asyncio.run(main())
场景4:自定义浏览器窗口大小
复制代码
import asyncio
from index import Agent, AnthropicProvider, BrowserConfig

async def main():
    # Configure browser with custom viewport size
    browser_config = BrowserConfig(
        viewport_size={"width": 1200, "height": 900}
    )
  
    # Initialize the LLM provider
    llm = AnthropicProvider(model="claude-3-7-sonnet-20250219")
  
    # Create an agent with the LLM and browser
    agent = Agent(llm=llm, browser_config=browser_config)
  
    # Run the agent with a task
    output = await agent.run(
        "Navigate to a responsive website and capture how it looks in full HD resolution"
    )
  
    # Print the result
    print(output.result)
  
if __name__ == "__main__":
    asyncio.run(main())
相关推荐
爱喝白开水a8 分钟前
LangChain 基础系列之 Prompt 工程详解:从设计原理到实战模板_langchain prompt
开发语言·数据库·人工智能·python·langchain·prompt·知识图谱
takashi_void14 分钟前
如何在本地部署大语言模型(Windows,Mac,Linux)三系统教程
linux·人工智能·windows·macos·语言模型·nlp
OpenCSG19 分钟前
【活动预告】2025斗拱开发者大会,共探支付与AI未来
人工智能·ai·开源·大模型·支付安全
生命是有光的23 分钟前
【深度学习】神经网络基础
人工智能·深度学习·神经网络
数字供应链安全产品选型27 分钟前
国家级!悬镜安全入选两项“网络安全国家标准应用实践案例”
人工智能·安全·web安全
科技新知39 分钟前
大厂AI各走“开源”路
人工智能·开源
字节数据平台41 分钟前
火山引擎Data Agent再拓新场景,重磅推出用户研究Agent
大数据·人工智能·火山引擎
TGITCIC42 分钟前
LLaVA-OV:开源多模态的“可复现”革命,不只是又一个模型
人工智能·开源·多模态·ai大模型·开源大模型·视觉模型·大模型ai
GeeLark1 小时前
GeeLark 9月功能更新回顾
人工智能
mwq301231 小时前
GPT-2 中的 Pre-Layer Normalization (Pre-LN) 架构详解
人工智能