
Nanobrowser 是一款开源的 Chrome 扩展工具,专注于 AI 驱动的网页自动化。
1. 核心功能:基于多智能体系统,支持任务自动化、多 LLM 集成和交互式侧边栏。
2. 技术原理:通过 Planner、Navigator 和 Validator 三个智能体协作,动态调整任务策略,确保任务成功完成。
Nanobrowser 完全免费,作为 OpenAI Operator 的开源替代方案,支持在本地浏览器运行,注重隐私保护,不涉及云服务。它让 AI 在浏览器中变得更加智能高效,适用于信息收集、电商购物、内容创作等多种场景。
Nanobrowser 的主要功能
1.多智能体系统:
- Planner(规划器):负责制定和调整任务策略。
- Navigator(导航器):执行网页导航和操作。
- Validator(验证器):检查任务是否成功完成。
2.交互式侧边栏:提供直观的聊天界面,实时显示任务状态,用户用自然语言与智能体交互。
3.任务自动化:自动化重复性网页任务,如信息提取、数据整理等,节省时间和精力。
4.多 LLM 支持:支持连接多种大型语言模型(LLM)提供商,用户根据需求为不同智能体选择不同的模型。
Nanobrowser 的技术原理
1.基于 LLM 的智能体架构:Nanobrowser 的核心是多智能体系统,每个智能体由大型语言模型(LLM)驱动。智能体分工协作,高效完成复杂任务:
- 规划器 Planner :制定和完善任务策略。
- 导航器 Navigator :浏览网站并执行操作。
- 验证器 Validator :确认任务结果,检查任务是否成功完成。
2.动态任务调整与自适应性:当遇到障碍或任务失败时,Planner 智能体自动调整策略,重新规划任务路径,确保任务能够成功完成。
3.集成多种 LLM 提供商:支持连接 OpenAI、Anthropic 等主流 LLM 提供商,用户根据需求选择不同的模型,为不同智能体分配最适合的模型。
如何使用/快速开始
1. 下载
从官方 GitHub 下载最新的 nanobrowser.zip 文件。
2. 安装
- 解压 nanobrowser.zip。
- 在 Chrome 中打开 chrome://extensions/。 在页面右上角启用 开发者模式。
- 开启后,点击页面左上角的 加载已解压的扩展程序按钮。
- 选择解压后的 nanobrowser 文件夹。
3. 配置智能体模型
- 点击工具栏中的 Nanobrowser 图标,打开侧边栏。
- 点击 设置 图标(右上角)。
- 添加你的 LLM API 密钥。
- 为不同智能体(Navigator、Planner、Validator)选择使用的模型。
本文采用 CC BY-NC 4.0 许可协议。商业转载、引用请联系本站获得授权,非商业转载、引用须注明出处。
链接:https://appmark.cn/sites/nanobroswer.html -APPMARK
LangGraph 是一个面向当前 LLM 开发领域最火热的 AI Agent 开发与控制的开发库,也是 LangChain 试图用来 弥补其在 Agent 开发、特别是复杂的多 Agent 系统定制方面的不足 的重大尝试。