II-Agent是开源智能助手,通过LLM驱动,能简化和增强跨领域工作流程,实现复杂任务的自主执行。
II-Agent 基于Anthropic Claude模型构建代理接口,有以下核心组件:
• 命令行界面(CLI),支持直接的终端交互
• WebSocket服务器,驱动基于React的现代前端界面
• 与Google Cloud Vertex AI集成,可通过API访问Anthropic模型
领域 | 具体能力 |
---|---|
研究与事实核查 | 多步骤网络搜索、来源三角验证、结构化笔记记录、快速摘要生成 |
内容创作 | 博客与文章草稿、课程计划、创意写作、技术手册、网站创建 |
数据分析与可视化 | 数据清洗、统计分析、趋势检测、图表绘制、自动报告生成 |
软件开发 | 代码合成、重构、调试、测试用例编写、多语言分步教程 |
工作流自动化 | 脚本生成、浏览器自动化、文件管理、流程优化 |
问题解决 | 问题分解、替代路径探索、分步指导、故障排除 |
核心架构和交互机制
• 系统提示:动态适配上下文的提示策略
• 历史管理:完整的交互历史记录和追溯功能
• 上下文管理:智能处理令牌限制,支持基于文件的大容量输出存档
• LLM调用:系统化的模型调用和能力选择机制
• 执行循环:通过迭代优化实现任务推进
规划与反思能力
• 结构化推理:应对复杂问题的分层解决策略
• 问题分解:将任务拆解为可执行的序列步骤
• 透明决策:可追溯的决策过程记录
• 假设验证:支持假设生成与测试的逻辑框架
执行能力集
• 文件系统操作:智能代码编辑功能
• 命令行执行:安全环境下的终端指令运行
• 网页交互:高级浏览器自动化与内容抓取
• 多模态处理:实验性支持PDF、音频、图像、视频、幻灯片等格式
• 深度研究集成:结合网络搜索的深度信息获取
实时通信
• WebSocket接口:支持交互式实时通信
• 客户端隔离:为每个用户提供独立代理实例
• 事件流机制:实时推送操作事件以优化用户体验
性能评估
难度等级 | II-Agent | 其他平台(示例) |
---|---|---|
Level 1 | 86.5% | Genspark.ai: 74.3% manus.ai: 84.9% |
Level 2 | 70.1% | OpenAI Deep Research: 72.7% Came: 69.1% |
Level 3 | 57.7% | Accuracy: 47.6%(对比项) |
环境要求
• Python 3.10及以上版本
• Node.js 18及以上版本(前端组件需安装)
• 启用Vertex AI API的Google Cloud项目或Anthropic API密钥
环境变量配置
在项目根目录创建.env
文件,配置以下内容:
# 图像与视频生成工具
OPENAI_API_KEY=你的OpenAI密钥
OPENAI_AZURE_ENDPOINT=你的Azure端点
# 搜索服务提供商
TAVILY_API_KEY=你的Tavily密钥
# 其他可选搜索服务(如SerpAPI)
#SERPAPI_API_KEY=你的SerpAPI密钥
STATIC_FILE_BASE_URL=http://localhost:8000/
# Anthropic客户端配置(可选)
ANTHROPIC_API_KEY=你的Anthropic密钥
# Google Vertex配置(推荐,需权限)
#GOOGLE_APPLICATION_CREDENTIALS=你的凭证文件路径
前端环境变量需在frontend
目录下的.env
文件中配置:
NEXT_PUBLIC_API_URL=http://localhost:8000
安装步骤
1、克隆代码仓库:
git clone https://github.com/Intelligent-Internet/ii-agent
2、配置Python环境:
python -m venv .venv
source .venv/bin/activate # Windows系统使用 .venv\Scripts\activate
pip install -e .
3、(可选)安装前端组件:
cd frontend
npm install
命令行界面
• 使用Anthropic模型:确保在.env
中已配置ANTHROPIC_API_KEY
,运行:
python cli.py
• 使用Vertex AI:配置GOOGLE_APPLICATION_CREDENTIALS
后运行:
python cli.py --project-id 你的项目ID --region 区域代码(如us-east5)
可选参数:
• --workspace
:指定工作目录路径(默认值:./workspace
)
• --needs-permission
:执行命令前需确认权限
• --minimize-stdout-logs
:减少终端日志输出量
网页界面
1、启动WebSocket服务器:
• 使用Anthropic模型:
export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000
• 使用Vertex AI:
export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000 --project-id 你的项目ID --region 区域代码
2、(在新终端中)启动前端服务:
cd frontend
npm run dev
3、打开浏览器访问:http://localhost:3000
ii-agent/
├─ cli.py # 命令行接口
├─ ws_server.py # WebSocket服务器
├─ src/ii_agent/ # 核心代理实现
│ ├─ agents/ # 代理实例
│ ├─ llm/ # 大语言模型客户端接口
│ ├─ tools/ # 工具模块
│ └─ utils/ # 通用工具函数
├─ frontend/ # 前端组件(React应用)
├─ tests/ # 测试代码
└─ ...其他配置文件