网页抓取工具

Email邮箱工具

多模态大模型

音乐播放器

股票股市工具

论文工具

3D工具

终端工具

PPT工具

AI智能体工具

jiasugongju#
outlook.com

加速工具 >> AI智能体工具 >> II-Agent 开源智能助手，简化和增强跨领域工作流程，实现复杂任务的自主执行

II-Agent 开源智能助手，简化和增强跨领域工作流程，实现复杂任务的自主执行

5月22日发布在AI智能体工具

II-Agent是开源智能助手，通过LLM驱动，能简化和增强跨领域工作流程，实现复杂任务的自主执行。

II-Agent 基于Anthropic Claude模型构建代理接口，有以下核心组件：

• 命令行界面（CLI），支持直接的终端交互

• WebSocket服务器，驱动基于React的现代前端界面

• 与Google Cloud Vertex AI集成，可通过API访问Anthropic模型

领域	具体能力
研究与事实核查	多步骤网络搜索、来源三角验证、结构化笔记记录、快速摘要生成
内容创作	博客与文章草稿、课程计划、创意写作、技术手册、网站创建
数据分析与可视化	数据清洗、统计分析、趋势检测、图表绘制、自动报告生成
软件开发	代码合成、重构、调试、测试用例编写、多语言分步教程
工作流自动化	脚本生成、浏览器自动化、文件管理、流程优化
问题解决	问题分解、替代路径探索、分步指导、故障排除

核心架构和交互机制

• 系统提示：动态适配上下文的提示策略

• 历史管理：完整的交互历史记录和追溯功能

• 上下文管理：智能处理令牌限制，支持基于文件的大容量输出存档

• LLM调用：系统化的模型调用和能力选择机制

• 执行循环：通过迭代优化实现任务推进

规划与反思能力

• 结构化推理：应对复杂问题的分层解决策略

• 问题分解：将任务拆解为可执行的序列步骤

• 透明决策：可追溯的决策过程记录

• 假设验证：支持假设生成与测试的逻辑框架

执行能力集

• 文件系统操作：智能代码编辑功能

• 命令行执行：安全环境下的终端指令运行

• 网页交互：高级浏览器自动化与内容抓取

• 多模态处理：实验性支持PDF、音频、图像、视频、幻灯片等格式

• 深度研究集成：结合网络搜索的深度信息获取

实时通信

• WebSocket接口：支持交互式实时通信

• 客户端隔离：为每个用户提供独立代理实例

• 事件流机制：实时推送操作事件以优化用户体验

性能评估

难度等级	II-Agent	其他平台（示例）
Level 1	86.5%	Genspark.ai: 74.3% manus.ai: 84.9%
Level 2	70.1%	OpenAI Deep Research: 72.7% Came: 69.1%
Level 3	57.7%	Accuracy: 47.6%（对比项）

II-Agent安装和使用

环境要求

• Python 3.10及以上版本

• Node.js 18及以上版本（前端组件需安装）

• 启用Vertex AI API的Google Cloud项目或Anthropic API密钥

环境变量配置

在项目根目录创建.env文件，配置以下内容：

# 图像与视频生成工具
OPENAI_API_KEY=你的OpenAI密钥
OPENAI_AZURE_ENDPOINT=你的Azure端点
# 搜索服务提供商
TAVILY_API_KEY=你的Tavily密钥
# 其他可选搜索服务（如SerpAPI）
#SERPAPI_API_KEY=你的SerpAPI密钥
STATIC_FILE_BASE_URL=http://localhost:8000/

# Anthropic客户端配置（可选）
ANTHROPIC_API_KEY=你的Anthropic密钥
# Google Vertex配置（推荐，需权限）
#GOOGLE_APPLICATION_CREDENTIALS=你的凭证文件路径

前端环境变量需在frontend目录下的.env文件中配置：

NEXT_PUBLIC_API_URL=http://localhost:8000

安装步骤

1、克隆代码仓库：

git clone https://github.com/Intelligent-Internet/ii-agent

2、配置Python环境：

python -m venv .venv
source .venv/bin/activate  # Windows系统使用 .venv\Scripts\activate
pip install -e .

3、（可选）安装前端组件：

cd frontend
npm install

使用方式

命令行界面

• 使用Anthropic模型：确保在.env中已配置ANTHROPIC_API_KEY，运行：

python cli.py

• 使用Vertex AI：配置GOOGLE_APPLICATION_CREDENTIALS后运行：

python cli.py --project-id 你的项目ID --region 区域代码（如us-east5）

可选参数：

• --workspace：指定工作目录路径（默认值：./workspace）

• --needs-permission：执行命令前需确认权限

• --minimize-stdout-logs：减少终端日志输出量

网页界面

1、启动WebSocket服务器：

• 使用Anthropic模型：

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000

• 使用Vertex AI：

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000 --project-id 你的项目ID --region 区域代码

2、（在新终端中）启动前端服务：

cd frontend
npm run dev

3、打开浏览器访问：http://localhost:3000

II-Agent项目结构

ii-agent/
├─ cli.py              # 命令行接口
├─ ws_server.py        # WebSocket服务器
├─ src/ii_agent/       # 核心代理实现
│  ├─ agents/          # 代理实例
│  ├─ llm/             # 大语言模型客户端接口
│  ├─ tools/           # 工具模块
│  └─ utils/           # 通用工具函数
├─ frontend/           # 前端组件（React应用）
├─ tests/              # 测试代码
└─ ...其他配置文件

你可能感兴趣的

II-Agent 开源智能助手，简化和增强跨领域工作流程，实现复杂任务的自主执行

TypeAgent：基于大语言模型的个人代理架构

Magentic-UI 以人为中心的网页代理研究原型

Ventoy 多系统启动U盘工具