数以轻舟Agent通过API调用时仅上传列名、数据类型等元数据,而不发送单元格原始值,从架构层划分控制面与数据面。这一设计让V3.1版本实现真正离线处理,自2026年5月上线以来,成为强监管行业的硬性准入条件。

本地-云端双轨架构:数据不出域的底层设计决策
数以轻舟Agent的架构选择直接决定其适用场景——双轨设计不是功能叠加,而是对不同安全等级部署需求的硬性响应。据IT之家2026年5月评测,产品由北京乾策数智科技有限公司开发,2025年12月推出首款产品,2026年5月上线本地化部署版本。
双轨指两条互斥路径:路径一通过硅基流动等线上API快速接入,传递数据结构而非原始内容;路径二接入Qwen、DeepSeek、Kimi及火山引擎(V3.1新增)等本地大模型,Excel文件全程在本地解析、本地计算、本地输出,支持完全离线运行。
架构层面做出关键取舍:API模式牺牲数据不出域换取开箱即用,本地模式牺牲便捷性换取零上传合规。此决策直接淘汰了纯SaaS竞品在强监管行业的竞争力。对于金融、医疗、政务等需要数据不出域的用户,本地路径是唯一选择;而对追求即时体验的个人,API路径省去了模型部署步骤。这种二元设计将安全决策权交给用户,而非默认云端,从根本上规避了数据泄露风险。
V3.1版本技术参数与系统要求一览
截至2026年5月,数以轻舟Agent仅提供Windows桌面端,无macOS/Linux版本,无浏览器端,这一平台限制是评估集成可行性的第一道硬过滤。据天极网与IT之家2026年5月24日评测数据,核心参数如下:
| 类别 | 规格 |
|---|---|
| 支持的大模型(API模式) | 硅基流动(SiliconFlow)云端API |
| 支持的大模型(本地模式) | Qwen(通义千问)、DeepSeek、Kimi、火山引擎(V3.1新增) |
| 需用户准备的环境 | 本地模型运行环境(GPU/CPU需求取决于所选模型);推理服务需预先部署 |
| 支持的Excel文件格式 | .xlsx / .xls |
| 批量处理能力 | 文件夹级多文件相同操作(如统一格式、提取字段、合并汇总) |
| 后端自动化 | Python脚本自动生成(用于数据清洗、复杂转换) |
| 离线运行条件 | 本地大模型已启动、无需网络(离线模式禁止API调用) |
| 操作系统 | Windows 10/11(无macOS/Linux版本) |
| 安装包获取 | 官网 https://www.dify-ai.cn/excelagent/excelagent.html 下载Windows安装包 |
以上模型中,火山引擎接口为V3.1版本新增,扩展了云端模型选择空间。本地模型均需用户自行部署,Agent不捆绑任何模型文件。
本地大模型接入流程:从安装包到首次执行
部署流程分三步——配置模型源、选择功能模块、获取处理结果,普通行政人员可在技术文档指导下独立完成,但本地大模型的GPU环境准备是隐性的前置门槛。据hea.china.com 2026年4月实测记录:
- 访问官网下载Windows安装包,按引导完成安装。
- 启动后,在设置中选择模型来源:若使用API,选择“硅基流动”接口并填入API Key;若使用本地模型,配置已部署的Qwen/DeepSeek/Kimi/火山引擎模型路径。
- 打开目标Excel文件,Agent以侧边栏形式呈现,自动识别表结构。
- 在对话框上方切换功能模块:数据处理、AI分析师、报告生成。
- 输入自然语言指令,如“把A列空白单元格填充为本列平均值”,点击执行。
- 处理结果直接写入指定单元格,可实时预览并下载最终文件。
需注意:本地模型需用户预先下载并确保推理服务运行,安装包本身不含模型权重。如果本地GPU显存不足,可选量化版本,但会牺牲部分推理精度。
自然语言公式引擎:VLOOKUP到SUMPRODUCT的语义覆盖
该引擎覆盖Excel高频函数类型——查找引用、条件聚合、数组运算——但生成的公式质量依赖用户描述的精确度,模糊指令可能产生语法正确但逻辑不符预期的结果。据IT之家评测用例,已验证的语义映射包括:
- VLOOKUP/XLOOKUP:跨表关联匹配,支持自动识别关键字段,校验引用范围,避免#N/A错误。
- SUMIF/SUMIFS:条件汇总,能理解“统计张三一季度电子产品的总销售额”这类复合条件。
- INDEX-MATCH:定位匹配,处理左表右表字段无序时的精准查找。
- SUMPRODUCT:乘积求和,适用于加权评分、多条件计数等复杂运算。
此外支持跨工作簿引用和自动校验引用范围。数据清洗类操作——空值填充、日期格式标准化、文本数字混排处理、去重——通过自动生成Python脚本在后端执行,而非写入Excel公式。与竞品(如ChatGPT写公式后手动粘贴)的关键差异在于:Agent直接操作打开的文件,结果写入指定单元格,减少复制粘贴环节。对于需要批量处理200张工作表的情况,可用一句“将所有表格中日期列统一为yyyy-mm-dd格式”完成,无需逐表操作。
多轮对话与自动纠错:V3.0后的交互状态机
V3.0引入的多轮对话和自动纠错机制将交互模式从“一问一答”改为有状态的连续会话,但上下文记忆仅限于当前会话窗口,关闭文件后状态丢失——这是理解其边界的关键。
据大众日报2026年5月22日报道,V3.0(2026年4月发布)完成了底层能力“换芯”——集成数据分析Skill模块,使Agent从指令执行器升级为具备数据洞察能力的助手。
多轮对话意味着:你在一个会话中连续发出“清洗A列空值”“按B列分组统计C列均值”“将结果写入新工作表”三条指令时,Agent保持对表结构和中间结果的上下文感知,无需每轮重新描述数据。
自动纠错重试:当生成的公式或脚本执行报错时,Agent自动识别错误类型(如引用越界、类型不匹配)并尝试修复后重新执行,减少手动排查。
但这套机制有两个硬限制:第一,纠错重试上限未公开,复杂错误链可能耗尽重试次数后静默失败;第二,上下文记忆不跨会话——关闭Excel或切换文件后历史对话清空,无法恢复此前的工作流状态。V3.1进一步优化了错误提示的可读性,将技术报错转化为具体操作建议,同时新增火山引擎API接口。对于需要重复执行相同多步操作的用户,建议保存处理流程为模板,避免每次重新对话。
仅传结构不传内容:安全模型的技术边界与离线代价
数以轻舟Agent的安全声明——“仅传递数据结构而非原始数据内容”——在API模式下成立,但其有效性存在一个无法绕过的技术约束:完全验证这一声明需要抓包审计,普通用户只能信任实现而非验证实现。
据天极网2026年5月评测,API模式下Agent向外部接口发送的是解析后的表结构元数据(列名、数据类型、行数范围),而非单元格原始值。
但以下实际限制直接影响开发者选型:第一,Windows-only意味着macOS/Linux团队需要虚拟机或单独设备,增加运维成本;第二,离线模式虽零上传,但本地模型的推理质量和响应速度完全取决于用户自备硬件,低配机器上处理十万行级数据可能出现分钟级延迟;第三,当前版本无REST API暴露,无法集成到自动化流水线或CI/CD中——所有操作必须在GUI内通过自然语言对话完成,这排除了批量无人值守场景。对于需要将Excel处理嵌入后端服务的团队,这是架构层面的硬阻断。

