数以轻舟Agent——本地部署的AI Excel智能体，自然语言驱动数据清洗与分析

数以轻舟Agent通过API调用时仅上传列名、数据类型等元数据，而不发送单元格原始值，从架构层划分控制面与数据面。这一设计让V3.1版本实现真正离线处理，自2026年5月上线以来，成为强监管行业的硬性准入条件。

本地-云端双轨架构：数据不出域的底层设计决策

数以轻舟Agent的架构选择直接决定其适用场景——双轨设计不是功能叠加，而是对不同安全等级部署需求的硬性响应。据IT之家2026年5月评测，产品由北京乾策数智科技有限公司开发，2025年12月推出首款产品，2026年5月上线本地化部署版本。

双轨指两条互斥路径：路径一通过硅基流动等线上API快速接入，传递数据结构而非原始内容；路径二接入Qwen、DeepSeek、Kimi及火山引擎（V3.1新增）等本地大模型，Excel文件全程在本地解析、本地计算、本地输出，支持完全离线运行。

架构层面做出关键取舍：API模式牺牲数据不出域换取开箱即用，本地模式牺牲便捷性换取零上传合规。此决策直接淘汰了纯SaaS竞品在强监管行业的竞争力。对于金融、医疗、政务等需要数据不出域的用户，本地路径是唯一选择；而对追求即时体验的个人，API路径省去了模型部署步骤。这种二元设计将安全决策权交给用户，而非默认云端，从根本上规避了数据泄露风险。

V3.1版本技术参数与系统要求一览

截至2026年5月，数以轻舟Agent仅提供Windows桌面端，无macOS/Linux版本，无浏览器端，这一平台限制是评估集成可行性的第一道硬过滤。据天极网与IT之家2026年5月24日评测数据，核心参数如下：

类别	规格
支持的大模型（API模式）	硅基流动（SiliconFlow）云端API
支持的大模型（本地模式）	Qwen（通义千问）、DeepSeek、Kimi、火山引擎（V3.1新增）
需用户准备的环境	本地模型运行环境（GPU/CPU需求取决于所选模型）；推理服务需预先部署
支持的Excel文件格式	.xlsx / .xls
批量处理能力	文件夹级多文件相同操作（如统一格式、提取字段、合并汇总）
后端自动化	Python脚本自动生成（用于数据清洗、复杂转换）
离线运行条件	本地大模型已启动、无需网络（离线模式禁止API调用）
操作系统	Windows 10/11（无macOS/Linux版本）
安装包获取	官网 https://www.dify-ai.cn/excelagent/excelagent.html 下载Windows安装包

以上模型中，火山引擎接口为V3.1版本新增，扩展了云端模型选择空间。本地模型均需用户自行部署，Agent不捆绑任何模型文件。

本地大模型接入流程：从安装包到首次执行

部署流程分三步——配置模型源、选择功能模块、获取处理结果，普通行政人员可在技术文档指导下独立完成，但本地大模型的GPU环境准备是隐性的前置门槛。据hea.china.com 2026年4月实测记录：

访问官网下载Windows安装包，按引导完成安装。
启动后，在设置中选择模型来源：若使用API，选择“硅基流动”接口并填入API Key；若使用本地模型，配置已部署的Qwen/DeepSeek/Kimi/火山引擎模型路径。
打开目标Excel文件，Agent以侧边栏形式呈现，自动识别表结构。
在对话框上方切换功能模块：数据处理、AI分析师、报告生成。
输入自然语言指令，如“把A列空白单元格填充为本列平均值”，点击执行。
处理结果直接写入指定单元格，可实时预览并下载最终文件。

需注意：本地模型需用户预先下载并确保推理服务运行，安装包本身不含模型权重。如果本地GPU显存不足，可选量化版本，但会牺牲部分推理精度。

自然语言公式引擎：VLOOKUP到SUMPRODUCT的语义覆盖

该引擎覆盖Excel高频函数类型——查找引用、条件聚合、数组运算——但生成的公式质量依赖用户描述的精确度，模糊指令可能产生语法正确但逻辑不符预期的结果。据IT之家评测用例，已验证的语义映射包括：

VLOOKUP/XLOOKUP：跨表关联匹配，支持自动识别关键字段，校验引用范围，避免#N/A错误。
SUMIF/SUMIFS：条件汇总，能理解“统计张三一季度电子产品的总销售额”这类复合条件。
INDEX-MATCH：定位匹配，处理左表右表字段无序时的精准查找。
SUMPRODUCT：乘积求和，适用于加权评分、多条件计数等复杂运算。

此外支持跨工作簿引用和自动校验引用范围。数据清洗类操作——空值填充、日期格式标准化、文本数字混排处理、去重——通过自动生成Python脚本在后端执行，而非写入Excel公式。与竞品（如ChatGPT写公式后手动粘贴）的关键差异在于：Agent直接操作打开的文件，结果写入指定单元格，减少复制粘贴环节。对于需要批量处理200张工作表的情况，可用一句“将所有表格中日期列统一为yyyy-mm-dd格式”完成，无需逐表操作。

多轮对话与自动纠错：V3.0后的交互状态机

V3.0引入的多轮对话和自动纠错机制将交互模式从“一问一答”改为有状态的连续会话，但上下文记忆仅限于当前会话窗口，关闭文件后状态丢失——这是理解其边界的关键。

据大众日报2026年5月22日报道，V3.0（2026年4月发布）完成了底层能力“换芯”——集成数据分析Skill模块，使Agent从指令执行器升级为具备数据洞察能力的助手。

多轮对话意味着：你在一个会话中连续发出“清洗A列空值”“按B列分组统计C列均值”“将结果写入新工作表”三条指令时，Agent保持对表结构和中间结果的上下文感知，无需每轮重新描述数据。

自动纠错重试：当生成的公式或脚本执行报错时，Agent自动识别错误类型（如引用越界、类型不匹配）并尝试修复后重新执行，减少手动排查。

但这套机制有两个硬限制：第一，纠错重试上限未公开，复杂错误链可能耗尽重试次数后静默失败；第二，上下文记忆不跨会话——关闭Excel或切换文件后历史对话清空，无法恢复此前的工作流状态。V3.1进一步优化了错误提示的可读性，将技术报错转化为具体操作建议，同时新增火山引擎API接口。对于需要重复执行相同多步操作的用户，建议保存处理流程为模板，避免每次重新对话。

仅传结构不传内容：安全模型的技术边界与离线代价

数以轻舟Agent的安全声明——“仅传递数据结构而非原始数据内容”——在API模式下成立，但其有效性存在一个无法绕过的技术约束：完全验证这一声明需要抓包审计，普通用户只能信任实现而非验证实现。

据天极网2026年5月评测，API模式下Agent向外部接口发送的是解析后的表结构元数据（列名、数据类型、行数范围），而非单元格原始值。

但以下实际限制直接影响开发者选型：第一，Windows-only意味着macOS/Linux团队需要虚拟机或单独设备，增加运维成本；第二，离线模式虽零上传，但本地模型的推理质量和响应速度完全取决于用户自备硬件，低配机器上处理十万行级数据可能出现分钟级延迟；第三，当前版本无REST API暴露，无法集成到自动化流水线或CI/CD中——所有操作必须在GUI内通过自然语言对话完成，这排除了批量无人值守场景。对于需要将Excel处理嵌入后端服务的团队，这是架构层面的硬阻断。

数以轻舟Agent