DTBot 的“文件拆分”智能体,可以根据提示词将输入文件(CSV / XLSX)进行任意拆分生成多个子CSV文件。

一、配置以及输入输出说明

在工作流编辑界面中,位于左侧 「文件处理」 分类下的 「文件拆分」 节点。如下图:


输入参数

  • 提示词: 拆分逻辑的描述提示词。
  • 输入文件: 选填,待拆分的文件(CSV/XLSX),支持多个,不填就取上一个智能体的输出文件
  • 输出目录: 选填,拆分后的子文件存放位置,不指定就默认在系统工作流目录。


输出

拆分后的CSV子文件列表


二、案例

比如有一份表格如下:

主订单编号 子订单编号 选购商品 商品规格 商品数量 商品ID 商家编码 商品单价 订单应付金额 运费 优惠总金额 平台优惠 商家优惠 达人优惠
6950386459060082569 6950386459060082569 沈小善坚果粗粮面包0添防腐剂全麦五黑小米山药核桃充饥零食代餐 小米山药坚果粗粮面包【送4个 到手10个】;50g*1枚 1 3790660001622786146 小米山药坚果粗粮面包500g 5 2 0 4 平台大促限时优惠券-4.00 - -
6923383253108292963 6923383253108555107 小米山药粗粮面包 默认 1 3787339658917183662 5 2 0 0 - - -
6923491310882750098 6923491310883012242 小米山药粗粮面包 默认 1 3787339658917183662 5 2 0 0 - - -
6924466786271067138 6924466786271067138 沈小善坚果粗粮面包0添防腐剂全麦五黑小米山药核桃充饥零食代餐 小米山药坚果粗粮面包【送4个 到手10个】;50g*1枚 1 3792550036265632031 小米山药坚果粗粮面包500g 5 2 0 0 - - -
6924166815117376635 6924166815117376635 路路通-可搭配枸杞 500g*1袋 1 3799806095824913194 路路通500g 5 2 0 0 - - -


需要按照“选购商品”列的名称进行拆分,那么上面的数据就会被拆成3个表。

我们只需配置如下提示词便可完成:


三、提示词注意事项

编写提示词尽量注意如下情况:

1. 先写清楚 按哪一列拆分 ,不要只说“帮我拆一下”

2. 如果是计算后拆分,要写清楚 计算规则 ,比如“大于等于5000归高销售额”

3. 如果是多列组合拆分,要明确说出 参与组合的列名 ,比如“按省份和城市拼接后拆分”

4. 列名尽量使用文件里的 真实标题名 ,不要自己起简称

5. 条件要具体,尽量写成“等于 / 不为空 / 大于等于 / 小于 / 包含”这种明确规则

6. 最好说明 空值怎么处理 ,比如“门店为空时归到未知门店”

7. 如果要控制拆分结果名称,最好直接写出 文件命名规则

8. 一次提示词尽量只描述 一个清晰的拆分逻辑

9. 适合做 单表按列或按计算结果拆分 ,不适合跨表关联后再拆分

10. 提示词越具体,拆分结果越稳定,避免使用“按情况拆分”“合理分类”这种模糊说法


下面这些提示词,都是这个工具比较适合处理的真实场景。

- 按“门店”列拆分文件,每个门店输出一个单独文件。

- 按“省份”和“城市”两列拼接后拆分文件,文件名格式为“省份_城市”。

- 按“销售员”列拆分,如果销售员为空则归到“未知销售员”文件。

- 按“客户等级”列拆分,把“普通、银卡、金卡、铂金、黑金”分别输出到不同文件。

- 按“日期”列中的月份拆分,例如“1月”“2月”分别生成不同文件。

- 按“销售额”列计算区间后拆分:小于1000为“低销售额”,1000到5000为“中销售额”,大于等于5000为“高销售额”。

- 按“评价分”列计算等级后拆分:大于等于5输出到“优秀”文件,大于等于4且小于5输出到“中等”文件,其余输出到“一般”文件。

- 按“是否促销”和“支付方式”两列组合拆分,例如“是_微信”“否_支付宝”分别输出成文件。

- 按“退货标记”列拆分,把“是”单独输出一个文件,“否”输出另一个文件。

- 按“库存”和“销售数量”计算库存状态后拆分:如果库存小于销售数量输出到“库存不足”文件,否则输出到“库存充足”文件。


四、总结

DTBot 的“文件拆分”智能体是一款自然语言驱动的文件拆分工具,用户只需输入提示词即可将 CSV 或 XLSX 文件按任意规则拆分为多个子 CSV 文件,无需编写代码;配置上支持多文件输入与自定义输出目录,拆分后返回子文件列表,使用提示词时需明确拆分依据的列名或计算规则、条件具体化、空值处理方式及文件命名规则,一次提示词建议只描述一个清晰的拆分逻辑,适用于单表按列或按计算结果拆分,不适用于跨表关联场景。