DTBot 的“数据入库”智能体可将二维表结构的文件解析后存入数据库堆,供后续智能体使用。每个文件对应一张表,默认以文件名为表名,故文件名需唯一;若为 Excel 文件,其每个工作表(Sheet)将独立建表,表名即工作表名。目前支持入库的格式包括:CSV、XLSX、XLS、TXT、JSON。

千万要注意:数据文件必须包含标题行,否则将导致入库失败。

数据库堆”含义请见: DT-Bot 简介


一、配置以及输入输出说明

在工作流编辑界面中,位于左侧 「数据处理」 分类下的 「数据入库」 节点,即为目前支持的入库智能体。

输入参数

  • 输入文件: 选填,待入库的文件,支持多个,不填就取上一个智能体的输出。


输出

多个数据库堆表


执行完入库后,可以查看到数据库堆的表情况。


二、入库文件描述

支持的文件为:“CSV、XLSX、XLS、TXT、JSON”。

2.1 文件说明

XLSX+CSV文件

这两类都是天生的行,列结构文件,只要注意有标题行存在和数据列的数据类型保持一致就行了。

TXT文件

后缀名为.txt的文件,入库的 TXT 文件需遵循以下格式规则,请按此准备文件:

  • 第 1 行为标题行,定义每一列的字段名称
  • 从第 2 行开始为数据行,每行一条记录,列顺序须与标题行保持一致

分隔符说明

  • 推荐使用 逗号 ,(最常用)
  • 也支持 制表符(Tab) 或 分号 ;
  • 请勿混用多种分隔符,一份文件内须统一使用一种

示例(逗号分隔)

订单ID,下单时间,金额,是否支付,城市
O000000001,2025-01-01 08:00:00,1234.56,true,上海
O000000002,2025-01-02 09:10:00,88.00,false,北京

Json文件格式

后缀名为.json的文件,格式如下:

[
  {
    "订单ID": "O000000001",
    "下单时间": "2025年1月1号 8:00:00",
    "金额": 1234.56,
    "是否支付": true,
    "城市": "上海"
  },
  {
    "订单ID": "O000000002",
    "下单时间": "2025-01-02 09:10:11",
    "金额": 88,
    "是否支付": false,
    "城市": "北京"
  }
]

三、总结

DTBot 的数据入库智能体支持结构化文件(CSV、Excel等)自动入库。使用时需注意:文件必须有标题行,文件名作为表名须唯一。

特别说明:数据入库只是数据处理的第一步,文件入库后生成数据库表,后续即可通过表名称对这些表进行查询、分析、加工等进一步操作。掌握入库要点,即可为后续数据处理打好基础。