今天,我们以一个“列类型转换”的案例为例,对表格中的列执行如下操作:

1. 将表格时间列进行强制转换成yyyy/MM/dd格式。当有脏数据转换失败时,填充“Error”。
2.将表格数值列强制转换成小数格式。当有脏数据转换失败时,填充“Error”。
3. 将表格性别列强制转换成男,女(固定枚举值)。当有脏数据转换失败时,填充“Error”。


一、需求分析

有一个表格,2000w数据。截取了表头和部分数据:

记录ID 下单时间 交易序号 折扣率 订单金额 账单日期 支付完成时间 客户备注 会员性别
R000000001 2025/4/1 8:11 1 12.35% 1235.5678901230 2025/4/1 2025/4/1 8:11 原样文本-1
R000000002 2025/4/1 8:22 00000002 0.123456 ¥1,234.57 2025/4/1 2025/4/1 8:22  保留前后空格  
R000000003 2025年4月1日 08:33:00 -3 1 -101.7654322 2025年4月1日 2025-04-01T08:33:00 文本,带逗号
R000000004 2025.04.01 08:44:00 -4 99.90% 0.0000548 2025.04.01 2025年4月1日 08:44:00 文本/特殊|分隔 未知
R000000005 20250401085500 123.45 0.005 -3456.789123 2025/4/1 2025.04.01 08:55 TEXT-000005
R000000006 2025-04-01T09:06:00 整数错误 百分比错误 小数错误 20250401 46097
R000000007 2025/4/1 1,234 88 88 日期错误 时间解析失败 原样文本-7
R000000008 2025/4/1 9:28  保留前后空格  
R000000009 46097 9 12.35% 1243.5678901230 2025/4/1 2025/4/1 9:39 文本,带逗号
R000000010 时间错误-10 00000010 0.123456 ¥1,234.57 2025/4/1 2025/4/1 9:50 文本/特殊|分隔 未知
R000000011 2025/4/1 10:01 -11 1 -102.7654322 2025年4月1日 2025-04-01T10:01:00 TEXT-000011


下单时间列: 需要强制转换成 yyyy/MM/dd格式 , 转换不了的 填充“Error”。

订单金额列:需要强制转换成小数,并且保留6位小数, 转换不了的 填充“Error”。

会员性别列:只能有 男,女两个值,其它的值都填充“Error”。


二、工作流配置

为了对表格进行数据类型转换,我们首先需要获取表格,然后配置”列类型转换“。


找到 ”文件获取“智能体,然后输出提示词,如图:

提示词描述的就是你的待处理的表格的位置, 可以描述目录,支持多个批量处理。


然后挂一个”列类型转换“,如图:

配置好要转换的列, 注意列名称一定要和表格文件的标题保持一致。 然后执行工作流。

等执行完成后,我们预览结果数据,还可以打开目录查看结果文件,如图: