今天给大家带来一个实际的案例分析:“退款数据分析”。数据量1500w行。

本次分析涵盖的核心统计维度与指标如下:

1. 整体汇总:帮我看一下整体的订单量、退款订单量、退款率和退款总金额。

2. 单维分组统计:按店铺名称分组,看看每个店铺的订单总数、退款订单数、退款率和退款总金额。

3. 原因分析:按退款原因分组,分析不同退款原因分别有多少退款订单、退款金额是多少。

4. 趋势分析:按月份看订单量、退款量和退款金额的变化趋势。

5. 异常数据分析:统计一下哪些订单金额异常,比如小于 0 或等于 0 的订单有多少,这些异常订单里退款情况怎么样。

6. TopN 排名:帮我找出退款金额最高的前 10 笔退款记录,看看都是什么订单、什么商品、什么退款原因。

7. 带过滤条件的分组统计:只看退款表里有记录的订单,按店铺名称和退款原因分组,输出店铺总订单数、退款订单数、退款率和退款总金额。

8. 主因识别:帮我看每个店铺最常见的退款原因是什么,对应退款金额有多少。

9. 占比分析:我想知道退款订单里,不同退款类型(仅退款、退货退款)分别占多少。

10. 渠道对比:按订单来源统计,看看不同来源渠道的退款率有没有明显差异。

11. 设备对比:按设备类型统计,看看不同设备上的订单量、退款量和退款率。

12. 用户分层对比:帮我比较会员订单和非会员订单的退款情况,看看哪一类退款率更高。

13. 业务标签对比:按直播订单和非直播订单分别统计,看看直播带来的订单退款情况怎么样。

14. 商品分析:按商品名称统计,找出退款最多的商品,以及这些商品的退款原因分布。

15. 类目分析:按一级类目统计退款情况,看看哪个类目退款率最高。

16. 品牌分析:按品牌统计,看看哪些品牌的退款金额最高、退款订单最多。

17. 地域分析:帮我分析不同省份、不同城市的退款情况,看看哪些地区问题更集中。

18. 客服分析:按客服名称统计订单和退款情况,看看是不是有客服对应的退款率明显偏高。

19. 物流分析:按快递公司和发货仓统计退款情况,分析是不是物流环节导致退款偏多。

20. 异常金额深挖:帮我找出退款金额异常大的订单,看看这些订单集中在哪些店铺、商品和退款原因上。


一、需求分析

有一批子订单表和退款表(共占5GB),如下图:

订单表列结构和部分数据:

订单号店铺ID店铺名称用户ID下单时间订单金额商品数量支付方式订单状态省份城市商品ID商品名称一级类目二级类目品牌商家编码活动ID优惠券金额运费收货人联系电话收货地址发货仓快递公司快递单号发货时间签收时间是否直播订单是否会员会员等级设备类型流量来源客服ID客服名称订单来源支付单号商家备注买家备注是否异常订单
ORD2026000000000001SHOP0006果然新鲜BUYER000000022026/8/25 9:59287.546微信已取消山东厦门SKU00009广西沃柑礼盒卡券苹果原产直发SHOPSKU0000002ACT0217629.9210.5收货人10000113000000017山东厦门幸福路2号华东一仓韵达金卡Android短视频KF0004客服阿梨APP优先冷链请尽快发货
ORD2026000000000002SHOP0015自然果语BUYER000000032026/3/27 11:5073.121银行卡已发货湖北苏州SKU00015精品果切拼盘休闲零食热带水果每日果仓SHOPSKU000000323.994.22收货人10000213000000034湖北苏州幸福路3号华东一仓韵达YT00000000000022026/3/28 21:50银卡iPad社群分享KF0004客服阿梨小程序PAY00000000000002赠送冰袋工作日白天配送


退款表列结构和部分数据:

退款单号订单号店铺ID退款金额退款原因退款时间退款状态店铺名称用户ID下单时间订单金额商品数量退款类型退款渠道退款件数是否退货审核时间完成时间审核人审核备注退款原因分类售后单号商品ID商品名称责任归属
RF2026000000000001ORD2026000000000001SHOP000653.01价格不满意2026/8/30 12:59已拒绝果然新鲜BUYER000000022026/8/25 9:59287.546退货退款平台余额22026/8/30 13:592026/9/2 4:59审核专员A不想要AFS00000000001SKU00009广西沃柑用户原因
RF2026000000000002ORD2026000000000038SHOP001356.2临时不想要2026/9/23 2:40已退款安心果市BUYER000000392026/9/16 1:4064.521仅退款线下转账12026/9/24 16:402026/9/25 15:40审核专员A凭证齐全不想要AFS00000000002SKU00013猫山王榴莲肉商家责任


现在需要执行如下步骤:

1. 合并:将多个订单子表合并成一个总订单表。多个子退款表也合并成一个总退款表

2. 清理异常:清理掉总订单表订单金额小于0的数据等。


根据 总订单表总退款表 进行下面20个指标数据分析:

1. 整体汇总:帮我看一下整体的订单量、退款订单量、退款率和退款总金额。
2. 单维分组统计:按店铺名称分组,看看每个店铺的订单总数、退款订单数、退款率和退款总金额。
3. 原因分析:按退款原因分组,分析不同退款原因分别有多少退款订单、退款金额是多少。
4. 趋势分析:按月份看订单量、退款量和退款金额的变化趋势。
5. 异常数据分析:统计一下哪些订单金额异常,比如小于 0 或等于 0 的订单有多少,这些异常订单里退款情况怎么样。
6. TopN 排名:帮我找出退款金额最高的前 10 笔退款记录,看看都是什么订单、什么商品、什么退款原因。
7. 带过滤条件的分组统计:只看退款表里有记录的订单,按店铺名称和退款原因分组,输出店铺总订单数、退款订单数、退款率和退款总金额。
8. 主因识别:帮我看每个店铺最常见的退款原因是什么,对应退款金额有多少。
9. 占比分析:我想知道退款订单里,不同退款类型(仅退款、退货退款)分别占多少。
10. 渠道对比:按订单来源统计,看看不同来源渠道的退款率有没有明显差异。
11. 设备对比:按设备类型统计,看看不同设备上的订单量、退款量和退款率。
12. 用户分层对比:帮我比较会员订单和非会员订单的退款情况,看看哪一类退款率更高。
13. 业务标签对比:按直播订单和非直播订单分别统计,看看直播带来的订单退款情况怎么样。
14. 商品分析:按商品名称统计,找出退款最多的商品,以及这些商品的退款原因分布。
15. 类目分析:按一级类目统计退款情况,看看哪个类目退款率最高。
16. 品牌分析:按品牌统计,看看哪些品牌的退款金额最高、退款订单最多。
17. 地域分析:帮我分析不同省份、不同城市的退款情况,看看哪些地区问题更集中。
18. 客服分析:按客服名称统计订单和退款情况,看看是不是有客服对应的退款率明显偏高。
19. 物流分析:按快递公司和发货仓统计退款情况,分析是不是物流环节导致退款偏多。
20. 异常金额深挖:帮我找出退款金额异常大的订单,看看这些订单集中在哪些店铺、商品和退款原因上。


二、工作流配置

为了完成需求,进行统计,我们需要先将数据入库准备数据,然后才能进行表统计。 我们来详细配置下工作流。


步骤1、数据准备阶段(子文件合并,清理,入库)

分别对“订单”,“退款”子表进行:

1. 获取(“文件助手”智能体)

2. 合并(“文件合并”智能体)

3. 清理异常(“内容清理”智能体)

4. 入库(“数据入库”智能体)。

配置节点如下图:

获取子订单表的提示词:

清理异常的提示词:


步骤2、表统计

数据入库好之后。我们就可以进行统计了。

统计1:整体汇总

帮我看一下整体的订单量、订单总金额、退款订单量、退款率和退款总金额。

直接挂一个 “表操作”智能体,输入上面提示词,这样“整体汇总”统计就配置好了。 注意,输出表名也需要输出一个。


配置好之后,我们先跑一下“整体汇总”的结果:

我们发现,总数据已经统计出来了,自己的数据可以核对下。


统计2:单维分组统计

按店铺名称分组,看看每个店铺的订单总数、退款订单数、退款率和退款总金额。

接着挂一个 “表操作”智能体,输入上面提示词,这样“单维分组统计”统计就配置好了。

配置好之后,我们先跑一下“单维分组统计”的结果:

我们发现,单个店铺的数据已经汇总出来了。


统计3:原因分析

按退款原因分组,分析不同退款原因分别有多少退款订单、退款金额是多少。

接着挂一个 “表操作”智能体,输入上面提示词,这样“原因分析”统计就配置好了。


配置好之后,我们先跑一下“原因分析”的结果:

我们发现,每个原因的 退款金额已经统计出来了。


统计4:趋势分析

按月份看订单量、退款量和退款金额的变化趋势。

接着挂一个 “表操作”智能体,输入上面提示词,这样“趋势分析”统计就配置好了。

配置好之后,我们先跑一下“趋势分析”的结果:

我们发现,每个月的 分析数据已经出来了。


统计5:配置所有的统计节点

同理,我们将剩下的所有节点配置完成,提示词:

5. 异常数据分析:统计一下哪些订单金额异常,比如小于 0 或等于 0 的订单有多少,这些异常订单里退款情况怎么样。
6. TopN 排名:帮我找出退款金额最高的前 10 笔退款记录,看看都是什么订单、什么商品、什么退款原因。
7. 带过滤条件的分组统计:只看退款表里有记录的订单,按店铺名称和退款原因分组,输出店铺总订单数、退款订单数、退款率和退款总金额。
8. 主因识别:帮我看每个店铺最常见的退款原因是什么,对应退款金额有多少。
9. 占比分析:我想知道退款订单里,不同退款类型(仅退款、退货退款)分别占多少。
10. 渠道对比:按订单来源统计,看看不同来源渠道的退款率有没有明显差异。
11. 设备对比:按设备类型统计,看看不同设备上的订单量、退款量和退款率。
12. 用户分层对比:帮我比较会员订单和非会员订单的退款情况,看看哪一类退款率更高。
13. 业务标签对比:按直播订单和非直播订单分别统计,看看直播带来的订单退款情况怎么样。
14. 商品分析:按商品名称统计,找出退款最多的商品,以及这些商品的退款原因分布。
15. 类目分析:按一级类目统计退款情况,看看哪个类目退款率最高。
16. 品牌分析:按品牌统计,看看哪些品牌的退款金额最高、退款订单最多。
17. 地域分析:帮我分析不同省份、不同城市的退款情况,看看哪些地区问题更集中。
18. 客服分析:按客服名称统计订单和退款情况,看看是不是有客服对应的退款率明显偏高。
19. 物流分析:按快递公司和发货仓统计退款情况,分析是不是物流环节导致退款偏多。
20. 异常金额深挖:帮我找出退款金额异常大的订单,看看这些订单集中在哪些店铺、商品和退款原因上。



配置完成后,我们执行就可以了。但是我们需要将统计结果输出到结果文件,并且每一个维度的统计都输出一个文件。


三、统计结果输出到文件

我们只需要在最后挂一个“数据出库”节点,然后选择要下载的表名称,如下图:


等待执行完成,打开目录,就可以看到所有统计文件,如图:


四、总结

本文以1500万行、5GB电商退款数据为例,完整演示了从子表合并、异常清理、数据入库,到20个维度指标统计的全流程工作流配置,并实现每个指标独立输出,为大规模退款分析提供了一套可复用的实战方案。