DTBot 的“多媒体入库”,可以将非结构化/媒体文件(图片、PDF、HTML、MD、DOCX)通过提示词描述提取关键信息进行入库,比如:提取图片的身份证号码,姓名等。
一、配置以及输入输出说明
在工作流编辑界面中,位于左侧 「数据处理」 分类下的 「多媒体入库」 节点,即为目前支持的入库智能体。
输入参数
- 提示词: 提取的描述提示词。
- 输入文件: 选填,待识别的媒体文件,支持多个,不填就取上一个智能体的输出文件。
- 输出表名: 入库的表名称。不能与现有表重复。
输出
输出表到数据库堆,无文件输出。
执行完入库后,可以查看到数据库堆的表情况。

二、案例
媒体文件包括:图片、PDF(含图片与文字)、HTML、MD、WORD 文档。这类文件不具备二维行列结构,本质为非结构化内容。
因此,媒体文件入库时需通过提示词(Prompt)引导模型进行信息抽取,将其转化为二维行列结构。
下面为一个身份证提取的案例:
请根据下面规则提取字段:“姓名,性别,民族,出生日期,住址,身份证号码,签发机关,证件有效期”。
## 一、姓名
规则:
1. 识别证件正面“姓名”字段内容
2. 保留原始姓名全称,不做简写或拆分
3. 姓名中含少数民族姓名空格或特殊符号时需保留
输出示例:
阿依努尔·艾合买提
## 二、性别
规则:
1. 优先识别字段“性别”内容
2. 仅输出“男”或“女”,不输出“性别:男”
3. 模糊时以身份证号第17位奇偶校验补充判断(奇数为男,偶数为女)
输出示例:
男
## 三、民族
规则:
1. 识别字段“民族”内容
2. 统一输出民族名称(如“汉”“维吾尔”“蒙古”)
3. 不输出“族”字(如“汉族”统一输出“汉”)
输出示例:
汉
## 四、出生日期
规则:
1. 识别“出生”字段日期
2. 统一转为标准格式:YYYY-MM-DD
3. 若原文为“1990年3月2日”→“1990-03-02”
4. 若只识别到年月,默认补“01”
输出示例:
1990-03-02
## 五、住址
规则:
1. 识别“住址”字段全部内容
2. 保留省市区县街道门牌等完整信息
3. 多行住址需合并为一行输出
4. 不要删减或纠错地址
输出示例:
广东省深圳市南山区科技园南区1号楼502室
## 六、身份证号码
规则:
1. 识别18位身份证号码,需完整保留
2. 若末位为“X”,需保持大写
3. 防止“0/O”“1/I”“2/Z”误识
4. 若号码缺失或不完整,输出“【未识别到】”并提示需补拍
输出示例:
440301199003021234
## 七、签发机关
规则:
1. 识别“签发机关”字段内容
2. 保留全称,如“深圳市公安局南山分局”
3. 不做简写
输出示例:
深圳市公安局南山分局
## 八、证件有效期
规则:
1. 识别“有效期限/有效期”字段
2. 统一格式:YYYY-MM-DD 至 YYYY-MM-DD
3. 若为长期有效,输出“长期”
4. 若只识别到开始日期,结束日期标注“【未识别到】”
输出示例:
2018-06-01 至 2038-06-01 或 长期
下面为车牌号的提取案例:
请根据下面规则提取字段:“车牌号,车牌颜色,是否新能源”。
## 一、车牌号
规则:
识别车牌图像中的号牌号码
保留完整车牌号,包括汉字、字母和数字
格式如:京A12345、沪B88888、粤CD12345
注意区分字母与数字的相似字符(如“0/O”“1/I”“2/Z”)
若车牌污损或遮挡导致识别不全,输出“【部分遮挡】+可识别部分”
输出示例:
京A12345
## 二、车牌颜色
规则:
根据图像识别车牌底色
输出标准颜色分类:蓝、黄、绿、白、黑
颜色说明:
蓝色:普通燃油车
黄色:大型车辆、驾校车辆
绿色:新能源车(小型车绿底黑字,大型车绿底黄字或渐变绿)
白色:警用车辆、军用车辆
黑色:涉外车辆(外资企业、外籍人士)
若颜色模糊无法判断,输出“【无法识别】”
输出示例:
蓝
## 三、是否新能源
规则:
综合车牌号和车牌颜色判断
判断依据:
车牌颜色为绿色 → 是
车牌为6位号码(不含汉字),小型车第二位为字母D/F,大型车末位为D/F → 是
其他情况 → 否
输出“是”或“否”
输出示例:
否
✨小秘诀 : 这些提示词千万不要自己傻傻的写。都可以直接交给AI来生成,比如我拿到DeepSeek里面:

三、总结
DTBot 的“多媒体入库”智能体是一款基于自然语言驱动的非结构化数据提取与入库工具,用户只需输入提示词,即可从图片、PDF、HTML、MD、DOCX 等媒体文件中提取关键信息并入库至数据库堆,无需编写代码;配置上支持多文件输入与自定义输出表名,执行后生成数据库表而非文件输出。使用时需通过提示词明确提取字段及规则,如身份证的姓名、性别、号码等信息或车牌号、车牌颜色等场景,提示词越具体、规则越清晰,提取效果越稳定。该工具适用于从非结构化内容中抽取结构化信息的场景,且提示词可由 AI 辅助生成,提升使用效率。