返回典籍目录

《书目答问补正》服饰内容提取 — 操作日志

操作时间:2026-05-05 操作者:AI SubAgent (Task 2-3) 输入文件:书目答问补正.txt(2029行,597,995字节)


操作流程

Step 1: 读取参考模板

读取华阳国志三个模板文件,理解排版格式: - 华阳国志_原文提取.md:原文引用+行号+分类 - 华阳国志_总结.md:概览+分类总结+对抗式审查表 - 华阳国志_日志.md:操作流程+去噪记录+关键发现

Step 2: 统计文件基本信息

wc -l: 2029 行
wc -c: 597,995 字节(约584KB)

文件为清张之洞撰、范希曾补正之目录学著作,著录约二千余部典籍,按经史子集四部分类。

Step 3: 多轮grep提取服饰关键词

第一轮:基本服饰类

关键词 命中行数 有效行数 噪音类型
9 0 全部为人名"孙衣言"
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
12 0 全部为人名"梁履绳""陶福履""方履""金履祥""刘履恂"等
0 0

第一轮结论:基本服饰词全部为噪音,无有效命中。此书为目录学著作,不含具体服饰描写。

第二轮:冠帽首饰类

关键词 命中行数 有效行数 噪音类型
6 1 "鹖冠子"为书名,"冠于别集之前"为引申义;仅"弁服"相关有效
1 0 "侧帽词"为词集名
52 0 全部为"巾箱本"(袖珍版本书志术语)
0 0
0 0
0 0
4 0 "小琅环馆""琅环山馆"为书斋/丛书名
9 0 "佩Δ"为书名,"张佩芳"为人名,"佩文斋"为书名
5 0 "山带阁"为书名,"带经堂"为堂号
1 0 "庄绶甲"为人名
1 0 "宝笏楼"为楼名

第二轮结论:冠帽首饰类几乎全部为书名、人名、版式术语噪音。

第三轮:织物面料类

关键词 命中行数 有效行数 噪音类型
0 0
22 0 全部为人名"葛""葛鸣阳""葛其仁""葛禄""葛元煦""葛洪"
1 0 "麻沙本"为版本术语
1 0 "乌丝词"为词集名
0 0
14 2 "锦里耆旧传"为书名噪音;有效:《蜀锦谱》《锦绣万花谷》
1 0 人名
0 0
21 0 全部为人名"罗振玉""罗福苌"等
0 0
0 0
0 0
6 0 "布政司""粟布演草""货布文字考"均非织物内容
0 0
0 0
0 0
1 0 不涉及服饰

第三轮结论:织物面料类噪音比例极高,"葛"字22行全部为人名,"罗"字21行全部为人名。

第四轮:工艺制度类

关键词 命中行数 有效行数 噪音类型
0 0
3 0 "绣石书堂""五绣堂"为书坊名
0 0
3 2 "冰蚕词"为词集名噪音;有效:《蚕书》
3 2 有效:《橡茧图说》《樗茧谱》
0 0
13 0 "素问"为医书,"缃素杂记"为书名,"养素堂"为堂号
0 0
0 0
0 0
0 0
1 0 "王黼"为人名
章服 0 0
服色 0 0

第四轮结论:工艺制度类几乎无有效命中。

第五轮:特殊服饰类

关键词 命中行数
赐服/赐紫/借紫/服紫/服绯 0
补服/龙袍/凤冠/霞帔 0
抹额/璎珞/禁步/玉佩/鱼袋 0
头戴/身穿/脚穿/着衣/穿衣 0
衣青/衣朱/衣黄/衣白/衣黑/衣玄 0

第五轮结论:特殊服饰类零命中。

补充搜索(针对目录学著作特点调整策略)

由于前五轮按常规服饰关键词搜索几无收获,调整为以书目内容为导向的搜索策略:

搜索词 命中行数 有效命中
深衣 2 2(《深衣考误》《深衣释例》)
冕服/弁服 2 2(《弁服释例》《冕服考》)
丧服 6 6
礼器图/礼器图式 2 2
三礼图 1 1
舆服 1 1(《南北史补志》含《舆服志》)
服制 1 1("以上宫室、服制之属")
蜀锦 1 1(《蜀锦谱》)
蚕书/农桑 5 5
木绵谱 1 1
古今注 1 1
五礼通考 2 2
考工记 3 3
桂海虞衡志 1 1
蛮书 1 1
符牌/官印 2 2

Step 4: sed提取上下文

对关键行号使用sed提取上下文,主要范围:

行号范围 内容摘要
199-207 考工记图、车制图考
211-213 仪礼图
221-225 弁服释例、冕服考、丧服类
231-233 礼器图、仪礼集释
240-241 深衣考误、深衣释例
254-258 白虎通义
267-269 五礼通考、三礼图集注
372 丧服变除
596 南北史补志(舆服志)
856-859 蛮书、峒溪纤志、番社采风图考
891 蜀锦谱、桂海虞衡志、岭外代答
919-925 大清会典、大清通礼、皇朝礼器图式、吾学录
995 历代符牌录
1005 集古官印考证
1165-1168 风俗通义、古今注
1246-1251 蚕书、橡茧图说、樗茧谱、木绵谱、农桑辑要
1349 丧服辑略、丧服今制表
1366-1367 南薰殿图象考、佩文斋书画谱

Step 5: 精简筛选

去除的噪音类型:

  1. 人名噪音:孙衣言、葛洪、罗振玉、庄绶甲、张佩芳、梁履绳、方履、金履祥等(含服饰字但为人名)
  2. 版式术语噪音:巾箱本(52行"巾"字全部为袖珍版本术语,非头巾之意)、麻沙本
  3. 书名/堂号噪音:佩文斋、带经堂、养素堂、宝笏楼、琅环馆、侧帽词、乌丝词、冰蚕词、锦绣万花谷
  4. 引申义噪音:冠于别集之前、类书之冠、绣石书堂
  5. 医书噪音:素问(非白色丝织品,为医书名)
  6. 非服饰织物:布政司(行政机构)、粟布演草(算书)、货布文字考(钱币学)

最终保留的服饰相关书目:

共筛选出约41条有效服饰相关书目录,涵盖: - 礼制服制专书(约15种) - 政书服制(约7种) - 农桑织物(约7种) - 杂家参考(约6种) - 边地民族(约6种)

Step 6: 对抗式审查结果

对总结中所有41条引用逐一回溯grep原文核实: - 通过:41/41 - 虚构:0 - 误引:0 - 行号错误:0


关键发现

  1. 《书目答问补正》几乎不含直接服饰内容——作为目录学著作,它记录的是"关于服饰的书"而非"服饰本身"
  2. 关键词噪音率极高——五轮常规服饰关键词搜索的有效命中率不足1%,绝大多数为"巾箱本""葛洪""罗振玉"等目录学语境下的噪音
  3. 需调整搜索策略——对于目录学类古籍,应直接搜索书名中的服制术语(弁服、冕服、丧服、深衣、礼器图式、舆服等)而非泛用服饰关键词
  4. 经部礼制类是核心——弁服、冕服、深衣、丧服、三礼图等专著均在经部仪礼类中
  5. 清代官修政书价值最高——《皇朝礼器图式》《大清会典图》为服饰制度研究的一手材料
  6. 蜀锦谱为纺织史孤本——元费著《蜀锦谱》是唯一以织物品种命名的专书
  7. 集部完全无涉——全书集部(诗文评、别集、总集)中无任何服饰相关著录

保存文件

文件 大小
书目答问补正_总结.md ~8KB
书目答问补正_日志.md 本文件
书目答问补正_原文提取.md ~7KB

备注