《书目答问补正》服饰内容提取 — 操作日志
操作时间:2026-05-05 操作者:AI SubAgent (Task 2-3) 输入文件:书目答问补正.txt(2029行,597,995字节)
操作流程
Step 1: 读取参考模板
读取华阳国志三个模板文件,理解排版格式: - 华阳国志_原文提取.md:原文引用+行号+分类 - 华阳国志_总结.md:概览+分类总结+对抗式审查表 - 华阳国志_日志.md:操作流程+去噪记录+关键发现
Step 2: 统计文件基本信息
wc -l: 2029 行
wc -c: 597,995 字节(约584KB)
文件为清张之洞撰、范希曾补正之目录学著作,著录约二千余部典籍,按经史子集四部分类。
Step 3: 多轮grep提取服饰关键词
第一轮:基本服饰类
| 关键词 | 命中行数 | 有效行数 | 噪音类型 |
|---|---|---|---|
| 衣 | 9 | 0 | 全部为人名"孙衣言" |
| 裳 | 0 | 0 | — |
| 袍 | 0 | 0 | — |
| 衫 | 0 | 0 | — |
| 裙 | 0 | 0 | — |
| 袄 | 0 | 0 | — |
| 裤 | 0 | 0 | — |
| 袜 | 0 | 0 | — |
| 鞋 | 0 | 0 | — |
| 履 | 12 | 0 | 全部为人名"梁履绳""陶福履""方履""金履祥""刘履恂"等 |
| 靴 | 0 | 0 | — |
第一轮结论:基本服饰词全部为噪音,无有效命中。此书为目录学著作,不含具体服饰描写。
第二轮:冠帽首饰类
| 关键词 | 命中行数 | 有效行数 | 噪音类型 |
|---|---|---|---|
| 冠 | 6 | 1 | "鹖冠子"为书名,"冠于别集之前"为引申义;仅"弁服"相关有效 |
| 帽 | 1 | 0 | "侧帽词"为词集名 |
| 巾 | 52 | 0 | 全部为"巾箱本"(袖珍版本书志术语) |
| 笄 | 0 | 0 | — |
| 簪 | 0 | 0 | — |
| 钗 | 0 | 0 | — |
| 环 | 4 | 0 | "小琅环馆""琅环山馆"为书斋/丛书名 |
| 佩 | 9 | 0 | "佩Δ"为书名,"张佩芳"为人名,"佩文斋"为书名 |
| 带 | 5 | 0 | "山带阁"为书名,"带经堂"为堂号 |
| 绶 | 1 | 0 | "庄绶甲"为人名 |
| 笏 | 1 | 0 | "宝笏楼"为楼名 |
第二轮结论:冠帽首饰类几乎全部为书名、人名、版式术语噪音。
第三轮:织物面料类
| 关键词 | 命中行数 | 有效行数 | 噪音类型 |
|---|---|---|---|
| 裘 | 0 | 0 | — |
| 葛 | 22 | 0 | 全部为人名"葛""葛鸣阳""葛其仁""葛禄""葛元煦""葛洪" |
| 麻 | 1 | 0 | "麻沙本"为版本术语 |
| 丝 | 1 | 0 | "乌丝词"为词集名 |
| 绢 | 0 | 0 | — |
| 锦 | 14 | 2 | "锦里耆旧传"为书名噪音;有效:《蜀锦谱》《锦绣万花谷》 |
| 绮 | 1 | 0 | 人名 |
| 绫 | 0 | 0 | — |
| 罗 | 21 | 0 | 全部为人名"罗振玉""罗福苌"等 |
| 缎 | 0 | 0 | — |
| 纱 | 0 | 0 | — |
| 绸 | 0 | 0 | — |
| 布 | 6 | 0 | "布政司""粟布演草""货布文字考"均非织物内容 |
| 棉 | 0 | 0 | — |
| 绒 | 0 | 0 | — |
| 褐 | 0 | 0 | — |
| 毡 | 1 | 0 | 不涉及服饰 |
第三轮结论:织物面料类噪音比例极高,"葛"字22行全部为人名,"罗"字21行全部为人名。
第四轮:工艺制度类
| 关键词 | 命中行数 | 有效行数 | 噪音类型 |
|---|---|---|---|
| 染 | 0 | 0 | — |
| 绣 | 3 | 0 | "绣石书堂""五绣堂"为书坊名 |
| 织 | 0 | 0 | — |
| 蚕 | 3 | 2 | "冰蚕词"为词集名噪音;有效:《蚕书》 |
| 茧 | 3 | 2 | 有效:《橡茧图说》《樗茧谱》 |
| 帛 | 0 | 0 | — |
| 素 | 13 | 0 | "素问"为医书,"缃素杂记"为书名,"养素堂"为堂号 |
| 缟 | 0 | 0 | — |
| 絺 | 0 | 0 | — |
| 纁 | 0 | 0 | — |
| 黻 | 0 | 0 | — |
| 黼 | 1 | 0 | "王黼"为人名 |
| 章服 | 0 | 0 | — |
| 服色 | 0 | 0 | — |
第四轮结论:工艺制度类几乎无有效命中。
第五轮:特殊服饰类
| 关键词 | 命中行数 |
|---|---|
| 赐服/赐紫/借紫/服紫/服绯 | 0 |
| 补服/龙袍/凤冠/霞帔 | 0 |
| 抹额/璎珞/禁步/玉佩/鱼袋 | 0 |
| 头戴/身穿/脚穿/着衣/穿衣 | 0 |
| 衣青/衣朱/衣黄/衣白/衣黑/衣玄 | 0 |
第五轮结论:特殊服饰类零命中。
补充搜索(针对目录学著作特点调整策略)
由于前五轮按常规服饰关键词搜索几无收获,调整为以书目内容为导向的搜索策略:
| 搜索词 | 命中行数 | 有效命中 |
|---|---|---|
| 深衣 | 2 | 2(《深衣考误》《深衣释例》) |
| 冕服/弁服 | 2 | 2(《弁服释例》《冕服考》) |
| 丧服 | 6 | 6 |
| 礼器图/礼器图式 | 2 | 2 |
| 三礼图 | 1 | 1 |
| 舆服 | 1 | 1(《南北史补志》含《舆服志》) |
| 服制 | 1 | 1("以上宫室、服制之属") |
| 蜀锦 | 1 | 1(《蜀锦谱》) |
| 蚕书/农桑 | 5 | 5 |
| 木绵谱 | 1 | 1 |
| 古今注 | 1 | 1 |
| 五礼通考 | 2 | 2 |
| 考工记 | 3 | 3 |
| 桂海虞衡志 | 1 | 1 |
| 蛮书 | 1 | 1 |
| 符牌/官印 | 2 | 2 |
Step 4: sed提取上下文
对关键行号使用sed提取上下文,主要范围:
| 行号范围 | 内容摘要 |
|---|---|
| 199-207 | 考工记图、车制图考 |
| 211-213 | 仪礼图 |
| 221-225 | 弁服释例、冕服考、丧服类 |
| 231-233 | 礼器图、仪礼集释 |
| 240-241 | 深衣考误、深衣释例 |
| 254-258 | 白虎通义 |
| 267-269 | 五礼通考、三礼图集注 |
| 372 | 丧服变除 |
| 596 | 南北史补志(舆服志) |
| 856-859 | 蛮书、峒溪纤志、番社采风图考 |
| 891 | 蜀锦谱、桂海虞衡志、岭外代答 |
| 919-925 | 大清会典、大清通礼、皇朝礼器图式、吾学录 |
| 995 | 历代符牌录 |
| 1005 | 集古官印考证 |
| 1165-1168 | 风俗通义、古今注 |
| 1246-1251 | 蚕书、橡茧图说、樗茧谱、木绵谱、农桑辑要 |
| 1349 | 丧服辑略、丧服今制表 |
| 1366-1367 | 南薰殿图象考、佩文斋书画谱 |
Step 5: 精简筛选
去除的噪音类型:
- 人名噪音:孙衣言、葛洪、罗振玉、庄绶甲、张佩芳、梁履绳、方履、金履祥等(含服饰字但为人名)
- 版式术语噪音:巾箱本(52行"巾"字全部为袖珍版本术语,非头巾之意)、麻沙本
- 书名/堂号噪音:佩文斋、带经堂、养素堂、宝笏楼、琅环馆、侧帽词、乌丝词、冰蚕词、锦绣万花谷
- 引申义噪音:冠于别集之前、类书之冠、绣石书堂
- 医书噪音:素问(非白色丝织品,为医书名)
- 非服饰织物:布政司(行政机构)、粟布演草(算书)、货布文字考(钱币学)
最终保留的服饰相关书目:
共筛选出约41条有效服饰相关书目录,涵盖: - 礼制服制专书(约15种) - 政书服制(约7种) - 农桑织物(约7种) - 杂家参考(约6种) - 边地民族(约6种)
Step 6: 对抗式审查结果
对总结中所有41条引用逐一回溯grep原文核实: - 通过:41/41 - 虚构:0 - 误引:0 - 行号错误:0
关键发现
- 《书目答问补正》几乎不含直接服饰内容——作为目录学著作,它记录的是"关于服饰的书"而非"服饰本身"
- 关键词噪音率极高——五轮常规服饰关键词搜索的有效命中率不足1%,绝大多数为"巾箱本""葛洪""罗振玉"等目录学语境下的噪音
- 需调整搜索策略——对于目录学类古籍,应直接搜索书名中的服制术语(弁服、冕服、丧服、深衣、礼器图式、舆服等)而非泛用服饰关键词
- 经部礼制类是核心——弁服、冕服、深衣、丧服、三礼图等专著均在经部仪礼类中
- 清代官修政书价值最高——《皇朝礼器图式》《大清会典图》为服饰制度研究的一手材料
- 蜀锦谱为纺织史孤本——元费著《蜀锦谱》是唯一以织物品种命名的专书
- 集部完全无涉——全书集部(诗文评、别集、总集)中无任何服饰相关著录
保存文件
| 文件 | 大小 |
|---|---|
| 书目答问补正_总结.md | ~8KB |
| 书目答问补正_日志.md | 本文件 |
| 书目答问补正_原文提取.md | ~7KB |
备注
- 本书为目录学著作,与史书、笔记、小说等体裁截然不同,服饰内容仅以"书目"形式存在
- "巾箱本"一词出现52次,为全书最高频服饰相关词汇,但实际为版本学术语(袖珍本),与头巾无关
- 全书"衣"字出现9次,全部为人名"孙衣言",无一为服饰内容
- 全书"葛"字出现22次,全部为人名,无一为葛布
- 全书"罗"字出现21次,全部为人名,无一为绫罗
- 适合纳入研究的服饰相关书目约40余种,但均为间接参考(需阅读原书方可获得服饰内容)