《阅微草堂笔记》服饰内容提取 · 工作日志
时间:2026-04-20 任务ID:batch3-1 操作者:rysxguji子Agent
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 阅微草堂笔记 |
| 作者 | [清] 纪昀(纪晓岚) |
| 输入文件 | /home/z/my-project/upload/part4/阅微草堂笔记.txt |
| 文件大小 | 1,110,670 字节(约1.1MB) |
| 文件行数 | 2524 行 |
| 输出目录 | /home/z/my-project/upload/4笔记output/阅微草堂笔记/ |
操作流程
Step 1:读取参考文件
- 读取 fushi-keywords.md(服饰关键词词库)
- 读取参考模板:总结.md、日志.md、原文提取.md
Step 2:文件基本信息
- wc -l: 2524行
- wc -c: 1,110,670字节(>500KB,属大型TXT)
Step 3:按词库执行多轮grep
第1轮:核心服饰词
| 关键词类别 | 命中行数 |
|---|---|
| 首服(冠冕弁巾帻幞头帽盔胄缨簪钗步摇胜花钿) | 214 |
| 体服(衣裳袍衫襦袄褐裘氅褂等) | 253 |
| 下服(裙裤裈蔽膝袴) | 22 |
| 足服(履舄靴鞋袜屦屐) | 41 |
| 腰带(带革带玉带等) | 32 |
| 佩饰(佩珮鱼袋笏绶环钏等) | 65 |
| 礼服(衮服章服朝服公服等) | 6 |
| 衣料(丝帛绢绸缎绫罗锦绮纱等) | 202 |
| 染色纹样(染绣纹黼黻龙蟒等) | 103 |
第2轮:制度动作词
| 关键词 | 命中行数 |
|---|---|
| 公服 | 1 |
| 朝服 | 1 |
| 僭/逾制/违式 | 0(僭0,逾制0,违式0) |
| 服色/品色 | 0 |
第3轮:扩展搜索
- 绣花鞋/绣履/红鞋/弓弯/缠足:5条重要命中
- 玉带/革带/犀带/帽顶之制/朝冠/纱帽:多条命中
- 衣冠/红衣/彩衣/缁衣/青衫/红袍/半臂:大量命中
Step 4:逐条审查与排除
排除记录: - "衣"作为"衣钵"用法:0条(本书无此用法) - "麻"→"麻制"误命中:0条 - "罗"→"罗列"误命中:少量(如"罗两峰"人名排除) - "环"→"环境"误命中:0条(古文无此用法) - "带"→"带领/地带"误命中:少量(如"连带"等排除) - "佩"→"钦佩"误命中:0条 - "服"→"服药/服从"误命中:少量 - "冠"→"冠军/冠绝"误命中:少量(如"冠瀛"人名排除) - "罗"→"罗刹"(佛教名词,非丝织品):已排除 - "绣"→"绣花鞋"保留;"绣鸾"为人名排除 - "锦"→"锦袱"保留(锦绣包袱为织物);"锦州"地名排除
审查结论:本书为笔记小说,服饰内容多为叙事附带,无系统性讨论。经审查后确认有效服饰条目约50条。
Step 5:分类整理
将确认的服饰内容分为6大类: 1. 清代官服制度(5条) 2. 缠足与女性足服(9条) 3. 人物服饰描写(19条) 4. 身份标识类服饰(8条) 5. 殉葬与丧葬服饰(5条) 6. 腰带与佩饰(4条)
Step 6:撰写三份MD
- 阅微草堂笔记_总结.md(约7KB)
- 阅微草堂笔记_原文提取.md(约9KB)
- 阅微草堂笔记_日志.md(本文件)
关键发现
- 帽顶之制:纪昀亲历雍正五年初定帽顶制度,铜盘六瓣如梅花,为清代官服制度之第一手记录
- 昌吉出土绣花鞋:新疆出土红丝绣花女鞋弓弯三寸,而当地不缠足,为西域与中原服饰交流之重要线索
- 缢鬼著红衣:民间迷信缢死穿红衣可为厉鬼,反映丧葬服饰信仰
- 二内监缠足扮女装:明末魏忠贤时期内监以软骨药缠足扮女装逃亡,揭示缠足为女性身份核心标志
- 魏忠贤衣绯红:肖像描写中服色信息,为明代高官服色佐证
- 纸衣裙襦焚化供鬼:冥界服饰习俗,以彩纸剪制裙襦焚化
关键踩坑记录
- 本书"衣冠"一词出现极多,绝大多数为"士大夫"代称(约30+处),需区分真正描述服饰的用法
- "罗刹"出现多次,为佛教名词,非丝织品"罗",须排除
- "绣鸾"为婢女人名,非刺绣服饰
- "惨绿袍"之"惨"为"深暗"义,非"悲惨"义
- "缁袍"在行2295指僧服,在行1757"缁衣黄冠"为僧道合称
- 部分条目中"衣"作动词用(如"衣绯红"),仍保留因含服饰信息
- 大型TXT(1.1MB),全程使用grep+sed提取,未整本载入
对抗式学术审查
审查1:是否存在过度解读?
判定:不存在。 所有提取条目均含明确的服饰器物名称(帽、袍、衫、裙、鞋、带等)或服饰制度用语(帽顶之制、公服、朝服等),无仅凭比喻或代称而收录者。
审查2:"衣冠"作为代称是否应全部排除?
判定:不应全部排除。 按《排除规则表》,"衣冠"代指士大夫仍含服饰信息,应保留。但需区分:(1)纯代称用法(如"衣冠者数百人")仅作背景信息;(2)含服饰描述的用法(如"衣冠华美""衣冠修整""古衣冠")则具服饰研究价值。本文已做此区分。
审查3:缠足相关内容是否属于"服饰"范畴?
判定:属于。 缠足与弓鞋(绣花鞋、绣履)密不可分,弓弯鞋为女性足服之核心组成部分,按词库"足服"类别应予收录。
审查4:纸衣裙襦是否属于"服饰"?
判定:属于。 冥衣(纸衣)为丧葬服饰之重要门类,"裙襦"为女服上下分体,属"体服"与"下服"范畴。
审查5:是否遗漏重要内容?
可能遗漏:因grep以行为单位,少数跨行长段中的服饰信息若不在同一行则可能遗漏。但本书为笔记体,每条故事自成一段,此风险较低。
审核结果
全部通过 ✅ — 原文均从TXT文件中grep提取,有明确行号对应,排除规则已严格执行。