《如此京华》服饰内容提取 · 操作日志
时间:2026-04-19 任务:提取《如此京华》TXT文件中服饰相关内容,产出3个MD文件 源文件:/home/z/my-project/upload/part2/如此京华.txt(1368行,约40万字)
Step 1: 读取参考模板
读取3个参考文件,理解格式结构:
- /home/z/my-project/upload/参考/总结.md — 《吕氏春秋》服饰总结,含分类表格和核心思想
- /home/z/my-project/upload/参考/日志.md — 《晋会要》操作日志,记录每步命令和结果
- /home/z/my-project/upload/参考/原文提取.md — 《天工开物》原文提取,按类分节带行号
Step 2: 检查源文件
wc -l 如此京华.txt → 1368行
wc -c 如此京华.txt → 398,367字节(约40万字)
确认文件体积适中,但仍需grep分段提取,不宜整本载入。
创建输出目录:
mkdir -p /home/z/my-project/upload/2小说output/如此京华/
Step 3: 第1轮grep — 基础服饰词
grep -n -E '衣|裳|裘|冠|冕|弁|帽|巾|袍|裙|袂|褐|衫|褂|襦|袴|裤|帔|履|靴|舄|鞋|袜' 如此京华.txt
结果:152行匹配
筛选有效服饰片段(排除假阳性): - "衣"作动词"穿":L93"少得衣着"→排除("衣着"为名词组合,保留) - "衣"在成语/比喻中:L709"衣冠禽兽"→保留(服饰象征) - "衣"在回目中:L18"珠络云裳"→保留 - "褐"未出现独立使用 - "裳"仅在L18"云裳"、L148"云想衣裳"中出现→保留
Step 4: 第2轮grep — 丝织品词
grep -n -E '锦|绮|帛|绢|绫|罗|缎|绸|纱|缂丝|缯|纨|素' 如此京华.txt
结果:约90行匹配
主要发现: - "缎"出现频繁:蓝缎/三闪缎/紫酱缎/元缎/花缎/素缎/银狐缎/蓝绸袍→多为实际服饰面料 - "锦"多用于"织锦图"(第6回核心情节)和比喻"锦衣华服""锦衣绣履" - "绸":皱绸/宁绸/湖绉/蓝绸 - "纨"仅出现在"纨扇"(第11-16回反复出现,为重要道具) - "绮"出现在回目和"绮席""绮霞""绮恨"中,多为修辞 - "纱"出现在"纱窗""窗纱"中,多为建筑/陈设,非服饰 - "绫"仅L208"绫头"(古画装裱),非服饰用
Step 5: 第3轮grep — 等级服色词
grep -n -E '舆服|服色|冠服|章服|法服|朝服|祭服|常服|公服|吉服|丧服|品色|赐紫|赐绯|借紫|借绯' 如此京华.txt
结果:0行匹配
重要发现:本书无任何传统服制术语。这是一部民国谴责小说,不涉及古代服色等级制度,仅有"羊皮褂"乐府涉及清代丧礼服制。
Step 6: 第4轮grep — 配饰词
grep -n -E '笏|鱼袋|革带|玉带|金带|银带|幞头|凤冠|步摇|簪|钗|钏|镯|佩|玉佩|霞帔|帔帛|披帛' 如此京华.txt
结果:约15行匹配
主要发现: - "笏":L715"敕命袍笏"(梦中场景)、L58"远山拄笏"(比喻山形) - "簪":L209"簪花"(书法术语) - "镯":L457"金镯一对、金戒子两只" - "佩":L179"鸳鸯佩"、L1097"佩大将军印"(非服饰配饰)、L909"贻佩" - 其余配饰词(鱼袋、幞头、凤冠、步摇、钏、霞帔等)均无匹配
Step 7: 第5轮grep — 纺织材料词
grep -n -E '绵|布|葛|麻|苎|棉|染|织|绣|纹|黼|黻' 如此京华.txt
结果:约80行匹配
主要发现: - "布":青洋布(L334)、大布褂袖(L394)、大青布袍(L470/482)——平民面料 - "棉":薄棉袍(L96)、棉袍(L1007)——冬装填充 - "织":织锦(L207/209等)——大量出现在"织锦图"情节中 - "绣":绣幕(L848/491)、绣履(L1144)、绣围(L345)、绣佛(L621)——多为陈设 - "染":L203"薰染纸色"——古画作伪技术 - "纹":仅L208"衣折色相"相关 - "黼黻":无匹配 - "葛/苎/麻":无服饰用法匹配
Step 8: 关键片段提取与上下文扩展
使用sed提取关键行及上下文:
sed -n '94,98p' → 少甫服饰上下文
sed -n '111,115p' → 华服少年上下文
sed -n '306,310p' → 青儿服饰上下文
sed -n '398,402p' → 伯纯服饰上下文
sed -n '847,852p' → 羊皮褂乐府上下文
sed -n '987,990p' → 衣冠百辈上下文
Step 9: 假阳性排除清单
| 行号 | 原文 | 排除原因 |
|---|---|---|
| L69 | "黄冠" | 指道士,非冠服制度 |
| L79 | "黄冠" | 同上 |
| L81 | "黄冠" | 同上 |
| L93 | "少得衣着" | "衣着"为日常用语 |
| L152 | "联袂" | 比喻,非服饰描写 |
| L240 | "白纱窗" | 建筑陈设 |
| L254 | "绵驹" | 人名 |
| L275 | "罗帕" | 诗句中,无服饰描写价值 |
| L392 | "破靴名士" | 绰号,非服饰描写 |
| L504 | "鱼龙" | 比喻 |
| L520 | "纨扇"一歌 | 文学典故引用 |
| L537 | "绣襦记" | 戏名 |
| L621 | "长斋绣佛" | 宗教用语 |
| L812 | "黄巾力士" | 神话意象 |
| L1007 | "宁绸棉袍" | 有效——实际服饰 |
| L1016 | "冠冕" | 修辞用法 |
Step 10: 分类整理
将有效片段分为10大类: 1. 官绅服饰(4个核心片段) 2. 妓女/名花服饰(5个片段) 3. 丫鬟仆役服饰(3个片段) 4. 市井平民/帮闲服饰(7个片段) 5. 裘皮冬装(4个片段+1个乐府) 6. 新潮/时髦服饰(6个片段) 7. 古画服饰与纺织品(5个片段) 8. 帽冠类(7种) 9. 靴鞋类(6种) 10. 服饰象征与品评(10条)
Step 11: 对抗式学术审查
审查1:原文行号验证
逐条核对关键片段行号: - L96 "蓝缎薄棉袍儿" → ✅ 确认 - L113 "银灰三闪缎银鼠袍儿" → ✅ 确认 - L308 "白灰皱绸的长袍" → ✅ 确认 - L400 "紫酱缎的袍子" → ✅ 确认 - L513 "珠络垂缨云裳贴地" → ✅ 确认 - L849 "羊皮褂" → ✅ 确认 - L1329 "银狐缎袍,草上霜马褂" → ✅ 确认
审查2:出处准确性
- 回目对应:通过grep -n '第.*回'确认回目与行号对应关系
- 第2回起L85、第3回起L117、第6回起L200、第8回起L295
- 第11回起L386、第15回起L508、第28回起L841
- 第2卷第1回起L995、第2卷第5回起L1093
审查3:假阳性复核
- "黄冠"(L69/79/81)确认为道士称呼,已排除
- "靴谊"(L682)为帮会术语,非服饰描写,已排除
- "割靴"(L698/536)为妓院术语"割靴统",已排除
- "同靴"(L597/623)为共狎一妓的隐语,已排除
- "裼裘"(L1329)出自《礼记·玉藻》"裘之裼也,见美也",此处为文学用典
审查4:内容完整性
- 5轮grep共匹配约337行
- 经筛选后有效服饰片段约50条
- 第3轮(等级服色词)0匹配,如实记录
- 全书服饰内容属中等密度,多为人物出场描写
关键发现
- 全书最核心的服饰片段:第28回"羊皮褂"乐府及本事——涉及清代宰辅致奠服制
- 最完整的服饰描写:L1329鹤山冬装——银狐缎袍+草上霜马褂+哆啰呢大衣+貂帽
- 最具讽刺意味:L969礼帽被撞落如西瓜、L1027黄龙缎写劝进名单
- 时代标记:剪辫发影(L333)、礼帽取代瓜皮帽、窄袖对襟取代方袖大褂
- 服饰等级序列:银狐>银鼠>羊皮;缎>绸>布;貂帽>瓜皮帽>毡笠>草履
审核结果
全部通过 ✅ — 原文均从源文件grep+sed提取,有明确行号对应,假阳性已逐条排除。