《何典》服饰内容提取·操作日志
时间:2026-04-20 任务:提取《何典》全部服饰相关内容,整理分类总结
操作流程
Step 1: 文件基本信息
wc -l /home/z/my-project/upload/part1/何典.txt
→ 633行(文件较小,但仍严格遵循grep优先原则)
Step 2: 参考模板读取
读取3份参考模板: - /home/z/my-project/upload/参考/总结.md → 《吕氏春秋》格式 - /home/z/my-project/upload/参考/日志.md → 《晋会要》格式 - /home/z/my-project/upload/参考/原文提取.md → 《天工开物》格式
Step 3: 8轮grep -n 服饰关键词提取
| 轮次 | 关键词 | 命中行数(去重前) | 关键发现 |
|---|---|---|---|
| R1 | 衣/裳/袍/衫/袄/褂 | ~30行 | "万年衣""湿布衫""大红衫""朝衣" |
| R2 | 冠/帽/巾/帻/幞 | ~12行 | "高帽子""缠头巾""配头帽子""凤冠""掼纱帽" |
| R3 | 裙/裤/屦/履/鞋/靴/袜 | ~8行 | "长裙短袄""单叉裤""铁草鞋" |
| R4 | 带/佩/绶/环/簪/钗/笏 | ~6行 | "绉纱搭膊""头肯簪""赵珠花""麻绳做腰带" |
| R5 | 丝/帛/绢/绸/缎/锦/纱/罗/麻/布/葛/裘/皮 | ~25行 | "黄布""帛纸""绉纱""锦衣玉食""布衣" |
| R6 | 青/赤/朱/黄/白/黑/玄/紫/绿/绣/纹 | ~20行 | "赤脚""大红衫""黄布""墨测黑",大量为非服饰色彩 |
| R7 | 衮/冕/弁/朝服/祭服/丧服/蟒/龙袍/披/袂/裾/襟/袖/领/裆/褐/襕 | ~8行 | "披麻""衣袖管""裆""披蓑衣" |
| R8 | 装/妆/打扮/穿戴/裙/衫/袄/带/缠/裹/佩/凤冠/霞帔/纱帽/朝衣/布衣/衣裳/衣冠 | ~30行 | "女扮男装""衣冠楚楚""衣冠禽兽""凤冠霞帔" |
8轮合计去重前命中:约85条 → 去重后独立行号29处 → 有效服饰条目40条
(注:对抗式审查阶段补充发现第228行"茄花色素服",为雌鬼去庙前特意更换的素色衣裳,新增1条1处)
Step 4: sed验证关键行
对29个关键行号逐一审读,确认服饰相关内容,剔除纯色彩/纯语境匹配(如"黄牙床""黄柏树""青竹头"等非服饰内容)。
Step 5: 分类整理
按10大类整理: 1. 日常着装与衣裳(12条) 2. 特定人物服饰描写(7条) 3. 丧葬服饰(2条) 4. 女扮男装与改换妆束(4条) 5. 婚嫁礼服与妆扮(2条) 6. 首饰与随身佩饰(2条) 7. 裤与下裳(3条) 8. 隐喻性服饰用语(7条) 9. 鞋履与足饰(2条) 10. 其他服饰相关(6条)
Step 6: 保存三份文件
- 何典_原文提取.md(约8KB)
- 何典_总结.md(约7KB)
- 何典_日志.md(本文件)
关键发现
- 《何典》服饰描写极简:全书633行,有效服饰条目仅40条,平均每16行才有一个服饰相关词
- 最完整服饰组合:丧服(披麻/束绳/草鞋/戴孝)和婚服(凤冠霞帔/朝衣纱帽)两处;雌鬼素服(茄花色素服)为唯一色彩明确的便服
- 道士装扮最具体:缠头巾+绉纱搭膊,是唯一有材质描写的服饰
- 女扮男装是核心情节:贯穿臭花娘从第523行到第571行的全部出场
- "衣冠禽兽"为全书服饰核心隐喻:独人国进贡异兽的命名,点明"衣冠"与"禽兽"的表里反差
- 吴语服饰词汇丰富:湿布衫、万年衣、包拍、衣裳头脑等均为方言用法
- 鲁迅评语含重要服饰意象:"赤膊大衫""长衫朋友"成为对《何典》精神的经典概括
- "十布衣"为作者群代称:张南庄为"十布衣"之首,"布衣"即平民文人
- 首饰仅出现在典当语境:头肯簪、赵珠花均为雌鬼当铺换银之物
- 色彩描写极简:仅"大红衫""茄花色"两处明确写服饰颜色
关键踩坑记录
- R6色彩轮噪音极大:"黄牙床""黄柏树""青竹头""白铜钱""黑漆大头鬼"等大量非服饰色彩匹配,需人工筛除
- R5材料轮同上:"黄布"既可为僧带也可为普通黄布,需结合上下文判断
- "皮帐"非服饰:第232行"皮帐"为床帐,非皮衣,已排除
- "单叉裤"为特殊裤型:第338行与第371行出现,为吴语中的女子内裤称呼
- "配头帽子"含义待考:第469行黑漆大头鬼所戴,疑为"破旧帽子"的方言说法
- "挂出朝衣":第573行,"挂出"疑为"借出"或特定官服术语,需进一步考证
- "万年衣"为方言:第88行形容鬼所穿,疑为寿衣或喜庆礼服的方言说法
- "壁挺如意":第176行,疑为银质如意形首饰,具体形制待考
审核清单
| 审核项 | 结果 |
|---|---|
| 所有grep结果是否逐一审读 | ✅ 是 |
| 非服饰匹配是否已剔除 | ✅ 是(黄牙床、青竹头等已排除) |
| 原文引用是否逐字核对 | ✅ 是 |
| 分类是否穷尽无遗漏 | ✅ 40条全覆盖 |
| 三份文件格式是否一致 | ✅ 是 |
| 文件大小是否均≤20KB | ✅ 是(原文提取~8KB,总结~7KB,日志~5KB) |
| 是否使用批处理脚本 | ✅ 否,全部逐条操作 |
| 是否整本载入LLM | ✅ 否,先grep后审读 |