《棣萼室谈虎》服饰内容提取 · 工作日志

时间:2026-04-20 任务:处理《棣萼室谈虎》服饰内容逐本整理 来源文件:/home/z/my-project/upload/谜语/谜语/棣萼室谈虎.txt


操作流程

Step 1: 检查文件大小

wc -c /home/z/my-project/upload/谜语/谜语/棣萼室谈虎.txt
→ 5,614字节
wc -l → 15行

文件极小,约1,800字短文。

Step 2: 读取参考模板

读取三个参考模板文件: - /home/z/my-project/upload/参考/总结.md - /home/z/my-project/upload/参考/日志.md - /home/z/my-project/upload/参考/原文提取.md

理解格式规范:总结MD按分类章节+原文引用+注释+总结表格;日志MD按Step编号记录流程;原文提取MD按章节分类带行号。

Step 3: 多轮grep检索服饰关键词

第一轮:主关键词全量检索

grep -n "衣|裳|服|冠|帽|巾|帻|履|鞋|靴|袜|带|佩|裘|袍|衫|裙|袴|褐|缊|絺|绤|帛|绢|丝|锦|绮|绫|罗|缎|绸|纱|绣|染|织|纺|缫|蚕|茧|绵|衮|冕|弁|笏|簪|钗|珰|珩|璜|琚|韨|芾|鞶|舄|屦|帷|帐|幕|幄|旌|旂|旗|幡|盖|伞|扇|珮|环|钏|镯|钿|翠|珠|玉|金|银|髻|鬟|簪花|脂粉|黛|妆"

命中7行:第4、5、7、9、10、12、13行。

第二轮:补充关键词检索

grep -n "袂|袖|胭脂|袈|裟|裙|裾|裆|褂"

命中3行:第9行(胭脂)、第10行(袂)、第11行(袖)。

第三轮:匹配行计数

grep -nc "衣|裳|服|...(同上综合)" → 7行

Step 4: sed提取全文

文件仅15行、5,614字节,远小于1M上限,直接sed -n ‘1,15p’获取全文阅读。

Step 5: 逐行甄别与噪音过滤

行号 命中关键词 是否服饰实质内容 判定
第4行 灯纸、绣(无) 无服饰内容 排除
第5行 绢(”黄绢幼妇”) 经典谜材中纺织物名 微弱保留
第7行 帽、靴、粉、玉 谜格名称,非实际服饰 间接保留
第9行 胭脂 谜面修辞,非妆法记载 微弱保留
第10行 袂(蒙袂) 乞丐外貌描写 保留
第11行 人物动作描写 保留
第12行 无实质 排除 排除
第13行 无实质 排除 排除

噪音过滤说明: - 第7行”粉颈”“素心”“粉底”“玉树”均为谜格专名,”粉”“玉”非妆饰/玉器实指→标记为间接关联 - 第5行”黄绢”为”色丝”拆字谜面,非绢布记载→标记为间接关联 - 第9行”胭脂”为谜面取象,非妆饰制度→标记为微弱关联

Step 6: 对抗式学术审查

核心问题:本书是否具备服饰学价值?

审查结论:不具备。理由: 1. 全书无一处服饰制度、等级、材质、工艺的正面记载 2. 所有涉及服饰语汇的段落均为谜语修辞或人物描写 3. 将谜格名称中的”帽”“靴”“粉”等误判为服饰记载,属伪关联 4. 袂、袖出现于叙事描写中,仅为文学性点缀

Step 7: 撰写三份MD文档

据实记录,不凑字、不灌水,明确标注关联强度。


关键发现

  1. 《棣萼室谈虎》为隐语(谜语)专论短文,非服饰文献
  2. 服饰关联内容极少:仅5处间接/微弱关联,无一正面服饰记载
  3. 谜格名称取象于服饰:落帽格、脱靴格以帽靴为喻,为修辞学而非服饰学内容
  4. 胭脂入谜侧面反映旧时妆俗:胭脂点唇已为公共认知,方可入谜,但本书未记载具体妆法
  5. “蒙袂结缕”为全篇最接近服饰描写的语句,描写乞丐衣衫破敝之态

踩坑记录

  • 谜语类古籍中”帽”“靴”“粉”“玉”等字极易误判为服饰内容,实际为谜格专名
  • “黄绢幼妇”中”绢”为拆字谜面(色丝=绝),非绢布记载
  • 文件极小(5.6KB),无需分段提取,但仍需严格执行grep-n+sed流程

审核结果

全部通过 ✅ — 原文均从本地TXT经grep-n定位、sed提取,有明确行号对应。服饰关联内容据实记录为”间接/微弱”,不强行升格。