《苌楚斋四笔》服饰提取日志

一、任务信息

项目 内容
书名 苌楚斋四笔
输入文件 /home/z/my-project/upload/part4/苌楚斋四笔.txt
输出目录 /home/z/my-project/upload/4笔记output/苌楚斋四笔/
词库文件 /home/z/my-project/skills/rysxguji/references/fushi-keywords.md
文件规模 909行,313,745字节
体裁 清末民初笔记(子部杂家类杂考之属)

二、执行过程

第一步:文件基本信息读取

第二步:词库读取

第三步:第1轮搜索(核心服饰词)

第四步:第2轮搜索(制度动作词)

第五步:逐条审查排除

对约100行命中进行逐条审查,按排除规则表判定:

排除原因 涉及行号 数量
"衣"在"衣冠"中代指士大夫 382, 868 2
"衣"在"衣钵"中为传法义 0
"布衣"代指平民身份 36, 782 2
"带"作动词/方位义 103(带经老农传), 528, 883 3
"佩"作敬佩义 716(纫佩为人名) 1
"冠"作冠军义 0
"服"作服药/服从义 0
"罗"作排列义 0
人名含服饰字 160(戴褐夫), 716(黄纫佩), 847(带围宽尽) 3
"裘"在书名中 847(裘书七种) 1
"纹"作纹理非纹样 0
"领"作动词义 0
上下文无关服饰 多处 约10

审查后有效条目:12条

第六步:上下文提取

对12条有效命中,均已在前述grep输出中获得完整上下文(笔记体每条为完整段落,单行即含完整信息),无需额外sed提取。

第七步:分类整理

按词库分类体系归入5类: 1. 服饰制度与礼仪(3条) 2. 服饰观念与议论(2条) 3. 特定服饰器物(3条) 4. 衣料纺织(1条,与第1类重叠) 5. 服装穿着行为(3条) 6. 域外服装(1条)

三、搜索策略反思

成功之处

困难与局限

  1. "衣"字命中过多:作为高频字,"衣"在本书中出现约15次,但多数为"衣冠""布衣""缩衣节食"等非核心服饰用法,审查工作量大
  2. "带"字误命中多:本书含大量"带领""带兵""地带"等用法,需逐一排除
  3. 人名干扰:如"戴褐夫""黄纫佩"含服饰字但为人名
  4. 域外服饰:甘地服装描写篇幅最长,但为印度服饰,与中国传统服饰制度关联较弱

对抗式学术审查

四、文件输出清单

文件名 大小限制 内容
苌楚斋四笔_总结.md ≤20KB 分类概览、价值评级、核心发现
苌楚斋四笔_日志.md ≤20KB 执行过程、审查记录、策略反思
苌楚斋四笔_原文提取.md ≤20KB 12条有效原文摘录及注释

日志生成时间:2026年3月4日