《求幸福斋随笔》服饰内容提取 — 操作日志

日期:2026-03-05 任务:提取《求幸福斋随笔》服饰相关内容 输入文件:/home/z/my-project/upload/part3/求幸福斋随笔.txt 输出目录:/home/z/my-project/upload/3笔记output/求幸福斋随笔/


Step 1: 文件基本信息

```bash wc -l -c /home/z/my-project/upload/part3/求幸福斋随笔.txt

结果:573行,195084字节

```

文件为民国笔记,非大型古籍(<200KB),但按规则仍用grep+sed提取,不加载全文。


Step 2: 第一轮搜索 — 核心服饰词

```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|钗|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' "/home/z/my-project/upload/part3/求幸福斋随笔.txt"

结果:89行命中

```


Step 3: 第二轮搜索 — 制度动作词

```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' "/home/z/my-project/upload/part3/求幸福斋随笔.txt"

结果:1行命中(行313:"龙凤之僭",政治语境,非服饰制度)

```


Step 4: 第三轮 — 按需扩展搜索

前两轮已覆盖主要内容,且本书为随笔笔记,非制度性文献,组合扩展词(品色制度、补服体系、蚕桑纺织等)命中概率极低,故跳过。


Step 5: 逐条审查与排除

按词库"排除规则表"审查89条命中:

排除类型 涉及行号 排除原因
"胜"=胜败 15, 249, 253 胜败之胜,非步摇之胜
"冠"=动词/首位 21, 145, 147 "冠全书""冠玉",非首服
"领"=领受/领会 23, 41, 255 动词义,非衣领
"佩"=钦佩/敬佩 35 "佩叹",非佩饰
"丝"=比喻/乐器 37(情丝), 393(丝竹) 非丝织品
"丝"=烟草 363 "皮丝烟"=烟草
"领"=领家(鸨母) 397,401,403,407,409 非衣领
"衣"=汗渍 67 "染衣际",仅提及衣,无服饰信息量
其他非服饰义 59,99,101,113,115,191,193,197,203,209,225,227,229,231,233,235,239,241,251,259,263,299,305,315,351,353,359,375,391,433,477,501,507,511,523,567 语境均非服饰

排除后有效命中:18条


Step 6: 上下文提取

对18条有效命中逐一执行sed提取:

```bash

核心段落(行177、185、495-496)提取前后2-3行上下文

sed -n '175,179p' ... # 上海妇女新装束 sed -n '183,189p' ... # 百结衣五代论 sed -n '493,497p' ... # 道妆与服妖

其余条目提取前后1-2行上下文

sed -n '73,77p' ... # 紫金冠、大红袍 sed -n '105,109p' ... # 袍笏登场 sed -n '117,121p' ... # 卸甲丢盔 sed -n '209,213p' ... # 古服祭天 sed -n '285,289p' ... # 服衮冕 sed -n '421,425p' ... # 新履监控 sed -n '433,437p' ... # 衣冠回拜 sed -n '293,297p' ... # 钗头凤 sed -n '301,304p' ... # 拥袂 sed -n '305,308p' ... # 布衣 sed -n '469,473p' ... # 纨袴 sed -n '477,481p' ... # 红裙典衣 sed -n '261,267p' ... # 推背图谶语 ```


Step 7: 分类与输出

按实际内容归为四类: 1. 民国女性时装与妆饰(2条核心) 2. 社会阶层服饰观察(3条) 3. 戏曲与仪式服饰(4条) 4. 文学中的服饰意象(9条)

产出3份文件: 1. 求幸福斋随笔_总结.md — 含分类整理、关键发现、对抗式审查 2. 求幸福斋随笔_日志.md — 本文件 3. 求幸福斋随笔_原文提取.md — 18条有效命中的原文片段


操作流程轨迹

文件检查✅(573行/195KB) → 第1轮grep 89条命中 → 第2轮grep 1条命中(非服饰) → 第3轮跳过(本书非制度文献) → 逐条审查排除71条误命中 → 有效18条 → sed上下文提取18处 → 分类4类 → 输出3份MD

统计

指标 数值
第1轮命中行数 89
第2轮命中行数 1
排除误命中 71
有效命中 18
核心段落(>2个服饰词) 3
最高服饰密度行 行177(6个服饰词:衣领、短领、袖、裙、靴、装束)