《泊宅编》服饰内容提取 — 操作日志
日期:2026-03-05 书名:泊宅编 作者:宋·方勺 输入文件:/home/z/my-project/upload/part3/泊宅编.txt 输出目录:/home/z/my-project/upload/3笔记output/泊宅编/ 文件规模:425行 / 85079字节
Step 1: 文件基本信息
```bash wc -l /home/z/my-project/upload/part3/泊宅编.txt
结果:425 行
wc -c /home/z/my-project/upload/part3/泊宅编.txt
结果:85079 字节
```
文件规模较小(<100KB),但按规则仍采用grep定位+sed提取方式,不加载全文。
Step 2: 第一轮grep — 核心服饰词全搜
bash
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/泊宅编.txt
命中行数:55行(含大量误命中)
关键命中行号: - 13, 17, 21, 31, 43, 57, 61, 73, 95, 103, 117, 121, 123, 131, 133, 139, 149, 159, 165, 167, 171, 175, 177, 189, 193, 195, 199, 205, 217, 227, 229, 237, 241, 243, 259, 261, 265, 267, 271, 279, 283, 287, 289, 299, 301, 331, 335, 355, 377, 385, 407, 409, 411, 415, 417
Step 3: 第二轮grep — 制度动作词
bash
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/泊宅编.txt
命中行数:1行 - 行123:知县鲍慎好赐绯
第二轮新增命中仅1条,说明制度动作词在笔记体中较少出现。
Step 4: 第三轮grep — 组合扩展词(按需)
根据前两轮结果,核心服饰内容较丰富,但按需补充搜索:
bash
rg -n '衮冕|衮服|大裘|赐绯|赐紫|赐鱼|蟒衣|绢帛|匹帛|品色|蚕|桑|茧|缫|织|纺|绸|缂丝|折帛|和买|市舶|绢价|白迭|木绵|吉贝' /home/z/my-project/upload/part3/泊宅编.txt
新增命中: - 行117:木绵、吉贝、织巾、白迭巾 - 行123:赐绯(已命中) - 行199:耕织 - 行293:蚕事、缣、和买 - 行415:大裘、衮冕、衮服
Step 5: 误命中审查
按词库第四部分排除规则逐条审查:
| 行号 | 关键词 | 原文片段 | 判定 | 理由 |
|---|---|---|---|---|
| 17 | 带 | "带假龙出典数郡" | 排除 | 带=动词"带领",非腰带 |
| 43 | 箸 | "如玉箸" | 排除 | 箸=筷子,非簪 |
| 73 | 环 | "环无初终" | 排除 | 环=哲学概念,非首饰 |
| 103 | 织 | "织竹为盘" | 排除 | 织=编织竹盘,非纺织 |
| 159 | 堤 | "长堤" | 排除 | 堤=堤坝,无服饰义 |
| 205 | 服 | "服阕" | 排除 | 服=守丧期满,非服饰 |
| 259 | 罗 | "罗拜" | 排除 | 罗=排列,非丝织品 |
| 265 | 褐 | "褐色" | 排除 | 褐仅表颜色,非指粗布服 |
| 283 | 麻 | "麻豆" | 排除 | 麻豆=药材大小规格,非麻布 |
| 331 | 冠 | "冲冠" | 排除 | 冠=怒发冲冠,比喻义 |
| 377 | 冠 | "冠平生" | 排除 | 冠=最佳/居首 |
| 407 | 冠 | "女冠" | 排除 | 冠=道姑称号组成部分 |
审查结果:55行原始命中 → 排除12行误命中 → 43行有效 → 去重合并后31条有效服饰命中
Step 6: sed 上下文提取
对31条有效命中逐一提取上下文(N-2至N+5行),关键提取:
bash
sed -n '11,13p' # 行13 冕服书
sed -n '19,22p' # 行21 衣褪香绡
sed -n '29,32p' # 行31 青衫
sed -n '93,96p' # 行95 笏
sed -n '115,118p' # 行117 木绵吉贝
sed -n '119,124p' # 行121,123 金带赐绯
sed -n '129,132p' # 行131 染缁
sed -n '137,140p' # 行139 蓝缕
sed -n '147,150p' # 行149 幅巾道服
sed -n '163,168p' # 行165,167 皂衣黄衣
sed -n '169,172p' # 行171 领巾
sed -n '173,178p' # 行175,177 白袍释褐
sed -n '187,190p' # 行189 缣帛
sed -n '191,196p' # 行193,195 披衣巾饰甲胄
sed -n '225,228p' # 行227 钗带
sed -n '235,238p' # 行237 笏
sed -n '241,244p' # 行243 衣冠靴履
sed -n '259,262p' # 行261 衣带
sed -n '285,290p' # 行287,289 冠
sed -n '291,294p' # 行293 和买缣
sed -n '299,302p' # 行301 钗股
sed -n '353,356p' # 行355 道服
sed -n '407,412p' # 行409,411 匹绢衣着
sed -n '413,417p' # 行415 大裘衮冕
Step 7: 分类整理
将31条有效命中归入9个类别:
| 类别 | 条数 | 行号 |
|---|---|---|
| 冕服制度 | 2 | 13, 415 |
| 衣冠改革 | 1 | 243 |
| 官服等级与赐服 | 8 | 31, 121, 123, 165, 167, 175, 177, 411 |
| 巾饰与首服 | 4 | 149, 195, 287, 289 |
| 衣料与纺织 | 5 | 117, 189, 293, 409, 411 |
| 佩饰 | 6 | 95, 171, 227, 237, 261, 301 |
| 甲胄军服 | 1 | 195 |
| 宗教服饰 | 2 | 149, 355 |
| 服饰意象与行为 | 5 | 21, 131, 139, 193, 199 |
Step 8: 生成三份文件
| 文件 | 路径 | 说明 |
|---|---|---|
| 总结 | 泊宅编_总结.md | 含9类分类、5条关键发现、5条对抗式审查 |
| 日志 | 泊宅编_日志.md | 本文件,含完整grep命令与统计 |
| 原文提取 | 泊宅编_原文提取.md | 31条原文片段,带行号 |
操作流程轨迹
文件基本检查✅(425行/85KB)
→ 第1轮核心词grep✅(55行命中)
→ 第2轮制度词grep✅(1行新增)
→ 第3轮组合扩展词✅(5行新增)
→ 误命中审查✅(排除12行)
→ 31条有效命中
→ sed上下文提取✅
→ 9类分类整理✅
→ 对抗式审查✅(5条)
→ 生成3份MD✅
统计摘要
| 指标 | 数值 |
|---|---|
| 文件总行数 | 425 |
| 第1轮核心词命中行数 | 55 |
| 第2轮制度词新增 | 1 |
| 第3轮组合扩展词新增 | 5 |
| 误命中排除 | 12 |
| 有效服饰命中条数 | 31 |
| 分类类别数 | 9 |