《耳新》服饰内容提取 — 操作日志
日期:2026-03-05 任务:提取《耳新》全部服饰相关内容,整理分类总结 输入:/home/z/my-project/upload/part3/耳新.txt 输出:/home/z/my-project/upload/3笔记output/耳新/
Step 0: 文件基本信息
```bash wc -l /home/z/my-project/upload/part3/耳新.txt
结果:473行
wc -c /home/z/my-project/upload/part3/耳新.txt
结果:90329字节(约88KB)
```
文件为小型笔记体古籍,未超过500KB,但仍遵守"不加载全文"规则,使用grep+sed提取。
Step 1: 第1轮grep——核心服饰词全搜
bash
rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/耳新.txt
命中行号:7, 13, 17, 23, 29, 31, 37, 51, 63, 67, 71, 73, 77, 81, 99, 103, 119, 123, 125, 135, 145, 165, 169, 171, 177, 181, 189, 193, 199, 217, 225, 227, 231, 235, 245, 253, 259, 265, 289, 301, 303, 317, 339, 353, 357, 363, 369, 391, 403, 411, 417, 443, 445, 449, 453, 459, 461, 463, 467
初步命中行数:59行
Step 2: 第2轮grep——制度动作词
bash
rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/耳新.txt
命中行数:0行(第2轮无新增命中)
Step 3: 第3轮grep——按需扩展词
根据前两轮结果,补充搜索:
bash
rg -n '蟒衣|飞鱼服|斗牛服|麒麟服|乌纱|软脚|硬脚|文官一品|武官一品|赐鱼袋|金银鱼袋|蚕|桑|茧|缫|织|纺|折帛|和买|市舶|绢价|匹帛' /home/z/my-project/upload/part3/耳新.txt
命中行数:0行(第3轮无新增命中)
Step 4: 排除规则审查
逐条审查59个初始命中行,按词库排除规则排除误命中:
| 行号 | 关键词 | 误命场景 | 排除理由 |
|---|---|---|---|
| 7 | 胄 | "郑仲夔胄师撰" | 胄为字号/职衔,非头盔 |
| 17 | 麻 | "加香麻少许" | 麻为药用,非衣料 |
| 31 | 罗 | "罗列古书" | 罗列=排列,非丝织品 |
| 119 | 冠 | "冠军""冠绝" | 冠军/冠绝=最胜义,非首服 |
| 135 | 带 | "杨带刑叩头" | 带=携带/佩戴刑具,非腰带 |
| 403 | 锦 | "锦鸡" | 锦鸡为鸟名,非丝织品 |
| 411 | 锦 | "锦鸡绕屋" | 同上 |
| 445 | 锦 | "锦模糊" | 诗中比喻视觉质感,非实物丝织 |
| 459 | 罗 | "罗经" | 罗经=罗盘/指南针,非丝织品 |
排除9条误命中,其余50行含有效服饰信息。合并同条目中多关键词重复后,有效独立条目37条。
Step 5: sed上下文提取
对37条有效命中的关键行提取前后文:
```bash
示例命令(对每条命中行N执行):
sed -n '$((N-2)),$((N+5))p' /home/z/my-project/upload/part3/耳新.txt
实际执行的sed命令(按需逐条提取):
sed -n '11,15p' 耳新.txt # line 13 绮纨 sed -n '21,25p' 耳新.txt # line 23 不胜衣 sed -n '49,53p' 耳新.txt # line 51 纱帽 sed -n '61,68p' 耳新.txt # line 63 衣鲜/布衣/囚服/佩 sed -n '65,73p' 耳新.txt # line 67,71 挂冠/衣冠 sed -n '101,105p' 耳新.txt # line 103 优孟衣冠 sed -n '123,127p' 耳新.txt # line 125 高冠/佩 sed -n '143,147p' 耳新.txt # line 145 冕 sed -n '163,167p' 耳新.txt # line 165 徒跣/神袍/网钗 sed -n '167,171p' 耳新.txt # line 169 罗裙 sed -n '169,173p' 耳新.txt # line 171 衲袄/草履 sed -n '175,183p' 耳新.txt # line 177,181 袖/幅巾布氅 sed -n '187,195p' 耳新.txt # line 189,193 袍/帽 sed -n '197,201p' 耳新.txt # line 199 帽/缙绅 sed -n '223,233p' 耳新.txt # line 225,227,231 袖/红衣/网巾 sed -n '243,247p' 耳新.txt # line 245 黄金盔/蟒袍玉带 sed -n '251,255p' 耳新.txt # line 253 冕者 sed -n '257,261p' 耳新.txt # line 259 衣著 sed -n '299,305p' 耳新.txt # line 301,303 青衣/盔甲 sed -n '337,345p' 耳新.txt # line 339 冠幞/衣黄/衣红 sed -n '351,365p' 耳新.txt # line 353,357,363 武弁/朝绅/朝衣朝冠/旒 sed -n '415,420p' 耳新.txt # line 417 白袷子 sed -n '459,463p' 耳新.txt # line 461 屦 sed -n '465,473p' 耳新.txt # line 467,463 重裘/佩 ```
Step 6: 分类整理
按词库类别整理为7大类: - 首服(冠帽类):20条 - 体服(衣袍类):18条 - 下服:1条 - 足服:3条 - 腰带:2条 - 佩饰:4条 - 衣料:2条
有效独立条目总数:37条(含跨类重复计)
Step 7: 生成三份文件
耳新_总结.md— 结构化总结+对抗式学术审查耳新_日志.md— 本文件,含grep命令和统计耳新_原文提取.md— 带行号的原文片段
操作流程轨迹
文件基本信息✅(473行/90KB)
→ 第1轮grep核心词59行命中✅
→ 第2轮grep制度动作词0行命中✅
→ 第3轮grep扩展词0行命中✅
→ 排除规则审查排除9条误命中✅
→ sed提取37条有效命中上下文✅
→ 分类整理7大类✅
→ 生成3份MD文件✅
统计摘要
| 指标 | 数值 |
|---|---|
| 文件总行数 | 473 |
| 第1轮命中行数 | 59 |
| 第2轮命中行数 | 0 |
| 第3轮命中行数 | 0 |
| 排除误命中 | 9条 |
| 有效独立条目 | 37条 |
| 首服类 | 20条 |
| 体服类 | 18条 |
| 下服类 | 1条 |
| 足服类 | 3条 |
| 腰带类 | 2条 |
| 佩饰类 | 4条 |
| 衣料类 | 2条 |