《涌幢小品》服饰内容提取 — 操作日志

日期:2026-03-04 任务:提取《涌幢小品》全部服饰相关内容,整理分类总结


Step 1: 文件基本信息

```bash wc -l /home/z/my-project/upload/part3/涌幢小品.txt

结果:5546行

wc -c /home/z/my-project/upload/part3/涌幢小品.txt

结果:1258826 bytes (约1.26MB)

```

文件较大,遵守"严禁加载整本TXT"规则,全程使用grep+sed操作。

Step 2: 第1轮grep — 核心服饰词全搜

```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/涌幢小品.txt | wc -l

结果:824行命中

```

逐类统计: - 首服类:272行 - 体服类:274行 - 下服类:10行 - 足服类:43行 - 腰带类:10行 - 佩饰类:18行 - 礼服类:16行 - 衣料类:394行 - 染色纹样:287行

Step 3: 第2轮grep — 制度动作词

```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/涌幢小品.txt | wc -l

结果:24行命中

```

Step 4: 第3轮grep — 组合扩展词(按需)

```bash rg -n '蟒衣|蟒袍|飞鱼|斗牛|麒麟|赐衣|赐帛|锦衣|玉带|金带|犀带|革带|束帛|绢帛|丝帛|绫罗|锦绣|缂丝|纱帽|乌纱|毡帽|皮弁|进贤冠|红罗|碧绸|织成|纻丝' /home/z/my-project/upload/part3/涌幢小品.txt | wc -l

结果:大量命中

```

高价值关键词精确搜索: ```bash rg -n '朝服|公服|常服|赐服|蟒衣|章服|衮冕|祭服|戎服|法服|吉服|丧服|品色|服色|冠服|舆服' /home/z/my-project/upload/part3/涌幢小品.txt

提取到约18条高价值条目

```

Step 5: 排除规则审查

逐条审查824+24条命中,按排除规则表过滤:

关键词 误命中数 处理
锦衣 ~30条 "锦衣卫"均为官署名,排除
~5条 "麻城"地名,排除
~8条 "罗"作人名,排除
~3条 "钦佩""敬佩",排除
~50条 "带领""地带""连带",排除
~20条 "冠军""冠绝",排除
~30条 "服药""服从""服丧""服阕",排除
~2条 保留(褐衣、短褐)
~5条 "头巾""儒巾"保留,"纸巾"无

审查后有效服饰条目约30条。

Step 6: sed提取上下文

对关键行号提取上下文(N-2到N+5):

```bash sed -n '1612,1620p' 涌幢小品.txt # 戎服出郊 sed -n '2316,2324p' 涌幢小品.txt # 常服入试 sed -n '3905,3919p' 涌幢小品.txt # 城隍章服/祭用常服 sed -n '4720,4724p' 涌幢小品.txt # 蟒衣玉带之赐 sed -n '5217,5221p' 涌幢小品.txt # 俺答蟒衣 sed -n '5017,5021p' 涌幢小品.txt # 皮弁服/朝衣/法服 sed -n '5260,5264p' 涌幢小品.txt # 朝鲜幞头束带 sed -n '3547,3553p' 涌幢小品.txt # 短褐草鞋/儒衣冠 sed -n '4031,4035p' 涌幢小品.txt # 乌纱幞头绯衣金带 sed -n '4224,4228p' 涌幢小品.txt # 木兰释戎服

... 等

```

Step 7: 分类整理与创作

将30条有效条目分为6类: 1. 朝堂冠服制度(8条) 2. 赐服与品级标识(5条) 3. 日常与人物服饰(6条) 4. 宗教与典礼服饰(4条) 5. 异域与神怪服饰(5条) 6. 衣料与纺织(2条)

创作三份MD: - 涌幢小品_总结.md - 涌幢小品_日志.md(本文件) - 涌幢小品_原文提取.md

操作流程轨迹

文件扫描5546行/1.26MB → 第1轮grep 824行命中 → 第2轮grep 24行命中 → 第3轮组合扩展 → 排除规则审查过滤 → 有效条目约30条 → sed提取上下文 → 六类分类整理 → 创作三份MD

审核结果