《浪迹三谈》服饰内容提取 — 操作日志

日期:2026-04-19 任务:提取《浪迹三谈》全部服饰相关内容,整理分类总结 输入文件:/home/z/my-project/upload/part3/浪迹三谈.txt 文件规模:751行 / 159KB


Step 1: 文件基本信息

```bash wc -l /home/z/my-project/upload/part3/浪迹三谈.txt

结果:751行

ls -lh /home/z/my-project/upload/part3/浪迹三谈.txt

结果:159KB

```

文件为中型TXT(<500KB),但仍按规范采用grep定位+sed提取策略,不一次性载入。


Step 2: 读取词库

词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md

词库结构: - 一、核心服饰词(首服、体服、下服、足服、腰带、佩饰、礼服、衣料、染色纹样) - 二、制度动作词(赐予、禁令、等级、礼仪、日常) - 三、组合扩展词 - 四、排除规则表 - 五、grep执行策略


Step 3: 第1轮grep — 核心服饰词

```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/浪迹三谈.txt | wc -l

结果:92行命中

```

高歧义关键词统计:

关键词 命中行数 服饰相关(估) 非服饰(估)
~25 ~10 ~15(人名/比喻)
~8 ~6 ~2
~8 ~3 ~5(地带/带领/带鱼)
~10 ~3 ~7(服从/服食/服小民)
~5 0 ~5(比喻/燕窝)
~5 0 ~5(人名)
~6 ~1 ~5(履历/践履)
~3 ~1 ~2(比喻)
~3 ~1 ~2(纱笼/笼纱)
~4 0 ~4(领域/带领)

Step 4: 第2轮grep — 制度动作词

```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/浪迹三谈.txt | wc -l

结果:5行命中

```

审查结果: - :3行命中,全部为政治僭越(僭号、僭逆、僭乱之心),无服饰僭越 - 赐绯:1行(L109赐绯衣)——有效 - 赐服/赐紫/赐蟒/赐鱼/赏衣:0行 - 冠礼/笄礼:0行


Step 5: 第3轮grep — 组合扩展词(按需)

根据前两轮结果,核心服饰词命中92行但高歧义率较高,补充搜索:

```bash rg -n '绯衣|赐绯|衣冠|冠带|袍服|青衣|绛袍|蟒衣|貂褂|朝冠|顶戴|花翎|彩衣|朱衣|纱貂|锦袍|葛衣|朱履|方巾|白角衫|冠玉|织金|纻丝|同袍|敝衣|锦被|彩服|冠裳|披衣|著帽|著屐|屐齿|顶带' /home/z/my-project/upload/part3/浪迹三谈.txt

结果:约30行命中

```


Step 6: 排除审查

按词库排除规则表逐条审查:

关键词 误命类型 排除操作
人名(罗大经)、字义(弥罗突) 排除~5行,保留0行
"命如丝"比喻、"丝之长"燕窝 排除~3行,保留0行
带鱼 鱼名 排除1行(L583)
铜环 人名小字 排除1行(L159)
巾巴盖局 棋盘覆盖布 排除1行(L29)
纱笼 装虫笼子 排除1行(L47)
骨如簪 形状比喻 排除1行(L667)
服小民之心 "服"为动词"使信服" 排除1行
服食方 养生之服食 排除1行
装饰 "百般装饰"非服饰 排除1行
履历/践履/步履 非足服义 排除~5行
锦簇团 比喻义 排除1行
笼纱 非纱帽 排除1行
布所记 "布"为动词"分布" 排除1行
领域/带领 动词/方位义 排除~4行

排除后有效命中:约28行(含25条服饰条目)


Step 7: sed上下文提取

```bash

对25条核心命中行号,提取N-2至N+5行上下文

行号列表:21, 49, 97, 109, 137, 139, 307, 315, 331, 407, 421, 433, 439, 447, 451, 459, 463, 477, 481, 485, 499, 501, 593, 615, 665

```

提取总行数:约200行上下文


Step 8: 分类整理

将25条有效命中分为9类: 1. 赐服与官服等级制度(4条) 2. 冠服名目(3条) 3. 首服与冠饰(3条) 4. 足服(3条) 5. 佩饰与服御(2条) 6. 衣料与丝织品(2条) 7. 丧服与礼仪(3条) 8. 冥间服饰(4条) 9. 古典典故中的服饰(4条,部分与上列交叉)

去重后共计25条独立条目。


Step 9: 生成三份文件

文件 路径 说明
总结 /home/z/my-project/upload/3笔记output/浪迹三谈/浪迹三谈_总结.md 含对抗式审查
日志 /home/z/my-project/upload/3笔记output/浪迹三谈/浪迹三谈_日志.md 含grep命令和统计
原文 /home/z/my-project/upload/3笔记output/浪迹三谈/浪迹三谈_原文提取.md 带行号片段

操作流程轨迹

文件基本信息确认✅(751行/159KB) → 读取词库✅ → 第1轮grep核心词92行命中 → 第2轮grep制度词5行命中(1行有效) → 第3轮grep组合扩展~30行命中 → 排除审查(~99行排除,~28行有效) → sed提取上下文~200行 → 分类整理9类25条 → 生成3份MD文件

统计摘要

指标 数值
文件总行数 751
第1轮原始命中行 92
第2轮原始命中行 5
排除后有效行 ~28
服饰条目数 25
分类数 9

关键发现