《浪迹三谈》服饰内容提取 — 操作日志
日期:2026-04-19 任务:提取《浪迹三谈》全部服饰相关内容,整理分类总结 输入文件:/home/z/my-project/upload/part3/浪迹三谈.txt 文件规模:751行 / 159KB
Step 1: 文件基本信息
```bash wc -l /home/z/my-project/upload/part3/浪迹三谈.txt
结果:751行
ls -lh /home/z/my-project/upload/part3/浪迹三谈.txt
结果:159KB
```
文件为中型TXT(<500KB),但仍按规范采用grep定位+sed提取策略,不一次性载入。
Step 2: 读取词库
词库路径:/home/z/my-project/skills/rysxguji/references/fushi-keywords.md
词库结构: - 一、核心服饰词(首服、体服、下服、足服、腰带、佩饰、礼服、衣料、染色纹样) - 二、制度动作词(赐予、禁令、等级、礼仪、日常) - 三、组合扩展词 - 四、排除规则表 - 五、grep执行策略
Step 3: 第1轮grep — 核心服饰词
```bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/浪迹三谈.txt | wc -l
结果:92行命中
```
高歧义关键词统计:
| 关键词 | 命中行数 | 服饰相关(估) | 非服饰(估) |
|---|---|---|---|
| 衣 | ~25 | ~10 | ~15(人名/比喻) |
| 冠 | ~8 | ~6 | ~2 |
| 带 | ~8 | ~3 | ~5(地带/带领/带鱼) |
| 服 | ~10 | ~3 | ~7(服从/服食/服小民) |
| 丝 | ~5 | 0 | ~5(比喻/燕窝) |
| 罗 | ~5 | 0 | ~5(人名) |
| 履 | ~6 | ~1 | ~5(履历/践履) |
| 锦 | ~3 | ~1 | ~2(比喻) |
| 纱 | ~3 | ~1 | ~2(纱笼/笼纱) |
| 领 | ~4 | 0 | ~4(领域/带领) |
Step 4: 第2轮grep — 制度动作词
```bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/浪迹三谈.txt | wc -l
结果:5行命中
```
审查结果: - 僭:3行命中,全部为政治僭越(僭号、僭逆、僭乱之心),无服饰僭越 - 赐绯:1行(L109赐绯衣)——有效 - 赐服/赐紫/赐蟒/赐鱼/赏衣:0行 - 冠礼/笄礼:0行
Step 5: 第3轮grep — 组合扩展词(按需)
根据前两轮结果,核心服饰词命中92行但高歧义率较高,补充搜索:
```bash rg -n '绯衣|赐绯|衣冠|冠带|袍服|青衣|绛袍|蟒衣|貂褂|朝冠|顶戴|花翎|彩衣|朱衣|纱貂|锦袍|葛衣|朱履|方巾|白角衫|冠玉|织金|纻丝|同袍|敝衣|锦被|彩服|冠裳|披衣|著帽|著屐|屐齿|顶带' /home/z/my-project/upload/part3/浪迹三谈.txt
结果:约30行命中
```
Step 6: 排除审查
按词库排除规则表逐条审查:
| 关键词 | 误命类型 | 排除操作 |
|---|---|---|
| 罗 | 人名(罗大经)、字义(弥罗突) | 排除~5行,保留0行 |
| 丝 | "命如丝"比喻、"丝之长"燕窝 | 排除~3行,保留0行 |
| 带鱼 | 鱼名 | 排除1行(L583) |
| 铜环 | 人名小字 | 排除1行(L159) |
| 巾巴盖局 | 棋盘覆盖布 | 排除1行(L29) |
| 纱笼 | 装虫笼子 | 排除1行(L47) |
| 骨如簪 | 形状比喻 | 排除1行(L667) |
| 服小民之心 | "服"为动词"使信服" | 排除1行 |
| 服食方 | 养生之服食 | 排除1行 |
| 装饰 | "百般装饰"非服饰 | 排除1行 |
| 履历/践履/步履 | 非足服义 | 排除~5行 |
| 锦簇团 | 比喻义 | 排除1行 |
| 笼纱 | 非纱帽 | 排除1行 |
| 布所记 | "布"为动词"分布" | 排除1行 |
| 领域/带领 | 动词/方位义 | 排除~4行 |
排除后有效命中:约28行(含25条服饰条目)
Step 7: sed上下文提取
```bash
对25条核心命中行号,提取N-2至N+5行上下文
行号列表:21, 49, 97, 109, 137, 139, 307, 315, 331, 407, 421, 433, 439, 447, 451, 459, 463, 477, 481, 485, 499, 501, 593, 615, 665
```
提取总行数:约200行上下文
Step 8: 分类整理
将25条有效命中分为9类: 1. 赐服与官服等级制度(4条) 2. 冠服名目(3条) 3. 首服与冠饰(3条) 4. 足服(3条) 5. 佩饰与服御(2条) 6. 衣料与丝织品(2条) 7. 丧服与礼仪(3条) 8. 冥间服饰(4条) 9. 古典典故中的服饰(4条,部分与上列交叉)
去重后共计25条独立条目。
Step 9: 生成三份文件
| 文件 | 路径 | 说明 |
|---|---|---|
| 总结 | /home/z/my-project/upload/3笔记output/浪迹三谈/浪迹三谈_总结.md | 含对抗式审查 |
| 日志 | /home/z/my-project/upload/3笔记output/浪迹三谈/浪迹三谈_日志.md | 含grep命令和统计 |
| 原文 | /home/z/my-project/upload/3笔记output/浪迹三谈/浪迹三谈_原文提取.md | 带行号片段 |
操作流程轨迹
文件基本信息确认✅(751行/159KB)
→ 读取词库✅
→ 第1轮grep核心词92行命中
→ 第2轮grep制度词5行命中(1行有效)
→ 第3轮grep组合扩展~30行命中
→ 排除审查(~99行排除,~28行有效)
→ sed提取上下文~200行
→ 分类整理9类25条
→ 生成3份MD文件
统计摘要
| 指标 | 数值 |
|---|---|
| 文件总行数 | 751 |
| 第1轮原始命中行 | 92 |
| 第2轮原始命中行 | 5 |
| 排除后有效行 | ~28 |
| 服饰条目数 | 25 |
| 分类数 | 9 |
关键发现
- 全书以弈棋和年号考据为主,服饰信息零星分布
- 摘顶记(L447-451)是全书最集中的服饰制度记录,详述清代顶戴与蟒衣貂褂的等级关系
- 冥报故事中的服饰描写(L481-501)极为丰富,但为想象而非现实
- 赐绯衣故事(L109)将赐服与弈棋结合,文化交叉记录