《洛阳搢绅旧闻记》服饰内容提取 — 操作日志

日期:2026-03-05 任务:提取《洛阳搢绅旧闻记》全部服饰相关内容,整理分类总结 输入:/home/z/my-project/upload/part3/洛阳搢绅旧闻记.txt(122行,73KB)


Step 0: 文件基本信息

```bash wc -l /home/z/my-project/upload/part3/洛阳搢绅旧闻记.txt

结果:122行

du -h /home/z/my-project/upload/part3/洛阳搢绅旧闻记.txt

结果:73KB

```

文件规模较小(122行/73KB),但单行极长(笔记体长段叙事),仍需sed定位提取。


Step 1: 第1轮grep — 核心服饰词

bash rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|钗|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/part3/洛阳搢绅旧闻记.txt

第1轮命中行:L2, L3, L22, L32, L34, L36, L38, L40, L52, L54, L57, L59, L67, L68, L70, L73, L75, L77, L87, L89, L92, L94, L96, L98, L105, L107, L110, L112, L116

初步统计:29行命中


Step 2: 第2轮grep — 制度动作词

bash rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/part3/洛阳搢绅旧闻记.txt

第2轮命中行:L110(赐绯)

新增命中行:1行(L110已含在第1轮中)


Step 3: 第3轮grep — 组合扩展词(蚕桑纺织/铠甲)

bash rg -n '蚕|桑|茧|缫|织|纺|赐鱼|金银鱼袋|折帛|和买|匹帛|绢价' /home/z/my-project/upload/part3/洛阳搢绅旧闻记.txt

第3轮命中行:L57(蚕麦/耕织/新茧/力耕桑)

bash rg -n '兠牟|兜牟|甲|铠|铁|冑|胄|弁' /home/z/my-project/upload/part3/洛阳搢绅旧闻记.txt

第3轮补充命中:L36(免胄), L38(甲骑), L94(兠牟)


Step 4: 排除规则审查

原始命中 行号 关键词 误命中场景 处理
缙绅(书名) L2/L22 "缙绅"=士大夫代称 排除——非服饰语境
罗网 L34 "空中设罗网"=蜘蛛网 排除——非丝织品
罗给事 L38 人名/官称 排除——非丝织品
履儒行 L70 "履"作动词"践行" 排除——非足服
李罗 L94 人名绰号 排除——非丝织品
衣冠之族 L59 衣冠 代指士族 保留——仍含服饰等级信息
衣带自缢 L98 衣带 非常规穿着 保留——仍描述服饰器物
甲骑 L38 "甲骑"=骑兵 排除——非服饰描述

审查后有效命中行:L32, L34, L36, L38, L40, L57, L59, L70, L73, L75, L77, L92, L94, L98, L110, L112

共16行含有效服饰内容。


Step 5: sed提取上下文

对每个有效命中行,提取关键服饰语段:

```bash

以L34为例

sed -n '34p' INPUT_FILE | rg -o '.{0,30}(冠褐|冬服|绵衣|造袜|绢).{0,30}' ```

提取结果已整理入"原文提取.md"。


Step 6: 分类整理与统计

服饰关键词命中统计

类别 命中数 主要行号
首服 6 L34, L40, L92, L94
体服 22 L32, L34, L38, L40, L57, L59, L70, L73, L75, L77, L92, L94, L98, L110
足服 2 L34, L77
腰带 3 L38, L98
佩饰 4 L59, L75, L77, L110
衣料纺织 5 L34, L57, L75, L112
蚕桑纺织 4 L57
染色纹样 2 L57, L98
铠甲 2 L36, L94
赐服制度 3 L32, L57, L110
合计 约49

排除误命中统计

排除项 数量
缙绅(非服饰) 2
罗(人名/网) 3
履(动词) 1
甲骑(非服饰) 1
合计排除 7

Step 7: 生成三份文件


操作流程轨迹

文件信息(122行/73KB) → 第1轮grep核心词(29行命中) → 第2轮grep制度词(1行新增) → 第3轮grep扩展词(蚕桑+铠甲,2行新增) → 排除审查(排除7处误命中) → sed提取上下文(16行有效) → 分类整理(9大类约49条) → 创作3份MD → 保存

关键发现

审核结果