《化书》服饰内容提取 — 操作日志

日期:2026-03-05
任务:提取《化书》全部服饰相关内容,整理分类总结
输入文件:/home/z/my-project/upload/诸子/诸子/化书.txt
输出目录:/home/z/my-project/upload/诸子重制output/化书/


Step 1: 基本信息

wc -l /home/z/my-project/upload/诸子/诸子/化书.txt
# 结果:308 行

wc -c /home/z/my-project/upload/诸子/诸子/化书.txt
# 结果:37954 字节(约37KB)

文件基本信息:
- 文件:化书.txt
- 版本:钦定四库全书本
- 作者:南唐 谭峭 撰
- 结构:六卷(道化、术化、德化、仁化、食化、俭化)
- 行数:308行
- 大小:37954字节


Step 2: 第一轮grep——核心服饰词

rg -n '衣|裳|冠|冕|袍|裘|带|佩|巾|帻|履|舄|笏|绶|幞头|裙|衫|袄|褐|缙|绅|纨|绮|绫|罗|锦|绣|帛|绢|绸|缎|丝|棉|葛|麻|毡|帽|靴|鞋|袜|披|氅|褂|领|袖|袂|裾|襟|衽|裆|裤|褶|襦|襕|裲裆|半臂|霞帔|首饰|簪|钗|钏|环|珮|鱼袋|鞍|鞯|辔|卤簿|仪仗|服色|章服|品服|朝服|公服|常服|吉服|丧服|祭服|戎服|赐服|赐紫|赐绯|蟒衣|飞鱼|斗牛|补服|弁|盔|胄|缨|钗|步摇|胜|花钿|蔽膝|袴|屦|屐|蹀躞|缂丝|纹|黼|黻|法服|燕服|翟衣|袆衣|深衣' /home/z/my-project/upload/诸子/诸子/化书.txt

命中行号:L12, L13, L17, L33, L43, L51, L95, L99, L141, L143, L155, L198, L200, L206, L224, L229, L230, L232, L238, L250, L252, L265, L269, L271, L273, L275, L277, L279, L291

合计:29行命中


Step 3: 第二轮grep——制度动作词

rg -n '赐服|赐紫|赐绯|赐蟒|赐鱼|赏衣|僭|逾制|违式|品色|冠礼|笄礼|敛衽|释服|加冠' /home/z/my-project/upload/诸子/诸子/化书.txt

命中行号:L141(僭)、L231(奢僭篇名)、L232(奢僭由兹而起)

合计:3行命中(其中L141、L232与第一轮重复)


Step 4: 第三轮grep——组合扩展词

rg -n '簮|绂|布素|组绣|絺绤|旒冕|缨|葛苎|丝纶' /home/z/my-project/upload/诸子/诸子/化书.txt

新增命中:L248(服布素)、L250(衣缨)、L267(簮绂、布素)

rg -n '蚕|桑|缫|织|纺' /home/z/my-project/upload/诸子/诸子/化书.txt

命中行号:L224(蚕告终而缲葛苎之衣)、L273(我蚕我衣)

合计:第三轮新增3行


Step 5: 逐条审查排除

行号 关键词 语境 判定 理由
L12 "环舞" ❌排除 环=圆形舞蹈,非首饰
L43 "犹环之无穷" ❌排除 环=循环义,非首饰
L51 "丝毫之虑" ❌排除 丝=微小量词义,非丝织品
L95 无服饰关键词 ❌排除 "婴児"非服饰
L99 "八卦环转" ❌排除 环=循环义,非首饰
L143 "忘辔" ❌排除 辔=马缰绳,非服饰
L200 无直接服饰词 药饵渐引 ❌排除 无有效服饰语境
L13 "粉巾为兎" ✅保留 巾=布巾,制作幻术道具
L17 冠、黼黻 "冠剑之状""黼黻之色" ✅保留 冕冠+纹样
L33 "化冠冕" ✅保留 冕服等级符号
L141 帛、僭 "粟帛""僭君子" ✅保留 帛=丝帛;僭=逾越等级
L155 衣冠 "衣冠可诈" ✅保留 衣冠=服饰+地位
L198 "网之以冠冕" ✅保留 冕服等级符号
L206 "文绮丽者" ✅保留 绮=丝织品
L224 蚕、葛苎、衣 "缲葛苎之衣" ✅保留 蚕桑+粗布衣
L229-230 丝、纶 "王取其丝" ✅保留 丝纶=丝线(赋税剥削)
L232 组、绣、僭 "张组设绣""奢僭" ✅保留 丝织+僭越
L238 锦绣、冕 "锦绣珠玉""冠冕旌旗" ✅保留 锦绣+冕服
L248 布素 "服布素则民自暖" ✅保留 布素=粗布衣
L250 衣、缨 "衣缨之费" ✅保留 衣服+帽带
L252 "均其衣" ✅保留 衣=衣服
L265 絺绤、布帛 "服絺绤""衣之布帛" ✅保留 细葛布+丝帛
L267 簮绂、布素 "簮绂""布素" ✅保留 发簪丝绶+粗布
L269 冕、冠 "戴冕者戴冠" ✅保留 冕冠等级
L271 布素、衣 "服布素之衣" ✅保留 粗布衣
L273 蚕、衣 "我蚕我衣" ✅保留 蚕桑+衣服
L275 布素、簮组、剑佩、旒冕 全段 ✅保留 等级服饰链
L277 黼黻、组绣、帛 "黼黻""组绣""粟帛" ✅保留 纹样+丝织
L279 "司粟帛" ✅保留 丝帛管理
L291 裘、帛 "推一裘""司粟帛" ✅保留 皮衣+丝帛

审查结论
- 总命中行:32行(三轮合计,去重前)
- 排除行:7行(L12、L43、L51、L95、L99、L143、L200)
- 有效行:24行
- 有效服饰条目:28条(含同一行多条不同服饰词)


Step 6: sed上下文提取

由于文件仅308行、约38KB,已读取全文,逐行定位后直接摘录。所有命中行上下文已在原文提取MD中完整呈现。


Step 7: 分类整理

将28条有效条目分为5类:
1. 首服类(冠、冕、巾):8条
2. 体服类(衣、裘、布素、絺绤):9条
3. 衣料纹样类(丝、帛、锦、绣、绮、黼黻):7条
4. 佩饰类(簮组、剑佩、簮绂、缨):4条
5. 服饰制度/等级词(僭、奢僭、等级攀比):3条


操作流程轨迹

读取基本信息✅(308行/38KB)
→ 第1轮核心词grep✅(29行命中)
→ 第2轮制度词grep✅(3行命中,2行重复)
→ 第3轮组合扩展grep✅(新增3行)
→ 逐条审查排除✅(排除7行,保留24行28条)
→ sed上下文提取✅(全文已读取)
→ 分类整理5类✅
→ 生成3份MD✅