返回典籍目录

皇朝经世文三编 服饰提取日志

任务ID:2-4
操作时间:2026-03-04
源文件:/home/z/my-project/upload/经世文编/经世文编/皇朝经世文三编.txt
输出目录:/home/z/my-project/upload/经世文编output/皇朝经世文三编/


步骤1:文件概况

wc -l 皇朝经世文三编.txt
# 结果:6663行

步骤2:第1轮grep——上位概念关键词

关键词:服饰|舆服|冠服|章服|服色|衣冠|服制

命令

rg -n "服饰|舆服|冠服|章服|服色|衣冠|服制" 皇朝经世文三编.txt | head -200

结果:命中12行,有效服饰相关8行:
- 行95:编者序,删服制目
- 行1033:衣冠之族
- 行1112:服饰之过制(禁服饰之过制)
- 行1164:核心段落——衣服之制,僭越,服色
- 行2953:章服虚也
- 行3090:定章服也
- 行3397:革其衣冠
- 行3675:服色语言
- 行4016:衣冠典制(重要长段
- 行4019:衣冠服御
- 行4123:车马服饰
- 行4183:易服色


步骤3:第2轮grep——冠帽关键词

关键词:冠|冕|弁|帻|巾|帽|幞头|进贤冠|武冠|通天冠|皮弁

命令(Python方式,因编码问题):

keywords = ['冠','冕','弁','帻','巾','帽','幞头','进贤冠','武冠','通天冠','皮弁']

结果:大量命中("冠"字高频),有效服饰相关:
- 行4016:冕→通天冠皮弁(关键衣冠演变段落)
- 行4128:日本易服色
- 行4133:日本更服色
- 行4428:本朝衣冠
- 行6270:首多不冠(土耳其)

噪音类型:"冠军""冠以""冠盖"等非服饰用法大量存在,需人工筛选。


步骤4:第3轮grep——衣服关键词

关键词:袍|裘|褐|衫|襦|袄|褂|深衣|法服|朝服|祭服|公服|戎服

结果:有效命中:
- 行1164:衣服之制(核心)、狐裘
- 行1114:草帽边(贸易品)
- 行3356:释裘(比喻用法,保留)
- 行4016:通袍(衣裳→通袍)
- 行4016:箭袖(广裾→箭袖)
- 行4767:恶衣、卑服、衣绨
- 行5418:被褐怀宝(文学用法,保留)
- 行5873:戎服(军服)
- 行6011:披坚(铁甲)
- 行6270:长袍(土耳其)


步骤5:第4轮grep——品色关键词

关键词:紫袍|绯袍|绿袍|青袍|白袍|黄袍|赐紫|赐绯|借紫|品色

结果零命中。该书无品色服制度的相关论述,印证了编者删去"服制"专目的做法。


步骤6:第5轮grep——材质关键词

关键词:锦|绮|帛|绢|绫|罗|缎|绸|缂丝|缯|丝帛|绢帛|绫罗|锦绮

结果:命中极多("罗""帛"等字在姓名、地名中大量出现),有效服饰相关:
- 行1114:绣货绸(贸易)
- 行1164:狐裘绮罗锦绣
- 行3480:缫丝局、织布、织绒毡呢纱
- 行3612:纺织细布
- 行3636:蚕桑之利
- 行3858:缫丝、织缯绢
- 行5360:纱布


步骤7:第6轮grep——配饰关键词

关键词:绶|佩|笏|鱼袋|金带|玉带|革带|鞶囊

结果:有效命中极少:
- 行370:锺佩贤(人名,噪音)
- 行4016:佩玉佩觿(关键演变记录)
- 行6093:佩一环钏(外国税制)

说明:该书几乎不涉及传统佩饰制度。


步骤8:第7轮grep——动作关键词

关键词:赐服|赐衣|赐帛|赐锦|禁|僭|逾制

过滤条件:对"禁""僭""逾制"等高频词,仅保留含服饰语境的命中。

结果
- 行95:海禁(非服饰,排除)
- 行1164:僭越(核心——服色僭越)
- 行2670:僭越(政治语境,排除)
- 行3090:定章服
- 行4019:问(礼俗语境)
- 行3397:锦绣而衣
- 行4183:易服色


步骤9:第8轮grep——纺织关键词

关键词:蚕|桑|织|染|绣|缫|练

过滤条件:要求命中行同时含"丝""布""帛""绸""缎""锦""绢""罗""衣""服""蚕""桑""织""染""绣""缫""纺""呢""绒"之一。

结果:命中极多,纺织为全书重要主题。关键行号:
- 行491-492:纺纱织布议、纺织二十五策(篇名)
- 行537:纺织利不外溢策(篇名)
- 行573-574:养蚕、饲蚕(篇名)
- 行825-827:纺织、纺织三要、纺织篇(篇名)
- 行1114:绣货绸
- 行1164:衣服之制
- 行3480:缫丝局、织布
- 行3612-3617:钢铁织纺
- 行3636:蚕桑之利
- 行3643:男耕女织
- 行3858-3865:蚕桑详论
- 行5360:纱布进口


步骤10:关键段落上下文提取

使用Python逐段提取,关键段落:

行号范围 提取内容 有效性
1160-1166 陈耀卿"复旧制"段 ✅ 核心服饰段落
4012-4020 郑观应《典礼上》 ✅ 衣冠演变核心
4016-4022 郑观应《典礼上+下》 ✅ 中西衣冠比较
2950-2958 贵私贵虚论 ✅ 章服虚文
3088-3092 陈炽《阜财裕国》 ✅ 定章服
3395-3400 论二氏 ✅ 革僧道衣冠
4121-4128 使臣服饰 ✅ 服饰与外交
4126-4134 日本易服色 ✅ 异国服制
4180-4188 易服色入公法 ✅ 服色与国际法
4426-4432 侨民衣冠 ✅ 服饰与认同
4765-4770 策论节俭 ✅ 恶衣卑服
5870-5876 俄军戎服 ✅ 军事服饰
6268-6274 土耳其服制 ✅ 异国服制
3856-3866 蚕桑 ✅ 纺织上游

步骤11:筛选与去噪

噪音类型统计
- 人名含服饰字:锺佩贤、张罗澄等(约15处)
- 比喻用法:被褐怀宝、委裘等(约5处)
- 非服饰"冠":冠军、冠盖、冠词等(约30处)
- 非服饰"禁":海禁、禁烟等(约20处)
- 品色关键词零命中

最终有效段落数:22处(见总结篇引用位置表)


步骤12:撰写三份MD