皇朝经世文三编 服饰提取日志
任务ID:2-4
操作时间:2026-03-04
源文件:/home/z/my-project/upload/经世文编/经世文编/皇朝经世文三编.txt
输出目录:/home/z/my-project/upload/经世文编output/皇朝经世文三编/
步骤1:文件概况
wc -l 皇朝经世文三编.txt
# 结果:6663行
步骤2:第1轮grep——上位概念关键词
关键词:服饰|舆服|冠服|章服|服色|衣冠|服制
命令:
rg -n "服饰|舆服|冠服|章服|服色|衣冠|服制" 皇朝经世文三编.txt | head -200
结果:命中12行,有效服饰相关8行:
- 行95:编者序,删服制目
- 行1033:衣冠之族
- 行1112:服饰之过制(禁服饰之过制)
- 行1164:核心段落——衣服之制,僭越,服色
- 行2953:章服虚也
- 行3090:定章服也
- 行3397:革其衣冠
- 行3675:服色语言
- 行4016:衣冠典制(重要长段)
- 行4019:衣冠服御
- 行4123:车马服饰
- 行4183:易服色
步骤3:第2轮grep——冠帽关键词
关键词:冠|冕|弁|帻|巾|帽|幞头|进贤冠|武冠|通天冠|皮弁
命令(Python方式,因编码问题):
keywords = ['冠','冕','弁','帻','巾','帽','幞头','进贤冠','武冠','通天冠','皮弁']
结果:大量命中("冠"字高频),有效服饰相关:
- 行4016:冕→通天冠、皮弁(关键衣冠演变段落)
- 行4128:日本易服色
- 行4133:日本更服色
- 行4428:本朝衣冠
- 行6270:首多不冠(土耳其)
噪音类型:"冠军""冠以""冠盖"等非服饰用法大量存在,需人工筛选。
步骤4:第3轮grep——衣服关键词
关键词:袍|裘|褐|衫|襦|袄|褂|深衣|法服|朝服|祭服|公服|戎服
结果:有效命中:
- 行1164:衣服之制(核心)、狐裘
- 行1114:草帽边(贸易品)
- 行3356:释裘(比喻用法,保留)
- 行4016:通袍(衣裳→通袍)
- 行4016:箭袖(广裾→箭袖)
- 行4767:恶衣、卑服、衣绨
- 行5418:被褐怀宝(文学用法,保留)
- 行5873:戎服(军服)
- 行6011:披坚(铁甲)
- 行6270:长袍(土耳其)
步骤5:第4轮grep——品色关键词
关键词:紫袍|绯袍|绿袍|青袍|白袍|黄袍|赐紫|赐绯|借紫|品色
结果:零命中。该书无品色服制度的相关论述,印证了编者删去"服制"专目的做法。
步骤6:第5轮grep——材质关键词
关键词:锦|绮|帛|绢|绫|罗|缎|绸|缂丝|缯|丝帛|绢帛|绫罗|锦绮
结果:命中极多("罗""帛"等字在姓名、地名中大量出现),有效服饰相关:
- 行1114:绣货绸(贸易)
- 行1164:绸、狐裘、绮罗、锦绣
- 行3480:缫丝局、织布、织绒毡呢纱
- 行3612:纺织细布
- 行3636:蚕桑之利
- 行3858:缫丝、织缯绢
- 行5360:纱布
步骤7:第6轮grep——配饰关键词
关键词:绶|佩|笏|鱼袋|金带|玉带|革带|鞶囊
结果:有效命中极少:
- 行370:锺佩贤(人名,噪音)
- 行4016:佩玉佩觿(关键演变记录)
- 行6093:佩一环钏(外国税制)
说明:该书几乎不涉及传统佩饰制度。
步骤8:第7轮grep——动作关键词
关键词:赐服|赐衣|赐帛|赐锦|禁|僭|逾制
过滤条件:对"禁""僭""逾制"等高频词,仅保留含服饰语境的命中。
结果:
- 行95:海禁(非服饰,排除)
- 行1164:僭越(核心——服色僭越)
- 行2670:僭越(政治语境,排除)
- 行3090:定章服也
- 行4019:问禁(礼俗语境)
- 行3397:锦绣而衣
- 行4183:易服色
步骤9:第8轮grep——纺织关键词
关键词:蚕|桑|织|染|绣|缫|练
过滤条件:要求命中行同时含"丝""布""帛""绸""缎""锦""绢""罗""衣""服""蚕""桑""织""染""绣""缫""纺""呢""绒"之一。
结果:命中极多,纺织为全书重要主题。关键行号:
- 行491-492:纺纱织布议、纺织二十五策(篇名)
- 行537:纺织利不外溢策(篇名)
- 行573-574:养蚕、饲蚕(篇名)
- 行825-827:纺织、纺织三要、纺织篇(篇名)
- 行1114:绣货绸
- 行1164:衣服之制
- 行3480:缫丝局、织布
- 行3612-3617:钢铁织纺
- 行3636:蚕桑之利
- 行3643:男耕女织
- 行3858-3865:蚕桑详论
- 行5360:纱布进口
步骤10:关键段落上下文提取
使用Python逐段提取,关键段落:
| 行号范围 | 提取内容 | 有效性 |
|---|---|---|
| 1160-1166 | 陈耀卿"复旧制"段 | ✅ 核心服饰段落 |
| 4012-4020 | 郑观应《典礼上》 | ✅ 衣冠演变核心 |
| 4016-4022 | 郑观应《典礼上+下》 | ✅ 中西衣冠比较 |
| 2950-2958 | 贵私贵虚论 | ✅ 章服虚文 |
| 3088-3092 | 陈炽《阜财裕国》 | ✅ 定章服 |
| 3395-3400 | 论二氏 | ✅ 革僧道衣冠 |
| 4121-4128 | 使臣服饰 | ✅ 服饰与外交 |
| 4126-4134 | 日本易服色 | ✅ 异国服制 |
| 4180-4188 | 易服色入公法 | ✅ 服色与国际法 |
| 4426-4432 | 侨民衣冠 | ✅ 服饰与认同 |
| 4765-4770 | 策论节俭 | ✅ 恶衣卑服 |
| 5870-5876 | 俄军戎服 | ✅ 军事服饰 |
| 6268-6274 | 土耳其服制 | ✅ 异国服制 |
| 3856-3866 | 蚕桑 | ✅ 纺织上游 |
步骤11:筛选与去噪
噪音类型统计:
- 人名含服饰字:锺佩贤、张罗澄等(约15处)
- 比喻用法:被褐怀宝、委裘等(约5处)
- 非服饰"冠":冠军、冠盖、冠词等(约30处)
- 非服饰"禁":海禁、禁烟等(约20处)
- 品色关键词零命中
最终有效段落数:22处(见总结篇引用位置表)
步骤12:撰写三份MD
- 皇朝经世文三编_总结.md ✅
- 皇朝经世文三编_日志.md ✅(本文件)
- 皇朝经世文三编_原文提取.md ✅(待写入)