《书叙指南》服饰内容提取操作日志

基本信息


Step 0:环境准备

$ wc -c /home/z/my-project/upload/part1_extracted/书叙指南.txt
332037

$ mkdir -p /home/z/my-project/upload/p1output/书叙指南/

文件324KB,未超500KB限制,但依规不全文载入上下文,采用grep逐步提取。


Step 1:第一轮grep——核心词(15个)

关键词:衣、裳、冠、冕、巾、帽、袍、衫、裙、裘、带、佩、履、舄、靴

命中统计

关键词 命中行数(主要) 服饰相关行
大量 35,238,266,307,330-333,472,474,568,570,843
少量 296,331,472
大量 16,35,226,238,265-266,330-333,345,602,843
少量 266,602
中等 270,302,331,360,474,592
极少 813("脱帽避帐")
少量 333,568,570,807
少量 333,841
极少 含于"帬"字,行333
少量 240,331,333,568,813
大量 266,331,333,602
少量 16,265,266
中等 35,228,296,331,333,662
极少 333,726
极少 333

核心发现:行330-333为"衣服冠履"专章,是全书服饰内容最密集区段。


Step 2:第二轮grep——制度词(10个)

关键词:服色、舆服、冠服、章服、朝服、祭服、丧服、吉服、常服、公服

命中统计

关键词 命中行数 说明
服色 0 未命中
舆服 3 行266、668、843("舆服志"引用)
冠服 0 未单独命中,含于"衣服冠履"中
章服 0 未命中
朝服 3 行238、266("严装衣冠待明""着朝服")
祭服 0 未命中
丧服 2 行333、841
吉服 1 行333("吉服曰嘉服")
常服 0 未命中
公服 0 未命中

核心发现:制度词命中较少,该书以名物雅称为主,不以制度分类。


Step 3:第三轮grep——材质词(15个)

关键词:丝、帛、绢、锦、绮、绫、罗、缎、绸、缂丝、葛、麻、布、褐

命中统计

关键词 命中行数 主要服饰相关行
302,331,333,360
163,266,360
163,360
331,360,462,600
331("文章遒丽"语境)
331,474("绀绫之袿")
331(含于他词)
0 未命中
264
缂丝 0 未命中
28,303,331,757("蕉葛""荃葛")
843
307,568,570
333,568

核心发现:高级材质词(锦、绮、绫、罗)多用于描述华服;基础材质(布、褐、葛、麻)多出现在贫服描述中。


Step 4:第四轮grep——品色词(10个)

关键词:紫袍、绯袍、绿袍、赐紫、赐绯、鱼袋、笏、幞头、金带、玉带

命中统计

关键词 命中行数 说明
紫袍 0 未命中
绯袍 0 未命中
绿袍 0 未命中
赐紫 0 未命中(但有"龟紫""假紫")
赐绯 0 未命中(但有"着绯曰朱衣鱼章")
鱼袋 0 未命中(但有"拥笏垂鱼""朱衣鱼章")
238,266("笏曰板""御珽""服笏")
幞头 0 未命中
金带 1 266("金带曰黄金横带")
玉带 0 未命中(但有"玉重组长""佩玉")

核心发现:该书使用雅称而非通行术语,如"龟紫"代"赐紫","朱衣鱼章"代"赐绯"。


Step 5:第五轮grep——配饰词(部分)

关键词:簪、钗、钿、翠、珮、玦、步摇、金摇

命中统计

关键词 命中行数 主要行
2 259("簪白笔")、264
1 296("折钗断带")
0 未命中
462,474,502,666("戴金翠""翠樽雕觞")
0 单独未命中,含于"佩"
1 402("赐玦")
步摇 1 474("妇人珠吊子曰步揺")
金摇 1 474("又曰金揺")

Step 6:对抗式学术审查

对总结中引用的关键条目逐一grep验证:

$ rg -n "儒衣冠曰危冠方袂" 书叙指南.txt  行331 ✅
$ rg -n "貂鹖之冠" 书叙指南.txt  行266 ✅
$ rg -n "金华之舄" 书叙指南.txt  行333 ✅
$ rg -n "布袍草履" 书叙指南.txt  行568 ✅
$ rg -n "绣衣袿裳" 书叙指南.txt  行474 ✅
$ rg -n "荷衣蕙" 书叙指南.txt  行333+602 ✅
$ rg -n "练冠麻衣" 书叙指南.txt  行843 ✅
$ rg -n "拖绥鸣玉" 书叙指南.txt  行266 ✅
$ rg -n "步揺" 书叙指南.txt  行474 ✅
$ rg -n "龟紫" 书叙指南.txt  行266 

全部10条验证通过,无编造。


总结