《说郛》服饰提取工作日志
基本信息
| 项目 | 内容 |
|---|---|
| 书名 | 说郛 |
| 作者 | 明·陶宗仪 撰 |
| 版本 | 钦定四库全书本 |
| 文件 | /home/z/my-project/upload/part4/说郛.txt |
| 总行数 | 60,043行 |
| 文件大小 | 约9MB |
| 输出目录 | /home/z/my-project/upload/4笔记output/说郛/ |
检索过程
第一轮:核心服饰词检索
使用词库核心服饰词全量grep,统计命中行数:
| 类别 | 关键词示例 | 命中行数(约) |
|---|---|---|
| 礼服/服色类 | 冠服、朝服、公服、常服、赐服、服色、章服 | 163 |
| 具体服制类 | 幞头、步摇、花钿、霞帔、鱼袋、蹀躞、蔽膝、裲裆、半臂、褙子、深衣 | 220 |
| 冕弁饰件类 | 冕、弁、簪、钗、珮、绶、笏、缨、钏 | 527 |
核心服饰词总命中约910行(去重前),经抽样审查确认有效服饰语境约400余行。
第二轮:制度动作词检索
| 关键词 | 命中行数 | 有效行数 |
|---|---|---|
| 赐服/赐紫/赐绯 | 约30行 | 约25行 |
| 僭 | 约15行 | 约8行(多非服饰语境) |
| 逾制/违式 | 约2行 | 1行 |
| 品色/冠礼/笄礼 | 约10行 | 约6行 |
| 释服 | 约3行 | 2行 |
制度动作词有效命中约42行。
第三轮:组合扩展词检索
| 主题 | 关键词 | 命中行数 | 有效行数 |
|---|---|---|---|
| 蚕桑纺织 | 蚕、桑、茧、缫、织 | 约60行 | 约15行(多数为非服饰语境) |
| 鱼袋制度 | 赐鱼袋、佩鱼、金银鱼袋 | 约8行 | 7行 |
| 幞头演变 | 软脚、硬脚、展角、乌纱 | 约12行 | 10行 |
| 赐服体系 | 蟒衣、飞鱼服、斗牛服 | 约3行 | 1行 |
组合扩展词有效命中约33行。
关键段落定位
经三轮检索与抽样审查,定位以下核心服饰段落:
| 序号 | 行号范围 | 所属子书 | 内容摘要 |
|---|---|---|---|
| 1 | 3042 | 《广名·广服》 | 服饰名词训诂(织、缯、布、纩、缟、素、絺、绤、元服、弁、绶、蔽膝、蓝缕、褰、袡、厉等) |
| 2 | 6752-6765 | 汉制考 | 冕冠制度、通天冠、进贤冠、法冠、武冠、帻、建华冠等 |
| 3 | 7218-7220 | 《中华古今注》卷上 | 冕服(繁露之义、衮冕垂旒) |
| 4 | 7261-7269 | 《中华古今注》卷上 | 文武冠(进贤冠/惠文冠)、貂蝉、部伍赤帻 |
| 5 | 7283 | 《中华古今注》卷上 | 靴(西服→赵武灵王→马周改制)、笏(品级用材) |
| 6 | 7305-7375 | 《中华古今注》卷中 | 皇后冠带、羃䍦、魏宫人蝉鬓、头髻演变、冠子/钗子、衫子背子、裙、披袄子、鞋子/靸鞋、披帛、麻鞋、袜、席帽/大帽/搭耳帽/乌纱帽、幞头、巾子、汗衫、半臂、袜肚、裩、袴、布衫、袍衫、绯绫袍 |
| 7 | 7619 | 汉制考 | 刘氏冠与衣服不贰 |
| 8 | 7945-7950 | 《邺中记》引 | 半臂(隋大业中半除→唐高祖半臂)、偏后衣 |
| 9 | 8113-8114 | 杂录 | 霞帔起源(唐睿宗赐司马承祯) |
| 10 | 9652 | 宋人笔记 | 宋代赐时服制度(太祖改制冬赐夹公服) |
| 11 | 9838 | 杂考 | 帕首/抹额考辨(禹涂山→韩愈→苏轼→娄师德) |
| 12 | 10575 | 宋人笔记 | 司马光深衣与唐妆 |
| 13 | 10761 | 宋人笔记 | 黄褙子(哲宗即位柩前衣此褙子) |
| 14 | 15565 | 宋人笔记 | 妇人旋裙(前后开胯便乘驴)、凉衫 |
| 15 | 18752 | 南宋笔记 | 御驾卤簿服饰详记(幞头罗袍、缬罗衫、背子、束带等) |
| 16 | 18997 | 《懒真子录》 | 鱼袋制度考辨 |
| 17 | 19360 | 宋人笔记 | 幞头演变通史(隋→唐→五代→宋) |
排除记录
以下命中经审查后排除:
- "麻制"(翰林诏书义)——约5处,非服饰
- "罗列""星罗棋布"——约8处,非丝织品义
- "环境""环能"——约3处,非首饰义
- "冠军""冠绝""冠名"——约20处,非首服义
- "服药""服从"——约15处,非服饰义
- "带领""地带"——约10处,非腰带义
- "锦州""锦城"——约3处,地名
- "衣钵"——约2处,传法义,但保留"衣冠"(代指士大夫仍有服饰信息)
- 诗小序中的服饰词(如"羔裘"等篇名)——保留,但仅作索引参考
方法说明
- 严格遵循词库关键词,未自行增减
- 大文件(9MB/6万行)禁止整本载入,全部通过grep定位→sed提取
- 上下文提取窗口为命中行±2-5行
- 三轮检索覆盖核心词→制度词→组合扩展词
- 对高频词(如"衣""冠""服")做语境二次过滤
- 最终选取17个核心段落,覆盖首服、体服、下服、足服、佩饰、制度六大类