《说郛》服饰提取工作日志


基本信息

项目 内容
书名 说郛
作者 明·陶宗仪 撰
版本 钦定四库全书本
文件 /home/z/my-project/upload/part4/说郛.txt
总行数 60,043行
文件大小 约9MB
输出目录 /home/z/my-project/upload/4笔记output/说郛/

检索过程

第一轮:核心服饰词检索

使用词库核心服饰词全量grep,统计命中行数:

类别 关键词示例 命中行数(约)
礼服/服色类 冠服、朝服、公服、常服、赐服、服色、章服 163
具体服制类 幞头、步摇、花钿、霞帔、鱼袋、蹀躞、蔽膝、裲裆、半臂、褙子、深衣 220
冕弁饰件类 冕、弁、簪、钗、珮、绶、笏、缨、钏 527

核心服饰词总命中约910行(去重前),经抽样审查确认有效服饰语境约400余行。

第二轮:制度动作词检索

关键词 命中行数 有效行数
赐服/赐紫/赐绯 约30行 约25行
约15行 约8行(多非服饰语境)
逾制/违式 约2行 1行
品色/冠礼/笄礼 约10行 约6行
释服 约3行 2行

制度动作词有效命中约42行。

第三轮:组合扩展词检索

主题 关键词 命中行数 有效行数
蚕桑纺织 蚕、桑、茧、缫、织 约60行 约15行(多数为非服饰语境)
鱼袋制度 赐鱼袋、佩鱼、金银鱼袋 约8行 7行
幞头演变 软脚、硬脚、展角、乌纱 约12行 10行
赐服体系 蟒衣、飞鱼服、斗牛服 约3行 1行

组合扩展词有效命中约33行。


关键段落定位

经三轮检索与抽样审查,定位以下核心服饰段落:

序号 行号范围 所属子书 内容摘要
1 3042 《广名·广服》 服饰名词训诂(织、缯、布、纩、缟、素、絺、绤、元服、弁、绶、蔽膝、蓝缕、褰、袡、厉等)
2 6752-6765 汉制考 冕冠制度、通天冠、进贤冠、法冠、武冠、帻、建华冠等
3 7218-7220 《中华古今注》卷上 冕服(繁露之义、衮冕垂旒)
4 7261-7269 《中华古今注》卷上 文武冠(进贤冠/惠文冠)、貂蝉、部伍赤帻
5 7283 《中华古今注》卷上 靴(西服→赵武灵王→马周改制)、笏(品级用材)
6 7305-7375 《中华古今注》卷中 皇后冠带、羃䍦、魏宫人蝉鬓、头髻演变、冠子/钗子、衫子背子、裙、披袄子、鞋子/靸鞋、披帛、麻鞋、袜、席帽/大帽/搭耳帽/乌纱帽、幞头、巾子、汗衫、半臂、袜肚、裩、袴、布衫、袍衫、绯绫袍
7 7619 汉制考 刘氏冠与衣服不贰
8 7945-7950 《邺中记》引 半臂(隋大业中半除→唐高祖半臂)、偏后衣
9 8113-8114 杂录 霞帔起源(唐睿宗赐司马承祯)
10 9652 宋人笔记 宋代赐时服制度(太祖改制冬赐夹公服)
11 9838 杂考 帕首/抹额考辨(禹涂山→韩愈→苏轼→娄师德)
12 10575 宋人笔记 司马光深衣与唐妆
13 10761 宋人笔记 黄褙子(哲宗即位柩前衣此褙子)
14 15565 宋人笔记 妇人旋裙(前后开胯便乘驴)、凉衫
15 18752 南宋笔记 御驾卤簿服饰详记(幞头罗袍、缬罗衫、背子、束带等)
16 18997 《懒真子录》 鱼袋制度考辨
17 19360 宋人笔记 幞头演变通史(隋→唐→五代→宋)

排除记录

以下命中经审查后排除:

  1. "麻制"(翰林诏书义)——约5处,非服饰
  2. "罗列""星罗棋布"——约8处,非丝织品义
  3. "环境""环能"——约3处,非首饰义
  4. "冠军""冠绝""冠名"——约20处,非首服义
  5. "服药""服从"——约15处,非服饰义
  6. "带领""地带"——约10处,非腰带义
  7. "锦州""锦城"——约3处,地名
  8. "衣钵"——约2处,传法义,但保留"衣冠"(代指士大夫仍有服饰信息)
  9. 诗小序中的服饰词(如"羔裘"等篇名)——保留,但仅作索引参考

方法说明

  1. 严格遵循词库关键词,未自行增减
  2. 大文件(9MB/6万行)禁止整本载入,全部通过grep定位→sed提取
  3. 上下文提取窗口为命中行±2-5行
  4. 三轮检索覆盖核心词→制度词→组合扩展词
  5. 对高频词(如"衣""冠""服")做语境二次过滤
  6. 最终选取17个核心段落,覆盖首服、体服、下服、足服、佩饰、制度六大类