清稗类钞·服饰提取日志
基本信息
- 书名:清稗类钞
- 作者:徐珂(仲可)
- 输入文件:/home/z/my-project/upload/part4_extracted/清稗类钞.txt
- 文件大小:9.1MB,43110行
- 输出目录:/home/z/my-project/upload/p4output/清稗类钞/
10轮Grep搜索记录
第1轮:服制类关键词
- 关键词:舆服|冠服|章服|服色|品服|朝服|公服|祭服|丧服|常服|法服|时服
- 命中行数:145行
- 主要内容:朝贺大会朝服制度、常朝朝服坐班、捐纳章服、皇帝/皇子/品官冠服制度详文、朝服之宜忌、诏定官民服饰、喇嘛服色、赐紫舆服、丧仪丧服等
- 高价值区域:L10197-L10375(皇帝至命妇冠服制度全文)
第2轮:冠帽类关键词
- 关键词:冠|冕|巾|帻|幞头|弁|帽|笠|盔|旒
- 总匹配:1399行(含大量单字"冠""帽"等通用匹配)
- 精确化处理:
- 复合词(幞头/弁/笠/盔/旒):216行
- 朝冠/吉服冠/冬冠/夏冠/暖帽/凉帽等:140行
- 皮帽/毡帽/红帽/笠子/头巾/冠冕:37行
- 主要内容:皇帝冬夏朝冠制、皇子至品官朝冠顶饰、暖帽凉帽制度、红绒结顶冠、拉虎帽、凤冠、小帽(西瓜皮帽)、方巾禁令
第3轮:袍衫类关键词
- 关键词:袍|衫|襦|袄|裙|裤|褐|裳|深衣|大袖|半臂|褙子
- 总匹配:781行
- 精确化处理:
- 稀有词(深衣/大袖/半臂/褙子/襦/袄):64行
- 复合词(龙袍/蟒袍/朝袍/旗袍/短褐/马褂/补褂等):150行
- 主要内容:龙袍蟒袍制度、缺襟袍、马褂源流、黄马褂、得胜褂、卧龙袋、巴图鲁坎肩、半臂、襕裙、套裤、灯笼裤
第4轮:佩饰类关键词
- 关键词:佩|笏|鱼袋|革带|大带|鞶囊|环|珮|簪|钗|步摇|花钗|钿
- 总匹配:805行
- 精确化处理:
- 稀有词(鱼袋/革带/大带/鞶囊/步摇/花钗/笏):37行
- 复合词(朝珠/金簪/玉簪/钿子/钿罩/翠钿等):72行
- 主要内容:朝珠制度(108粒/五品以上)、花翎蓝翎、便顶顶珠品级、扳指、金指甲、指环、钏、耳环、钗、卍字簪、方胜
第5轮:履鞋类关键词
- 关键词:履|舄|靴|鞋|袜|赤舄
- 总匹配:524行
- 精确化处理:
- 复合词(赤舄/朝靴/花盆底/马蹄鞋/旗鞋/弓鞋/绣鞋等):21行
- 主要内容:靴制(缎/绒/布)、朝靴方头、绿牙缝靴、弓鞋(扬州最尖)、高底、马蹄底鞋、旗女平底鞋、睡鞋、画屧、草鞋、钉鞋、木屐
第6轮:织物类关键词
- 关键词:锦|绮|帛|绢|绫|罗|缎|缂丝|纱|绸|绉|缯|纨|素
- 总匹配:2101行
- 精确化处理:
- 稀有词(缂丝/绮/纨/绉/缯):157行
- 复合词(明黄缎/蟒缎/妆缎等):28行
- 主要内容:明黄缎/石青缎/金黄缎(制度用)、蟒缎、糚缎、缂丝八团、片金缘、实地纱、建绒、绸罗绢帛各类织物记载
第7轮:纹样色彩类关键词
- 关键词:黼黻|文章|绣|纹|龙章|日月|华虫|宗彝|藻火|粉米|染|蓝|靛|朱|绛|赭
- 总匹配:1914行
- 精确化处理:
- 稀有词(黼黻/华虫/宗彝/藻火/粉米/靛/绛/赭):123行
- 复合词(十二章/五爪/四爪/补子/补服):77行
- 主要内容:十二章纹详载(日月星辰山龙华虫黼黻在衣、宗彝藻火粉米在裳)、五爪龙/四爪蟒之分、补子文鸟武兽、香色禁令、染色工艺
第8轮:纺织生产类关键词
- 关键词:蚕|桑|丝|绵|茧|织|纺|缫|纬|经|机杼
- 总匹配:2735行(大量为通用字"经""丝"等)
- 精确化处理:
- 复合词(蚕桑/缫丝/机杼/织造/纺绩/养蚕/茧丝/织锦):46行
- 主要内容:青海毛布纺织工艺、拉萨金工、各地织造零散记载(本书非农书,纺织生产内容较少)
第9轮:平民服饰类关键词
- 关键词:布衣|短褐|缊袍|敝衣|粗布|麻衣
- 命中行数:172行
- 主要内容:傅青主布衣毡帽、黄九烟布衣素冠、叶英多摄敝衣冠、度冬常服判阶级(狐裘/羊裘/木棉)、农商之衣(农民许绸纱、商贾止许绢布)、短褐苗、布裙等
第10轮:礼制服饰类关键词
- 关键词:赐服|赐紫|赐绯|借紫|加冠|及笄|冠礼|释服|更衣
- 命中行数:71行
- 主要内容:宗室公赐紫舆服、在旗大臣赐紫、赐紫沙门(玹水/成衡/石泉/啸岩/烎虚)、噶伦卜戴冠礼、及笄(大量婚俗记载)、更衣(斋宫/颐和园更衣室等)、释服(丁忧守制)、冠礼(哈萨克割礼非冠礼)
搜索策略说明
- 大文件(9MB/43110行),单字关键词(冠/帽/袍/裙/靴/鞋/袜/锦/绣/染/蓝/朱/蚕/丝/织等)命中量过大,采用复合词精确化策略
- 优先提取服饰专类(L10187-L11500,约1313行)为核心,辅以各类散见条目
- 已识别关键条目标题约180个(服饰专类内)
文件大小控制
- 总结MD:约6KB
- 日志MD:当前文件
- 原文提取MD:需控制在20KB以内
↑