陕西通志 服饰内容整理日志
基本信息
- 文件名:陕西通志.txt
- 文件大小:9,315,596 字节(约9.3MB)
- 总行数:48,989 行
- 整理日期:2026-05-04
处理流程记录
Step 1: 创建输出目录
mkdir -p /root/.openclaw/workspace/地理3output/陕西通志/
Step 2: 多轮grep提取服饰片段
第一轮提取:使用Python脚本,涵盖全部服饰关键词(衣、裳、袍、衫、裙、袄、甲、胄、铠、冠、帽、巾、笠、冕、履、靴、鞋、袜、佩、簪、钗、绫、罗、绸、缎、纱、绢、帛、锦、绣、缂、色、紫、绯、绿、青、白、黑、黄、红、裘、貂、狐、羊皮、染、织、纺、绩、丝、麻、葛、苎、赐服、服色、品色、章服、冠服、舆服、冕服、补服、褐、布衣、缊袍、龙袍、蟒袍、凤冠、霞帔等)
- 匹配行数:10,836 行
- 输出文件大小:4,615,082 字节(约4.6MB)
- 问题:大量天文星象、地理水道、人名地名中的匹配字(如"白""黑""青""带""环""丝"等)导致噪声过多
Step 3: 精简筛选
第二轮筛选:采用Python正则表达式分层匹配策略
- Tier 1:服饰专用复合词(赐服、服色、章服、冠服、龙袍、蟒袍、凤冠、霞帔、布衣、短褐、幞头、璎珞、朝服、公服、祭服、丧服、戎服、织造、缂丝、蚕桑、纺织、刺绣、甲胄、铠甲等)
- Tier 2:需两个以上服饰单字同时出现
- Tier 3:颜色词需搭配服饰上下文
- Tier 4:纺织生产专用词(织造、织锦、缂丝、蚕桑、纺织等)
- 排除天文星象相关行
- 匹配行数:912 行(后增至1,824行)
- 输出文件大小:约839KB
第三轮筛选:最终聚焦
- 新增负面排除:水经注、山川地理、天文星象
- 保留服饰相关度最高的条目
- 最终匹配行数:782 行
- 输出文件大小:504,042 字节(约492KB)
- 控制在1MB以内 ✓
Step 4: 分类整理与对抗式审查
分类结果:
- 纺织生产与物产(木棉、织绒、织锦回文、隔织、胭脂等)——约30条
- 服饰风俗与等级制度(各县风俗记载、杨用晦冠约、品色衣制度等)——约40条
- 军需服饰(甲胄、衲袄、冬衣绢、胖袄鞋袴等)——约15条
- 衣冠典故与传说(苏蕙织锦、黄帝衣冠葬、织锦城等)——约10条
- 赋税中的纺织品(庸调、棉布输纳、棉花地税等)——约20条
- 其他低相关条目(人名含"履""锦"、地名含"衣"等)——已剔除
对抗式审查要点:
- ✓ 所有引用均来自grep提取的原文
- ✓ 未编造古文原文
- ✓ 仅处理陕西通志.txt
- ✓ 据实撰写,无凑字灌水
- ✓ 每篇MD均≤20KB
Step 5-6: 生成并保存三份MD
| 文件名 | 大小 | 状态 |
|---|---|---|
| 陕西通志_总结.md | 5,189 字节 | ✓ |
| 陕西通志_日志.md | (本文件) | ✓ |
| 陕西通志_原文提取.md | (见下文) | ✓ |
主要发现
陕西通志服饰内容较为分散:不像一些专志有专门的"舆服志"或"服饰"类目,服饰相关内容散布在风俗、食货、物产、人物等各类中。
杨用晦《冠约》是最集中的服饰史料:详细记录了明代陕西冠髻、衣服的奢靡化变迁,具有重要史料价值。
木棉纺织是陕西民间衣食之源:各县志多有记载棉花种植与纺织情况。
苏蕙织锦回文是陕西特色纺织文化:武功苏蕙织锦故事被多次引用。
边军服饰问题是重要的军政议题:余子俊奏请运胖袄鞋袴等记载反映了边地士卒衣着困难。
技术说明
- 因原文件含大量异体字、缺字(以""""等代替),部分文字可能显示不完整
- 原文保留原有标点与分段,未做改动