广博物志 服饰内容提取日志
基本信息
- 书名:广博物志
- 文件:/home/z/my-project/upload/part4_extracted/广博物志.txt
- 总行数:7968行
- 输出目录:/home/z/my-project/upload/p4output/广博物志/
搜索策略
10轮关键词grep
| 轮次 |
关键词 |
命中行数 |
| 1 |
衣 |
547 |
| 2 |
裳 |
62 |
| 3 |
冠 |
235 |
| 4 |
带 |
101 |
| 5 |
佩 |
104 |
| 6 |
履 |
121 |
| 7 |
袍 |
22 |
| 8 |
裘 |
47 |
| 9 |
裙/裠 |
18 |
| 10 |
冕 |
29 |
- 合计含任一关键词的行数:927行(去重后)
- 服饰实质性内容行数(经人工甄别):约180行
甄别标准
- 排除:仅含"衣"字的泛指(如"衣冠人物""衣钵"等非服饰专述)
- 排除:上下文与服饰无实质关联的偶现词
- 保留:服饰名物、服制礼仪、服色等差、织物纹样、冠帽履舄等专述内容
提取过程
第一阶段:广搜
- 使用grep -n逐关键词搜索,记录所有行号
- 10轮共识别927行含服饰关键词
第二阶段:精筛
- 对927行逐一审读,筛出约180行实质性服饰内容
- 按主题归类:星神服饰、帝王礼服、礼制官服、日常衣裘、织物纹样、服饰观念
第三阶段:sed提取
- 对关键行段使用sed -n提取原文
- 重点提取行段:78, 175-187, 200, 223, 266, 353-364, 949, 1282, 1307-1308, 1337, 1493-1494, 1536, 1578, 2097, 2218, 1951-1955, 5056, 5270, 5294, 5296, 5300-5306, 5311-5318, 5326, 5329, 5330, 5335, 5337, 5345, 5349, 5382, 5385, 5391, 5414, 6566等
第四阶段:审查
- 所有提取内容均来自原文,未编造
- 引书出处随文标注(如《云笈七籖》《周礼》《隋书》《物原》等)
- 去除重复条目,合并同一主题散见条目
丰富度评估
| 维度 |
评级 |
说明 |
| 礼制服饰 |
★★★★★ |
《周礼》司服/司裘/弁师/屦人原文完整 |
| 道教神仙服饰 |
★★★★★ |
五帝/北斗/二十八宿/五岳体系完整独详 |
| 后周服制 |
★★★★★ |
皇帝十二服/皇后十二等衣/诸公九服 |
| 服饰起源 |
★★★★☆ |
《物原》系统梳理,从有巢至唐代 |
| 历史人物服饰 |
★★★☆☆ |
散见各条,非集中专述 |
| 织物纹样 |
★★★☆☆ |
名目丰富但篇幅不长 |
| 服饰观念 |
★★☆☆☆ |
仅数条,非本书重点 |
输出文件
- 广博物志_总结.md —— 内容总结与分类分析
- 广博物志_日志.md —— 本文件,搜索提取记录
- 广博物志_原文提取.md —— 核心原文摘录
↑