云南野乘
《云南野乘》服饰内容提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 源文件 | /home/z/my-project/upload/演义/演义/云南野乘.txt |
| 文件大小 | 25,983字节(约26KB) |
| 总行数 | 67行 |
| 输出目录 | /home/z/my-project/upload/演义output/云南野乘/ |
| 执行时间 | 2026-03-04 |
执行步骤
步骤1:创建输出目录
mkdir -p /home/z/my-project/upload/演义output/云南野乘/
结果:成功
步骤2:四轮grep提取
第一轮:核心服饰词(37个关键词)
关键词:服饰 服色 冠冕 冕 弁 袍 裘 甲胄 铠甲 锦绣 绶 佩 笏 帻 巾帽 靴 履 舄 裙 袄 褂 衫 褐 朝服 公服 常服 丧服 祭服 衮服 龙袍 蟒袍 补服 品色 舆服 冠服 章服 幞头 鱼袋
命中行:第32行、第44行
- 第32行:重铠、虎皮裙、佩(铜环铜钏属佩饰)
- 第44行:佩剑
第二轮:衣冠制度词(22个关键词)
关键词:衣裳 衣冠 冠带 带剑 佩剑 服制 赐服 赐紫 赐绯 紫袍 绯袍 绿袍 黄袍 白袍 青袍 布衣 蟒衣 仙鹤 狮子 豹子 补子
命中行:第44行
- 第44行:佩剑
第三轮:面料纹饰词(18个关键词)
关键词:锦 绣 绫 罗 绸 缎 纱 绢 帛 丝 葛 麻 棉 缂丝 黼黻 文章 纹 章 彩
命中行:第3行、第34行、第56行、第62行
- 第3行:”紫姜”——地名,排除
- 第34行:”金玉珠宝”——贡品,非面料,排除
- 第56行:”攀藤附葛“——葛为藤蔓非布料,排除
- 第62行:”叛服不常”——服为顺从义,排除;”豫章“——地名,排除
第三轮全部为误命中,本书无任何面料纹饰描写。
第四轮:配饰动作词(27个关键词)
关键词:翠 珰 簪 钗 玉带 金带 银带 革带 丝鞭 冠缨 冠盖 车服 赐衣 更衣 披衣 解衣 衣袂 衣襟 袖 素服 缟素 戎服 戎装 战袍 披甲 戴甲
命中行:无
第四轮零命中,本书无配饰动作类服饰描写。
步骤3:补充grep
针对首轮结果暴露的关键遗漏,追加搜索:
| 关键词 | 命中行 | 有效命中 |
|---|---|---|
| 种桑/育蚕/耕织/蚕桑 | 第21、36、54行 | 全部有效 |
| 衣服/裸体/裸 | 第21、28、44行 | 全部有效 |
| 叉手/面缚/严装/旗帜 | 第28、34、46、56行 | 全部有效 |
| 冠 | 第56行 | “为诸蛮之冠”=首位,排除 |
| 带 | 第17、32行 | 铜环”带”=佩戴,有效 |
| 甲 | 第19行 | 不穿”盔甲”,有效 |
| 发/足/赤/裸 | 第17、19、21、32、44、46行 | 有效 |
命中统计
| 轮次 | 关键词数 | 命中行数 | 有效命中 | 误命中 | 有效率 |
|---|---|---|---|---|---|
| 第一轮 | 37 | 2 | 2 | 0 | 100% |
| 第二轮 | 22 | 1 | 1 | 0 | 100% |
| 第三轮 | 18 | 4 | 0 | 4 | 0% |
| 第四轮 | 27 | 0 | 0 | 0 | N/A |
| 补充搜索 | 8 | 9 | 9 | 1 | 90% |
| 合计 | 112 | 16 | 12 | 5 | 71% |
有效命中涉及行号:第17、19、21、28、32、34、36、44、46、54、56行,共11行(占总行数16%)。
误命中分析
| 误命中 | 行号 | 原词 | 误判原因 |
|---|---|---|---|
| 紫姜 | 3 | 紫 | 地名,非紫色面料 |
| 金玉珠宝 | 34 | 珠 | 贡品珠宝,非服饰配饰 |
| 攀藤附葛 | 56 | 葛 | 葛为藤蔓植物,非葛布 |
| 叛服不常 | 62 | 服 | 服=顺从/臣服,非服饰 |
| 豫章 | 62 | 章 | 地名,非纹章 |
| 为诸蛮之冠 | 56 | 冠 | 冠=首位,非帽饰 |
误命中集中在第三轮短关键词(单字词歧义最大),提示:单字grep需结合上下文二次筛选。
分类体系
提取的服饰内容按以下五大类组织:
- 西南蛮族服饰(7条):夜郎土人、夜郎兵、猓猓人、猓女、邛都人
- 中原服饰影响(2条):蔡国遗民、楚国旗帜
- 军事装备(3条):重铠、佩剑、严装
- 纺织文明传播(1条):种桑育蚕
- 礼仪姿态(2条):叉手礼、面缚
文件产出
| 文件 | 大小 | 内容 |
|---|---|---|
| 原文提取.md | ~4KB | 15条服饰相关原文摘录,关键词加粗 |
| 总结.md | ~5KB | 分类总结与分析,含表格和文明梯度图 |
| 日志.md | 本文件 | 提取过程、命中统计、误命中分析 |
三文件均≤20KB限制。
质量自检
- [x] 未整本载入LLM,仅通过grep+sed提取相关行
- [x] 四轮grep覆盖112个关键词
- [x] 误命中已逐一标注并排除
- [x] 原文提取忠于原文,未增删改写
- [x] 总结据实撰写,所有结论有原文依据
- [x] 三文件均≤20KB