《韵语阳秋》服饰内容提取日志
基本信息
| 项目 | 内容 |
|---|---|
| 书目 | 宋·葛立方《韵语阳秋》 |
| 输入文件 | /home/z/my-project/upload/诗话/诗话/韵语阳秋.txt |
| 输出目录 | /home/z/my-project/upload/诗话output/韵语阳秋/ |
| 文件行数 | 904行 |
| 文件编码 | UTF-8 (CRLF) |
搜索过程
第一轮:全量grep搜索
关键词列表(共56个):
衣 裳 裘 冕 冠 服 佩 戴 袍 裙 褐 袂 衿 领 袖 履 舄 笏 帔 襦 衮 帽 巾 锦 帛 绢 绫 罗 缎 绸 纱 绮 丝 布 葛 麻 毡 染 绣 织 裁 缝 练 簪 钗 珰 玦 环 绶 靴 袜 鱼袋 幞头
匹配结果:188行
第二轮:逐条人工审查
对188条匹配逐条判定,分类为:
- ✅ 有效服饰片段:30条
- ❌ 误报剔除:158条
误报类型统计
| 误报类型 | 数量 | 典型示例 |
|---|---|---|
| 葛=姓氏 | 4 | “葛立方”“葛公” |
| 罗=姓氏 | 3 | “罗隐”“罗昭谏” |
| 戴=人名 | 3 | “访戴”(访戴逵) |
| 领=动词”率领/领会” | 3 | “再领三公府”“能领客”“当领此” |
| 练=”练字/如练” | 3 | “练字”“澄江静如练” |
| 冠=”冠军/冠绝” | 2 | “冠吾唐” |
| 布=瀑布 | 1 | “瀑布” |
| 丝=丝竹/一丝 | 4 | “丝竹管弦”“不挂一丝”“白间生黑丝”“如丝如膏” |
| 服=钦服/佩服 | 2 | “钦服”“捷思为可服” |
| 衮=人名 | 1 | “曾公衮” |
| 冕=人名 | 1 | “裴冕” |
| 染=沾染(非染色) | 2 | “目濡耳染”“泪痕所染” |
| 其他(锦/绣/织=比喻) | 多 | “锦绣花草”“织冰縠”“锦绣肠” |
有效片段分布
| 行号范围 | 有效条数 | 主要内容 |
|---|---|---|
| 33-93 | 6 | 笠/衣冠冕旒/短褐/草衣/田衣帔 |
| 103-139 | 6 | 宫廷簪钗/蓝缕衣/执衣/儒服/衣裳/彩衣绢素 |
| 161-173 | 5 | 牛衣织縠/裙绮丝/龟冠/红巾御衣/云衣/拥褐/履缝 |
| 193-235 | 5 | 佩刀/华裾织翠/冠缨/赐帛 |
| 239-304 | 8 | 衾裳/马嵬袜/服色鱼袋/服丧/钗裘/舆服绶囊/罗襦/珠履 |
对抗式审查记录
关键判定
- 行253:白居易服色制度——保留。虽然”服”可作动词,此处”紫为三品之服”“衣紫者鱼袋以金饰”明确为服色制度
- 行276:晋书舆服志——保留。”舆服”为专有名词,”囊绶”“袷囊”“簪笔”均为服饰制度
- 行93:田衣/帔——保留。”稻田衲”“田衣”为僧服专称,”香帔”为佛教帔帛
- 行131:仙人衣裳——保留。虽为比喻,”衣裳弃刀尺”涉及裁衣概念
- 行163:女萝代裙——保留。以自然物代服饰的想象,反映服饰认知
- 行235:赐帛倡优等——保留。赐帛为朝廷赏赐丝织品制度
- 行251:马嵬袜——保留。杨贵妃遗袜为著名服饰轶事
- 行193:佩刀——保留。佩刀为官员仪卫服饰之一
边缘判定(保留但标注)
- 行169”云衣”:以衣喻花瓣,非实指服饰,但反映”衣”的意象用法——保留
- 行255”听履上星辰”:履为比喻,非实指——剔除
- 行302”曾公衮”:衮为人名——剔除
- 行157”如丝如膏”:丝为雨丝比喻——剔除
- 行13”当领此”:领为动词——剔除
处理时间线
- 创建输出目录 ✓
- 读取源文件(904行) ✓
- 全量grep搜索(56关键词→188行匹配) ✓
- 逐条人工审查(188→30条有效) ✓
- 对抗式审查(标注边缘案例) ✓
- 产出三份MD ✓