《韵语阳秋》服饰内容提取日志

基本信息

项目 内容
书目 宋·葛立方《韵语阳秋》
输入文件 /home/z/my-project/upload/诗话/诗话/韵语阳秋.txt
输出目录 /home/z/my-project/upload/诗话output/韵语阳秋/
文件行数 904行
文件编码 UTF-8 (CRLF)

搜索过程

第一轮:全量grep搜索

关键词列表(共56个):
衣 裳 裘 冕 冠 服 佩 戴 袍 裙 褐 袂 衿 领 袖 履 舄 笏 帔 襦 衮 帽 巾 锦 帛 绢 绫 罗 缎 绸 纱 绮 丝 布 葛 麻 毡 染 绣 织 裁 缝 练 簪 钗 珰 玦 环 绶 靴 袜 鱼袋 幞头

匹配结果:188行

第二轮:逐条人工审查

对188条匹配逐条判定,分类为:

误报类型统计

误报类型 数量 典型示例
葛=姓氏 4 “葛立方”“葛公”
罗=姓氏 3 “罗隐”“罗昭谏”
戴=人名 3 “访戴”(访戴逵)
领=动词”率领/领会” 3 “再领三公府”“能领客”“当领此”
练=”练字/如练” 3 “练字”“澄江静如练”
冠=”冠军/冠绝” 2 “冠吾唐”
布=瀑布 1 “瀑布”
丝=丝竹/一丝 4 “丝竹管弦”“不挂一丝”“白间生黑丝”“如丝如膏”
服=钦服/佩服 2 “钦服”“捷思为可服”
衮=人名 1 “曾公衮”
冕=人名 1 “裴冕”
染=沾染(非染色) 2 “目濡耳染”“泪痕所染”
其他(锦/绣/织=比喻) “锦绣花草”“织冰縠”“锦绣肠”

有效片段分布

行号范围 有效条数 主要内容
33-93 6 笠/衣冠冕旒/短褐/草衣/田衣帔
103-139 6 宫廷簪钗/蓝缕衣/执衣/儒服/衣裳/彩衣绢素
161-173 5 牛衣织縠/裙绮丝/龟冠/红巾御衣/云衣/拥褐/履缝
193-235 5 佩刀/华裾织翠/冠缨/赐帛
239-304 8 衾裳/马嵬袜/服色鱼袋/服丧/钗裘/舆服绶囊/罗襦/珠履

对抗式审查记录

关键判定

  1. 行253:白居易服色制度——保留。虽然”服”可作动词,此处”紫为三品之服”“衣紫者鱼袋以金饰”明确为服色制度
  2. 行276:晋书舆服志——保留。”舆服”为专有名词,”囊绶”“袷囊”“簪笔”均为服饰制度
  3. 行93:田衣/帔——保留。”稻田衲”“田衣”为僧服专称,”香帔”为佛教帔帛
  4. 行131:仙人衣裳——保留。虽为比喻,”衣裳弃刀尺”涉及裁衣概念
  5. 行163:女萝代裙——保留。以自然物代服饰的想象,反映服饰认知
  6. 行235:赐帛倡优等——保留。赐帛为朝廷赏赐丝织品制度
  7. 行251:马嵬袜——保留。杨贵妃遗袜为著名服饰轶事
  8. 行193:佩刀——保留。佩刀为官员仪卫服饰之一

边缘判定(保留但标注)


处理时间线

  1. 创建输出目录 ✓
  2. 读取源文件(904行) ✓
  3. 全量grep搜索(56关键词→188行匹配) ✓
  4. 逐条人工审查(188→30条有效) ✓
  5. 对抗式审查(标注边缘案例) ✓
  6. 产出三份MD ✓