返回典籍目录

《唐书直笔》服饰内容提取 · 操作日志

任务时间:2026-05-06
操作者:服饰内容提取子Agent
输入文件:~/.openclaw/workspace/史评/002/唐书直笔.txt


Step 0: 文件信息确认

wc -l ~/.openclaw/workspace/史评/002/唐书直笔.txt
# 786行

wc -c ~/.openclaw/workspace/史评/002/唐书直笔.txt
# 66213字节(约65KB)

结果:文件786行、65KB,属于中等体量古籍,无需分段处理。


Step 1: 多轮关键词检索

第一轮:核心服饰关键词

cd ~/.openclaw/workspace/史评/002 && grep -n '冠\|冕\|服\|衣\|裳\|裘\|帛\|锦\|绮\|绫\|罗\|缎\|褐\|袍\|带\|绶\|笏\|履\|舄\|佩\|饰\|绣\|染\|丝\|绸\|绢\|布\|甲\|胄\|巾\|帽\|钗\|簪\|笄\|品色\|紫袍\|绯袍\|章服\|衮冕\|朝服\|祭服\|舆服\|衮\|旒\|韍\|鞶\|革带\|玉佩\|𫄸\|紱\|冕服\|袆衣\|褕翟\|鞠衣\|钿\|步摇\|褕\|褕狄\|阙翟\|蔽膝\|珩\|璜\|璲\|组\|缨\|紘\|綖' 唐书直笔.txt

结果:匹配约100+行,但大量为"服"字的"服从/降服"义项及"冠"字的"列于首位"义项。需进一步筛选。

第二轮:精确服饰关键词

cd ~/.openclaw/workspace/史评/002 && grep -n '车服\|舆服\|章服\|元服\|衮\|冕\|锦绣\|珠玉\|缌纕\|布帻\|祭服\|冠带\|加元\|释奠\|齿胄\|出母\|焚珠\|绢\|绵\|布.*端\|帛' 唐书直笔.txt

结果:筛选出12个有效匹配行:
- 行174:犀带
- 行476:焚珠玉锦绣
- 行498-499:加元服
- 行504:五色云裙、出母服
- 行622-624:郡国车服志
- 行636:缌纕布帻
- 行644:珠玉绣服
- 行702:绢绵布
- 行776:舆服
- 行784:指衣定谋


Step 2: 上下文提取

对每个匹配行使用 sed -n 提取上下文(前后5-10行):

sed -n '471,481p' 唐书直笔.txt | cat -n   # 行476上下文
sed -n '493,509p' 唐书直笔.txt | cat -n   # 行498-504上下文
sed -n '617,630p' 唐书直笔.txt | cat -n   # 行622-624上下文
sed -n '631,650p' 唐书直笔.txt | cat -n   # 行636、644上下文
sed -n '697,710p' 唐书直笔.txt | cat -n   # 行702上下文
sed -n '771,786p' 唐书直笔.txt | cat -n   # 行776、784上下文
sed -n '169,179p' 唐书直笔.txt | cat -n   # 行174上下文

上下文总量:约4KB,远低于1MB限制。


Step 3: 有效性筛选

从原始匹配中排除非服饰义项:

行号 原文片段 排除原因
114 天下服 "服"=服从,非遗饰
164 幸生服叛 "服"=降服,非遗饰
258 擅甲兵 "甲兵"=军备,非甲胄服饰
312 擅甲兵之威 同上
315 甲兵土地之势 同上
345 无服饰义 误匹配
369 无服饰义 误匹配
392 舆尸 "舆"=车运,非舆服
552 冠以后妃 "冠"=置首,非冠冕
598-599 冠于列传之首 同上

有效匹配:11个独立服饰相关段落。


Step 4: 文档产出

产出三份文档:

文档 字节数 内容
唐书直笔_原文提取.md ~2.6KB 11段带行号的原始服饰匹配片段
唐书直笔_总结.md ~3.0KB 6类服饰内容分类综述 + 对抗式学术审查
唐书直笔_日志.md 本文件 完整操作日志

Step 5: 写入磁盘

mkdir -p ~/.openclaw/workspace/史评output/唐书直笔

使用 write 工具写入三份文件至输出目录。


关键发现

  1. 《唐书直笔》非服饰专书:全书为唐史编纂方法论著作,服饰内容均作为史法讨论的论据出现
  2. 服饰内容集中于四类:帝王服饰行为(焚锦绣、赐犀带)、礼制服饰(加元服、出母服)、舆服志体例、税赋纺织品
  3. "服"字歧义严重:全文中"服"字出现数十次,绝大多数为"服从/降服"义,需严格区分
  4. 缌纕布帻(行636)为最有价值的服饰实体描写——萧铣以丧服投降的具体描述
  5. 舆服志体例论述(行622-624)虽非服饰描写,但反映了宋人对唐代服饰文献化的认识

耗时记录

步骤 操作 耗时(估)
Step 0 文件信息确认 <1s
Step 1 多轮grep检索 <2s
Step 2 sed上下文提取 <2s
Step 3 有效性筛选 <1s(人工判断)
Step 4 文档撰写 ~3min
Step 5 写入磁盘 <1s
总计 ~4min