柯南同人文分析项目

双重目标

灰原哀角色数字人：构建有深度、有逻辑、能自然对话的AI角色模型
同人文学知识库：梳理优质作品的情节、技巧、主题，供阅读推荐和创作参考

核心思路：一次深度阅读，双重产出。角色分析和文学分析共享同一个阅读过程，不重复消耗tokens。

预算：400美元 API额度

核心原则

质量>数量：精读少量优质作品，不要被烂文污染
逻辑>统计：找"为什么这样做"，不只是"经常做什么"
保留矛盾：角色的复杂性和不一致才真实

文件结构

project/
├── works/                # 同人作品（txt格式）
│
├── analysis/               
│   ├── works/              # 单篇分析（双重输出）
│   │   ├── 001_角色.md     # 角色维度分析
│   │   ├── 001_文学.md     # 文学维度分析
│   │   └── ...
│   │
│   └── baseline.md         # 前3-5篇的基线分析
│
└── outputs/
│   ├── character/          # 角色数字人成果
│   │   ├── character_card.yaml        # 最终角色卡
│   │   ├── value_system.json          # 价值观体系
│   │
│   └── knowledge_base/     # 同人文学知识库
│       ├── by_quality.md              # 按质量分级索引
│       ├── by_theme.md                # 按主题分类索引
│       ├── plot_patterns.json         # 常见情节模式
│       ├── writing_techniques.md      # 写作技巧合集
│       └── recommendations.md         # 阅读推荐路径

分析流程

Step 1: 建立基线 (3-5篇)

读前几篇高质量作品，建立双重基线：

角色维度：

核心性格特征（共识部分）
典型说话方式
基本反应模式

文学维度：

常见题材和类型
基础质量标准（什么算"写得好"）
社群偏好（粉丝喜欢看什么）

输出：analysis/baseline.md

Step 2: 单篇双重分析 (N篇)

对每篇作品进行平行分析：

2.1 角色维度分析 → `works/XXX_角色.md`

标题: [作品名]
字数: [X万字]
质量: [1-5星]

# 核心特征（3-5个）
- 特征1: 具体表现
- 特征2: 具体表现

# 关键场景
场景1:
  情境: "..."
  她的选择: "..."
  内在逻辑: "为什么这样选？体现了什么价值观？"

# 典型对话（5-10句）
- "原文引用" - 情境 - 体现什么

# 关系动态
柯南:
  互动模式: "..."
  情感状态: "..."
  关键时刻: "..."

# OOC标记（如果有）
- 哪里不像她？为什么？

# 边界案例
- 有没有"破例"的时刻？

2.2 文学维度分析 → `works/XXX_文学.md`

标题: [作品名]
作者: [如果知道]
字数: [X万字]
类型: [日常/推理/AU/...]
完结: [是/否]

# 质量评分
总分: X/5
- 情节: X/5
- 人物: X/5  
- 文笔: X/5
- 创新: X/5

# 情节分析
核心冲突: "..."
结构: "起承转合的分布"
节奏: "快/慢节奏的处理"
转折点: "第X章发生了什么"

# 主题
核心主题: [3-5个关键词]
表达方式: "通过什么手法传达主题"

# 写作技巧亮点
- 技巧1: 具体例子
- 技巧2: 具体例子

# 情感曲线
[简单描述：开局-发展-高潮-结局的情感强度]

# 金句（3-5句）
- "引用" 

# 推荐理由
- 适合什么样的读者
- 为什么值得读

# 相似作品
- [如果有的话]

Step 3: 汇总生成

3.1 角色数字人输出

从所有XXX_角色.md中提取：

# outputs/character/character_card.yaml

角色: 灰原哀

核心定位: "一句话总结她是谁"

价值观体系:
  真相追求:
    强度: 9/10
    表现: ["例子1", "例子2"]
    边界: "什么情况下会妥协"
    来源: [作品001, 作品005]
  
  保护他人:
    强度: 8/10
    表现: [...]
    冲突: "当和真相追求冲突时如何权衡"

情感触发器:
  破防时刻: ["什么让她情绪失控", ...]
  温柔时刻: ["什么让她柔软", ...]
  回避话题: ["什么她不愿提", ...]

典型反应:
  被关心: "..."
  遇危险: "..."
  面对柯南: "..."
  
语言特征:
  语气: "冷静、带点调侃、..."
  常用表达: ["工藤", "大侦探", ...]
  句式偏好: "短句/长句"
  禁用词: [...]

关系动态:
  柯南:
    定位: "搭档/命运共同体/..."
    互动: "既撩拨又担忧"
    边界: "什么话题不开玩笑"

额外输出：

value_system.json - 价值观决策树（用于处理冲突场景）
test_scenarios.yaml - 100个测试场景及期望反应

3.2 同人文学知识库输出

从所有XXX_文学.md中整理：

by_quality.md - 按质量分级

# 5星作品（必读）
- [作品名] - 作者 - 推荐理由

# 4星作品（优质）
...

# 3星作品（及格）
...

by_theme.md - 按主题分类

# 真相与代价
- 作品A: 如何处理这个主题
- 作品B: 不同角度

# 身份认同
...

# 情感成长
...

plot_patterns.json - 情节模式库

{
  "误会-解开": {
    "描述": "柯南和灰原因误会产生隔阂，后解开",
    "成功案例": ["作品A", "作品C"],
    "失败案例": ["作品X为什么没写好"],
    "关键要素": ["时机", "铺垫", "情绪递进"]
  },
  
  "生死危机": {
    ...
  }
}

writing_techniques.md - 写作技巧合集

# 节奏控制
优秀案例：作品A 在第X章用了XX手法
效果：...

# 情感推进
优秀案例：作品B 通过XX细节
效果：...

# 对话设计
...

recommendations.md - 阅读路径

# 新手入门
先读这3篇了解基本设定：[列表]

# 情感向
如果你喜欢细腻的情感描写：[列表]

# 推理向
如果你喜欢烧脑剧情：[列表]

# 进阶阅读
看完基础后可以挑战这些：[列表]

Step 4: 交叉验证（可选）

用知识库的洞察反哺角色卡：

某个主题在多篇中如何体现？角色的态度一致吗？
某个情节模式下，角色的反应有规律吗？
写作技巧中，哪些对话/场景最"像她"？

成本控制

核心策略：一次深度阅读，双重输出。不需要读两遍。

预估消耗（基于Claude Sonnet 4）：

单篇深度分析（角色+文学）：~15k tokens/篇
20篇作品：~300k tokens
基线分析：~30k tokens
汇总生成（两个维度）：~50k tokens
总计：~380k tokens ≈ $5-15

实际可分析量：

400美元可以支撑分析数百篇作品
但不需要——30-50篇优质作品足够构建完整体系

质量>数量：遇到烂文直接跳过，不浪费tokens

使用说明

准备数据

# 转换docx为txt
python tools/docx_to_txt.py --input fanfics_raw/ --output fanfics/

开始分析

将同人txt文件放入fanfics/目录，然后告诉Claude：

"请按照README的流程，从fanfics/目录开始分析，先建立baseline。"

注意事项

版权：仅供个人学习，不公开分发
质量筛选：遇到烂文直接跳过，不要浪费tokens
保持怀疑：如果某个特征只在一两篇出现，标注"低信心"
记录来源：重要特征注明来自哪篇作品

最终成果

角色数字人

一个可以：

在新场景下做出符合逻辑的反应
不只是"像她说话"，而是"像她思考"
保留角色的复杂性和矛盾性
在价值观冲突时做出可预测但不僵化的选择

的AI角色模型。

同人文学知识库

一个可以：

快速定位：想看某个主题/类型，立刻找到优质作品
学习参考：提取优秀作品的写作技巧和情节模式
避坑指南：知道哪些套路容易写崩
阅读路径：为不同需求的读者提供个性化推荐

的结构化文库。

两个系统的协同效应

角色分析 → 文学评价：角色塑造得好不好，是文学质量的重要指标
文学分析 → 角色深化：不同作品中的角色表现，揭示角色的多面性
共享阅读过程：一次投入，双重产出，成本效率最大化

这不是两个独立的项目，而是一个有机整体。

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
analysis		analysis
outputs		outputs
works		works
CLAUDE.md		CLAUDE.md
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

柯南同人文分析项目

双重目标

核心原则

文件结构

分析流程

Step 1: 建立基线 (3-5篇)

Step 2: 单篇双重分析 (N篇)

2.1 角色维度分析 → `works/XXX_角色.md`

2.2 文学维度分析 → `works/XXX_文学.md`

Step 3: 汇总生成

3.1 角色数字人输出

3.2 同人文学知识库输出

Step 4: 交叉验证（可选）

成本控制

使用说明

准备数据

开始分析

注意事项

最终成果

角色数字人

同人文学知识库

两个系统的协同效应

About

Uh oh!

Releases

Packages

Yalums/haibara

Folders and files

Latest commit

History

Repository files navigation

柯南同人文分析项目

双重目标

核心原则

文件结构

分析流程

Step 1: 建立基线 (3-5篇)

Step 2: 单篇双重分析 (N篇)

2.1 角色维度分析 → works/XXX_角色.md

2.2 文学维度分析 → works/XXX_文学.md

Step 3: 汇总生成

3.1 角色数字人输出

3.2 同人文学知识库输出

Step 4: 交叉验证（可选）

成本控制

使用说明

准备数据

开始分析

注意事项

最终成果

角色数字人

同人文学知识库

两个系统的协同效应

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

2.1 角色维度分析 → `works/XXX_角色.md`

2.2 文学维度分析 → `works/XXX_文学.md`

Packages