Thanks to visit codestin.com
Credit goes to github.com

Skip to content

Yalums/haibara

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

柯南同人文分析项目

双重目标

  1. 灰原哀角色数字人:构建有深度、有逻辑、能自然对话的AI角色模型
  2. 同人文学知识库:梳理优质作品的情节、技巧、主题,供阅读推荐和创作参考

核心思路:一次深度阅读,双重产出。角色分析和文学分析共享同一个阅读过程,不重复消耗tokens。

预算:400美元 API额度


核心原则

  1. 质量>数量:精读少量优质作品,不要被烂文污染
  2. 逻辑>统计:找"为什么这样做",不只是"经常做什么"
  3. 保留矛盾:角色的复杂性和不一致才真实

文件结构

project/
├── works/                # 同人作品(txt格式)
│
├── analysis/               
│   ├── works/              # 单篇分析(双重输出)
│   │   ├── 001_角色.md     # 角色维度分析
│   │   ├── 001_文学.md     # 文学维度分析
│   │   └── ...
│   │
│   └── baseline.md         # 前3-5篇的基线分析
│
└── outputs/
│   ├── character/          # 角色数字人成果
│   │   ├── character_card.yaml        # 最终角色卡
│   │   ├── value_system.json          # 价值观体系
│   │
│   └── knowledge_base/     # 同人文学知识库
│       ├── by_quality.md              # 按质量分级索引
│       ├── by_theme.md                # 按主题分类索引
│       ├── plot_patterns.json         # 常见情节模式
│       ├── writing_techniques.md      # 写作技巧合集
│       └── recommendations.md         # 阅读推荐路径

分析流程

Step 1: 建立基线 (3-5篇)

读前几篇高质量作品,建立双重基线

角色维度:

  • 核心性格特征(共识部分)
  • 典型说话方式
  • 基本反应模式

文学维度:

  • 常见题材和类型
  • 基础质量标准(什么算"写得好")
  • 社群偏好(粉丝喜欢看什么)

输出:analysis/baseline.md


Step 2: 单篇双重分析 (N篇)

对每篇作品进行平行分析

2.1 角色维度分析 → works/XXX_角色.md

标题: [作品名]
字数: [X万字]
质量: [1-5星]

# 核心特征(3-5个)
- 特征1: 具体表现
- 特征2: 具体表现

# 关键场景
场景1:
  情境: "..."
  她的选择: "..."
  内在逻辑: "为什么这样选?体现了什么价值观?"

# 典型对话(5-10句)
- "原文引用" - 情境 - 体现什么

# 关系动态
柯南:
  互动模式: "..."
  情感状态: "..."
  关键时刻: "..."

# OOC标记(如果有)
- 哪里不像她?为什么?

# 边界案例
- 有没有"破例"的时刻?

2.2 文学维度分析 → works/XXX_文学.md

标题: [作品名]
作者: [如果知道]
字数: [X万字]
类型: [日常/推理/AU/...]
完结: [是/否]

# 质量评分
总分: X/5
- 情节: X/5
- 人物: X/5  
- 文笔: X/5
- 创新: X/5

# 情节分析
核心冲突: "..."
结构: "起承转合的分布"
节奏: "快/慢节奏的处理"
转折点: "第X章发生了什么"

# 主题
核心主题: [3-5个关键词]
表达方式: "通过什么手法传达主题"

# 写作技巧亮点
- 技巧1: 具体例子
- 技巧2: 具体例子

# 情感曲线
[简单描述:开局-发展-高潮-结局的情感强度]

# 金句(3-5句)
- "引用" 

# 推荐理由
- 适合什么样的读者
- 为什么值得读

# 相似作品
- [如果有的话]

Step 3: 汇总生成

3.1 角色数字人输出

从所有XXX_角色.md中提取:

# outputs/character/character_card.yaml

角色: 灰原哀

核心定位: "一句话总结她是谁"

价值观体系:
  真相追求:
    强度: 9/10
    表现: ["例子1", "例子2"]
    边界: "什么情况下会妥协"
    来源: [作品001, 作品005]
  
  保护他人:
    强度: 8/10
    表现: [...]
    冲突: "当和真相追求冲突时如何权衡"

情感触发器:
  破防时刻: ["什么让她情绪失控", ...]
  温柔时刻: ["什么让她柔软", ...]
  回避话题: ["什么她不愿提", ...]

典型反应:
  被关心: "..."
  遇危险: "..."
  面对柯南: "..."
  
语言特征:
  语气: "冷静、带点调侃、..."
  常用表达: ["工藤", "大侦探", ...]
  句式偏好: "短句/长句"
  禁用词: [...]

关系动态:
  柯南:
    定位: "搭档/命运共同体/..."
    互动: "既撩拨又担忧"
    边界: "什么话题不开玩笑"

额外输出:

  • value_system.json - 价值观决策树(用于处理冲突场景)
  • test_scenarios.yaml - 100个测试场景及期望反应

3.2 同人文学知识库输出

从所有XXX_文学.md中整理:

by_quality.md - 按质量分级

# 5星作品(必读)
- [作品名] - 作者 - 推荐理由

# 4星作品(优质)
...

# 3星作品(及格)
...

by_theme.md - 按主题分类

# 真相与代价
- 作品A: 如何处理这个主题
- 作品B: 不同角度

# 身份认同
...

# 情感成长
...

plot_patterns.json - 情节模式库

{
  "误会-解开": {
    "描述": "柯南和灰原因误会产生隔阂,后解开",
    "成功案例": ["作品A", "作品C"],
    "失败案例": ["作品X为什么没写好"],
    "关键要素": ["时机", "铺垫", "情绪递进"]
  },
  
  "生死危机": {
    ...
  }
}

writing_techniques.md - 写作技巧合集

# 节奏控制
优秀案例:作品A 在第X章用了XX手法
效果:...

# 情感推进
优秀案例:作品B 通过XX细节
效果:...

# 对话设计
...

recommendations.md - 阅读路径

# 新手入门
先读这3篇了解基本设定:[列表]

# 情感向
如果你喜欢细腻的情感描写:[列表]

# 推理向
如果你喜欢烧脑剧情:[列表]

# 进阶阅读
看完基础后可以挑战这些:[列表]

Step 4: 交叉验证(可选)

用知识库的洞察反哺角色卡:

  • 某个主题在多篇中如何体现?角色的态度一致吗?
  • 某个情节模式下,角色的反应有规律吗?
  • 写作技巧中,哪些对话/场景最"像她"?

成本控制

核心策略:一次深度阅读,双重输出。不需要读两遍。

预估消耗(基于Claude Sonnet 4):

  • 单篇深度分析(角色+文学):~15k tokens/篇
  • 20篇作品:~300k tokens
  • 基线分析:~30k tokens
  • 汇总生成(两个维度):~50k tokens
  • 总计:~380k tokens ≈ $5-15

实际可分析量

  • 400美元可以支撑分析数百篇作品
  • 不需要——30-50篇优质作品足够构建完整体系

质量>数量:遇到烂文直接跳过,不浪费tokens


使用说明

准备数据

# 转换docx为txt
python tools/docx_to_txt.py --input fanfics_raw/ --output fanfics/

开始分析

将同人txt文件放入fanfics/目录,然后告诉Claude:

"请按照README的流程,从fanfics/目录开始分析,先建立baseline。"


注意事项

  1. 版权:仅供个人学习,不公开分发
  2. 质量筛选:遇到烂文直接跳过,不要浪费tokens
  3. 保持怀疑:如果某个特征只在一两篇出现,标注"低信心"
  4. 记录来源:重要特征注明来自哪篇作品

最终成果

角色数字人

一个可以:

  • 在新场景下做出符合逻辑的反应
  • 不只是"像她说话",而是"像她思考"
  • 保留角色的复杂性和矛盾性
  • 在价值观冲突时做出可预测但不僵化的选择

的AI角色模型。

同人文学知识库

一个可以:

  • 快速定位:想看某个主题/类型,立刻找到优质作品
  • 学习参考:提取优秀作品的写作技巧和情节模式
  • 避坑指南:知道哪些套路容易写崩
  • 阅读路径:为不同需求的读者提供个性化推荐

的结构化文库。


两个系统的协同效应

  • 角色分析 → 文学评价:角色塑造得好不好,是文学质量的重要指标
  • 文学分析 → 角色深化:不同作品中的角色表现,揭示角色的多面性
  • 共享阅读过程:一次投入,双重产出,成本效率最大化

这不是两个独立的项目,而是一个有机整体

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published