Thanks to visit codestin.com
Credit goes to github.com

Skip to content

vivian-9907/LLM-Quant-Paper

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

LLM-Quant-Paper

这是一个给 Codex 使用的 LLM 量化论文阅读 skill,用来做论文雷达和论文精读。

这里的“量化”指 LLM quantization / low-bit / compression / inference optimization,包括低 bit 量化、模型压缩、推理优化、serving/runtime 集成、算子/kernel 相关工作。它不是金融量化研究。

工作流

  • radar:在固定研究范围内,按时间和来源搜索 LLM 量化相关论文/项目,只输出真正有价值的候选。
  • deep-read:对选中的论文做深度技术评审,重点看算法新颖性、工程成熟度、vLLM/SGLang/TensorRT-LLM 兼容性、实验扎实程度、模型覆盖、算子相关性和实际部署价值。

项目目录

.
├── SKILL.md
├── workflows/
│   ├── radar.md
│   └── deep-read.md
├── config/
│   ├── topics.yml
│   ├── sources.yml
│   ├── radar-rubric.yml
│   └── deep-read-rubric.yml
├── templates/
│   ├── radar-result.md
│   ├── deep-read-report.md
│   └── paper-scorecard.md
├── references/
│   ├── research-map.md
│   └── prompt-style.md
├── outputs/
│   ├── radar/
│   └── deep-read/
└── agents/
    └── openai.yaml
  • SKILL.md:Codex skill 入口,负责触发和选择 radar / deep-read 工作流。
  • workflows/:两套核心工作流说明。
  • config/:固定研究范围、信息来源、radar 初筛标准和 deep-read 深度评估标准。
  • templates/:雷达结果、精读报告和论文评分卡模板。
  • references/:LLM 量化研究地图和输出风格约束。
  • outputs/:保存实际运行后的 radar 和 deep-read 结果。
  • agents/:Codex UI 元数据。

资源消费关系

sources.yml
  └─ 决定 radar 去哪里搜

topics.yml
  └─ 被 radar 消费,用于搜索召回、主题过滤和排除误召回

radar-rubric.yml
  └─ 被 radar 消费,用于对通过主题过滤的候选做初筛排序和动作建议

research-map.md
  ├─ 被 radar 消费,用于给候选打标签、描述技术方向和应用场景
  └─ 被 deep-read 消费,用于组织精读报告中的技术方向、系统方向、应用场景、成熟度和算子视角

deep-read-rubric.yml
  └─ 被 deep-read 消费,用于生成评分卡、分配分析重点和展示论文维度画像

简短理解:

  • topics.yml 是入口过滤器,决定什么能被搜到和留下。
  • research-map.md 是分类解释器,决定留下来的内容怎么被理解和描述。

状态

当前是 v0.1 baseline。后续应该通过真实运行 radar 和 deep-read 来迭代关键词、评分标准和输出模板。

About

Codex skill for LLM quantization paper radar and deep technical review.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors