new_impl.md

type

onboarding

Add a New Impl

先判断是不是新 impl

下面这些情况更适合做成一个新的 impl：

你想长期维护一条新的实现路线，例如 lite / hybrid / triton
差异已经不只是一个局部开关，而是模型构造、checkpoint、训练栈接线中的一整组选择
你需要把 benchmark、回归验证和用户配置都按“另一套实现”来比较

下面这些情况通常先不要拆新 impl：

只是一个短期开关实验
只是现有 impl 内部的局部策略切换，且不会成为稳定对外选择
差异只存在于一个很窄的内部 helper，用户层面不需要感知

注册方式

register_model(
    "my_model",
    package="my_repo.my_model",
    hf_model_types=["my_model"],
    impls={
        "lite": "my_repo.my_model.lite.protocol",
        "hybrid": "my_repo.my_model.hybrid.protocol",
        "triton": "my_repo.my_model.triton.protocol",
    },
)

关键点：

新 impl 仍然属于同一个 model_name
impl 名字应该表达稳定实现路线，而不是一次性实验结论
不要为了“先跑通”把半成品 impl 暴露成长期公共名字

`ImplConfig` 该怎么收

只暴露这个 impl 真正独有、且你愿意长期维护的字段
共用字段保持和已有 impl 一致，例如 parallel、optimizer、recompute
如果某个能力当前未稳定支持，就不要先把 knob 占出来

一个实用标准是：用户是否真的需要在 bench / runtime 配置里显式选择它；如果不需要，先别公开。

验证顺序

新增 impl 后，验证顺序建议固定：

先跑这个 impl 的最小 BB case，确认能 build + run
再和已有 impl 做对比，例如 lite vs hybrid
必要时再和 bridge 做 baseline 对比
所有对比都尽量复用同一组输入规模和并行配置

如果要做多组 impl 对比，可以直接参考：exp/bench_1n_bridge_lite_hybrid.sh

边界 / 限制

新 impl 不等于新 model family；尽量复用已有 model family 的公共部分
不要因为新增 impl 就复制一整套完全相同的 config / checkpoint 代码
文档不规定哪种 impl 一定更快；这必须交给本地 benchmark

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add a New Impl

先判断是不是新 impl

推荐目录

推荐做法

注册方式

`ImplConfig` 该怎么收

验证顺序

边界 / 限制

相关 skill

FilesExpand file tree

new_impl.md

Latest commit

History

new_impl.md

File metadata and controls

Add a New Impl

先判断是不是新 impl

推荐目录

推荐做法

注册方式

ImplConfig 该怎么收

验证顺序

边界 / 限制

相关 skill

`ImplConfig` 该怎么收