Skip to content

Conversation

@zeroRains
Copy link
Contributor

@zeroRains zeroRains commented Oct 15, 2025

pybind注册的自定义算子对比于直接使用paddle注册的算子在动态图场景具有更高的调度效率,因此推荐同时使用pybind和paddle进行算子注册。而当前只有GPU和XPU算子使用pybind注册自定义算子。

由于pybind注册算子时是硬件无关的,所以这里统一编写了cpp_extensions.cc实现不同硬件的pybind注册(除了XPU,XPU的编译脚本在custom_ops/xpu_ops/build.sh)。

通过给不同硬件添加-DCUSTOM_XXX的TAG(如-DCUSTOM_GPU)区分不同设备下要注册那些算子,并在cpp_extensions.cc中根据TAG进行算子注册与方法声明。

风险:缺少对应的硬件设备,验证GPU以外的算子正确性。

@paddle-bot
Copy link

paddle-bot bot commented Oct 15, 2025

Thanks for your contribution!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant