-
Notifications
You must be signed in to change notification settings - Fork 1.7k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
bert模型的embedding层在X86+英伟达平台上使用opencl的结果和cpu的结果对不上 #2424
Comments
收到 |
可以修改下source\backend\opencl\execution\image\EltwiseExecution.cpp文件,将210行的return new EltwiseExecution(inputs, "in0-sign(in1)*in0/(fabs(in1)>(FLOAT4)((FLOAT)0.0000001)?fabs(in1):(FLOAT4)((FLOAT)0.0000001))", op, backend);改为: |
能给下三输入的模型吗 |
git上传不了,可以给个邮箱吗,我把测试样例和模型一起发过去 |
发送到这个邮箱吧 |
已发,请查收哈 |
这个模型我本地测试结果opencl与cpu是一致的。 |
附件是我这边的打印信息,和您那边的是一样的吗?我用的是2.5.1的MNN |
我这边复现问题了,我先定位下。 |
我这边把输入弄对,现在cpu和opencl结果一致了,但与你给的log结果显示不一样。你那边可以试试MNNV2Basic.cpp这个文件,改下里面的输入,看下结果对不对。 |
好的,我我试试哈,感谢 |
你好,我用basic把里面的filename << pwd << "input0.txt" 改成filename << pwd << "input_ids.txt"后,cpu和opencl还是不一样,不改的话是因为代码里面给输入都是送0,输出是一样的, |
使用basic,你可以把runMask参数置为2,然后在pwd目录下创建output文件夹,这个会在运行后将每一层的输入输出dump下来,你可以看下cpu和opencl的dump结果是否一致。 |
我就是这么测的呢,两个结果不一样。。。 |
dump显示第一层的输入是一样的,但是经过第一个binary之后结果就不一致了吗?我这边之前不对就是第一次的输入就不一致了,后面改好后,结果就变得一样了。 |
我是直接看最后的output.txt的呢 |
为啥opencl的输入和cpu的不一样呢,都是读的input_ids |
opencl涉及到数据从cpu到gpu的拷贝,你有阿里钉账号吗,我们可以私聊下 |
有,我在MNN钉钉群里,怎么加您 |
你在群里的名称是什么 |
我在1群发消息了,看到没 |
你搜下共进吧,我是在三群 |
我进三群了,加您了看到了么 |
平台(如果交叉编译请再附上交叉编译目标平台):
Platform(Include target platform as well if cross-compiling):
X86
Github版本:
Github Version:
2.5.1
直接下载ZIP包请提供下载日期以及压缩包注释里的git版本(可通过
7z l zip包路径
命令并在输出信息中搜索Comment
获得,形如Comment = bc80b11110cd440aacdabbf59658d630527a7f2b
)。 git clone请提供git commit
第一行的commit idProvide date (or better yet, git revision from the comment section of the zip. Obtainable using
7z l PATH/TO/ZIP
and search forComment
in the output) if downloading source as zip,otherwise provide the first commit id from the output ofgit commit
编译方式:
Compiling Method
编译日志:
Build Log:
demo_embed_debug.zip
The text was updated successfully, but these errors were encountered: