Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

volclava随运行时间延长会出现不给运算主机分派任务的情况 #1

Open
xaisc opened this issue Feb 28, 2025 · 4 comments

Comments

@xaisc
Copy link

xaisc commented Feb 28, 2025

您好!近期在初次使用volclava的时候,发现volclava运行一段时间后调度会变得无效了,详细信息如下:
环境:Centos 7.9+volclava(2025.02.26时最新版本)、回归任务作业、数量约10万+、试运行约12小时,并针对默认的队列做了一些使用限制,其余均为默认设置

Image
运行效果如下

Image
大约5~6个小时左右,volcalava就不给一台主机分配任务了

Image
又过了一个小时,第二台主机也不给分配任务了

Image
又过了约5小时,第三台主页也不给分配任务了

Image
9点发现这个现象后,取消默认队列里的所有规则后,用命令badmin reconfig使生效

Image

以上是全部的问题现象

@limingze-ste
Copy link
Collaborator

您好!近期在初次使用volclava的时候,发现volclava运行一段时间后调度会变得无效了,详细信息如下: 环境:Centos 7.9+volclava(2025.02.26时最新版本)、回归任务作业、数量约10万+、试运行约12小时,并针对默认的队列做了一些使用限制,其余均为默认设置

非常感谢使用并反馈问题,我们内部先复现分析看下,后续有结论我们会及时在这里反馈

@limingze-ste
Copy link
Collaborator

limingze-ste commented Feb 28, 2025

您好!近期在初次使用volclava的时候,发现volclava运行一段时间后调度会变得无效了,详细信息如下: 环境:Centos 7.9+volclava(2025.02.26时最新版本)、回归任务作业、数量约10万+、试运行约12小时,并针对默认的队列做了一些使用限制,其余均为默认设置

@xaisc /opt/volclava-1.0/log路径下的log是否也可以帮忙提供一下哈,或者自定义的volclava安装路径 下的log目录里,重点应该是 mbatchd.log,其他的volclava日志如果方便也可以一起提供一下哈。

@xaisc
Copy link
Author

xaisc commented Feb 28, 2025

@limingze-ste 可以的,怎么发给你们呢,邮件或者qq?

@limingze-ste
Copy link
Collaborator

@limingze-ste 可以的,怎么发给你们呢,邮件或者qq?

@xaisc 邮箱可以哈,[email protected]

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants