`val_batch_size` not used in `ray_trainer`?

https://github.com/volcengine/verl/blob/7a128c1cd804180d96b54406f2ad26d5d9cc0859/verl/trainer/ppo/ray_trainer.py#L494-L505

It seems that `val_batch_size` is not utilized. It would always be the length of the `RLHFDataset`, which is length of the `DataFrame`?

	self.val_dataset = RLHFDataset(parquet_files=self.config.data.val_files,
	tokenizer=self.tokenizer,
	prompt_key=self.config.data.prompt_key,
	max_prompt_length=self.config.data.max_prompt_length,
	filter_prompts=True,
	return_raw_chat=self.config.data.get('return_raw_chat', False),
	truncation='error')
	self.val_dataloader = DataLoader(dataset=self.val_dataset,
	batch_size=len(self.val_dataset),
	shuffle=True,
	drop_last=True,
	collate_fn=collate_fn)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

`val_batch_size` not used in `ray_trainer`? #352

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

val_batch_size not used in ray_trainer? #352

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions

`val_batch_size` not used in `ray_trainer`? #352