[BUG] Transformer predict does not use path from parameters #570

bschifferer · 2022-12-08T14:07:00Z

Bug description

trainer.predict(test_paths) does not use the files parsed in the function to evaluate.

predict calls get_test_dataloader

trainer.predict(
    test_dataset: torch.utils.data.dataset.Dataset,
    ignore_keys: Union[List[str], NoneType] = None,
    metric_key_prefix: str = 'test',
) -> transformers.trainer_utils.PredictionOutput
        self._memory_tracker.start()
        test_dataloader = self.get_test_dataloader(test_dataset)

predict initialize the test dataloader from self.test_dataset_or_path
see https://github.com/NVIDIA-Merlin/Transformers4Rec/blob/main/transformers4rec/torch/trainer.py#L204-L209

        test_dataset = test_dataset if test_dataset is not None else self.test_dataset
        assert self.schema is not None, "schema is required to generate Test Dataloader"
        return T4RecDataLoader.parse(self.args.data_loader_engine).from_schema(
            self.schema,
            self.test_dataset_or_path, ### <- This is incorrect?
            self.args.per_device_eval_batch_size,
            max_sequence_length=self.args.max_sequence_length,
            drop_last=self.args.dataloader_drop_last,
            shuffle=False,
            shuffle_buffer_size=self.args.shuffle_buffer_size,
        )

Work around could be

trainer.test_dataset_or_path = paths
prediction = trainer.predict(paths)

The text was updated successfully, but these errors were encountered:

sararb · 2022-12-08T15:08:06Z

Thank you for catching this bug!
regarding your point: self.test_dataset_or_path, ### <- This is incorrect? --> This is not correct and the method should use test_dataset instead of self.test_dataset_or_path.
I opened a quick fix in #571

bschifferer added bug Something isn't working status/needs-triage labels Dec 8, 2022

bschifferer assigned sararb Dec 8, 2022

sararb mentioned this issue Dec 8, 2022

Fix the test data path in Trainer.predict() #571

Merged

sararb closed this as completed in #571 Dec 8, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[BUG] Transformer predict does not use path from parameters #570

[BUG] Transformer predict does not use path from parameters #570

bschifferer commented Dec 8, 2022

sararb commented Dec 8, 2022

[BUG] Transformer predict does not use path from parameters #570

[BUG] Transformer predict does not use path from parameters #570

Comments

bschifferer commented Dec 8, 2022

Bug description

sararb commented Dec 8, 2022