La pile Pytorchvideo s'attend à ce que chaque tenseur soit de taille égale, mais a obtenu [89088] à l'entrée 0 et [88064] à l'entrée 1

# Add decode_audio=False to the val_dataset 

# Before:
val_dataset = pytorchvideo.data.Kinetics(
  data_path=os.path.join(self._DATA_PATH, "val.csv"),
  clip_sampler=pytorchvideo.data.make_clip_sampler("uniform",
                                                   self._CLIP_DURATION),
  transform=val_transform
)

# After
val_dataset = pytorchvideo.data.Kinetics(
  data_path=os.path.join(self._DATA_PATH, "val.csv"),
  clip_sampler=pytorchvideo.data.make_clip_sampler("uniform", 
                                                   self._CLIP_DURATION),
  decode_audio=False,
  transform=val_transform
)
Jittery Jay