broadcast_tensor in core_vq.py for multi_gpu training #24

mindmapper15 · 2024-11-12T05:07:13Z

SpeechTokenizer/speechtokenizer/quantization/core_vq.py

Lines 139 to 149 in 30c96fb

    
           def init_embed_(self, data): 
        
               if self.inited: 
        
                   return 
        
               embed, cluster_size = kmeans(data, self.codebook_size, self.kmeans_iters) 
        
               self.embed.data.copy_(embed) 
        
               self.embed_avg.data.copy_(embed.clone()) 
        
               self.cluster_size.data.copy_(cluster_size) 
        
               self.inited.data.copy_(torch.Tensor([True])) 
        
               # Make sure all buffers across workers are in sync after initialization 
        
               #broadcast_tensors(self.buffers())

In core_vq.py, broadcasting tensor function is commented, which is different from the original code facebookresearch/encodec

According to the original author of encodec, this broadcasting seems to required for multi-gpu training.
Have you been tested and compared the encodec model trained w/ or w/o broadcasting function?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

broadcast_tensor in core_vq.py for multi_gpu training #24

broadcast_tensor in core_vq.py for multi_gpu training #24

mindmapper15 commented Nov 12, 2024

broadcast_tensor in core_vq.py for multi_gpu training #24

broadcast_tensor in core_vq.py for multi_gpu training #24

Comments

mindmapper15 commented Nov 12, 2024