使用llava论文提供的数据集进行训练报错“The number of images does not match the number of image tokens” #5883
Closed
1 task done
Labels
solved
This problem has been already solved
Reminder
System Info
llamafactory 0.9.1.dev0
Reproduction
使用llava官方提供的数据集去sft llava模型
Expected behavior
看了一下相关代码,问题应该是出在数据集格式,llava论文里使用的数据集中,image的路径是按字符串给的,例如在json中,image字段可能是"test1.jpg",因此在处理图片数据时,读取到的图片路径是字符串,而我使用的llamafactory版本中,提供的mllm demo数据集里的image字段是列表,例如“[test1.jpg]”,因此读取到的图片路径是列表。最终在LlavaPlugin.process_messages方法中进行 “if len(images) != num_image_tokens” 判断时,如果只有一张图片,num_image_tokens为1,而image字段是list时,len(images)也为1,若image字段是字符串,则len(images)为 “test1.jpg”这个字符串的长度,最终报错。
不知道是否需要更新llamafactory最新版本
Others
No response
The text was updated successfully, but these errors were encountered: