Data-Juicer内置了丰富的算子来支持图片多模态数据合成,譬如Img-Diff数据集。该合成数据在MMVP基准上带来了12个性能点的模型提升。更多细节参见Img-Diff论文,对应菜谱实现可参考ImgDiff-Dev. LLaVA pretrain (LCS-558k): 使用完善后的预训练数据集预训练并使用原始的指令 ...