萌新一个,不知道这种问题能不能发,求大佬们轻喷。想讨论下 DeepFM 模型,Deep 侧和 FM 侧是否应该共享 embedding ?
现在是想热加载一个训了很久的 deep 结构,然后加上 fm 结构辅助学习,看到原文里两边貌似是共享 embedding 的,感觉有点奇怪。FM 这边的收敛逻辑和旁边的 Deep 侧应该不太一样吧,让两个网络共享 embedding 不会造成混乱吗?
现在是想热加载一个训了很久的 deep 结构,然后加上 fm 结构辅助学习,看到原文里两边貌似是共享 embedding 的,感觉有点奇怪。FM 这边的收敛逻辑和旁边的 Deep 侧应该不太一样吧,让两个网络共享 embedding 不会造成混乱吗?