deepFM源码学习
github地址数据集效果比较疑问
github地址
https://github.com/ChenglongChen/tensorflow-DeepFM
数据集
https://www.kaggle.com/c/porto-seguro-safe-driver-prediction
效果比较
deepFMFMDNN
normed gini0.26685 (0.00119)0.26872 (0.00327)0.25871 (0.00108)gpu耗时/分钟242019
用2核cpu跑了半小时,没有输出任何结果。
用单个2080gpu跑。显存只用了10%,gpu只用了1%,gpu算力没有充分利用起来。
疑问
113行,dropout_keep_deep数组下标会超吗?
self
.y_deep
= tf
.nn
.dropout
(self
.y_deep
, self
.dropout_keep_deep
[1+i
])
该代码中似乎少了0次项?如何对id类特征左hash编码?连续特征如何处理?最好做离散化。知乎上讨论了这个问题,详见推荐系统算法FM、FFM使用时,连续性特征,是直接作为输入,还是经过离散化后one-hot处理呢?