deepFM源码学习

    科技2025-05-26  11

    deepFM源码学习

    github地址数据集效果比较疑问

    github地址

    https://github.com/ChenglongChen/tensorflow-DeepFM

    数据集

    https://www.kaggle.com/c/porto-seguro-safe-driver-prediction

    效果比较

    deepFMFMDNNnormed gini0.26685 (0.00119)0.26872 (0.00327)0.25871 (0.00108)gpu耗时/分钟242019

    用2核cpu跑了半小时,没有输出任何结果。

    用单个2080gpu跑。显存只用了10%,gpu只用了1%,gpu算力没有充分利用起来。

    疑问

    113行,dropout_keep_deep数组下标会超吗? self.y_deep = tf.nn.dropout(self.y_deep, self.dropout_keep_deep[1+i]) # dropout at each Deep layer 该代码中似乎少了0次项?如何对id类特征左hash编码?连续特征如何处理?最好做离散化。知乎上讨论了这个问题,详见推荐系统算法FM、FFM使用时,连续性特征,是直接作为输入,还是经过离散化后one-hot处理呢?
    Processed: 0.015, SQL: 8