python自然语言处理—Datasets(数据集)

    科技2025-01-19  36

                                                                    Datasets(数据集)

     

    本文整理了一些文本摘要数据集,具体如下:

        1、中文数据集:新浪微博摘要数据集(679898 条数据)

            

        2、英文数据集:Gigaword 、LCSTS 、Newsroom 、Xsum、CNN dailymail。

    推荐一个网站:

        https://paperswithcode.com/

        该网站将ArXiv上的最新机器学习论文与GitHub上的代码(TensorFlow/PyTorch/MXNet /等)对应起来。我们可以按标题关键词查询,也可以按流行程度、GitHub星星数排列“热门研究”。这个网站能让我们跟上ML社区流行的最新动态。

    Processed: 0.013, SQL: 8