Datasets(数据集)
本文整理了一些文本摘要数据集,具体如下:
1、中文数据集:新浪微博摘要数据集(679898 条数据)
2、英文数据集:Gigaword 、LCSTS 、Newsroom 、Xsum、CNN dailymail。
推荐一个网站:
https://paperswithcode.com/
该网站将ArXiv上的最新机器学习论文与GitHub上的代码(TensorFlow/PyTorch/MXNet /等)对应起来。我们可以按标题关键词查询,也可以按流行程度、GitHub星星数排列“热门研究”。这个网站能让我们跟上ML社区流行的最新动态。