自动文摘评测方法
ROUGE
ROUGE(Recall-Oriented Understudy for Gisting Evaluation) ,在 2004 年由 ISI 的 Chin-Yew Lin 提出的一种自动摘要评价方法,是评估 自动文摘 以及 机器翻译 的一组指标。
ROUGE 基于摘要中 n 元词(n-gram)的共现信息来评价摘要,是一种面向 n 元词召回率的评价方法。基本思想为由多个专家分别生成人工摘要,构成标准摘要集,将系统生成的自动摘要与人工生成的标准摘要相对比,通过统计二者之间重叠的基本单元(n 元语法、词序列、词对)的数目,来评价摘要的质量。通过与专家人工摘要的对比,提高评价系统的稳定性和健壮性。