新闻头条信息提取

数据挖掘 nlp 信息提取
2022-02-24 20:53:13

我在信息提取领域相对较新,想知道是否有任何方法可以总结同一主题的多个标题,比如某种“平均”标题。想象一下关于洛杉矶公羊队赢得超级碗主题的新闻文章中的 20 个标题,例如“公羊队赢得超级碗”、“洛杉矶集会击败孟加拉虎赢得超级碗”,......

目标是找到一个总结这些标题的“平均”句子。我已经在 Google 和 Google Scholar 中进行了搜索,但我没有找到任何合适的内容,所以我不确定是否真的什么都没有,或者我只是不知道在这里搜索的正确方法/关键字。

先感谢您!

1个回答

我能想到的最接近的 NLP 任务是自动摘要:给定一些任意长度的文本,系统应该生成最重要点的简短摘要。

我想如果为一个好的摘要系统提供多个相似的标题,系统应该能够只输出主要信息作为输出。虽然不能保证它会是一个句子。