文本摘要
基于抽取式的方法(Extractive)
基于Page Rank,把每句话当作一个节点(Page Rank中功德节点式某个网页),找到Page Rank值大的几句话。
句子向量的生成有多种方法。
图的生成也有多种方法,权重可以采用句子间的相似度,也可以删去某些权重比较低的连接。
提取得分高的前几个句子,也不一定最好,因为可能这几个句子相似,我们要句子有代表性又多样化。
基于生成式的方法(Abstractive)
基于sequence模型,然后加一些attention model等。最常见的是seq2seq模型。
博客
源码
文章自动摘要之Pointer-Generator Networks(没看)
Generating wikipedia by summarizing long sequences(没看)
论文
https://github.com/yuedongP 博主https://www.cs.mcgill.ca/~ydong26/ Yue Dong. “A Survey on Neural Network-Based Summarization Methods.” arXiv preprint arXiv:2199934 (2018) Yue Dong, Yikang Shen, Eric Crawford, Herke van Hoof, Jackie Chi Kit Cheung. “BanditSum: Extractive Summarization as a Contextual Bandit.” EMNLP (2018)
A Survey on Neural Network-Based Summarization Methods Yue Dong Learning Multi-task Communication with Message Passing for Sequence Learnin Yue dong