Text Summarization

2018/12/15 NLP

文本摘要

基于抽取式的方法(Extractive)

基于Page Rank,把每句话当作一个节点(Page Rank中功德节点式某个网页),找到Page Rank值大的几句话。

句子向量的生成有多种方法。

图的生成也有多种方法,权重可以采用句子间的相似度,也可以删去某些权重比较低的连接。

提取得分高的前几个句子,也不一定最好,因为可能这几个句子相似,我们要句子有代表性又多样化。

基于生成式的方法(Abstractive)

基于sequence模型,然后加一些attention model等。最常见的是seq2seq模型。

博客

一文梳理NLP之机器翻译和自动摘要的发展现状

文本自动摘要

基于TextRank的中文摘要工具

netwotkx 摘要

源码

使用Python实现一个文本自动摘要工具

文章自动摘要之Pointer-Generator Networks(没看)

keyphrase github

Generating wikipedia by summarizing long sequences(没看)

变身抓重点小能手:机器学习中的文本摘要入门指南

谷歌开源新的TensorFlow文本自动摘要代码

论文

Pointer Networks简介及其应用

https://github.com/yuedongP 博主https://www.cs.mcgill.ca/~ydong26/ Yue Dong. “A Survey on Neural Network-Based Summarization Methods.” arXiv preprint arXiv:2199934 (2018) Yue Dong, Yikang Shen, Eric Crawford, Herke van Hoof, Jackie Chi Kit Cheung. “BanditSum: Extractive Summarization as a Contextual Bandit.” EMNLP (2018)

A Survey on Neural Network-Based Summarization Methods Yue Dong Learning Multi-task Communication with Message Passing for Sequence Learnin Yue dong

Search

    Table of Contents