Pytorch使用全局编码(Global-Encoding)生成文本摘要(北大开源)

Song • 148次浏览 • 0个评论 • 2019-03-14 15:32:18

Global-Encoding

此项目主要是为了实现论文Global Encoding for Abstractive Summarization

一、要求

  • Ubuntu 16.0.4
  • Python 3.5
  • Pytorch 0.4.1(更新)
  • pyrouge 要使用pyrouge,请使用以下行设置rouge路径:
pyrouge_set_rouge_path RELEASE-1.5.5/

似乎有些用户遇到了pyrouge的问题,所以我更新了脚本,用户可以将目录RELEASE-1.5.5放在你的主目录中并设置路由路径(或运行命令chmod 777 RELEASE-1.5.5获得系统权限)。

二、预处理

python3 preprocess.py -load_data path_to_data -save_data path_to_store_data 

记得将数据放入一个文件夹,并将它们命名为train.srctrain.tgtvalid.srcvalid.tgttest.srctest.tgt,并在其中创建一个名为data的新文件夹

三、训练

python3 train.py -log log_name -config config_yaml -gpus id

为超参数设置创建自己的yaml文件。

四、评估

python3 train.py -log log_name -config config_yaml -gpus id -restore checkpoint -mode eval

五、引文

如果您将此代码用于研究,请引用我们的论文:

@inproceedings{globalencoding,
  title     = {Global Encoding for Abstractive Summarization},
  author    = {Junyang Lin and Xu Sun and Shuming Ma and Qi Su},
  booktitle = {{ACL} 2018},
  year      = {2018}
}

原文地址:Pytorch使用全局编码(Global-Encoding)生成文本摘要(北大开源)

提交评论
要回复文章请先登录注册
用户评论
  • 没有评论
    公告
    中国晚上好,随时随地分享前沿科技,好吃好玩,有趣有料的新鲜事;本站可以分享资源,技术,观点,态度;同时希望大家做一个文明的分享者!
    广告
    pytorch中文网