(2) 本文结合CFDED事件检测模型,提出了一种名为Fin-PTPCG的事件抽取方法,该方法充分融入了金融领域的先验知识,解决了现有方法中对负面样例以及复杂的文本难以有效识别的问题。Fin-PTPCG模型首先使用CFDED模型获得文档中包含的事件类型,并以此生成空白的事件表,接着使用LSTM和PTPCG方法进行解码,通过PTPCG的解码器生成的相似度矩阵剪枝构成有向无环图,再将实体输入分类器解码填充到空白事件表中得到抽取结果。该方法经过测试,在两个数据集上的结果均优于基线算法,证明了该模型的有效性和先进性,并且进行了消融实验证明了模型引入的模块的作用,此外,本文还进行了对比实验,通过实验结果可以说明测试的几种编码方式中,本文使用的Fin-BERT是最适合金融领域的事件抽取任务的。
(3) 本文整合了上述训练完成的各种事件检测及论元抽取模型,设计并实现了一个中文金融领域的事件抽取系统,该系统可以使用网络爬虫对金融新闻文档进行爬取并进行预处理,用户可以自由选择输入文档或是使用爬取的新闻,然后通过用户选择的模型抽取文档内的事件论元信息以结构化的形式展示给用户,并且在原文中使用不同颜色标注出事件的关键信息。此外在对从网络上爬取的新闻抽取结束后加入了用户评价的机制,并以此方式扩充标注的数据集。
参考文献(略)
