软件工程硕士论文栏目提供最新软件工程硕士论文格式、软件工程硕士硕士论文范文。

中文金融领域的事件抽取方法探讨

日期:2025年06月08日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:181
论文价格:150元/篇 论文编号:lw202506051553069971 论文字数:36522 所属栏目:软件工程硕士论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis
,将事件检测问题转化为多标签分类问题,并使用二元关联模型BR,将多标签分类问题使用多个独立的二元分类器解决。CFDED方法经过测试,结果相较于基线算法有所提升,证明了该方法的有效性和先进性,并通过消融实验验证了模型中引入的Fin-BERT编码器模块起到的作用。

(2) 本文结合CFDED事件检测模型,提出了一种名为Fin-PTPCG的事件抽取方法,该方法充分融入了金融领域的先验知识,解决了现有方法中对负面样例以及复杂的文本难以有效识别的问题。Fin-PTPCG模型首先使用CFDED模型获得文档中包含的事件类型,并以此生成空白的事件表,接着使用LSTM和PTPCG方法进行解码,通过PTPCG的解码器生成的相似度矩阵剪枝构成有向无环图,再将实体输入分类器解码填充到空白事件表中得到抽取结果。该方法经过测试,在两个数据集上的结果均优于基线算法,证明了该模型的有效性和先进性,并且进行了消融实验证明了模型引入的模块的作用,此外,本文还进行了对比实验,通过实验结果可以说明测试的几种编码方式中,本文使用的Fin-BERT是最适合金融领域的事件抽取任务的。

(3) 本文整合了上述训练完成的各种事件检测及论元抽取模型,设计并实现了一个中文金融领域的事件抽取系统,该系统可以使用网络爬虫对金融新闻文档进行爬取并进行预处理,用户可以自由选择输入文档或是使用爬取的新闻,然后通过用户选择的模型抽取文档内的事件论元信息以结构化的形式展示给用户,并且在原文中使用不同颜色标注出事件的关键信息。此外在对从网络上爬取的新闻抽取结束后加入了用户评价的机制,并以此方式扩充标注的数据集。

参考文献(略)