本文是一篇计算机论文范文,本研究围绕移动应用综合评价的关键问题,通过系统性的方法创新和技术融合,构建了一套完整的细粒度评价体系。
第1章 绪论
1.1 课题研究背景与意义
当前,我国已全面步入到移动互联网时代。2023年3月,中国互联网络信息中心发布的报告中显示,截至到2022年底,我国网民数量达10.67亿人,其中手机上网的占比高达99.8%[1]。随着智慧终端的不断迭代创新,应用程序也得到了广泛普及,体现了移动互联网经济、便捷、高效的发展方向。据工信部统计,截至2022年底,各类高质量移动应用在架数量超过258万款,下载量超万亿次[2]。移动应用成为了民众工作和生活中不可或缺的一部分。用户在应用商店中可以轻松获得大量的应用程序,覆盖社交媒体、游戏、生产力工具、娱乐等多种类型的移动应用,具有多样化的应用选择。然而,现有的对移动应用的评价只提供用户对该应用的整体评价,如星级打分,这种评价形式虽然简洁,但无法提供足够详细的信息,不能深入解用户对应用的具体满意和不满意之处。同时,用户评论的内容复杂多样,包含了用户自身各样的观点、体验和需求[3]。复杂多样的评论使得开发商和普通用户都难以识别评论中的关键信息,无法快速而全面地认知某个应用的优劣。移动应用细致分析的缺乏衍生出两个极其重要的问题,第一,应用开发商无法更好了解用户需求,针对性的改进移动应用;第二,用户很难在众多的选项中选择到最符合其需求的移动应用。即应用商店缺少移动应用综合评价功能,由此限制了应用开发商改进移动应用的能力,阻碍了他们全面了解用户需求、市场趋势和竞争情况;给用户选择移动应用带来了信息不足、难以区分主观评论、难以满足个性化需求等潜在问题。
目前,软件工程研究人员和用户可以从应用商店的在线评论中获得大量关于众多移动应用的技术、功能和服务信息[4],这些不断增加的有价值的信息对于移动应用的深入评估具有重大意义。研究表明,在线评论中对移动应用的正向评论可以提高其认可度与相对竞争力,而负向评论则会有损移动应用的声誉[5]。情感分析是一种自动化的方法,旨在确定大型文本数据集中情感和情绪的极性[6]。这种方法被应用于计算和监控应用程序用户在在线社交媒体和应用程序评论网站上的反馈、评论和评论的态度和行为[7]。然而,现有的在线评论情感分析方面的研究存在一定的局限性,主要表现在多数的分析方法停留在句子或篇章层面,不能充分挖掘评论中针对特定属性的情感倾向,难以精准识别用户的情感态度。
1.2 国内外研究现状
当前,移动应用评价研究的主要焦点集中在评论主题识别和文本情感分析上,这两个方面的研究对于深入了解用户对应用的反馈、改进应用质量以及提升用户体验具有重要意义[11]。随着互联网的发展,越来越多的人愿意在使用后对某些应用发表自己的意见和评论,形成了大量的评论文本。这些短文通常具有强烈的主观性,有时在一个句子中包含不同的情感倾向。
如图1-1所示为CNKI以及WOS核心数据库中文本情感分析的相关研究近十年发文量,在CNKI上以“文本情感分析”“细粒度情感分析”为主题进行检索,在WOS上以 “Text Sentiment Analysis”“Aspect Based Sentiment Analysis”为主题进行检索。从图中可以看出该领域的发文量总体呈上升趋势,说明近十年来有关文本细粒度主题情感分析的研究热度一直在增加。

第2章 融合语义特征的细粒度评论主题识别
2.1 语义特征及其融合机制
语义特征,是指从文本中获取可以体现语言意义和上下文信息的特征描述。侧重从文本中提取概念、关系、情绪和上下文特征,不关注文本中词的表层特征,旨在发现特定情况下词、短语和语句等的语义特性。语义特征融合,是指将不同级别或者不同来源的语义特征信息内容结合起来,以提高文本处理任务的效果。在评论主题识别任务中,语义特征融合具有重要意义。首先,在评论内容中,用户所评论的信息通常涉及多个方面且表述不规范、不完整,使用单一的语义特征不能充分、精确地分析评论的主题。使用不同级、不同类型或者不同来源的语义特征,可以从多维度考虑评论中的特征信息,避免使用单一语义特征所带来的片面性。其次,在评论主题识别的任务中,评论的语义包含于不同的语义源中,比如基于中文文本标注生成的语义标注信息、基于语义感知构建的评论域领域知识、从语料库中抽取的句法规则以及使用机器学习方法构建的特征表达等。融合这些语义特征有助于深入理解评论的语义含义,拓展对评论主题分析的覆盖范围,从而提高评论主题识别任务的整体性能。在评论主题识别任务中,语义特征融合的意义主要体现在以下几个方面:
(1)提升主题识别的准确性和覆盖度:传统方法诸如LDA主题识别模型,存在一定局限性。该模型主要依赖词语的共现频率来判定主题,无法精确捕捉词语间语义关系以及上下文信息。例如,LDA模型虽能够识别出“电池”和“续航”两个词高频共现,但不能识别“电池续航时间短”与“电量消耗快”在表达的是同一主题的语义关联。主要是因为仅从词语表面的共现频次出发,缺乏对句子整体语义及词语在具体语境中含义。
(2)增强对复杂语义的理解能力:用户评论中通常包含着复杂的语义结构,如同一主题通过不同的表达方式呈现,或者同一句子包含多个主题。例如,“这款应用的界面很漂亮,但加载速度太慢”包含两个主题(界面设计和性能),通过对多层次语义特征的融合,可以更好划分评论中多个主题。
2.2 数据预处理
移动应用评论文本数据集在语言表达层面,涵盖了较多非正式表述、缩写形式、拼写失误、表情符号,以及与核心内容无关的冗余信息。同时,评论文本是非结构化的,上下文意义关系十分复杂。而且在移动应用评论文本中,经常存在多个主题相关联的现象,情感导向模糊,语义上有许多歧义,这给数据预处理带来了更多困扰。例如“这个软件用起来很方便,但偶尔会出现卡顿”的评论中包含对软件的正面评价及卡顿的内容负面评价。针对上述问题,对数据集进行处理,经过数据预处理,即去除数据集中的多余内容,拼写错别字、规范非正式的用词等预处理。可以使评论文本数据集更加整洁,高质量的数据可为对手机进行主题分析、情感分析、整体评价等关键任务提供更为精确、可靠的数据支撑。
2.2.1 数据集选取
本研究选取了公开的“Top Indian Educational Apps Reviews”数据集作为实验数据来源,来验证本研究方法的有效性和普适性。数据集收录了印度市场上11款热门教育类移动应用的用户评论,一共包含13000条用户评论文本数据。数据集中的每条评论数据包含多个字段,分别为作者、评级、标题、评论内容、评论时间等。但由于本研究的重点主要聚焦于评论文本的语义分析和主题识别,作者、标题和评论时间等字段对本研究无直接贡献,因此在数据预处理阶段,本研究仅保留了评论内容字段。
本研究所使用数据集为教育类移动应用用户的评论数据,表2-1为数据集预处理后的一则评论,从中可以看出,评论数据的内容也较为多样化,对于应用的评论包括其应用功能、软件体验、使用性能等,语言表达模式也比较多样化,从语言层面看,既有正式客观的评论,也有比较口语化一些的表达,数据的多样性可以用来验证本文提出的融合语义特征的细粒度评论主题识别方法的性能。
第3章 基于MHA-MLP-Mixer的评论主题情感分析 ....................... 20
3.1 评论主题情感分析研究思路 ............................ 20
3.2 MHA-MLP-Mixer的评论主题情感分析模型 ..................... 21
第4章 基于评论主题聚类的移动应用综合评价....................... 31
4.1 移动应用综合评价体系构建的思路 ................................... 31
4.2 DCHKE模型 ................................. 32
结论 .................................. 44
第4章 基于评论主题聚类的移动应用综合评价
4.1 移动应用综合评价体系构建的思路
移动应用综合评价体系的构建主要是基于对评论主题识别结果的聚类方法,针对移动应用评论主题聚类研究中存在的关键科学问题,本研究系统性地分析了三个维度的技术挑战:第一,在特征表示层面,不同主题类别的评论文本呈现出显著的语义异质性,具体表现为专业术语分布差异和句式结构多样性,这使得传统聚类方法采用的统一语义空间难以实现最优的主题可分性;第二,在样本表征层面,用户评论普遍存在多主题混合表达现象,导致评论向量在特征空间中呈现复杂的重叠分布,传统基于固定核函数的聚类算法无法有效解耦这些语义重叠特征;第三,在动态适应层面,移动应用持续迭代的特性要求聚类模型具备自主演化能力,以应对新出现主题模式的识别需求。
针对上述问题,本文提出了一种深度的混合核嵌入学习主题聚类模型DCHKE(Deep Clustering via Hybrid Kernel Embedding),构建了从评论特征提取到主题簇划分的端到端学习框架,为移动应用评论分析提供有理论支撑的聚类方案。该模型的核心创新如下:
(1)混合语义核嵌入学习器模块:采用深度变分高斯过程构建双通道语义表征体系,通过内容语义核和结构语义核分别建模主题分布特征和句法模式特征。该模块创新性地实现了核函数的自适应选择机制,能够根据文本多样性特点动态调整语义映射空间,有效解决了传统固定核函数在面对混合主题评论时的表征局限性问题。
(2)混合语义核嵌入解码器模块:设计了对抗式与内积式双路解码架构,为嵌入学习提供双向监督信号。其中,基于生成
