本文是一篇计算机软件论文,本文对相关算法进行了深入且系统的研究,并创新性地提出了两个具有一定研究价值的改进算法模型。
1绪论
1.1研究工作的背景与意义
在工业发展的漫长进程中,产品质量始终是企业立足市场的核心竞争力。随着科技的飞速进步和全球化市场竞争的日益激烈,现代社会对工业产品的质量要求达到了前所未有的高度,同时工业生产的规模和产品复杂度也不断提升。在汽车制造、电子产品生产、航空航天设备,精密机械加工等领域,都需要更高的生产精度。在汽车发动机零部件生产中,微小的缺陷可能导致发动机性能下降、可靠性降低,这些瑕疵将可能引发安全隐患。在电子产品制造中,芯片上的细微瑕疵可能使整个电子产品出现故障。在电子产品市场中,电子产品的品控也决定着其在当今激烈的社会的竞争力,例如是否包括完整的外表,屏幕内是否含有灰尘等。
这说明了保障产品质量是至关重要的,工业图像异常检测是其中的重要一环,而传统人工检测存在许多弊端。长时间检测容易使检测人员疲劳,从而导致误判率变高,严重影响产品检测的准确性和可靠性。例如在电子元件生产流水线上,工人可能因长时间专注于流动的微小元件的检测而出现视觉疲劳,将有缺陷的元件误判为合格产品。而且人工检测成本巨大,在大规模生产场景下,大量的人力投入不仅会增加生产成本,还难以满足快速生产的节奏。在一些对人体健康有潜在威胁的生产环境中,如化工产品检测或放射性材料生产环节,人工检测可能会使检测人员在有安全隐患的环境中工作,从而引发健康问题。由于制造业的快速发展,企业对产品质量要求的愈发严苛,传统的人工检测方式由于各种弊端难以在当前社会立足。
随着工业自动化的推进,传统机器视觉的检测技术逐渐兴起,其利用工业相机快速采集图像,通过图像处理算法对产品图像进行分析,能够能在短时间内处理大量图像数据,检测一些明显的缺陷。该技术相比人力,更稳定且大幅提升了检测效率,更能适应大规模生产需求。但是该方法在面对复杂的产品表面和多样化的缺陷类型时,仍存在诸多局限性,且泛化性弱对复杂环境的适应性灵活性也有待提高。
1.2国内外研究现状
当前,工业图像异常检测任务主要是通过有监督或无监督的方法来开展相关工作。有监督方法需要同时利用大量已标注的正常样本和异常样本构建模型,基于已知的样本特征和标注信息来学习如何区分正常与异常图像。然而,在实际工业应用中,获取大量标注精准的异常样本往往面临诸多困难[1],比如对于新上线的产品,可能缺乏足够的异常数据,对新产品标注将耗费大量人力、物力和时间成本,这就限制了有监督方法在某些场景下的广泛应用。无监督方法在这类情况下则展现出独特的优势,它无需使用真实的异常样本,可以仅依靠现有的正常样本构建模型。这种特性使得无监督方法能有效解决工业上的冷启动问题,拓展了工业图像异常检测技术的应用范围。下面将介绍工业缺陷算法的几种主流方法。
1.2.1基于特征嵌入的方法
近年来,深度学习技术在工业图像异常检测领域发展迅猛,众多基于深度学习的无监督方法被相继提出并应用,总的来说它们都是基于特征嵌入的方法但是按照核心理论不同,大致可分为以下几类:
(1)基于记忆库
该方法通过利用神经网络强大的特征提取能力,提取图像的块特征,并将其存储到记忆库中后续将新图像特征与之对比判断是否异常[3][4][5]。该方法可以很好的提取图像的局部信息,在测试时可以快速进行特征比对判断图像是否异常但是需要存储特征,需要大量的存储空间,对大规模下的图像特征处理可能会有困难,此外对记忆库更新或者维护也需要大量计算资源和时间。为了缓解这个问题以减少内存库大小为目的的方法被提出,如PatchCore[3]该方法首先利用预训练的CNN来提取正常图片的特征,存储到记忆库后对内存库二次采样进行优化。还有引入位置信息和邻域信息相结合的方法PIN[4]解决了传统方法中忽略这些信息导致的检测准确性不足的问题。这类方法能够准确的对简单类型异常进行分割与定位但是对其记忆库的管理和维护需要大量的计算资源,推理的延迟也稍高。
2相关理论及技术
2.1工业图像缺陷检测任务
工业图像缺陷检测是指从工业产品的图像中准确识别出所存在的缺陷,在深度学习应用于该领域之前,传统方法使用基于阈值分割、边缘检测等图像处理技术。这类方法在简单场景下有一定应用,但面对复杂产品表面和多样化缺陷类型时局限性比较明显。
在深度学习领域,工业图像缺陷检测的方法分为两大类,有监督学习算法,以及无监督算法。有监督方法通过大量标注的正常与异常样本训练模型,使模型学习到不同类别图像的特征差异,从而实现对新图像的分类判断。例如,在训练过程中,模型会根据标注信息不断调整自身参数,从而最小化预测结果与真实标签之间的误差。然而,如前面所述,其面临异常样本获取困难及标注麻烦的问题。
无监督算法则基于正常样本学习数据的分布特征或模式,将哪些与正常样本分布差异较大的图像判定为异常。例如基于记忆库的方法利用神经网络提取图像块特征并存储,后续通过比对新图像特征与记忆库特征来检测异常;分布图方法对提取的特征进行分布建模,依据测试图像特征是否偏离训练分布来判断异常;师生模型借助预训练的教师网络指导学生网络学习正常图像特征,通过对比学生网络在正常与异常图像上的输出差异进行检测;图像重建方法期望模型将异常图像重建为正常图像,利用重建误差判断异常;基于多模态大模型的方法结合图像与文本特征进行异常判断。这类方法有效规避了有监督算法在某些场景下的局限性。
2.2视觉状态空间
状态空间模型因为处理长语言序列建模方面的有效性而受到广泛关注。GU等[33]提出了S4模型。这是一种Transformer的替代方案用于建模长距离依赖关系。Smith等[34]通过在S4层引入MIMO SSM和高效并行扫描,提出了新的S5层。最近Gu等[35]提出了数据依赖的SSM层,并构建了一个通用语言模型骨干Mamba,它在各种数据集上的表现优于各种规模的Transformer。Mamba的成功引发其在计算机视觉的广泛研究。最近,Zhu等[36]提出的视觉Mamba(Vision Mamba,VIM)采用双向序列建模在自然图像分类任务取得巨大成功。
结合上述知识我们可以对该方法的优缺点进行相关分析。视觉Mamba架构在长序列数据处理领域展现出了独特的优势与显著的效能。其最为突出的特点之一是在计算过程中具备高效率。例如当序列长度不断增加时,视觉Mamba的计算复杂度仅保持相对较低的增长速率,能够实现线性缩放。这一特性在工业图像异常检测应用中具有至关重要的意义可以有效降低延迟。

并且在面对工业产品图像时,尤其是那些具有复杂纹理和结构的图像,视觉Mamba能够精准的捕捉图像中不同位置特征之间的长程依赖关系。因为其能够跨越较大的空间距离,将原本看似毫无关联的局部特征有效地联系起来,进而实现对图像整体特征模式的更为全面且深入的理解。这种能力有效的提升了其对异常情况的识别水平,特别是针对那些涉及较大区域的异常情形,视觉Mamba往往能够精准地发现并识别。
3基于视觉Mamba和块特征分布的缺陷检测算法.................15
3.1引言..........................................15
3.2算法模型结构..................................16
3.3基于视觉Mamba的自编码重建网络.....................17
4基于小波卷积的轻量化工业图像异常检测模型.......................29
4.1引言..........................29
4.2算法模型设计..............................30
4.3基于小波卷积的轻量化图像块描述网络....................30
5工业缺陷检测验证系统设计与实现.......................38
5.1需求分析..................................38
5.2系统设计.................................39
5工业缺陷检测验证系统设计与实现
5.1需求分析
开发一个工业表面缺陷检测系统,首先,需要考虑使用什么架构去搭建这个系统,传统的系统架构有,客户端/服务器(CS)架构,浏览器/服务器(BS)架构,嵌入式架构。如今还有分布式架构,混合架构等等。下面将分析这些架构的优缺点,然后根据可行性最后选择一种架构进行开发。
CS架构的优势是客户端计算资源丰富,可协助服务器处理部分数据和业务逻辑,但存在软件更新维护成本高、需针对不同操作系统开发不同版本软件、硬件要求过高等问题,不利于在工业生产线上大规模部署。嵌入式架构虽具有实时性强的优势,但硬件计算资源有限,限制了可运行的模型复杂度和数据处理能力,且开发难度大、升级扩展困难。分布式架构虽能处理大规模数据和复杂计算任务,但系统设计以及实现复杂,运维难度较大。而BS架构无需在客户端安装专门软件,只需通过浏览器访问,不仅方便用户使用,而且降低了软件部署和更新的成本。其服务器端集中管理数据和业务逻辑,便于维护和升级,能够快速响应业务需求的变化。但是其对网络依赖程度较高,如果网络不稳定,可能会影响系统的正常使用。在处理大量数据和复杂计算时,服务器压力较大,可能会导致响应延迟,且浏览器的安全性问题可能会对系统造成一定风险,需要采取额外的安全措施。但是这种架构市面发展较为成熟,开发方便。

6总结与展望
6.1本文工作总结
如今现代社会对产品质量的要求达到了一种前所未有的高度,产品表面质量成为一个企业立足市场的核心竞争力。然而目前的工业异常检测技术仍然面临许多挑战。一方面,工业产品
