最新刊期

    2025年第71卷第4期

      综述

    • 数字化学习中认知负荷智能化评估研究进展 AI导读

      智能技术发展推动数字化学习,认知负荷智能化评估成研究热点。专家梳理机器学习、深度学习算法在评估中的应用,探索大语言模型潜力,为高效学习提供帮助。
      刘娟, 胡雪莲, 王军豪, 刘清堂, 付雅瑄
      2025, 71(4): 427-441. DOI: 10.14188/j.1671-8836.2024.0211
      摘要:随着智能技术的飞速发展,数字化学习的逐渐普及为学习者们提供了多样化的资源和途径,然而这一学习方式在丰富学习体验的同时也对学习者的认知负荷带来了复杂的挑战。传统的认知负荷测量方法存在过程性不足、动态监测缺失以及即时反馈缺乏等精准度方面的问题,因此,认知负荷智能化评估逐渐成为研究的热点。智能化评估通过结合生理指标,利用机器学习与深度学习等非侵入性技术手段,实现对学习者认知负荷的精准评估。本文系统梳理了支持向量机、随机森林、线性判别分析等传统机器学习算法,以及前馈神经网络、卷积神经网络、长短期记忆网络和混合模型等深度学习算法在认知负荷智能化评估中的应用,探讨数字化学习中认知负荷智能化评估的启示和发展方向,并探索了大语言模型在认知负荷智能化评估中的潜力,旨在为高效的数字化学习提供帮助。  
      关键词:数字化学习;认知负荷;智能化评估;机器学习;深度学习   
      100
      |
      64
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 91987167 false
      更新时间:2025-08-28

      人工智能与深度学习

    • 运动约束增强的可见光惯性紧组合定位系统 AI导读

      在室内定位领域,可见光惯性紧组合定位系统有效提升了遮挡和倾斜情况下的定位精度,平均精度达10.27厘米。
      庄园, 韩旭, 孙骁, 姜家乐, 周嘉升
      2025, 71(4): 442-452. DOI: 10.14188/j.1671-8836.2024.0111
      摘要:可见光定位(VLP)由于其低成本、高精度、现有基础设施大量部署等优点而在室内定位研究与应用中受到广泛关注。然而,VLP系统在接收端倾斜或被遮挡的情况下定位性能严重下降。针对这一问题,设计了一个可见光惯性紧组合定位系统。该系统引入惯性测量单元以估计接收端倾角,从传感器原始观测层面进行滤波融合以削弱遮挡的影响,并通过附加运动约束来增强定位性能。系统在实际测试中平均定位精度达10.27 cm,在遮挡和倾斜情形下相比纯VLP精度分别提升了35.34%和63.19%,综合性能优于现有方法。  
      关键词:室内定位;可见光定位;惯性导航;紧组合系统;运动约束   
      54
      |
      60
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 77047359 false
      更新时间:2025-08-28
    • 基于改进YOLOv8模型的交通标志检测方法 AI导读

      在交通标志检测领域,研究者提出了基于改进YOLOv8模型的新方法,通过引入注意尺度序列融合机制和增加小目标检测层,有效提升了多尺度信息提取能力和小目标检测性能。同时,采用RT-DETR检测头和inner-mpdiou损失函数,显著提高了模型训练效率和精度。实验结果表明,该方法在保证实时性的前提下,平均精度高达84.0%,相较于YOLOv8模型提高了7.1%,整体模型大小降低了12.9%,有效提升了低分辨小目标检测的有效性。
      余荣威, 张逸轩, 曹书明, 王丽娜
      2025, 71(4): 453-462. DOI: 10.14188/j.1671-8836.2024.0077
      摘要:当前交通标志检测方法主要依赖单阶段深度学习算法构建的目标检测模型,存在检测精度低、模型通用性弱等问题。为解决这类问题,提出一种基于改进YOLOv8模型的交通标志检测方法。该方法通过引入基于注意尺度序列融合的机制,提升了神经网络对于多尺度信息的提取能力;通过增加小目标检测层,使得方法更适用于小目标检测;采用RT-DETR的检测头,通过解耦尺度内交互和跨尺度融合高效处理多尺度特征。此外,为了克服现有交通标志检测方法在弱泛化方面的局限性,提高包围盒回归的准确性和效率,采用一种全新的损失函数inner-mpdiou,有效提高了模型的训练效率和精度。基于清华-腾讯100K(TT100K)数据集的实验结果表明:在保证实时性的前提下,该方法平均精度高达84.0%,相较于目前国际主流YOLOv8模型,提高了7.1%,整体模型大小降低了12.9%,提升了低分辨小目标检测有效性。  
      关键词:小目标检测;交通标志检测;YOLOv8;低分辨率;损失函数   
      317
      |
      223
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 77116446 false
      更新时间:2025-08-28
    • GMambaScanX:基于双流并行的三维人体姿态估计 AI导读

      GMambaScanX在三维人体姿态估计领域取得突破,通过GCN和Mamba双流并行方法,有效提取人体结构特征,提高模型效率。
      汤昊霖, 袁煜麟, 卢笑, 汪鲁才, 吴成中, 王耀南
      2025, 71(4): 463-472. DOI: 10.14188/j.1671-8836.2024.0143
      摘要:基于Transformer的模型通过编码所有的关节点之间的连接关系,捕获全局视野的数据依赖关系,因而在三维人体姿态估计任务中取得了优秀性能。然而这类方法无法对关节局部依赖关系进行建模,且存在模型计算复杂度随序列长度平方增长的计算资源浪费问题。为了解决上述问题,本文将人体运动过程定义为状态空间模型的序列输入和输出过程,提出基于GCN(Graph Convolutional Network)和Mamba双流并行的人体结构扫描三维姿态估计方法GMambaScanX,GCN模型对人体运动序列时空邻接关系进行建模,增强模型的局部依赖关系捕获能力。Mamba模型对人体运动序列时空长程关系进行建模,增强模型的全局依赖关系捕获能力,提出两种MambaScan扫描策略,针对人体运动状态转移特征的时序关节扫描,增强模型在时间维度对人体运动特征的理解能力;针对人体关节结构特征的人体结构先验引导的空间关节扫描,增强模型在空间维度对人体结构特征的理解能力。GMambaScanX在Human3.6M数据集上进行训练验证,平均关节位置误差为39.8 mm,参数量仅为MotionBERT的12.4%(5.3×106)。相比于进行全连接建模,GMambaScanX能够更好地提取人体结构特征,高效使用参数,提高模型的有效性与效率。  
      关键词:三维人体姿态估计;状态空间模型;图卷积网络;人体结构关节点扫描   
      112
      |
      93
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 82681553 false
      更新时间:2025-08-28
    • 基于多尺度与多级语义融合Transformer的人体姿态估计 AI导读

      在人体姿态估计领域,MMSF模型通过多尺度与多级语义融合,提高了估计精度,降低了模型复杂度。
      李俊, 袁通达, 陈黎
      2025, 71(4): 473-484. DOI: 10.14188/j.1671-8836.2024.0094
      摘要:针对人体姿态估计任务中视觉Transformer模型存在的尺度多样性受限和近距离信息忽视问题,提出多尺度与多级语义融合Transformer(MMSF)模型。该模型通过引入关键点标记作为代理的交叉Transformer操作,实现了不同分辨率视觉信息的相互学习,提高了估计精度。同时,利用深度卷积和稠密连接复用标记技术,有效提取了含有多级语义信息的交叉标记,减少了编码器层堆叠,降低了模型复杂度。通过交叉标记与标准标记的交叉融合注意力操作,整合了多级语义信息,进一步增强了姿态估计效果。实验结果表明,在相同的条件下,MMSF模型在COCO数据集上达到了78.1%的平均精度,比TokenPose基准模型高2.3%;在MPII数据集上验证了其有效性,与近几年经典的基于Transformer的人体姿态估计方法相比取得了更好的性能。  
      关键词:视觉Transformer;人体姿态估计;深度卷积;标记融合;交叉注意力   
      197
      |
      149
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 73304322 false
      更新时间:2025-08-28
    • 融合大语言模型和证据抽取的事实核查模型 AI导读

      在不实信息核查领域,研究者提出了融合大语言模型和证据抽取的事实核查模型,有效提升了事实核查的准确度。
      何富威, 张仕斌, 卢嘉中, 李晓瑜
      2025, 71(4): 485-494. DOI: 10.14188/j.1671-8836.2024.0067
      摘要:基于事实信息的核查是目前不实信息核查研究的主流方法,但现有研究成果还存在文档检索中抽取的文档内容与待检测声明相关度不高、证据检索中忽略了句子间的内在联系以及声明验证中小语言模型的逻辑推理能力不足等问题。基于此,提出了一种融合大语言模型和证据抽取的事实核查模型。为提高待检测声明与文档内容的相关度,提出了DRCV(Document Retrieving for Claim Verification)文档检索算法;为了从文档中提取与声明最相关的句子作为证据,构建了“文档-声明对”训练证据检索模型,提出了基于关键词-注意力机制的证据检索方法;为增强模型的逻辑推理能力和提高事实核查的准确度,开发了基于大语言模型的声明验证模型,该模型选取参数量从5亿至1 300亿的七款大语言模型对声明进行验证,并利用其逻辑推理能力核查声明的事实性。基于真实数据集对提出的事实核查模型进行仿真实验,结果表明该模型进行事实核查的准确率比仅使用大语言模型高0.1%~34.0%,且比现有效果最好的模型准确率高1.8%。  
      关键词:虚假信息检测;证据抽取;事实核查;大语言模型   
      196
      |
      241
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 75895085 false
      更新时间:2025-08-28
    • 基于语义引导注意力和多任务学习的图文情感分析 AI导读

      在社交媒体大数据背景下,专家提出了基于语义引导注意力和多任务学习的图文情感分析方法,为理解用户情感倾向提供解决方案。
      冯松, 胡慧君, 刘茂福
      2025, 71(4): 495-505. DOI: 10.14188/j.1671-8836.2024.0099
      摘要:在社交媒体和在线平台产生的大数据背景下,图文情感分析成为了一个重要的研究任务,对于理解用户情感倾向至关重要。现有方法通常局限于模态的单层次特征,缺乏对图像多层次情感信息的理解,并且在多模态特征融合时容易产生信息冗余和特征偏移,导致模型效果不佳。针对上述问题,提出了一种基于语义引导注意力和多任务学习的图文情感分析方法。通过多尺度特征提取模块捕获图像的多层次情感信息,利用语义引导注意力融合与文本情感信息相关的图像信息,在多任务学习模块中引入情感聚焦校准任务来最小化融合特征与其情感质心的距离。在三个社交媒体数据集上的实验结果表明,该方法在图文情感分析任务中优于其他现有方法。  
      关键词:图文情感分析;多尺度特征提取;语义引导注意力;情感聚焦校准;多任务学习   
      169
      |
      246
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 69591319 false
      更新时间:2025-08-28
    • 基于BERT的面向多情感字符级信息的文本情感分类方法 AI导读

      在文本情感分类领域,专家提出了基于BERT的多情感字符级信息注意力方法CBSA,通过整合字符级信息和情感来源信息,显著提高了情感预测准确性。
      王董祺, 杨洪山, 黄勃, 何传鹏, 高志荣, 刘瑾
      2025, 71(4): 506-516. DOI: 10.14188/j.1671-8836.2024.0028
      摘要:当前基于深度学习的文本情感分类方法尚未充分利用字符级信息和情感来源信息,仍有改进空间。因此,提出了一种基于预训练模型BERT的面向多情感字符级信息的注意力方法(Character-BERT-Sentiment-Attention, CBSA)。该方法通过捕捉字符级信息丰富文本语义信息,拼接融合BERT预训练的单词级向量,得到语义向量,然后将上下文词与4种情感来源信息(情感词、否定词、程度副词、连接词)整合到门控循环单元(Gated Recurrent Unit, GRU)神经网络中,通过注意力机制构建融合情感资源信息的句子表示,最后通过Softmax分类层预测情感极性。该方法对字符级信息与多情感来源信息进行提取,获得来自不同表示子空间的情感相关信息,从而使情感预测更加准确。在5个数据集上的实验结果表明,本文提出的方法在分类准确性上有了明显的提高。  
      关键词:情感分类;Bert;字符级信息;融合向量;注意力   
      139
      |
      11
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 89920912 false
      更新时间:2025-08-28

      信息安全

    • 基于对比学习的域名生成算法加密流量检测技术 AI导读

      在加密DNS通讯领域,EDGAD方案提升了DGA流量检测的实时性、准确率和泛化性,有效识别7种DGA恶意软件,准确率达到98.07%。
      朱蓓佳, 李娜, 陈晶, 何琨, 杜瑞颖
      2025, 71(4): 517-525. DOI: 10.14188/j.1671-8836.2024.0034
      摘要:为进一步提升在加密DNS(Domain Name System)的通讯场景中,DGA(Domain Generation Algorithm)流量检测的实时性、准确率和泛化性,保障计算机通信安全,提出了一种域名生成算法加密流量检测方案——EDGAD(Encrypted Domain Generation Algorithm Detection)。EDGAD由数据预处理和流量分类两个模块构成。预处理模块通过流量簇划分策略和高效特征集减小开销。流量分类模块包含两阶段分类模型,其中阶段一采用二分类模型将DoH(DNS over HTTPS)流量分为DGA流量和非DGA流量;阶段二基于对比学习思想构建多分类模型,识别DGA加密流量所属的具体DGA软件。此外,阶段二中还设计了流量样本增强方法,以及对比学习模块和多分类模块联合调优方法,以提升模型泛化性和训练效率。在采用1 s流量数据构建特征的数据集实验中,选择XGBoost模型作为阶段一的二分类模型,并将阶段二中缩放参数确定为0.25。实验结果表明,EDGAD能有效识别7种DGA恶意软件,准确率达到98.07%,平均精度均值达到0.981 3,较对比方案分别提升了1.24个百分点和0.013 6。  
      关键词:机器学习;流量分析;异常检测   
      137
      |
      227
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 64957463 false
      更新时间:2024-11-11
    • 高维广义Arnold变换的量子图像置乱算法 AI导读

      在量子图像加密领域,专家提出了基于等比数列的高维广义Arnold变换量子图像置乱算法,验证了其可行性,具有较大密钥空间和抗攻击能力,满足密码学要求。
      邹玮刚, 杨火根, 张朝全
      2025, 71(4): 526-538. DOI: 10.14188/j.1671-8836.2024.0124
      摘要:针对低维规则矩阵加密算法系数变化不灵活、高维加密矩阵难以构造的问题,提出一种基于等比数列的整数矩阵获取的高维广义Arnold变换的量子图像置乱算法。构造两个行列式等于1的高维整数矩阵,通过传统的矩阵乘法运算得到高维广义Arnold变换矩阵,再基于通用彩色量子图像表示方式,将高维广义Arnold变换矩阵应用于量子图像加密过程中。构造了高维广义Arnold变换矩阵的逆矩阵,并应用于图像解密。该算法变换公式类型丰富,可以生成维度很高的加密矩阵,研究以24位真彩色图像加密为例,验证了该算法的可行性。仿真实验结果表明,该算法具有较大的密钥空间,提高了密钥的随机性,具有较好的抗攻击能力,能满足密码学的要求。  
      关键词:量子图像处理;量子图像加密;量子图像表示模型;高维几何变换;等比数列;广义Arnold变换   
      45
      |
      42
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 82455676 false
      更新时间:2025-08-28

      面向知识图谱和大模型的工业软件

    • 基于邻域信息与嵌套注意力的知识图谱补全 AI导读

      最新研究进展表明,基于邻域信息与嵌套注意力的知识图谱补全方法,有效提升了工业领域模型预测准确性,同时保持较低参数量。
      戴宇凡, 熊玉洁
      2025, 71(4): 539-548. DOI: 10.14188/j.1671-8836.2024.0152
      摘要:随着工业系统的复杂性和智能化需求的增加,知识图谱在工业领域的应用越来越广泛。知识图谱的补全对于优化业务流程、提升决策质量和实现系统自动化具有重要意义。然而,现有的大多数补全方法在分析工业实体之间关系时,仅考虑节点本身的相似性,未能充分利用节点邻域的丰富信息,限制了对节点关系的关联推断。为解决以上问题,提出一种基于邻域信息与嵌套注意力的知识图谱补全方法。首先,获取三元组的邻域信息,进行对应的词嵌入,组合得到邻域信息表示和三元组表示;然后将获取的特征向量进行嵌套注意力编码,使结构特征得到稳定保持;最后通过内积解码器,实现对图谱缺失关系的补全。在三个数据集上进行了实验,结果显示,模型预测准确性得到提升,同时保持了较低的参数量,为知识图谱补全任务提供了一种兼顾模型规模和预测准确性的方法。  
      关键词:知识图谱;知识图谱补全;知识推理;Transformer;注意力机制   
      39
      |
      24
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 112223082 false
      更新时间:2025-08-28
    • 基于改进YOLOv8n模型的芯片点胶检测算法 AI导读

      在芯片点胶检测领域,专家改进YOLOv8n模型,提出SPA-KG算法,提升检测速度和精度,满足工业需求。
      潘安理, 范涛, 侯世维, 黄璞, 黄勃
      2025, 71(4): 549-559. DOI: 10.14188/j.1671-8836.2024.0155
      摘要:针对芯片点胶运动状态下外观不良检测中存在速度慢、精度低和推理能力不足问题,对原始YOLOv8n模型进行了改进;基于改进的YOLOv8n,提出一种融合知识图谱和改进YOLOv8n的检测算法SPA-KG(Self-Position Attention-Knowledge Graph)。对YOLOv8n的改进表现在:在坐标注意力(Coordinate Attention,CA)的基础上设计SPA注意力,SPA注意力能够更充分地学习小目标的细节信息;在主干网络与特征融合网络中分别引入轻量化卷积模块GHOSTConv与AKConv(Adaptive Kernel Convolution),并且使用SIMSPPF(Simplified Spatial Pyramid Pooling-Fast)改进空间金字塔池化,降低模型的参数量,提升检测速度,结合α-IoU与EIoU设计α-EIoU损失函数,提高算法的定位能力与识别精度。实验结果表明,SPA-KG的平均精度均值达到96.7%,精确率达到94.2%,召回率达到94.0%,参数量达到2.58×106,检测速度达到107.7帧/s。本文提出的SPA-KG达到了工业检测需求。  
      关键词:外观检测;知识图谱;YOLOv8n;注意力机制;机器视觉   
      43
      |
      39
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 110088367 false
      更新时间:2025-08-28
    • 基于时序大语言模型的污水处理排放指标预测 AI导读

      在水资源保护领域,SSP-GLM模型通过深度学习技术,有效提升了再生水排放指标预测的准确性,为工业污水处理智能化管理提供技术支持。
      陶怡, 王飞, 马玲娜, 歹杰, 严栋飞
      2025, 71(4): 560-572. DOI: 10.14188/j.1671-8836.2024.0168
      摘要:污水处理厂作为水资源保护的重要设施,其核心任务之一是监控和预测再生水的排放指标。由于污水排放数据具有高复杂度和场景一致性差等特点,传统的时序预测方法效果有限。为此,提出一种新型工业时序预测模型SSP-GLM(Sewage-oriented Serial data Processing Generative Large Model),该模型通过将时间序列划分为子序列,利用深度卷积神经网络(CNN)提取局部特征,并结合生成式大模型(GLM)进行时序推理,提高了预测准确度。基于西安市两处污水处理厂的真实出水数据进行了实验,采用均方误差(MSE)和平均绝对误差(MAE)作为评估指标。结果表明,SSP-GLM在全量样本和小样本学习场景下均优于GRU、DLinear和Autoformer等基线方法,特别是在小样本条件下,其对复杂时序特征的捕捉能力显著增强。SSP-GLM在不同污水处理厂的数据上展现出良好的泛化能力,为工业污水处理的智能化管理提供了有力的技术支持。  
      关键词:工业软件;污水处理指标预测;生成式大语言模型;时序模式预测   
      105
      |
      43
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 100416576 false
      更新时间:2025-08-28
    • 极端复杂条件下水电站大坝变形的生成式智能分析 AI导读

      在水力发电领域,专家提出了基于大语言模型与马尔可夫概率逻辑生成式神经网络的智能分析方法,为水电站大坝结构设计和材料选取提供参考。
      王勇飞, 薛一博, 田凌云
      2025, 71(4): 573-579. DOI: 10.14188/j.1671-8836.2024.0173
      摘要:针对地处高山峡谷的水力发电设施在长期运行过程中遇到极端复杂条件下结构变形的国际前沿问题,在对水电站大坝变形特性成因分析以及水电站大坝长期运行特性研究的基础上,结合近十年来多维度实时监测传感网络获取的水电站大坝基础设施变形数据,提出了一种基于大语言模型(LLM)与马尔可夫概率逻辑生成式神经网络相结合的生成式智能分析方法。利用大语言模型的强大语义理解和生成能力,优化了水电站大坝变形数据的特征提取和相关性分析,提升了模型对复杂条件下多因素相互作用的准确性。该方法应用于大渡河瀑布沟水电站大坝基础设施受极端天气、地质灾害及大渡河湍流突变等复杂条件影响下的大坝主体工程以及特殊骨架和大型装置的位移等潜在重大隐患问题的精准预测预报。大量实验验证表明,极端复杂条件下,结合大语言模型和知识图谱的马尔可夫概率逻辑生成式神经网络可以准确识别水电站大坝基础设施不均匀的变形特性,并能挖掘大坝各部位因内力相互作用在形变过程中的互相影响。通过与知识图嵌入方法进行比较,准确率存在较为明显的提升。该方法为我国后续水电站修建过程中结构设计以及各部位材料选取提供了参考。  
      关键词:大语言模型;知识图谱;马尔可夫概率;水电站基础设施;极端复杂条件;生成式智能;传感网络;知识图嵌入   
      41
      |
      11
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 103971957 false
      更新时间:2025-08-28
    • 在时间序列预测领域,研究者提出了mWKN-HAGRU时序预测方法,显著提升了船舶柴油机冷却水系统性能参数预测性能。
      郭宝, 甄诚, 王佳懿, 钟凯
      2025, 71(4): 580-588. DOI: 10.14188/j.1671-8836.2024.0133
      摘要:为了提升GRU (Gated Recurrent Unit)模型对时间序列的特征提取与预测能力,提出一种多尺度小波核驱动的混合注意力网络(mWKN-HAGRU)时序预测方法。该模型通过调整小波核函数的尺度参数,从多个粒度提取时间序列中隐藏的状态信息,为后续的预测模型提供丰富的特征输入;设计了一种混合注意力门控循环单元(HAGRU),其中,时间局部注意力可以定量刻画不同特征对预测性能的影响并学习序列间的长期依赖关系,空间全局注意力能够有效捕捉特征间的信息交互,有助于全面表征不同序列之间的空间相关性和演变规律。真实船舶柴油机数据集中的实验结果表明,所提方法显著提升了冷却水系统关键性能参数的预测性能。  
      关键词:多尺度小波核;混合注意力;门控循环单元;时序预测   
      86
      |
      110
      |
      0
      <HTML>
      <网络PDF>
      <引用本文> <批量引用> 77218384 false
      更新时间:2025-08-28
    批量引用
    0