基于Kolmogorov-Arnold网络的多模态三维目标检测算法
2025
发表期刊激光与光电子学进展 (IF:0.9[JCR-2023],0.6[5-Year])
ISSN1006-4125
发表状态正式接收
摘要

针对传统MLP模型存在的可解释性不足、神经元数量增加导致训练成本上升,以及图像与点云数据融合效果欠佳等问题,提出了一种基于Kolmogorov-Arnold Networks(KANs)的多模态三维目标检测网络。该网络以KANs为主干,设计了一种结合融合层的体素特征编码器KANDyVFE。其中,融合层采用自注意力机制动态融合图像和点云特征。此外,通过RGB图像裁剪和绘制生成彩色点云,以增强点云特征表达。在KITTI数据集上的实验表明,与基准方法相比,该网络在汽车类别的鸟瞰图检测中平均精度提升了3.78%,在3D检测中提升了3.75%。可视化结果显示,该方法在减少误报和漏检方面表现优异。实验结果验证了KANs在点云应用中的有效性,消融实验进一步证明了所提出模块带来的性能提升。

关键词深度学习 Kolmogorov–Arnold 网络 多模态融合 点云 3D目标检测
语种中文
文献类型期刊论文
条目标识符https://kms.shanghaitech.edu.cn/handle/2MSLDSTB/497030
专题信息科学与技术学院_硕士生
通讯作者李范鸣
作者单位
1.上海科技大学
2.中国科学院上海技术物理研究所
第一作者单位上海科技大学
第一作者的第一单位上海科技大学
推荐引用方式
GB/T 7714
凌言武,饶俊民,李燕,等. 基于Kolmogorov-Arnold网络的多模态三维目标检测算法[J]. 激光与光电子学进展,2025.
APA 凌言武,饶俊民,李燕,&李范鸣.(2025).基于Kolmogorov-Arnold网络的多模态三维目标检测算法.激光与光电子学进展.
MLA 凌言武,et al."基于Kolmogorov-Arnold网络的多模态三维目标检测算法".激光与光电子学进展 (2025).
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[凌言武]的文章
[饶俊民]的文章
[李燕]的文章
百度学术
百度学术中相似的文章
[凌言武]的文章
[饶俊民]的文章
[李燕]的文章
必应学术
必应学术中相似的文章
[凌言武]的文章
[饶俊民]的文章
[李燕]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。