欢迎光临机器视觉网
免费注册
用户登录
首页
新闻
企业动态
行业热点
宏观报道
案例
镜头
相机
传感器
采集卡
光源
传输及线材
系统产品
智能设备
解决方案
软件算法及深度学习
集成及工业计算机
机器人及机械臂
3D产品
行业综述
其他
产品
专访
供求
培训
视觉工程师认证课程
师资团队
培训资讯
下载
论文
招聘
书刊
报告
标准
展会
会员
联盟简介
联盟章程
联盟架构
联盟理事
入会申请
会员服务
在线调查
联盟党建
联盟活动
会员公告
会员企业
在线视频
Menu
导航
首页
新闻
返回
企业动态
行业热点
宏观报道
案例
返回
镜头
相机
传感器
采集卡
光源
传输及线材
系统产品
智能设备
解决方案
软件算法及深度学习
集成及工业计算机
机器人及机械臂
3D产品
行业综述
其他
产品
专访
供求
培训
返回
视觉工程师认证课程
师资团队
培训资讯
下载
论文
招聘
书刊
报告
标准
展会
会员
返回
联盟简介
联盟章程
联盟架构
联盟理事
入会申请
会员服务
在线调查
联盟党建
联盟活动
会员公告
会员企业
在线视频
首页
>
论文
类别:
全部
专家综述
技术前沿
专业论文
展开
标签:
全部
机器视觉
图像处理
机器人
人工智能
模式识别
其他
展开
重置
基于邻域像素注意力机制的光场深度估计方法
通过发掘深度信息与子孔径图像邻域像素间的高度相关性,提出了一种基于邻域像素注意力机制的光场深度估计方法。首先根据光场图像的数据特性提出了一种邻域像素注意力机制,该注意力机制考虑了不同子孔径图像在同一邻域间的极几何关系,能够增强网络对遮挡像素的感知能力。其次基于注意力机制设计了一个光场子孔径图像序列特征提取模块,该模块通过三维卷积将相邻序列图像上的特征编码到特征图上,并通过注意力机制增强网络对光场图像极几何特征的学习能力。最后联合邻域像素注意力机制和特征提取模块设计了一个多分支的全卷积神经网络,该网络使用部分光场子孔径图像序列即可估计图像的深度特征。实验结果表明,所提方法在均方误差(MSE)和平均坏像素率(BP)指标上总体表现优于其他先进方法,同时得益于高效注意力机制的加入,与其他先进方法相比所提方法运行速度最快。
专业论文
2025-04-25 | 图像处理 | 模式识别 |
771
基于物理方程的高分辨率光场层析粒子图像测速技术
提出一种基于物理信息神经网络(PINN)的高分辨率光场层析粒子图像测速(PIV)技术,在稀疏速度场观测数据基础上耦合Navier-Stokes方程作为先验物理信息,建立PINN-PIV融合模型,实现对致密流场信息的预测。对于所构建的模型,首先采用高斯涡环的仿真数据对其性能进行了评估,然后开展了圆柱绕流三维流场测量实验,以进一步验证PINN-PIV融合模型的有效性。结果表明,采用PINN-PIV模型所预测的高斯涡环u、v、w位移分量的全局均方根误差分别为0.2433、0.2105、0.2423voxel,较传统互相关算法结果降低了52.36%、58.95%、75.84%。从圆柱绕流流场测试结果可以看出,PINN-PIV模型能够将光场PIV流场测量分辨率提高8倍,实现了流场小尺度漩涡结构的表征。
技术前沿
2025-04-18 | 机器视觉 | 图像处理 |
1161
视点密度渐变的大视角三维光场显示
随着虚拟现实技术的日趋成熟,三维光场显示(3D-LFD)逐渐成为研究和产业的焦点,其能够为观众带来无需外部辅助设备的真实立体观看体验。尽管3D-LFD技术展现出广阔的应用前景,但在实际应用中仍面临众多技术难题。视点密度是影响3D-LFD还原度的关键因素。为了提升视点密度,传统方法通常需要增加信息总量,这会使得系统复杂度加大。为此,提出了一种视点密度随观看视角渐变的3D-LFD。该方法在不增加显示面板像素总量的前提下,结合用户的观看习惯和显示深度,为中心观看区域提供所需的密集视点,同时适当降低边缘观看区域的视点数。设计了一种主光线密度渐变的复合透镜阵列(GDLA),能够实现视点密度从视区中心到两侧渐变的分布。结合与视点分布匹配的光场采集与编码方法后,实现了观看视角为100°,视点密度由中心到两侧从2.5个/(°)到1个/(°)渐变的三维光场显示。
技术前沿
2025-04-18 | 图像处理 | 模式识别 |
1096
基于光线模型的成像系统标定与三维测量进展
标定是成像系统执行精准视觉测量的基础,其目的在于确立三维空间物点与传感平面像点的映射关系。区别于传统的小孔透视模型,主要介绍一种光线模型用于对成像系统的标定与测量。
技术前沿
2025-02-13 | 机器视觉 |
1550
基于局部最大梯度与最小强度先验的光场图像去模糊
空间三维重建在遥感、军事、航空航天等多种领域均有着重要应用。其中,光场成像技术被广泛应用,为了使三维重建更精确,需要对光场成像的每个平面清晰成像。因此,提高光场图像的像质是解决空间重建的关键。
专业论文
2025-01-06 | 机器视觉 |
1702
基于视觉语言模型的导航框架VLMnav,实现端到端导航
本文提出了一种将视觉语言模型(VLM)转换为端到端导航策略的具体框架。不依赖于感知、规划和控制之间的分离,而是使用VLM在一步中直接选择动作。惊讶的是,我们发现VLM可以作为一种无需任何微调或导航数据的端到端策略来使用。
技术前沿
2024-12-25 | 机器视觉 |
2458
1
2
3
4
5
6
7
最后一页
推荐论文
基于邻域像素注意力机制的光场深度估计方法
基于物理方程的高分辨率光场层析粒子图像测速技术
视点密度渐变的大视角三维光场显示
基于光线模型的成像系统标定与三维测量进展
基于局部最大梯度与最小强度先验的光场图像去模糊
基于视觉语言模型的导航框架VLMnav,实现端到端导航
* 请登录会员后进行操作
会员登录
用户名
密码
忘记密码?
登录
新用户注册账号