网站公告:
诚信为本:市场永远在变,诚信永远不变。
全国服务热线:0898-88889999

TELEPHONE

联系我们 CONTACT US
手机:
16306281261
电话:
0898-88889999
邮箱:
admin@e6541.com
地址:
内蒙古自治区锡林郭勒盟蒙自市文赛大楼31号
行业资讯INDUSTRY
当前位置: 首页 > 行业资讯
从图像识别到物体识别:9393体育APP入口官方网站
发布时间:2024-12-21 03:12:01 点击量:144
本文摘要:在增强现实(AR)与自动驾驶的时代到来之际,3D数据呈现出爆炸式快速增长。

在增强现实(AR)与自动驾驶的时代到来之际,3D数据呈现出爆炸式快速增长。在旋即的将来,处置3D数据的算法将应用于像机器人自动巡弋、基于AR的智能用户界面等应用程序上。不受此灵感,我们在Matroid公司所著的论文明确提出了FusionNet,这一框架用作在一个取名为PrincetonModelNet的标准数据集上做到3DCAD物体分类。  FusionNet的核心是全新的、应用于3D物体的三维卷积神经网络(ConvolutionalNeuralNetworks,CNN)。

我们必需在多个方面调整传统的CNN以使其有效地。为了说明得确切些,我们不妨再行看一下用作图像分类的二维CNN。这个思路是,机器学习研究者不会建构数个隐层构成的模型,每一层与前一层都以有所不同的形式相连。

在第一层,你不会享有一个在二维图像上滑动的一块窗口区域作为输出。因为这个区域继续执行了卷积操作者在窗口滑动时它交错其上,因此它被称作卷积层。其后还有几层有所不同形式的隐层,最后一层用作预测潜在的输入;每一种输入对应着图像标示中的某种分类。

在ModelNet40Challenge数据集中于,不存在40个分类,因此模型中最后一层有40个神经元。第一类有可能是猫,第二类有可能是车辆,以此类推迭代数据集包括的所有分类。

如果第一个神经元在40个中唤起的最得意,那么输出样本就不会被判断为第一类,一只猫。  整个模型假设输出是图片形式,即二维数据。你该如何将它扩展到三维呢?一种有可能的方法是,就像显示器表明三维物体那样,再行把物体通过投影处置成二维图像,然后在其上运营标准的二维CNN算法。

实质上,现在在PrincetonModelNetChallenge数据集上已递交的拟合算法的思路是,把任何3D物体在多个角度上对物体展开一组2D投影展开像素传达,然后用于卷积神经网络。FusionNet显然也基于像素传达用于了CNN,但关键是,它同时还减少了一种新式的三维CNN。  与在二维图像上滑动一个区域有所不同的是,我们可以在物体上滑动一块三维空间了!在这种传达之下,没适当做到投影这一步。这种方法用体积传达来处置物体。

  在我们的体积传达中,3D物体被线性化作30*30*30的体素(译者录:volumepixel,文中全称voxel)网格。如果物体的任何部分坐落于1*1*1的体素中,就给体素赋值为1,反之则赋值为0.与之前的工作有所不同的是,我们在自学物体特征的过程中同时中用了像素传达和体素传达,这种方法对分类3DCAD物体而言,比分开用于其中一种要好。其中一些例子如下:  图1.两种传达.左图:浴缸、低脚凳、坐便器与衣橱的2D投影。

右图:体素化之后的浴缸、低脚凳、坐便器与衣橱.感激RezaZadeh获取图片  我们创建了两种处置体素数据的卷积神经网络(V-CNNI与V-CNNII),以及一种处置像素数据的网络(MV-CNN).右图表明了这些网络是如何融合在一起工作,并得出对于物体分类的最后辨别的。处置2D图像的标准CNN就不一样了,它们不能从图像中学到一些空间局部特征。


本文关键词:9393体育APP入口,9393体育APP入口官方网站,9393体育APP入口网页版登录入口,9393体育APP入口手机APP下载,9393体育APP入口在线登录入口,9393体育APP入口官网登录入口

本文来源:9393体育APP入口-www.e6541.com