从图像识别到物体识别：9393体育APP入口官方网站

Transport Line 运输线路

联系我们 CONTACT US

手机：: 16306281261

电话：: 0898-88889999

邮箱：: admin@e6541.com

地址：: 内蒙古自治区锡林郭勒盟蒙自市文赛大楼31号

行业资讯INDUSTRY

当前位置：首页 > 行业资讯

从图像识别到物体识别：9393体育APP入口官方网站

发布时间：2024-12-21 03:12:01　点击量：144

本文摘要：在增强现实(AR)与自动驾驶的时代到来之际，3D数据呈现出爆炸式快速增长。

在增强现实(AR)与自动驾驶的时代到来之际，3D数据呈现出爆炸式快速增长。在旋即的将来，处置3D数据的算法将应用于像机器人自动巡弋、基于AR的智能用户界面等应用程序上。不受此灵感，我们在Matroid公司所著的论文明确提出了FusionNet，这一框架用作在一个取名为PrincetonModelNet的标准数据集上做到3DCAD物体分类。　　FusionNet的核心是全新的、应用于3D物体的三维卷积神经网络(ConvolutionalNeuralNetworks，CNN)。

我们必需在多个方面调整传统的CNN以使其有效地。为了说明得确切些，我们不妨再行看一下用作图像分类的二维CNN。这个思路是，机器学习研究者不会建构数个隐层构成的模型，每一层与前一层都以有所不同的形式相连。

在第一层，你不会享有一个在二维图像上滑动的一块窗口区域作为输出。因为这个区域继续执行了卷积操作者在窗口滑动时它交错其上，因此它被称作卷积层。其后还有几层有所不同形式的隐层，最后一层用作预测潜在的输入；每一种输入对应着图像标示中的某种分类。

在ModelNet40Challenge数据集中于，不存在40个分类，因此模型中最后一层有40个神经元。第一类有可能是猫，第二类有可能是车辆，以此类推迭代数据集包括的所有分类。

如果第一个神经元在40个中唤起的最得意，那么输出样本就不会被判断为第一类，一只猫。　　整个模型假设输出是图片形式，即二维数据。你该如何将它扩展到三维呢？一种有可能的方法是，就像显示器表明三维物体那样，再行把物体通过投影处置成二维图像，然后在其上运营标准的二维CNN算法。

实质上，现在在PrincetonModelNetChallenge数据集上已递交的拟合算法的思路是，把任何3D物体在多个角度上对物体展开一组2D投影展开像素传达，然后用于卷积神经网络。FusionNet显然也基于像素传达用于了CNN，但关键是，它同时还减少了一种新式的三维CNN。　　与在二维图像上滑动一个区域有所不同的是，我们可以在物体上滑动一块三维空间了！在这种传达之下，没适当做到投影这一步。这种方法用体积传达来处置物体。

　　在我们的体积传达中，3D物体被线性化作30*30*30的体素(译者录：volumepixel，文中全称voxel)网格。如果物体的任何部分坐落于1*1*1的体素中，就给体素赋值为1，反之则赋值为0.与之前的工作有所不同的是，我们在自学物体特征的过程中同时中用了像素传达和体素传达，这种方法对分类3DCAD物体而言，比分开用于其中一种要好。其中一些例子如下：　　图1.两种传达.左图：浴缸、低脚凳、坐便器与衣橱的2D投影。

右图：体素化之后的浴缸、低脚凳、坐便器与衣橱.感激RezaZadeh获取图片　　我们创建了两种处置体素数据的卷积神经网络(V-CNNI与V-CNNII)，以及一种处置像素数据的网络(MV-CNN).右图表明了这些网络是如何融合在一起工作，并得出对于物体分类的最后辨别的。处置2D图像的标准CNN就不一样了，它们不能从图像中学到一些空间局部特征。

本文关键词：9393体育APP入口,9393体育APP入口官方网站,9393体育APP入口网页版登录入口,9393体育APP入口手机APP下载,9393体育APP入口在线登录入口,9393体育APP入口官网登录入口

本文来源：9393体育APP入口-www.e6541.com

上一篇 : 一文看懂变速器的核心工艺与定位方式“93...

下一篇: 低功耗M2M市场广阔芯片设计如何降耗|9...

[返回列表]