热点:

    旷视科技:四大基石演绎AI+ 3D的全栈感知

      [  中关村在线 原创  ]   作者:赵珏

        对于影像的映射,人类的记录方式可追溯到旧石器时代晚期的洞窟壁画,而这一行为另一核心目的即是如何辨别猎物以及为生存积累经验。

        公元650年左右,当最早的油画艺术作品出现在阿富汗巴米扬窑洞上时,其才真正从历史上开启了融艺术与生活的影像展现,接着便是造纸术、工笔画、银幕、屏幕,直至当前人手一部的智能手机终端。

        关于当前人们对于影像的需求,显然,智能识别以及3D立体沉浸式的体验正在成为主流演进路线。

        因为对于绝大多数用户来说,影像的体验既要具备主动思考式的交互过程,更要有身临其境的感知。

        用3D感知全栈方案赋能全行业

        其实这对于AI和3D技术而言,即是创新也是挑战。

        重点在于,无论是何种应用服务呈现3D视觉效果,软硬一体且一条龙式的全栈方案无疑承载了包括行业用户、消费级用户对于应用、算法、终端升级等一切优化的期许。

        所以,当首个“软硬一体”的移动端3D感知全栈解决方案,亮相旷视科技3D视觉产业先锋研讨会时,业界再次被旷视科技这一领先人工智能企业的眼界与智慧折服。

        这套方案所包括的算法创新、应用开发、设备制造、解决方案四大层面分别阐释了旷视科技最新、最全面的“AI+3D”发展脉络,可以说,它贯穿3D感知落地的全生命周期整体环节。

    旷视科技:四大基石演绎AI+ 3D的全栈感知
    旷视科技高级副总裁吴文昊

        在了解3D感知全栈解决方案之前,旷视科技高级副总裁吴文昊强调其公司对于计算机视觉发展方向。

        在他看来,三大方向决定了“AI+3D”的发展脉络:首先是深度学习联系最紧的识别与感知,即手机具备更智能的识别和感知能力,例如根据场景不仅能识别脸部特征,更能适应用户身体的温度,用户所有一切都被手机所识别和感知;

        其次,计算摄影,其能够根据软件和算法反向驱动硬件的设计,传感器设计、光学设计,实现AI Define Camera的发展路径。实际上,这也从侧面证明了旷视科技所看到的未来十年甚至更长的发展核心,即围绕软件深度开发能够带动硬件变化的核心竞争力。

        要知道,用技术融合产品价值一直旷视科技所倡导的发展理念,其把AI+3D定位于一种赋能者角色,赋能行业应用方案,使得产品随之变化,更加智能,进而去挖掘更多的附加价值。

        第三,3D视觉,通过计算机本身的识别能力+3D,智能终端可以基于感知思维实现全方位的立体呈现效果。

        基于此,旷视科技3D感知全栈解决方案便从上至下贯穿了应用、算法、方案、硬件四大基石,整合3D产业链上下游资源、打造软硬一体的整体解决方案赋能行业。

        3D 应用上,旷视研发的3D人脸识别解锁和3D人像光效应用已经实现了大规模的应用,从OPPO 3D结构光人脸识别方案到vivo在上海MWC期间发布的TOF 3D 超感应技术背后的3D人脸建模算法,加上其在业内开发出的全面可用的安全支付、3D 美颜、3D 整形等应用。一套全面的3D应用框架牢牢的嵌入在手机终端之上,旷视科技从上层应用端开启了自上而下的发展布局。未来,旷视将投入到AR游戏、虚拟试穿等应用上,持续探寻3D能为手机带来的更多能力。

        其次,在3D 算法上,旷视专注于识别和重建两个大类。识别怎么理解?以人脸识别技术为例,它实际上需要检测、跟踪、比对等环环相扣的识别能力,其实这背后也要求3D 算法提供商能够具备深厚的感知学习技术能力。

        基于旷视自研的MegBrain深度学习引擎,旷视在人脸识别、人体识别、活体检测、注意力检测追踪及其他图像识别的算法层面拥有业界顶尖的技术实力。

        关于重建,旷视科技将识别出的物体进行三维重建,这其实就是开发针对人、针对物的3D视觉应用核心所在。旷视目前已在人像3D建模、人体3D建模及物体几何测量算法研发方面走在世界前列,并与Bellus 3D、Altizure等3D视觉企业开展了联合研发合作。

        解决方案:在旷视科技看来,未来3D视觉解决方案的落地一定离不开各种不同的应用场景,与场景的特点不断调整变化。旷视及合作伙伴根据不同应用场景中对深度计算、深度修复、深度优化、标定、畸变校正等能力的需求,设计出基于双摄、三摄、深摄的丰富解决方案,在整合结构光、TOF、双目等不同的摄像、传感系统架构上拥有成熟的应用经验。

        生态构筑3D应用未来发展大平台

        本次研讨会,旷视同时邀请到了包括Bellus 3D、深圳珠科创新技术有限公司(Altizure)、叠境数字科技、艾迈斯半导体一同畅谈3D视觉产业的发展大计。

        吴文昊强调,旷视科技未来的发展目标之一就是联合软件、硬件、算法、应用,让3D视觉从技术到产品的落地速度进一步提升。

        “生态这件事我很有体会,我们有一个开放平台Face++,是目前最大的人脸视觉开放平台,有数十万的开发者。苹果的优势在于闭源,可以把闭源威力发挥的作用最大。安卓最大的威力是开放,首先要有开放的心态,有开放的API,有这样的平台再去Work。这是安卓生态最要解决问题的要点”。吴文昊强调。“由此,基于开放的生态体系,Face++很愿意跟大家一起打造上面的应用,共同发展”。   

        “我想一定会持续往上升,真正要产生后续的生态,不能光靠解锁,其新鲜感过去了,3D的价值不局限于解锁”。Bellus3D的CEO Eric Chen强调,当前3D产业的技术和硬件研发进入快速发展期,研发3D扫描器不再像以前一样昂贵、难做,3D应用或许现在还没有展现完整清晰的面貌,但未来人手一台三维扫描器后每个人都将成为应用的开发者,创造无限可能。

        在Altizure 的联合创始人兼CEO方天看来,Altizure平台主要通过计算机视觉技术来识别图片中的信息,加以人工智能以及深度学习技术来实现二维图像到三维模型的建立工作。

        自2015年上线以来,Altizure已经和众多大型工程企业合作为其提供项目工程的三维建模服务,帮助提高建筑效率和质量。

        关于生态合作发展,Altizure将在户外运动、旅游、游戏、影视、三维打印,自动驾驶、高精度地图等领域,联合行业合作伙伴一起继续三维建模技术和应用的创新研发。

        与其他企业不同,来自上海的叠境数字科技则致力于通过光场技术于研发虚拟现实、增强现实、3D成像等多个领域的应用。叠境数字科技联合创始人兼CEO洪煦介绍,光场是指光在空间中辐亮度的空间和方向分布,人眼观察世界就是个不断收集周围光场信息的过程,叠境研发了一整套光场重建系统来实现更加逼真的3D建模。

        “光场技术相比于其他三维建模技术来讲比较新颖,但却在动态建模和建模逼真度上拥有显著优势,光场技术在VR、AR领域具有巨大的应用价值,叠境目前已经通过自主研发的结合人工智能技术的光场系统,在构建更加真实的VR场景和AR效果上取得众多成果。” 洪煦介绍道

        参会的除3D技术企业外,还有全球领先的高性能传感器解决方案提供商艾迈斯半导体。艾迈斯半导体在3D和光学传感领域拥有先进的研发制造实力,近年更是不断加大在光学、成像领域的投入,以持续保持手机市场应用的第一位置。

        艾迈斯半导体大中华区销售和市场副总裁陈平路认为:“艾迈斯半导体过去一年营收增长的70%都主要来自于手机市场,其中手机3D摄像模组的应用贡献了巨大力量。此外,艾迈斯半导体在中国的业务也实现了300%的增长,也是得益于中国手机市场对传感模组的需求增长。艾迈斯非常注重与旷视这样的人工智能企业合作,以不断加强自身传感设备在人工智能和3D多个领域的领先性,为中国更多手机厂商提供更优质的硬件制造服务。”

        随着对场景的深入探索、 3D 数据的开发及传感设备的升级,这种结合将在更多领域产生不可思议的3D应用创新。而对于旷视而言,其最重要的事情便如前文所述,通过整合行业上下游资源,将软硬一体的智能3D解决方案应用在更多行业领域,让3D真正进入到人类世界的各个角落。

    本文属于原创文章,如若转载,请注明来源:旷视科技:四大基石演绎AI+ 3D的全栈感知//smb.zol.com.cn/695/6956013.html

    smb.zol.com.cn true //smb.zol.com.cn/695/6956013.html report 5930 对于影像的映射,人类的记录方式可追溯到旧石器时代晚期的洞窟壁画,而这一行为另一核心目的即是如何辨别猎物以及为生存积累经验。公元650年左右,当最早的油画艺术作品出现在阿富汗巴米扬窑洞上时,其才真正从历史上开启了融艺术与生活的影像展现,接着便是造纸术、工笔...
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错