服务器 频道

图像识别大揭秘,SACC2017让你不虚此行!

  【IT168 评论】随着科技革命进入高速发展态势,云计算、大数据、物联网、机器学习、移动化等新技术不断涌现,并相互融合,构建了一种全新的生态,推动着整个社会向智能化方向发展。在近十年智能化的路程中,深度学习的发展取得巨大突破,这是人工领域的一大进展。深度学习在语音识别、自然语言处理、计算机视觉、图像与视频分析、多媒体等诸多领域的应用也取得巨大成功。

  此次“云智未来”2017SACC大会“图像识别技术”专场邀请了许多技术大咖和名流专家为我们分享并交流他们多年的心得体会。

  云端图像识别技术中的深度学习模型与应用

  从用户读取信息的习惯来看,相比于文字,图片能够为用户提供更加生动、容易理解、有趣及更具艺术感的信息。但目前图像技术面临三个核心难点,奇虎360的图像算法工程师李东亮在这次大会中介绍了360小水滴里面的图像技术、图像技术开发上遇到的问题,图像技术的应用框架。

图像识别大揭秘,SACC2017不虚此行!

  李东亮为我们介绍的小水滴360智能摄像机,可以通过人工智能实现求救与留言的功能。但并不需要用户自己求救,而是后台发现然后进行提示。但有个很重要的问题是,如何区分是小偷还是家人,这是很容易出现误检的,因此,对它的要求比较高。针对上述问题,360在数据、工程、模型等方面进行了优化。

  ImageNet挑战赛之后的计算机视觉新征程

  计算机视觉识别是人工智能领域的经典命题,长久以来一直受到学术界和产业界的广泛关注。随着计算机视觉识别技术的不断进步,到2017年,深度学习在常见图片的物体识别上已超过人类的识别水平。今年的ImageNet挑战赛也是最后一届了,它不但是计算机视觉发展的重要推动者,也是深度学习热潮的关键驱动力之一。这是一个时代的结束,也是新征程的开始。

图像识别大揭秘,SACC2017不虚此行!

  接下来计算机视觉会往哪里发展?慧川智能CTO表示,首先是更加精细的感知,包括物体检测、物体分割、物体跟踪尤其是复杂物体检测,小型物体分割,实时物体跟踪等。更重要的是在认知层面,通过识别物体、动作、属性、环境以及他们之间的关系来进行图像理解。应用包括图像描述,深度场景理解和识别,视频理解等。其中刘曦还为我们分享了智影(ZenVideo.cn),它是中国知名个在线的智能视频制作平台,依托于NLP、视频理解和大规模云计算技术。智影云平台能够帮助快速生成短视频,用户只需要输入脚本文字,就可以直接通过云端生成相应的视频内容,自动配音,并且用户可以在线进行编辑和修改。上线后,已经被1000家媒体使用,每日生成近600条视频。

  Intelligent Virtual Reality on Cloud

  虚拟现实和人工智能传统上被分为不同的研究社区和行业,而Visbit的CEO周昌印认为他们正在趋同。两个领域都有十分强大的计算能力,有着类似的增长模式。这种融合将导致智能虚拟现实的开始,以及更加开放和连接的虚拟世界,物体也可以演化并进行相应交互。

  VR是下一代的人机界面,而人工智能是机器的大脑,虽然许多人把他们当作割裂的两个领域,他们之间其实有许多深层次的关联。对于VR,简单的说就是人机界面。因不同的应用,可能导致不同的理解。但是总体来说,是一个VR内容生成,到VR内容消费的过程。内容的生成可以是Cg产生,也可以是由VR相机在屋里世界采集;内容的消费可以是简单的cardboard,也可以是比较高级一点点的vive等设备。

  VR与AI未来会有更多的融合。VR里所有的用户行为都是对数据的标注,可以为AI提供训练数据;而AI的结果可以通过Bot形式直接在VR中进化。

  深度学习在色情图像识别的应用

  互联网的飞速发展和信息量的猛增,不得不提的就是大量的色情图片、暴力等不良信息夹杂其中,严重影响着互联网的健康发展。尤其是现在各种直播的快速兴起,使得行业监管在内容审核方面面临比较大的困难。那么,企业针对这些技术诉求和业务痛点又是怎么做的呢?本次专场腾讯优图后台开发高级工程师谭国富为我们分享了相关的解决方案。

  传统的识别算法由于效果较差,一直是以人工审核为主,耗时耗力。但随着深度学习技术的兴起,识别算法已经有了质的飞跃,谭国富表示,腾讯优图在图像审核技术、识别技术、OCR技术、图像分割以及超分辨率等技术方面进行了加强。相应的,还有一系列的应用落地:

  Webank身份证识别、主播实名认证,方便用户快速输入证件信息;DeepEye可给出图片属于色情、性感和正常的概率,并结合三者概率给出综合分,通过分数所属区间判断图片性质。

图像识别大揭秘,SACC2017不虚此行!
OCR证件识别

  京东图片系统演进

  大家戏称京东是“卖图片的”,因为打开京东的页面呈现出来的都是图片。那么这个时候页面的加载速度就显得极为重要。京东商城的技术总监桂创华在这次的专场为我们详细介绍了京东图片系统的演进,是从图片的底层存储到上层应用server的实现,以及基于图片做的智能识别、智能排版技术。

  由于京东的618和双十一的影响,京东业务量从11-16年几乎呈现翻倍增长,图片量的增长速率更快。桂创华表示,在系统研发期间就已经考虑到了未来的图片量可能会增长很高,达到数百亿张。因此,从开源改进和从头开发这两方面入手解决。在应用方面,京东有图文属性校验、商描合规、商详页图片信息抽取等。

图像识别大揭秘,SACC2017不虚此行!
智能化图片系统

  这几年,深度学习在图像识别中的发展呈现模型层次不断加深、结构日趋复杂、海量的数据标注和适当的数据扰动的趋势,这时候的深度学习的转型在各个领域都会引起一拨儿涟漪。

图像识别大揭秘,SACC2017不虚此行!
更多信息尽在IT168现场报道专题

0
相关文章