360安全人工智能:让一切物联网产品自学习

2016-04-18 09:39:26来源:铅笔道 热度:

Oh~ 今天的铅笔道有一个别致的小标签,是“2016中国企业服务峰会”的合作媒体,还是名单中的第一名,有些小紧张,感谢主办方IDG、36氪对我们的宠幸。
  
这次大会,也是铅笔道的首秀了,第一次驻场报道如此规模的峰会活动。在北京751时尚设计广场79罐,我们有一个大约6平米的精美小展台,美女帅哥记者已经驻场,报道本次活动。
  
活动的参会嘉宾业务多为企业级服务,如SaaS服务商金蝶云、纷享销客等;数据服务商GrowingIO、聚合数据等;安全服务商安全狗、青藤云安全、四叶草安全等。
  
这篇文章主要介绍360在人工智能方面的产品类型(人脸识别、车辆、人体分析),以及研究进展。以下为360人工智能研究院院长颜水成会上分享内容:
  
我们的产品类型
  
非常高兴能有机会跟大家分享360在人工智能方面的状况和进展。大家都知道360是一家以安全起家的公司,在过去的11年中,安全一直是我们最基础的基因。
  
过去这些年,360从电脑安全转移到手机安全,最近开始关注企业安全。
  
在互联网大环境下,公司把安全的概念进行了一个延展,进入大安全时代。所以除了传统的线上安全,也很关注线下安全。
  
线下安全业务主要有3方面:1、面向小孩安全。主要是发展穿戴式的设备;2、关注家庭和家人的安全,主要是智能家居。3、关注出行安全,主要跟车辆有关的安全问题,如信息安全、车联网安全以及驾驶的安全。
  
所有东西合在一起,我们希望给每个人都带来一种安全的感觉。
  
在这种大安全的策略下,公司希望把人工智能作为安全的磐石,逐步打造面向大安全的安全智能。对一个公司来说,如果要很好地应用人工智能,有3个关键要素:1、有大标注的数据;2、有人工智能的前沿算法;3、需要大的计算平台。
  
总的来说,360的人工智能有2个阶段。第一个阶段,我们希望从0到1,即在不同产品线上使用。第二个阶段,从1到N。意思是我们希望人工智能的技术不只是可以使用,也可产生一定的技术意义。
  
360有很多面向线下安全的智能硬件产品。为了让这些产品更好地智能化,我们有很多人工智能的技术研发。比如人脸识别、车辆、人体分析等。也有其它应用领域,如语音分析,面向企业安全的网络流分析等。
  
人脸识别
  
人脸识别技术在很多应用中非常重要,比如“小水滴”,它需要家人有很好的监控,比如识别是家人还是陌生人,其行为是否正常等。
  
在人脸分析方面,我们做了很多研究。在过去半年,我们主要让高性能的算法快速跑起来,也就是说能以非常快的速度在产品端使用。
  
在人脸检测方面,我们主要解决两个问题,一是人脸的不清晰,如说遮挡、模糊、姿态和光照,我们团队当前主要是针对有遮挡的脸,提出了专门的模型,在数据库上有很好的技能,现已达97%的准确率。
  
我们的算法上主要是想解决人脸上有很多点可能被遮挡的情况,当前在300W的人脸分析上取得了不错的结果。
  
人脸识别场景化也非常关键。比如对互联网图片的人脸识别,如互联网金融方面,需把拍摄的照片和身份证照片匹配。这种场景和360的应用场景有比较大的差别,我们比较关心在小水滴领域,在家庭领域的人脸识别。这样的话数据就变得非常关键,如果有好的测量方法,用比较少的数据就能取得相应好用的性能。
  
车辆与人+大数据
  
下面是车辆和人的分析,我们团队在物体的检测和识别方面取得了很不错的成绩,他们经验的积累,对算法的打磨,让模糊无法识别的概率从74%降至9.6%。在人和车非常复杂的背景情况下,它可以基于双目方案对人和车进行精确定位。
  
我们同样在视觉感知方面做了一些进展,因为面向这种智能家居,只是视觉感知还是不够的,也要在语音和语义方面有不错的进展,比如云识别的错字率如果能降到1%,它就能比较好地支持语音输入,语音的搜索、语音对话。另外是今后学习的方向:语音的唤醒,对于智能硬件,如手表、智能摄像头等设备,语音唤醒还是非常重要的。
  
除了这一块,我们在大数据方面也有较好的积累和铺垫。我们企业安全部的同事用堆栈式的服务,可对网络上的网络流进行协议识别和应用识别。比如在网站随意截取一个网络流,即可预测出它所发送协议,发送运程。这是非常有价值的互联网信息。
  
基于深入学习的人工智能,训练的平台可能已经非常普及了。公司的技术从0到1的转变可能性也变得很大。但人工智能或者技术的发展最关键还是怎么产生技术壁垒。
  
360最近有两个重点:1、重点发展端上的智能,因为端上的量肯定要比云上的量高很多,而且会有各种端出现。
  
要发展端上的智能化,可用编译的专用芯片,但用这种方式,它肯定会让产品的价格有大幅度提升。所以这绝对不应该是唯一途径,也就是说让端上建立技术壁垒的话,要在算法上降低计算量。
  
打比方说1×1的卷积,它就能设计出高效的网络。最近的微软产品,把256级做3×3的卷积,就是9的量级,如果能用1×1把256做成64家,就有4×4的降低,这对于端上是非常有价值的。
  
另外,端上的小模型,可能精度上会有损失,但是如果运用大量数据的话,就会在某种程度上弥补精度的损失。
  
当然,它绝对不会成为技术壁垒,真正的技术壁垒是在不减少技术的情况下有精度的提升。这也是360研究院在极力发展的方向。
  
综合来说,奔跑在CPU上的编译绝对是以后端上重要的发展方向。
  
自学习能力
  
另外一个非常重要的方向:怎么样让人工智能的系统具备自学习的能力。
  
很多应用真的没办法标注数据,比如自动驾驶,一般的企业没有办法搜集到各种场景下的数据。
  
但如果系统在运行的过程中能够自主学习、自主搜集信息,那它的性能肯定就可以逐步增强。
  
另一方面,在端上我们只能有轻量级的计算,如果能自主学习的话,之后就可以保证在端上达到计算目的,因为个性化服务不是服务所有的人,这样的话小模型就有比较好的针对性。
  
此外,自主学习完全有自主性,一方面当一辆车在路上行驶的时候,就可根据上下文推导出哪些是人,哪些是车。特别是家里的机器人,如果能逐步积累一些位置,检测出一个人,如果能把这些样本做增益样本的话,那么机器人的性能就会自主增强。
  
我们的最终目的是希望这些物联网的产品有自主学习的功能,最后变成懂我的互联网产品,而不是互联网产品到了家里,变成一个Fix的东西。
  
最后做一个小的总结,在360这种大安全的策略上,现在人工智能技术已经逐步地运用到很多产品中,同时也进一步证明了人工智能有很多新的产品形态正在打磨,我也敬请大家期待360有更多的人工智能的产品服务于普通的老百姓。
 

责任编辑:高娟

为您推荐

应给物联网植入人工智能的基因

从09年起在全球范围内出现物联网的概念,代表信息化发展方向。物联网(TheInternetofthings)的概念是在1999提出的,它的一般定义是:把所有物品通过射频识别(RFID)、红外感应器、全球定位系统(GPS)、激光扫描器等信息传感设备与互联网连接起来,进行信息交换和通讯,实现智能化识别、定位、跟踪、监控和管理。2005年11月17日,在突尼斯举行的信息社会世界峰会(WSIS)上,国际电信联盟(ITU)发布了(ITU互联网报告2005:物联网》,正式提出了“物联网”的概念。报告指出,无所不在的“物联网”通信时代即将来临,世界上所有的物体从轮胎到牙刷、从房屋到纸巾都可以通过因特网主动进