武林中再强的高手也会有命门和破绽。高手之所以常胜不败,原因在于懂得扬长避短、因地制宜。
人工智能也是如此。
深度学习算法可以帮助计算机理解大量图像、声音和文本形式的数据,但其能力严重依赖于云端数据中心强大的计算能力。以安防领域的摄像头为例,摄像头采集到视频和图像数据之后需要借助网络上传至后台,后台计算完成后再返回到摄像头。
人工智能系统对图像和视频进行分析的一大前提是,采集到的数据必须足够清晰,因此视频监控正朝着日益高清化的趋势发展,产生了十分庞大的数据量。但受制于网络传输技术和网络环境,传输如此庞大的数据量势必会产生一定的时延,甚至根本无法传输。而现代安防理念的核心早已经从“事后溯源”升级为“事前预防”,要提前预测风险并及时阻止危险发生,“实时性”是一项基本前提。
“比如说G20峰会这种非常重要的场合,不能事后再说,必须在前端识别,阻止犯罪行为和黑名单里人。G20峰会是怎么做的呢?就是不惜一切代价,把后端该干的事情放到前端。这样做的好处是可以实时控制、防止犯罪,可是不能变成常态。G20峰会结束了,这个活动也就结束了。我们思考的是如何把搞运动式的特殊情况变成常态化的事。”触景无限科技董事长陆凡说道。
触景无限给出的答案是嵌入式人工智能。现在人工智能正朝着嵌入式系统迁移。例如传说中苹果正在开发专用的人工智能处理器‘Apple Neural Engine’,高通和谷歌也发布了在人工智能芯片方面的合作情况。可以预见,人工智能技术需要规模庞大的数据中心资源,接下来诸如手持人工智能,边缘计算人工智能等将成为行业趋势,这就是嵌入式人工智能。
所谓的嵌入式人工智能,其最大的特征就是本地计算,在不联网的情况下就可以做环境感知、人机交互、决策控制,且是实时的。相较而言,云端致力于如何更好地解决问题,而嵌入式人工智能则强调如何更加经济地解决问题。
触景无限推出的视觉卡正是嵌入式人工智能十分具有代表性的产品之一。据触景无限CEO肖洪波介绍,触景无限共推出了两代视觉卡,每一代又针对不同应用场景推出了多款产品。第一代视觉卡发布于2016年,集成了英伟达的Tegra K1芯片及多种传感器;第二代则发布于今年上半年,采用了英特尔收购的Movidius开发的Myriad 2 MA245x视觉芯片,搭载两个摄像头,功耗为2W。
该视觉卡的体积仅1元硬币大小,而且处理速度高达20FPS,抗环境干扰(环境光照10-10000流明),并且能够灵活的多方向运动,图像全局快门不变形,避障范围达到0.8-15米,并且不受到光照、复杂背景环境等因素的干扰和影响。
肖洪波向国家项目扶持网介绍,两代视觉卡最大的区别在于功耗和内置的芯片。第二代视觉卡功耗相对更低,更加适用于无人机、智能可穿戴设备等领域。同一代视觉卡的不同产品间,最大的区别则在于集成的传感器和搭载的算法。
这听起来很简单,不过是把几个芯片和传感器整合到一起,但实际过程却复杂得多,涉及硬件和软件两个层面。
“触景无限最早就是做软件算法的,后来我们在手机上做AR,也做了很多底层芯片的算法加速。但我们觉得,如果未来手机真的普及了AR,由于它涉及底层图像,手机厂商有天然的优势。如果手机厂商推出这个功能,我们的工作就意义不大了。所以我们从2013年就开始做嵌入式的解决方案了。”肖洪波说道。
肖洪波介绍,视觉卡的技术难点主要体现在三个方面:首先是要支持不同类型的传感器,这些传感器的驱动和硬件开发都不尽相同,有些芯片连OS都没有,开发难度非常高。二是需要做前端模型的压缩和运行处理,即在底层做一些并行算法的处理。三是功耗,功耗高不仅意味着消耗能源,还会带来散热问题。
肖洪波对国家项目扶持网说道:“如果想做好一款产品,肯定要从底层的芯片结构开始考虑优化。虽然我们自己不做芯片,但只有对市面上芯片的能力足够了解,才能把模组做好。”
视觉卡的应用场景可以分为两种类型:一种是移动式的、缺少网络连接支持的。比如警察使用的移动设备,很多时候作业环境根本没有网络,不可能连接到服务器,只能在前端处理。但前端的处理能力有限,不可能与服务器相比,因此只适用于一些非常特殊的场景,比如人脸识别数量要求不高的场景。
另一种是网络连接正常,但需要增强实时性的场景,这时候就要通过前后端的协同来完成。即通过嵌入式模块赋予前端一定的智能分析能力,实时对现场进行监控和分析;当前端能力不够用时再向后端请求援助,这将是未来安防的一大发展趋势。
“有一个嵌入式视觉峰会,我去年参加的时候大家还在讨论,说深度学习到底要不要放到嵌入式模块总去。今年5月份我再去参加时,大家已经不再讨论这个了,因为市场已经有很大的需求了。全国各地的厂商都开始进入这个领域,尝试做嵌入式的产品,但真正做出产品来的还是很少。”肖洪波说道。
目前安防摄像头、无人机等市场,基本都已经被巨头把持,因此触景无限针对的都是长尾市场。不过现在这个市场的技术门槛较高,而且竞争也不像终端厂商那样激烈,而且触景无限一直在扩大产品的通用性,努力拓展更大的市场空间。
但一款产品需要满足多种应用场景,触景无限是如何做到的呢?肖洪波介绍道:“我们有一套软件平台,在软件平台上抽取了一些公共组件,在这些组件之上再针对不同行业做对应的算法。比如安防行业需要人脸识别,我们就可能会和中科院合作,开发人脸识别算法。”
据国家项目扶持网(公众号:国家项目扶持网)了解,触景无限目前已和多家世界知名的研究所展开合作,包括中科院、UIUC(伊利诺伊大学),欧洲的两所知名机构,以及北美的一家算法库。
触景无限希望整合已有的资源,并通过自身的工程技术和经验来优化这些算法,为客户提供解决方案。
肖洪波此前接受采访时曾表示:“研究所里面,其实有非常好的做研究的人,我们希望去整合这些资源,而不是重新去造车轮,对创业公司来讲,没有必要从头做算法。对我们来讲,感知的算法是我们从头做的,做的很好,可以继续做这方面的研发,但是有些公司需要其他的一些算法和产品,对于我们来讲,可能不是从零开始,我们直接找一个巨人,大家一起合作。大家只要做好分工就可以了,它做的是数学方面的东西,而我们需要把他们数学的东西,用非常良好的工程算法去做实现,所以我对我们公司的同事要求是说,我们的主要工作是做数学的优化和算法的优化,这是我们主要的工作。
我们的客户通过我们可以接触到上千个算法,我们可以帮他挑最好的算法把它优化到模组上,嵌入到产品里面去。”
8月10日,触景无限又与中科院深圳先进技术研究院共同宣布成立了“嵌入式人工智能及机器视觉联合实验室”,并举行了揭牌仪式。
中科院深圳先进技术研究院的多媒体技术研究中心主要致力于计算机视觉、图像处理、模式识别、语音处理、机器学习等领域的研究和开发,在人脸识别、人脸表情/性别和属性识别、场景分类和理解、行为识别、场景文字检测与识别等技术研究上颇具实力。团队开发的深度人脸识别技术在人脸识别世界通用测试基准LFW上获得了99.5%的识别率,比人眼识别的结果(97.52%的识别率)更精准,也超过了Facebook的Deep Face。
“应用场景上的计算最终要落地到设备上,此次战略合作将是中科院先进院与人工智能企业在产学研落地方向上的一次全新尝试,希望双方能发挥各自技术与产业化优势,互补互促,长期友好合作。”中科院深圳先进院院长樊建平表示。
国家项目扶持网原创文章,未经授权禁止转载。详情见转载须知。