已经是语音AI的领跑者,科大讯飞为何还要做视觉AI?

在昨天的10月24日,第二届世界声博会暨2019科大讯飞全球1024开发者节在安徽合肥开幕,本届大会的规模再创历届之最,吸引了来自全球各地的参与者。而作为科大讯飞总部,合肥这个低调的非网红省会城市也再度迎来了高光时刻。

笔者受邀参与了本届大会,到达第一天笔者就在科大讯飞1024开发者节现场发现,有一款特别的设备吸引了许多参会者的驻足体验。它可以迅速识别各种违禁品,帮助安检人员智能判图,让参会者在高峰期能够秒过安检,缓解安检通道压力,为会场安全保驾护航,它就是科大讯飞X光安检图像智能识别系统。

据现场人员介绍,科大讯飞X光安检图像智能识别系统与传统依赖人工判图的X光安检不同,科大讯飞为X光安检图像的目标检测专门研发了一套新型检测技术。基于神经网络的深度学习,将安检图片结构化处理,进行特征提取,解决图像目标识别难点,可高效、精准地检测所有目标。这就相当于在X光安检机上装上了孙悟空的火眼金睛,人工智能辅助判图,系统识别率可达90%,能够实时、精准识别各类可疑液体、易燃易爆物品、各类刀具、枪支等29种50多类违禁品。

简单的来说,就是让人工智能代替人眼去发现X透视下影像中的危险品,科大讯飞已经实现90%了高识别率,可见提升效率,提升生产力的作用将非常明显。而据笔者分析,90%识别率的这个难度在AI计算机视觉领域其实蛮大的,因为X透视后的图像完全没有色彩和立体轮廓,仅凭一张相当于2D平面的光谱图让人工智能去识别,还要识别出真实物体,达到较高可实用的准确率。

据笔者从科大讯飞内部人士处获悉,科大讯飞这套X光安检图像智能识别系统并不是实验室阶段产品,它已经在一些大型活动、轨交铁路、机场海关、快递物流等多个领域进行应用。

值得注意的是,科大讯飞一直以来是以语音AI而蜚声业界的,目前是全球屈指可数的语音AI,普通用户也通常能够接触到其消费级语音AI产品,比如智能翻译机、听见智能转写机、智能和学习机等产品,但这些都是主打语音AI领域。而此次亮相的X光安检图像智能识别系统是基于视觉AI的技术,是AI领域的计算机视觉技术,和很多人对科大讯飞主打语音AI的印象不同。

实际上,科大讯飞并非只专注于语音AI领域,据网络上公开信息,科大讯飞其实在2016年以前就已经布局视觉AI领域,早期主要由科大讯飞研究院推进。

科大讯飞做视觉AI不是最早,但进展惊人。据悉在今年6月份举办的计算机视觉与模式识别国际会议举办的物体检测挑战赛上,科大讯飞在机器视觉定位和视觉识别能力项目上夺得冠军。在文档分析与识别国际会议举办的数学公式识别挑战赛上,科大讯飞包揽了在线手写数学公式识别、离线手写数学公式识别两项任务冠军。在场景文本视觉问答比赛上,讯飞团队在全部三个赛道中均大幅超越对手,取得了第一的好成绩。

其实在人工智能的计算机视觉领域,行业里的明星级独角兽玩家众多,像商汤、旷视等。那么作为语音AI领域的领跑者,科大讯飞为什么会还要去涉足玩家众多的视觉AI领域?

笔者认为主要原因首先是一个人工智能技术应用场景本身的问题,因为未来的人工智能交互方式必须是包含语音交互和视觉交互这两个方面的。

笔者在参与科大讯飞轮值总裁胡郁的群访时获悉,科大讯飞坚持专注于人工智能领域,其业务方向可以从水平和垂直两个方向来讲,除了现在外界关注在做最擅长的语音AI这个垂直领域以外,科大讯飞还有很多的人工智能技术,比如说视觉AI、自然语言理解和超脑技术。

胡郁认为科大讯飞将来的整个商业生态系统,它应该是个多样化的,用户通过各种不同形态的智能硬件在人工智能的环境下建立连接。科大讯飞希望通过AI人工智能平台,来实现整个的基础设施基础层面上的一些工作,去为用户、开发者和合作伙伴赋能。

可以看出,科大讯飞在人工智能领域拥有着更大的野心,不仅在专注于语音AI,已经进入了人工智能领域的多条赛道,从垂直领域的深挖到水平方向的拓展。

而我们看到目前AI智能硬件与机器人领域,国内市场虽然正在走向收获期,但还未到达完全的成熟期,如果希望从中获利,首先需要广阔的市场空间和成熟的上下游产业链。因此我们也看到了科大讯飞在人工智能等方面的广泛参股投资,包括一部分机器人及智能硬件公司外,还有产业链上下游的公司,例如科大讯飞已经参股了视觉AI独角兽商汤科技、智能机器人公司优必选、智能芯片厂商寒武纪等等。

而如今在人工智能领域的创投资本预冷,巨头的影响力更加凸显。虽然科大讯飞现阶段在体量上不如谷歌、百度或亚马逊这样的巨头,但毕竟拥有深厚的积累和行业领先优势,随着盈利能力的提升和落地场景的日渐清晰化,人工智能产业正在走向收获期,科大讯飞未来依然值得期待。

0 Shares:
发表评论

邮箱地址不会被公开。 必填项已用*标注

你可能也喜欢