百度为AI开发者所铺的路,远比想象中的要长

  • Post author:
  • Post category:IT
  • Post comments:0评论

作为 2017 年度人工智能领域最具看点的大会之一,昨天的百度开发者大会引发行业的广泛关注。一方面,这是百度整体战略转向人工智能之后的首次集中展示,另一方面,也是人工智能历经一个甲子(1956——2016起起伏伏。尤其是过去一年多以来的媒体热炒之后,人工智能的发展方向在哪里?又会在哪些领域取得突破以及开发者们又该如何正确看待这个「新兴」领域以及背后的技术、商业价值.....

上述问题或许并不能在此次大会上找到直接的答案,但却为解决上述难题找到些许线索。比如,一个完整的人工智能开放平台对于开发者的重要性到底意味着什么?又或者,在百度全面转型人工智能之际,百度、行业合作伙伴以及众多开发者的角色变化,都会成为未来观察人工智能发展的窗口。

可以想象,此次大会宣布对AI基础能力的进一步开放,开发者、创业者、行业伙伴将如虎添翼,让人工智能技术赋能更多场景,创造更多价值。

正如百度副总裁、百度AI技术平台体系(AIG)总负责人王海峰在会上所言:从 PC互联网时代开始,互联网就是一个开放的生态。人工智能也应该秉承这种开放的精神,更重要的是人工智能技术不仅应用于互联网,它会对各行各业有更广泛的影响。

从这个角度说,人工智能技术不仅仅属于互联网或某一家公司,而是属于我们全人类。因此,开放AI技术满足开发者和合作伙伴不同层次的需求,让人工智能技术变得更好,一起去建设属于AI的生态,属于我们所有人共同的更美好的AI的未来。

人工智能的发展离不开开放与产业生态

人工智能诞生于上世纪 50 年代中期,这是一门从学术领域引出的研究课题。随着计算机行业的快速发展,人工智能研究也进入到一条快车道,但研究倘若没有商业化的驱动,无论是其研究速度还是研究成果,都很难真正转化为技术成果造福人类。

回首计算机的发展历史,半导体技术的革命当然离不开贝尔实验室那群伟大发明家无私的奉献,但同样也离不开包括仙童、英特尔等商业公司的巨大努力。从这个角度去看,只有当人工智能以及研究者们真正走出学术圈,以开放的心态拥抱计算机行业、互联网行业的时候,才是其真正崛起的时刻。

第二,互联网给人工智能研究带来海量的数据。当下人工智能最火的领域毫无疑问就是深度神经网络算法的突破,而这一算法的发展离不开互联网的海量数据以及廉价、高效的计算能力,这也是互联网公司尤其是擅长数据的处理互联网公司能够快速切入人工智能的原因所在,纵观海内外,掌控流量入口的百度、Google,掌控社交入口的 Facebook以及掌控电商入口的亚马逊、阿里,对于人工智能都具有不小的话语权。

第三,人工智能从来不是一个学科,但却正在成为一种基础设施,这是人类历史上又一次技术变革带来的重大机遇。在这个宏大的历史背景中,没有一家商业公司轻言可以一家独大,围绕每个细分行业与垂直领域,人工智能所扮演的都是底层驱动者的角色,在全新的行业分工里,有底层人工智能开放平台提供者、有中层技术提供商,还有最直接面对客户(消费者)的应用开发者。

过去几年,底层人工智能平台开放的潮流势不可挡,Google、Facebook、百度先后加入其中。然而,对所谓「AI开放平台」的理解的不同,不同公司在所谓「开放」上所做的事情也有诸多不同,比如 Google 、FB 的开放策略更多集中在底层算法或单点突破,与之相对的,此次百度对于开放的思考,则走了一条更具探索精神的道路。

百度的AI开放策略有哪些不同?

正如上文所言,一个完整性的AI开放平台到底意味着什么?早前,李彦宏就曾在百度世界大会上宣布开放「百度大脑」的核心能力及底层技术,这构成了开放平台的第一阶段:算法层。

此次开发者大会上,包括感知层、认知层等在内的五大类、14项核心技术全面开放,由此也扩大了AI开放平台的第二阶段,同时也让开放平台更具完整性——从底层算法到主打听懂、看懂的感知再到知识图谱、用户画像的认知——这个完整的AI开放平台能够满足开发者们多层次、多样化的需求。

以用户画像为例,目前已拥有近十亿用户画像、千亿级别的细分标签。庞大的用户群和丰富的数据量,为百度深刻了解每一个用户打下基础,同时也为广大开发者提供了更准确获取目标用户的能力。

其次,在当下人工智能最具应用价值的语音和计算机视觉层面,百度此次发布了多个值得关注的技术。以语音为例,基于语音开发生态里的远远场识别及唤醒技术、定制化语音合成、语音合成音色、 Emotional CUI(ECUI)等技术,可以帮助开发者快速构建一个听清声音的产品模块。

更进一步,则是在自然语言处理技术之上,百度推出了理解与交互平台,这是一个让机器具备理解声音的开放平台,开发者可以利用该平台,实现对采集语音的情感分析、词法分析、机器翻译等多个功能。换句话说,开发者们可以在上述语音平台上完成语音从「听清」到「听懂」的一站式开发需求。

过去几年,动态影像已经成为互联网用户内容生产、消费的重要组成部分,特别是 VR、AR 正在从概念落地到部分产品中,用「视频吃掉世界」来形容这个时代其实也一点不为过,在巨大的需求面前,摆在开发者面前的难题就是:如何利用人工智能让机器看懂视频,从而创造全新的创业、创新领域。

为此,百度此次大会期间推出的视频理解技术就显得很合时宜。这项技术包括视频分割、语义理解以及极其重要的应用方向机器人视觉,拥有全球首个室外语义分割 RGBD 视频数据集,同时还将上线视频细粒度识别技术,这意味着开发者们能拥有像处理静态图片那样处理视频,完成从视频识别、分割到视频内容理解的全流程化处理。

想象一下,当机器从「看清影像」到「看懂影像」时,开发者们可以多大的「魔力」,比如,视频颗粒度技术能识别上千种菜品,那么,开发一个在餐厅行走的机器人怎么样?

另外不得不提的一点,在百度全面转型人工智能的这个时间点上,从技术价值到商业价值的转化正在加快,这对开发者们来说更是一个好消息,当你基于一个开放技术平台完成产品的技术创新升级之后,其商业化的考量同样重要。

以基于视觉的 AR 为例,此次大会上百度的发布了一款名叫 DuMix AR 的开放平台,不仅提供了 AR SDK、内容制作工具等关键技术,还将在内容分发上有诸多探索,未来,开发者们或许能将自己辛苦开发的产品直接利用百度各个内容分发产品实现商业化变现,这里的想象空间非常大。

属于中国人工智能开发者的最好时代

长期以来,无论是计算机行业还是互联网,其话语权都掌握在硅谷的巨头公司手中。但到人类步入 2017 年,这个 iPhone 诞生的第十个年头,由 iPhone 引发的移动互联网浪潮中,中国的互联网公司们已成弄潮儿,从移动支付到社交、电商、O2O,不断创新的商业模式反过来又进一步推动了技术的快速发展,某种意义上说,移动互联网的时代,是属于中国的时代。

而人工智能时代则更进一步。与移动互联网的发展路径十分类似,人工智能时代里,商业模式的演化、产业结构的升级改造,都急需技术的变革,正如本文开篇所言,人工智能正在演变为一项全新的技术基础设施,百度所扮演的,正是底层人工智能技术赋能者的角色,基于一个完整、开放的技术平台,越来越多的开发者们将具备化腐朽为神奇的「魔法」,越来越多的行业也将享受到这些「魔法」带来的红利。这是属于人工智能的中国时代,也是属于中国人工智能开发者的最好时代。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

发表回复