在2016年微软Build全球开发者大会上,微软全球执行副总裁陆奇和全球执行副总裁沈向洋博士分别接受了中国记者的采访。这是他们两位华人高管在本次大会唯一一次与记者沟通的时间。作为在全面球科技巨头中数量不多的执行副总裁级别华人高管,陆奇博士和沈向洋博士都能用中文直接与记者沟通,而且两位这是以往微软高管做不到的。
对任何一个开发平台来说,最核心的竞争力就是能够帮助开发者获取收益。微软这次开发者大会的核心目标,自然也是向开发者说明自己的优势。实际上,2000美元的门票开售1分钟就被抢空,说明了开发者们对微软平台的热情。而发布一年就已经拥有2.7亿Windows 10用户,也让微软对自己未来的Windows全平台用户基数有充分的信心。
作为需要具备前瞻性的大会,微软将来的应用软件会是什么样,开发者将遇到什么挑战呢?
全球执行副总裁沈向洋博士
智能和对话 是未来应用开发的趋势
虽然互联网应用在中国如火如荼,但是我们在Build大会上看到,仍然有传统桌面应用程序的开发仍然是重要的话题。用户不仅需要手机APP的新玩法,传统的商业运营、基本的数据和文档操作仍然需要新一代的软件来支持。
在微软总裁Satya的开幕演讲中,向公众重新宣布了微软公司的三个愿景:更加个性化的计算,构建基于Windows 10的智能云平台以及重塑生产力和业务流程。而这三个方向继续发展下去,都会引入更多的创新,而且必将需要智能计算的参与,沈向洋博士确定地告诉记者。
微软在人工智能或者智能的代表作品就是内置在Windows 10里的语音助手Cortana小娜。在这次Build大会上,微软强调:对话式的机器人将在未来移动应用中成为核心交互方式。微软认为,在移动设备上自然语言是直觉而且方便的沟通方式,而且现在技术平台已经能够支持准确、高效的自然语言对话。微软提供的对话机器人(BOT)开发平台,不但支持小娜内置的对话功能,也可以让第三方根据需求开发独立的机器人应用。
微软认知服务助力应用实现智能化
在Build大会的演讲中,沈向洋博士主要介绍了微软向开发者提供的认知服务(Cognitive)开发接口。利用微软在云端提供的运算和识别能力,开发者可以让自己的应用实现理解用户表情、语音识别、自动翻译等更多智能而且人性化的功能,让计算机与人类用户的交互更顺畅,同时改善人机接口的使用体验。
“微软已经在后台进行了多年的研究,视觉和语音这两年的进展都非常大,中国的微软研究院对此作出了很多贡献”,沈博士告诉记者。他认为,智能计算不只是计算能力和算法的体现,同样重要的是能够随着终端用户的需求变化一起成长。所以有更多用户使用智能计算能力,能够提供更多反馈,对智能计算的成长和发展也是很重要的。
令人兴奋的是,沈向洋博士表示这些API接口对需要试用或者学习的开发者来说,都是完全免费的,包括接口背后的云端计算和识别能力。如果是商业软件对云端服务的需求达到了某个数量级,微软会采取收费的方式与其合作。所以对想要尝试新功能,探索人机界面创新的开发者来说,微软提供了全新的工具。
微软有自己的“助理”应用小娜,又推出了“机器人”BOT开发平台,这两者有什么区别,会不会产生冲突呢?沈向洋博士强调,这两者都是以对话为交互方式的机器人。BOT类似一个平台化的应用,帮助用户快速得到答案。而助理则是一个超级BOT,更类似你真实生活中的助理人员,对主人的信息了解更深入,甚至可能根据需求主动提出建议。
人工智能和认知能力还在初级阶段
在Build大会上,微软成功地演示了程序实时识别人脸的八种表情状态,这让开发者可以方便地了解用户状态并在应用中做出适当的反应。但是计算机真的像它表现的那样,知道我们是高兴还是沮丧吗?
沈向洋博士表示:“这一类人工智能的API(应用开发接口),实质上是以统计为基础的东西,因此必须不断进步才有意义。”所以现在的机器并不是真的理解用户的情绪,而是根据统计数据进行推测。在未来,除了对静止图片进行判断,如果能够观察一系列组合画面,或者从多个表情(心情)状态的组合来判断用户状态,或许将是更有价值的应用方向。
对于最近比较热门的人工智能奇点问题,沈向洋博士倒是不太担心。他认为人工智能技术毕竟是人开发出来的技术,和人类之间是互相帮助互相学习的过程。沈博士告诉记者,在前不久一个人工智能的会议上,主持人就曾经问过他多少年以后人工智能将会比人类强?他表示完全无法判断,如果一定要有一个数字,答案就是50到100年以后,“因为那个时候我已经不在了。”
相比强人工智能,沈博士认为现阶段我们在弱人工智能,比如认知服务(Cognitive Services)方面有更大空间,未来三到五年,机器的语音识别能力将超过人类,未来五到十年,机器的视觉识别能力将超过人类。写到这里,想到过几年手机将有可能帮我识别所有打过交道的人,不由得让笔者这样脸盲症患者激动不已。
人机交互平台还将继续发展
微软在Build大会上同时强调了两个方面的人机交互平台:基于自然语言的BOT对话系统,以及科技感极强的Hololens头戴式眼镜产品。显然,微软并不认为未来的人机界面只有一种。
沈向洋博士告诉记者,微软在Hololens产品设计上一开始就给自己设定了很高的目标,比如要求完全不接线,独立运行。现在的Hololens还有视野不足等问题,但是在初期它的目标也不是面向消费者的产品,在特定的商业领域Hololens已经能够获得很好的应用。让第一代产品能获得市场认可,并持续获得用户反馈,这就能能在后续产品上做出更符合用户需求的改进。
当前产业最热的领域之一就是VR,但微软只推出了以Hololens为代表的AR产品。沈向洋博士表示微软并没有错过VR的浪潮,实际上AR的难度要远超过VR,而另一方面,几乎所有的VR系统都需要Windows平台的支持才能运行。他说,微软最近在TED上进行了全息瞬移(Holoportation)”技术的演示,能够实时传送全息影像,实现超过视频通话的现场感沟通体验。