智能语音行业观察:微软萧冰的半开放生态AI创作和商业化是否已经到来?
但就像会议本身一样,萧冰也在不自觉地走出实验室和研究机构,逐渐尝试商业化。这就是萧冰第一步的由来。经过过去的五代,萧冰从萌芽到成长,从拥有二维的框架图到二维图像,再到现在展示三维全息图像,越来越接近一个人类。
背后的技术不断迭代,生态开始成型。根据微软的说法,这次会议是萧冰情感技术框架所有部分的全面升级。从第一次登陆时的情商+智商设定,到对话式人工智能、生成模型、全双工语音,萧冰现在已经进入AI创作阶段。在生态方面,微软首次提出构建双AI半开放生态系统,差异化整合合作伙伴优势,打造萧冰专属技能和能力。
“人工智能的终极目标是‘人机协作’,用数字智能帮助人类,但这个方向有不同的路线。”微软全球执行副总裁、微软人工智能和微软研究部门负责人沈向洋表示,“萧冰团队走出了一条不同的道路。”
人工智能创造
从去年开始,微软萧冰在创作上做了很多尝试,甚至出版了一本自己的诗集。现在,萧冰将更进一步。
在发布会上,沈向洋宣布微软思考了AI创造的三个原则:其主体首先必须是智商和情商的结合,而不仅仅是智商;其次,人工智能创造的产品必须能够成为拥有自主知识产权的作品;第三,人工智能创造的过程必须对应人类的某种创造行为,而不是对人类劳动的简单替代。
萧冰的目标是成为一个高情商的机器人。“我们计划将人工智能创造作为一个新兴产业来运营。”在发布会上,微软人工智能创作事业部总经理许表示,“如果把AI创作看作是一个内容产业,而不是简单的文学创作,光有‘概念车’是不够的。从去年开始,我们开展了‘量产车’的工作。”
据介绍,在过去的12个月里,萧冰主持了21个电视节目和28个电台节目,覆盖了全国41个电视台和电台,其中包括9个各大卫视。今天,萧冰每天主持25个广播节目。在日本和中国,萧冰制作了2878小时的视听内容。
与此同时,萧冰的有声读物已经覆盖了中国90%以上的早教机器人和80%的在线游戏平台。此外,与网易新闻客户端合作的新闻阅读器萧冰,两个月前新闻阅读评论突破654.38+00万。在金融和其他相关领域,萧冰也在继续创造内容。
这背后的技术支持来自于萧冰的情感技术框架,第六代萧冰的核心对话引擎和交互感官得到了进一步升级。微软在第六代萧冰上推出了全新的通感模型,并公开测试了一种融合了文本、全双工语音和实时视觉的全新感官。
其中,通感模型是基于生成模型的对话引擎。据报道,萧冰去年完成的生成模型可以创建自己的响应,而不是从现有的对话语料库中检索。今天的通感模式进一步增强了萧冰对对话内容、领域和节奏的控制,即萧冰可以创造自己的回应来引领对话的方向。
此次全新感官的公测,融合了通感模型、全双工语音和实时视觉的对话引擎,使萧冰能够通过视觉和语音的实时持续交互,指挥用户完成人脸检测,并在此过程中进行开域对话。
此外,微软还发布了第四版DNN模式的AI歌曲。据萧冰首席语音科学家栾建介绍,该版本的模型可以快速合成与人类歌手同等质量的歌曲,还可以让萧冰自由吸收人类歌手的演唱技巧和特点,甚至可以在模仿的同时代替人类完成新作品。
然而,尽管微软提出了AI创造的原则并进行技术更新,但萧冰的行动将只是真正AI创造的开始。“根据Gartner技术成熟度曲线2017,虚拟助手成为主流还需要5-10年。”在评论AI的创造力时,Gartner研究副总裁蔡惠芬告诉21世纪经济报道记者,“这一应用主要针对智能家居设备中的个人助理或语音控制等狭窄领域,但仍需要包括针对不同领域的知识图谱构建和自然语言理解与生成等技术的完善。它仍然是一个新兴领域。”
双重AI生态
除了技术能力的升级,第六代萧冰最大的特点就是开始打造自己的生态——dual ai。
“在微软之前,业界已经有很多不同的合作生态和模式。其中,有两个最重要的模型。一种是开放赋能模式,通过提供SDK/API来构建生态系统。”萧冰产品负责人彭爽分析,“另一类是专注于自身的封闭平台,通过在平台上开设AI应用商店来构建生态环境。”
双AI不一样,更类似于半开放的生态。“在这样的生态环境下,一方面,微软将直接负责产品体验,掌控与用户直接接触的最具体的产品细节。另一方面,我们不是封闭在自己的平台上,而是在对外联系,甚至直接整合到第三方平台。”彭爽说。
之所以这样选择,是因为另外两类生态各有各的问题。其中,封闭模式极大地限制了数据的自由流通,违背了AI的本质。因为无法获得迭代所需的基础数据,很难快速迭代,发挥升级的优势。
在开放的赋能模式中,无论赋能谁,赋能谁,都是一种相对松散的关系,“也就是说,没有人真正对最终的产品体验负责。”比如目前火热的智能音箱,实际体验普遍低于预期,恰恰是因为配合松散导致的问题。
同时,由于开放使能生态中的API/SKD强调通用性,也在一定程度上限制了最新最好技术应用的时效性,通过这样的接口或工具包得到的数据不一定是最好的。
在合作过程中,萧冰也在探索自己的盈利模式。目前,萧冰已经推出了四个商业领域,包括金融、流行文化、媒体和出版。“我们讨论了各种AI盈利模式,最终发现它们分为两类。一类是用AI技术以更低的成本取代人类的低并发和高并发工作,比如内容制作”,李迪告诉21世纪经济报道记者。“二是AI与人类的协作,通过提高协作转化率来实现共享。”