微论坛:移动互联网使语音互动门槛急剧降低

来源:互联网 发布:手机淘宝优惠券在哪里 编辑:程序博客网 时间:2024/05/01 08:53

微论坛:移动互联网使语音互动门槛急剧降低

2012年03月15日12:26
转播到腾讯微博
20期腾讯科技微论坛现场

20期腾讯科技微论坛现场(腾讯科技配图)

腾讯科技讯 3月15日消息,昨晚,讯飞副总裁江涛和智能360联合创始人李传丰做客20期腾讯科技微论坛(组图),就语音互动相关话题展开讨论。

江涛表示,在国内,使用语音互动的习惯还需要有个培养的过程。语音跟位置服务相比,其语音个性化会更强大。

李传丰说,语音云如同十年前第一代门户网站,如新浪搜狐大概是几十万美金的估值,十年后以腾讯、百度为代表。“十年之前都是用户量,就是互联网享受互联网成果的是几千万级别。以后进入移动互联网时代,特别是语音的出现之后,将使这个门槛急剧降低,以后文盲可能都能享受这个成果。人数越多,这个市场越大。”

“现在语音云很大的问题是怎么去噪音,随着技术的提升,包括硬件、软件,以及相关的共同努力,是能够有一个比较大的进展。”李传丰如此强调。

而江涛不看好手机指令和语音搜索。在他看来,现在大部分手机已经实现了双麦克风降噪,一个是降噪,一个是检测信号的,互相来抵消,将来不排除三麦克风或麦克风阵列来降噪,这是难点所在。

以下为微论坛文字实录:

主持人:大家好,这里是腾讯科技第20期微论坛,感谢今天到场各位,我是主持人杨忠雄。

今天微访谈现场的主题是“声音遥控世界--语音互动技术时代揭秘”。请到的第一位嘉宾是科大讯飞副总裁、北京讯飞董事长江涛先生,另一位是智能360的创始人李长丰。

首先,今天先请大家看段视频(现场大屏幕播放电影《铁甲钢拳》语音遥控格斗机器人的片段);电影中很精彩地展示了未来语音互动的想象,那么显示中语音互动技术是怎么样呢?首先抛出一个问题给讯飞的江总,有请江总给大家分享下。

江涛:大家好,我是科大讯飞江涛,很高兴来到腾讯科技微论坛现场。首先我想给大家展示PPT资料,讲下语音技术的现状。(播放PPT)

主持人:谢谢江总,就这个问题,下面有请第二位嘉宾,智能360的创始人李传丰。

李传丰:我们最初做语音360,现在开发产品叫做智能360。

主持人:我先打断一下,此360是一个360,不是彼360。

李传丰:我们智能360大概是1月15号推出来,到现在有一个多月的时间用户总量,加上前期少量语音360积累突破百万了,大概两个月的时间。所以江总那个用户量飞速增长也有我们的一份功劳。

主持人:也就是李传丰的产品用的江总的KPI来提供服务?

江涛:用的讯飞语音云上的语音听写服务,讯飞语音云目前大家用得比较多的就是语音、听写,我们叫语音转写,还有语音合成。目前的语音云主要提供这三项功能。下一步新发布的语音云提供哪些功能,只有到3月22号来说了。

主持人:我们期待3月22号的大会。我们接下来进入下一个环节,我们想看好一下,语音技术未来是品牌化,还是插件化,因为大家知道前两年有一个非常好的技术LBS服务,当年进入中国的时候非常火,有特别多的创业者。当时就讲LBS到底能做成很大的品牌,还是能够成立一个插件,到现在答案非常明显了,包括有很多微博都把LBS变成一个插件了。我们今天的话题就是说冲着这个方向探讨一下,语音的未来会怎么样?

江涛:我觉得首先要分析一下语音跟位置服务的区别了,不同点几乎每个应用都能用上,因为每个应用,移动互联网应用都有一个位置相关的要素,这一点来说是有普遍的共性。差别在什么呢?最重要的一点,我觉得语音个性化会更强大,我们稍微提前透露一下,我们这次3月22号发布其中有一项就是个性化的语音合成、语音识别。现在用的都是通用,我手里拿着用是一样的,3月22号发布新品是不一样的,会更加个性。通过这个技术让大家很明显看出来这是一个大家资源共享的平台。

主持人:传丰,您是创业者,也是应用了江总他们的技术的创业者。下一个问题想问一下你,你用了讯飞的语音云,你用了他们的语音转化,核心的技术在江总那边。你们做的工作是什么?

李传丰:李开复(微博)之前也发了一个微博,说很多创业者要做私有云,有一堆困难,觉得创业者不要做这块。我们今天江总说晚上7点半在车库咖啡有一个展示。首先把声音转换成文字,就是江总他们做的。但是具体是什么意思,就是自然云的解析处理,包括分式以及后面的生成,是我们做的东西。

主持人:我们讯飞要开放我们的东西,要做品牌,以后怎么跟开放者、开发者共用?

江涛:这个是一个比较好的话题,好多人也问我,苹果的siri不是用的你们技术,我们跟苹果有沟通过,他太傲慢了,我们也不会接受。Google有一个200人的团队也在做,微软更不用说,其实从2000年起就非常重视语音技术。李开复老师曾经觉得语音是作为重点的东西来做。这些都这么重视,未来几年苹、谷、微肯定是很大的。这跟苹果内置siri一样,至了别人还玩什么,这对于我们也是尖锐的问题。我们用四个字来回答的问题,毛主席说的人民战争。

主持人:这个云战争详细分享一下?

江涛:我们不是孤军奋战,而是把平台开放出去,让360这样有激情、有智慧的创业者,还有产业链的合作伙伴更好的应用。我相信一定会比一个封闭系统能提供的东西更加丰富。我们构建的是这样的。

李传丰:刚才我觉得语音云,十年前第一代门户网站,比如新浪、搜狐大概是几十万美金的估值,十年后以腾讯、百度为代表的,十年之前都是用户量,就是互联网享受互联网成果的是几千万级别。以后进入移动互联网时代,特别是语音的出现之后,将使这个门槛急剧降低,以后文盲可能都能享受这个成果。人数越多,这个市场越大。如果以后语音领域出现千亿级的非讯飞莫属了。如果认识不到语音云这块潜能的话,算是门外汉吧。

主持人:刚才李传丰讲的,他相信您这边能做到千亿的级别,您怎么看?

江涛:这是我们讯飞的目标,在讯飞前年的年度大会上,我们董事长向讯飞的员工宣布,我们在下一个十年要做到的几个事情,其中有一个就是我们要做到一千亿的市值,要产生一千个千万富翁。

主持人:好棒的远景啊。接下来的环节,我想请在座的嘉宾和在座的观众先看一份资料,有请我们同事。是我在2012年12月9才好了清语音实验室的教授,叫徐明星。当时聊到了语音识别技术,当时给了几个观点,当时对观点的截图。首先第一个观点,当时讲,技术方面只能在安静的环境下有理想表现,可能适合在手机指令、语音搜索方面比较适合。而且给的观点是说,在2G时代还是边缘化的业务,并没有讲在3G会怎么样,我们首先先就这个观点有请两位嘉宾分享一下目前跟徐教授的观点有什么样的区别?

李传丰:我觉得作为清华徐教授分析得很有道理,包括现在语音云很大的问题是怎么去噪音的问题,包括华为可能也在研发去噪芯片之类的。我觉得随着技术的提升,包括硬件以及软件,以及相关的共同努力,我相信是能够有一个比较大的进展,就是说可以实用的,能够达到这个程度。

主持人:他有看好手机指令和语音搜索,您认同吗?

江涛:不认同。我们应该说对于语音关注的人往往都会提到这个问题,你们在强调一下怎么样。应该说这个领域确实提升空间很大,我们语音云上线一年多来,这块有一个显著的提高,就是现在大家如果有讯飞语音软件的,包括360软件,可以试试比较嘈杂的环境下使用。如果在比较吵的环境下拿得近一点,能够到一个足够强的值的话,我们的系统还能辨识。这个系统要能比较好的解决,不只软件的问题,要软硬件综合来解决的问题。现在关于如何通过硬件来降噪,实现有效的降噪,现在业界技术增长很快,也出现了很多公司。大家有没有体会到苹果iPhone4上面的,如果在嘈杂的环境下通电话的话,他的降噪效果比普通手机要好。现在大部分手机已经实现了双麦克风降噪,一个是降噪,一个是检测信号的,互相来抵消,将来不排除三麦克风或麦克风阵列来降噪。这是一个难点,也是我们值得重点说的,包括在3月22号发布会上包括大家关心的抗噪问题,我们会有新的展示。

李传丰:我们在这方面有新的探索,有线控,不需要对着手机说。还有蓝牙版本,在开车的时候可以控制,噪音问题可以在很大程度上进行解决。

主持人:我们就这个话题先聊到这儿,我们看这个资料。当时嘉宾给的数据说,当时的识别率,声音识别率是60%到70%,加了语音模式是80%。不知道现在识别率能达到多少呢?

江涛:我们后台的统计数据是已经达到80%多了,就是在各种复杂环境下的综合识别率,应该说是越来越逼近可用的状态。当然现在确实还有口音要适应的技术难点,我们跟苹、谷、微相比我们更了解中国文化,我们可以进行更好的适应。

主持人:李传丰是有什么补充的?

李传丰:同意江总的看法,没有什么补充的。

主持人:我们看徐教授的第三个观点,认为云技术的未来价值在音乐搜索、同传翻译手机和手机新交互模式。

江涛:我现场看看,大家知道中国移动(微博)的12530的有多少?能够举一下手,12530音乐服务热线。确实不多。我们北京移动的12530在2008年就已经上线了讯飞的音乐云,到现在四年多了,其实业务量也不咋的。其实识别率很高了,不用说歌手名,只要哼哼一段就能找到。因为讯飞讲我们不是一个大众品牌,所以我们做的一些东西,大家知名度没有像百度、腾讯推出来这么关注,其实这个技术很早就到了成熟的状态。其实真正会通过哼唱去搜索的用户不是多,我们并不是猜的。我们有这么多的运营,现在三大运营商中的音乐搜索、音乐语音搜索60%都是讯飞来提供的,所以我们讲这个话是有数据支撑的。

主持人:第二个是同传翻译手机,这个可能性大吗?

江涛:这个要一段时间,这个是讯飞的梦想,如果讲讯飞的理念和使命感,就有一条实现人与人之间、人与社会网络之间无障碍沟通,这是理念级的东西。但是会有一些在特定场合下的应用会出来,而且这个应用在特定场合会比较好用,讯飞在去年的语音计算大会上推出了一个示范应用,就是我们的语音翻译,刚刚还是一个很初的技术圆型。将来在一些特定的场合,比如点菜,或者到国外去出行、酒店等等,在特定的领域我相信是能够有应用做出来。

主持人:也就是说我到点菜,我用中文讲就可以了。

李传丰:我补充一下,我对徐教授的观点不同,我觉得他远远忽视了语音潜在的价值。包括我们现在开发的职能360,有一个比较理想的,一个私人云,私人助理的角色。比如包括定机票、美食,或者充话费,所有的日常服务都能解决,这仅仅是前端的。更多是情感的交互,也是可能实现的。更重要的是以后可能超越现在的浏览器,并且将极大的减少流量,我觉得这是非常大的分歧。

主持人:徐教授的观点是在前年出来,可能这个有时间差。

江涛:徐教授如果参加我们2010年10月份语音云发布会可能有不同的感受。

主持人:咱们看下一个,当时他在2010年给出来的观点,我们国内的目前还处于跟国外一年或半年的差距,两位怎么看这个数据?

江涛:我这边跟大家分享一下,国际上做语音技术有一个非常有名的暴风雪,是由美国和日本联合发行,全部是顶级的研究机构,还有包括IBM、微软公司的研发中心。讯飞2006年参加的时候,第一次参加就成为最黑的黑马,拿了一个全球冠军。第二年参加的时候,当时中科院的路甬祥院长跟我们说,你们能拿前三名就是我们的荣誉。去年我们第二届蝉联冠军,应该说在核心技术层面丝毫不比国外的差。

另外,国际上还有一个比赛也是很有名的,就是美国国家标准技术署举办的语音识别赛,是每两年比一次,分两类,一类是说话识别比赛,一个是语种比赛。我拿一段声音过来,就能判断出这个是谁的声音。另外语种识别比赛,来了语音我要判断出是用的哪一种语言类型。我们在这些大赛中一直保持名列前茅,特别是高难度的比赛中我们连续两年也是拿了第一。应该说,这都是属于理论界的一些比赛,我们中国人的研究还是在世界的研究上占有一席之地。

主持人:江总,感谢您的分享,你不分享的话可能我们不知道我们已经走到前面去了,期待以后您经常分享一下。看徐教授的最后一个观点,有待挖掘,是谷歌等巨头布局已久了,这个怎么看?

江涛:谷歌在交易操作系统中其实已经内置了语音交互的功能,但是正好这里有另外一个观点,就是产业化应用的差距。现在应该倒过来,国内做按开发的,用谷歌的引擎和讯飞的引擎,用谷歌的我不知道,但我知道国内中文80%是用讯飞的。我们跟谷歌不一样,他是几乎所有的语种都要有,应该说是宽平大的,我们讯飞在未来的一段时间内还会扎根在中华文化上,聚焦在我们中文,然后比较窄的范围内做到最大。大家可以试试看,现在搜狗输入法中间有云收入功能,还有谷歌的,大家可以对比来看一下。我们还是比较有信心的,我们在跟中文相关的大部分指标下,还是有明显优势的。

主持人:各位比较一下,上微博跟我们分享一下,谢谢。两位嘉宾先请坐。刚才李传丰讲到李开复老师上面发了微博,对这方面的创业有自己的问题。现在有请我们的微博同事帮我帮开复老师的微博找一下,投上墙。

可能需要两位看一下开复老师的观点。李开复老师讲,他的回馈有四条,看一下两位嘉宾是一一来评点一下吗?

李传丰:我就先抛砖引玉,一一恢复可能比较慢,就整体上说一下。首先开复老师可能站得比较高,但是从我们创业者的角度,在一线接触实际用户的角度来讲,用户需要的并没有开复老师说得这么多,你给他一点点的惊喜,包括前端的语音控制这块是非常容易实现的,技术非常成熟,就这么一点点就能给用户带来全新的体验,这点技术上已经成熟了。但是开复老师后面说的海量数据学习技术门槛,全球只有一个公司有这个技术,这需要有很长时间的积累,只能说一步一步慢慢往前走,但是不可能说一下子就做到很好的情况。

总体来讲,这个是很难,开复老师讲得很对,不代表不能做,我们可以找一些切入点,满足用户的某些方面,比如像打电话、发短信,一些下载软件,就是日常常用的可以积累用户,然后慢慢向前推进,这是有可能的,我们就是这么做的。1月15号到现在3月14号,两个月的时间用户已经突破百万了,我们更多是做的前端,包括后面的搭建只是一个雏形,目前数据库也就是一千多万的样子,是远远不够的。像开复老师说的海量数据学习技术门槛,我觉得思路决定出路,这个问题我们认为是可以解决的,或者用另外一种方式解决,希望大家关注一下我们的产品,大家拭目以待。不能说很长,大概就是这几个月的时间,可能从零变成零,然后变为二十,会发现于是乎智能,你不能奢望他由零变成智商180,这是很难的,但是我们要有信心一步一步推进,不能因为难就不做了。而且用户反响也很好,我们要做的、始终做的就是比用户期望值多做一点,用户就不会离开你。我想说的就是这些,谢谢。

江涛:在讲这个话题的时候给大家分享一个国外的情况,去年IBM做了一个很有意思的实验,美国有一个很有意思的智能答题智力竞赛节目,这个节目已经火了25年,就跟咱们的正大综艺一样,是很传统的节目。大家上去智力问答,答对了有奖。有两个牛人,有一个连续70多期拿了冠军,属于知识面非常广泛的、反应很快的牛人。另外一个牛人比之前的还牛,没拿那么多期,但是奖金200多万,比谁都多。把这两个牛人请来,IBM的一个服务器中间装了IBM的DQA的系统,这个问题在特定领域的,结果IBM的系统完全击败了人类的观点。这里讲到的就是开复老师说的海量数据的学习。因为很多问题的数据是分散在不同的库里面,中间有很多交叉和重叠,如何通过一个系统能够把这些知识有效的提取、归纳、提炼,这确实是一个比较难的事情。

我不知道开复老师说的只有一家能做,是指哪家。

主持人:是讯飞吗?

江涛:我们还没有这么高的水平,目前只有一家公司有这个技术。我们用发展的眼光看问题,我相信从大的方向来说,就是这种后台的基于人工智能的技术会持续往前走。应该说有了这方面的加上交互界面的完善,未来的人机交互前景还是很可观的。

确实到了具体的业务来说,智能手机主界面是触屏,语音真正解决了什么问题,这个问题提的也很尖锐,确实是这样的,因为语音有特定的应用场景,比如开会的时候就不能突然蹦出一句话来。我觉得未来的人机交互一定是这样的,是一个综合、立体、多模块的交互,而不是一个简单的语音替代触屏或什么替代什么,我们想象一下过去的IT设备发展了十多年,确实是一个回归自然的过程,就是越来越人性化,跟人最本原的操作方式去接近,从原来的键盘到鼠标,鼠标其实还是有问题的,你在这边动,那个在那边动。后来触屏跟多点触控,就跟你的本原操作就更将近了。往下语音会跟手势、表情多模态的方式交互在一起用,现在已经有公司在做这方面的探索了,是一个综合多模态的交互过程。这一点大趋势一定是不可改变的,是一个回归自然的过程,用人类最自然的方式来操控机器,用机器来交互。

主持人:第四个问题我相信大家会挺关注的,因为是设计了很重要的问题,应用谁开发?自己开发难扩张,用别人的应用很难整合好体验。这个问题李传丰解释更好一点。

李传丰:我就直接给大家介绍一下我们的远景是怎样的,首先是自己开发,我们要做的其实刚才已经说了一些,做真正意义上的智能助手,就是日常需求这些,比如平常作为一个令到分配给秘书干的事情,其实很大程度上,不说全部,相当大一部分能够分担。第二点,这也不是智能,真正的智能是有一个人的属性,是有情感,这些是可以做到的,慢慢是可以做到的。我们是用什么?功能越来越多,能帮你解决的问题越来越多,可能要借鉴QQ,类似于每一个智能云是一个小机器人,你可以给他取名字,可以给他皮肤,可以打扮装饰,可以教他学习。慢慢接触之后,他就有一种情感的黏性。最后能帮你解决问题。我刚才说是做什么事。

第二是通过这个事怎么盈利。

主持人:我打断一下,其实我想让你回答一个问题,我看开复的意思,怎么能整合好很好的体验。你用的是讯飞他们提供的云技术,你们是怎么整合的?

李传丰:其实你这个问题稍微有点偏差,用江总提供的语音识别技术,但更大一部分是我们自己做的,包括自己的服务器以及后台的东西,绝大部分都是我们做的,也没有说这个是我们开发,扩张也不是问题。没有在大媒体上宣传,说是口碑宣传,像新浪微博、腾讯微博好评90%以上。你所能做的比用户期望多一点,就能支持你,推着你往前进,我们现在就是用户推着往前进的。整合好体验的话,最后也能解决,不用回答了。

主持人:开了开复老师的微博,两个嘉宾也有回答。现场观众有向江总和李传丰提问的,就是以开复老师的微博作为背景。

嘉宾:你有没有一个展示在现场秀一下,就是想看一下你那个东西的情况。

江涛:我觉得大家下载一个360的智能助手就可以了,我相信你一定有智能机,下载一个可以试一下看。

主持人:可以线下用一下。我这边想问一个问题,开复老师讲到语音服务器和带宽成本较大,这个成本有多大?

江涛:这一点,我们可以比较自信地告诉像语音360这样的开发者,讯飞还是有把握做下去。我们相对做视频的来说,我们幸福多了,其实带宽跟他们比不是一个数量级,毕竟语音不是一个连续流量,有些语音片断又进行了比较好的压缩编码,这块不是特别大的问题。讯飞目前的系统容量已经到5000万,虽然现在才3000万用户,我们基本上会保持一倍的语量,现在已经准备做扩容计划,准备扩到1个亿的。现在讯飞支撑10多亿的人口是没有问题的。

主持人:如果我们能支撑到5000万的量级,成本是多少,能透露一下吗?

江涛:具体涉及到披露的问题,还真不能说。但是讯飞现在整体上作为国内2008年就上市的公司,上市后每年也是有很好的业绩表现,应该说支撑这块是没有问题的。

主持人:感谢两位嘉宾和在座的各位,刚才从不同的方面聊一下云互动技术,可能刚才聊得比较虚,下面聊一些干货,就是怎么赚钱?听到下面有人关注,说对。在这个环节可以提一些问题。

嘉宾:谢谢主持人,大家刚才就在考虑了,刚才李传丰讲未来有可能成为千亿市值的公司,现在应该是完全免费开放的平台,未来像智能360语音非常好用,我还真没想到在哪个方面去实现一些盈利的模式。

李传丰:我刚才已经说了,这个有点类似QQ、QQ秀之类的,说白了就是一个机器人,有点属性,你给他换皮肤,属于增值业务,可以采用不同的声音,可以给他取名字。包括已经有儿童的像玩具之类的应用,已经有单了,可以做定制化的。包括以后会跟第三方导入流量,每天可以带来几十万级别。如果以后用户量上去了,用户体验更好,预计以后达到1千万用户,其实现在已经有正在谈好,放上去就是几千万的。仅仅算一千万的量,每天的PV大概是6千万的优质流量,只要10%,变现就很可观。带来流量,这个就是有很多的方法可以挣钱。

主持人:李传丰讲的是干货吗,来点掌声。掌声不够响,江总来分享一下。

江涛:我先把讯飞的情况说一说,我们讯飞是1999年在中国科大实验室的情况下成立的,我们十几个人出来创业,成立了一个注册资金上百万的小公司。后来也是因为核心技术,确实在国际比较领先,像联想、复兴等等的风险投资,那时候风险投资比较少,我们到2004年才盈亏平衡。2005到2007年几年增长非常迅速,2008年就迅速上市了,现在市值也一百多个亿。我们讯飞现在主要的业务模式是什么呢?我们几个主要的事业部,比如说像国内电子行业百强中用到语音中的有用到讯飞的,比如华为、中兴、大唐,大家在智能网呼叫中心上都用到语音的引擎,这块基本上是用讯飞的。另外移动终端很多用到语音技术交互的,以前有很多的电子书是可以读的,也用到我们的。

另外基于语音还延伸了两块的应用,一块就是教育,我们说学习是什么,学习是一个听说读写的过程,听和说都是跟语音技术相关的,你说练听力,你得有人给你带读,课文的原文当然有录音,课文以外的怎么办呢?得通过语音合成软件来做。我们刚才讲到讯飞的语音合成软件在国外比赛拿到了六届冠军,比西部中小学很多英文老师的发语还准,用来带读还是没有问题的。还有普通话的带读,现在我给大家透露一个数字,去年我们统计了一下,全国已经有5000多万师生在课堂上使用我们的教学带读设备,这是听。再就是说,你要很流畅地说出内容了,你说的准不准,过去我们靠人来听,你这个语发得不准,应该这么说。现在讯飞已经用软件来使用,能告诉你哪个语不准,应该怎么发,也已经做成了教学设备。现在在国内也卖得非常好,这是教育领域我们基本上跟这个相关的,讯飞是一统天下,属于技术无敌的状态。

另外还有运营商,通过刚才我们讲的搜索这些东西,我们是跟运营商合作运营的,我们的核心技术不是卖来给你,把技术包装成相应的业务进行合作分成,这块也有一定的收入。这些都是B2B的业务模式,讯飞现在做语音云带来的一个很大的好处,过去我们经常跟国外的厂商关于某某项目进标,这个项目可能500万、1000万,过去费牛劲说如何。现在手机语音云、大量的输入法很好,经常发现有很多人用讯飞输入法的用户,不用产品经理说我们识别率如何之高,用户自然会讲。讯飞现在之所以有这样的承诺长期免费服务,就是有这部分的底气,我们现在B2C这块的用户规模的扩张,对我们B2B业务形成了很好的促进作用。现在B2B这块在未来的十年内是有足够的投入。所以怎么挣钱,B2C这块我也不知道,先做到一定量的用户再说。

主持人:最后一句话把我的话堵回去了,讯飞做到了这么大,其实应该有条件说我怎么带产业链的开发者赚钱。刚才李传丰分享说,我还是靠我想卖流量赚钱,其实说实话这都是很苦逼的赚钱方法。讯飞作为这么大的品牌商,国内80%的市场,想请您分享一下,往后的路怎么走,怎么带开发者赚钱?

江涛:说实在的,还不能说带人家赚钱,只不过讯飞的定位比较明确,我们未来希望做移动互联网时代能力的基础设备,为各种各样的移动互联设备提供交互的能力。我相信随着业务的逐步深入,将来商业模式一定会出来的,真正产生足够的价值、产生足够的用户黏性之后,无论是讯飞,还是基于讯飞语音云的开发者都会找到盈利的模式。现在中国有一点必须承认,中国移动互联网的创业环境还是蛮恶劣的,确实不容易,像小的,像李传丰这样的创业团队,最重要成长起来,刚才我们在下面聊的时候,咱们要考虑我的核心能力积累在哪个地方,逐步积累厚。因为初创团队毕竟没有多少积累,讯飞在之前科大的王老师做语音做了十多年了。原来做语音比较哈的是南边的王文华老师,北边是清华大学的一个网老师,现在已经退休了。一个做语音合成做特别好,一个做语音识别做得特别好。讯飞我们幸福的是有一个团队在做,但即使是这样也是头破血流很多年,联想是2011年投的讯飞,当时投我们的时候,柳传志问我们未来想做多大,我们就说做得比联想很大,最后投了讯飞了。我们给他描绘了一个业绩如何快速增长的蓝图,结果在2005年之前的每一年,其实都是低于预期的,好在像柳传志这样的大师还是蛮有远见的,没有像现在很多VC那样急功近利,逼着你转型、逼着你赚钱。我们当时刚创业的时候大家工资也比较低当时最大的两个股东,一个是上海复星,一个是联想。当时复星给我们开年会的时候,看了我们的情况以后说不要逼自己那么苦,可以把自己的待遇提升一点。这给了我们很大的努力,使我们在语音的方向上继续能做下去。

李传丰:我们觉得你们非常幸福,有的VC一期资金就是10年,前面投完了,后面看着赚钱可能止亏,觉得你们非常幸运。

主持人:您现在是拿到多少?

李传丰:因为我们做得比较早,是12月份拿到的,现在正在找,接洽了十多家。

主持人:他们好像没有讲怎么赚钱,接下来我想把提问的权利交给台下的,台下的所有观众下忙,有哪位观众提问拷问两位嘉宾的。

嘉宾:刚才听两位介绍,我觉得语音的发展像江总说的,是接近人最本身的发展方向,我觉得也非常好。有两个问题,一个是我知道科大讯飞是中小板上市,咱们上市以后未来的增长是怎么个增长方式,有多少,是不是可以投一点?

江涛:现在讯飞是一个公众公司,欢迎大家成为我们的股东。

嘉宾:可以流通股,是吗?

江涛:对,因为我们是2008年上市的,现在已经全流通的,包括我们创业团队在内,我们创业团队十几个人中间只有几个人卖了很少,大部分人没有卖,因为我们知道讯飞的价值释放还早着呢。

嘉宾:我们关注到这个月的月初,有一个姓陈的出售了十万股,有没有和我们有关联,为什么卖股票?

江涛:有的同事想改善生活,也无可厚非了。

嘉宾:大家如果有电脑的话,就先百度一下有一个乐爱梦想俱乐部(音),是我从中学开始搞的,现在已经工作了,从中学开始搞机器人的。我们在几年前做了一个东西,当时在网上下载一个程序,我们这边说一个话,我们根据这个程序自动匹配,能自动编译。我看现在这个产品还没有达到完全的智能,完全有一种自己的交互和学习能力的。因为我对这块也稍微了解一些,未来这块的趋势,包括智能机器人方面,不知道您了解不了解日本方面这块的内容,你通过交流,他会帮你做任何事情,其实他也有学习能力,也有智能的能力。这块和国外差多远?未来智能机型这块怎么结合?

江涛:实话实说了,讯飞在智能机器人这块,我们跟国外有比较大的差距,这个我们积累还不多。就刚才讲的,包括IBM做的,我们跟他的技术级别差很远,如何建立支持系统,如何能够让他自我学习等等,我们承认我们有很大的差距,这个也是下一步讯飞还要持续发展,这方面会有一个积累的过程。要真正做成比较聪明的智能机器人的话,我觉得还有很多环节要走。目前相对来说解决比较好的是交互层面,下一步我们会进一步延伸,交互这个层面做完以后,我们这一次3月22号发布会发布的有一个自然源理解能力,我们会让更多的开发者参与这个事情。说白了就是大脑不是讯飞自己来做,是由大家来做的,让他能够处理更多的问题,有这样的一个过程。现在我们在这个领域,我们离国际水平还有差距。

嘉宾:我是来自联想研究院的产品经理。刚才听到两位演讲学到了很多东西,我和主持人有一个想法,就是还没有听清楚商业模式和盈利点,前景和背后的科研还是比较了解的,到什么时候能够做到语音搜索挖掘,还是有一些预估的。主要是对商业模式。还有,在语音这一块的很多软件是开源的,国内也有很多公司在做,包括腾讯也有语音输入,很多语音也有输入,这块你们的竞争力在哪里?

江涛:其实最根本的是几条,首先是你能不能提供更好的交互体验,首先准确率能不能做到比别人高,至少我们现在自信地说,我们比目前的Google要高,Google在安卓上的识别准确率是高的。语音合成方面,我们的自然度也是在业界领先的,而且我们会逐步形成更多发音特色,更多特色发音库,将来甚至可以开放出给每一个用户、每一个合作伙伴来定制化声音特征,这个是刚才讲的体验能不能做的比别人好,讯飞凭什么未来能够占据一席之地,首先我们的体验要比别人做得好。

第二个我们的服务成本足够低,我们在过去的一年多里面,我们语音云上线到现在,整个运算效率、算法的效率提升了两个数量级,可以说提升还是非常显著的,未来还有持续提升的空间。这一块我们有信心在中国这个人口的数量级上面做到成本讯飞能够迅速地掌握住,这个应该说有明确的技术路线。相信我们的单次服务成本是有竞争力的。这两点是比较关键的。

第三点,我们讯飞在商业上能不能相对其他人更好地融入中国的商业环境,和更多的合作伙伴配合,这些相比于苹、谷、微都有很好的优势。

嘉宾:江总,您好,感谢您的分享。我有一个问题,之前我也听过搜狗网的CEO提到过语音,而且他今年的主要战略很大在语音这一块,他提到讯飞,他今年有很多的动作是针对语音的,而且有输入法、浏览器,包括搜索,叫三级火箭。他说要发布一个更好的产品,针对与讯飞的,不知道咱们讯飞有没有应对的一些措施,您对这些方面是怎么看的?

江涛:我们这么多年做语音下来,就发现一个最现实的问题,我们要面对的不是最大的竞争对手,不是我们的同行,因为国内除了讯飞也还有一些做语音的厂商。我们要面对最大的困难和挑战,就是用户的使用习惯的培养。你看苹果发布iPhone4S,一夜之间大家都知道语音原来可以这么交互,就是一次非常好的用户教育。包括智能360的应用。现在真正用过云的,现在统计也就是3000多万,离我们中国的人口总数还有一个很大的距离。就是如何让更多的人来使用呢,我觉得需要整个产业链各种合作伙伴,还有同行更同来教育。所以我觉得我们原来就一直坚信这一点,苹果发布了iPhone4S,对于讯飞来说是一个利好的消息,我们的股价通过iPhone4S发布以后涨了很多。讯飞面临的最大问题是开拓市场,现在多了这些同盟军,绝对是一个好事。把蛋糕做大,把用户使用习惯培养起来,都能体现你创造的价值,这个蛋糕怎么分,根据你创造价值的大小来分。

嘉宾:另外有一个问题,现在互联网都很重视输入法、浏览器,这些都作为一个特别大的人口。讯飞作为一个幕后的大的云数据库,就是为大家提供服务的。换句话说,可能为别人做嫁衣,您有没有考虑更多的推出您面对客户更多的方式去直接面对客户?

江涛:我们现在的输入法就是直接面对客户的,应该说推出一年多来,增长也是很好的,用户认可度比较高。在主要的应用商店,安智、安卓,包括APP store,我们的讯飞都是最好的输入法。

嘉宾:感谢江总的分享,我是中国运通公司的,姓月。我想请问下江总,你们发布了一个云搜索,不知道你们作搜索方面有什么规划、设想?

江涛:我们目前语音云提供的三大服务中间就有语音搜索功能,但是这个搜索跟上搜狗的搜索,其实意义是不一样的。我们提供的搜索,像现在很多合作伙伴,比如新浪、微博,这些合作伙伴在用了讯飞的语音云以后,就给用户提供语音搜索的能力,其实搜索还是在后面处理,只是把这个列表提交给过,我让用户输入的时候相对于普通的听写,我最后在他给的列表里面再过一些,就是给他更准确的侯选结果而已,不涉及常规的搜索。

嘉宾:我理解讯飞没有自己在搜索这个领域去研发,而是选择了和一些合作伙伴合作,是这个意思吗?

江涛:因为什么时间做什么事情,春季播种秋季才能收,现在再去做搜索,我自己觉得没有什么意义。

嘉宾:谢谢。

主持人:还有提问吗?

嘉宾:你现在做的智能网络上的机器人,就是刚刚介绍具有一定的语音功能是什么?第二,有没有隐私上的问题?这个语音在国外很大程度上不是因为技术不程度,微软、Google都做了很长时间的工作,还有很多法律的壁垒,这在中国会不会也成为一个壁垒?

李传丰:现在是这样子的,大家对机器人说的话,目前是存在云端的,你要看用户这些信息权限是非常高的,不会存在泄露这个问题。还有开复老师很担心的就是自己智能,第一步像IBM的机器人为什么聪明,就是因为数据库,还有一些算法,我们现在的做法是搭建一个知识库,用户问一些问题,你可以教他一些问题。有一些问题是私有的,不希望大家知道。还有一些是公有的,像果壳网做的东西是专业性很强的。实际上我们所有的权利都是交给用户,用户说了算,隐私这块做得比较好。

主持人:我插一句,感谢这位观众提了非常哈的问题。传丰当你的用户数据库足够大的时候,对用户的幸好有一些理解。比如我对手机上我感冒了,我吃什么药好,你的APP跟我说你到前面路口哪个药店买什么好。我边上有一个药店,他不推荐,推荐路口的药店,可能因为我们跟药店合作了,有这个可能性吗?

李传丰:我们不是这样的,周围有好几家,这个选择还是交给用户的,用户去哪家,还是用户的选择。

嘉宾:这确实是我担心的问题,因为我给你的信息越多,你对我的服务才会更好。我要给你更多的信息,意味着要泄露更多的隐私。刚才江总也给我们演示了山寨CCTV的信息,如果我把信息给你了,如果仿造我的语音给家里人打电话或给老板打电话,是很危险的事情。

江涛:有矛就有盾,我们这次发布的语音中还有中文识别,其实你刚才提到的问题,不是专门针对语音云,凡是基于云计算的服务模式都统一存在这个问题,比如你用Gmail,这个信息要回谷歌,如果你发短信,运营商那里肯定有你的短信内容。只要是联网的设备、服务,这个问题都是存在的。跟是不是用语音这种形式并没有绝对的关系,关于这种通过云计算提供的服务,在未来这个信息时代怎么保障,其实国家还是蛮重视的,包括工信部等等相关部门在关注这件事情。

嘉宾:江总,您好。我问两个问题,一个就是还是竞争这方面的问题,因为据我看这过公司也看了比较久的时间了,单讲语音,语音库和语音资料是绝对重要的东西。就我现在看的这些公司里面,比方说百度,还有一个是中移动,在百度也有了自己的东西,他的用户群很大,我们在这个地方上属于争夺用户的状态,不知道他的语音技术用的是谁的,以及我们跟他相比的,我们的状态是怎么样?

第二个是跟中移动,我们看过了我们跟中移动方面的收益,跟联通、电信这块来讲,我们占的份额是很大的。但是在移动这一块来讲用户是最多的,从我原来看的资料上来讲,至少我们讯飞在各省级的合作上来讲份额不是最多的,不知道现在合作的状况怎么样,如果这块来讲一个是跟中移动,一个是跟百度都有庞大的用户群,如果从这块来讲,以及和第三方来讲,这个差距可能缩得比较快一些,这是一个问题。

第二个问题是讲的用户,因为你刚才讲了有3000万用户,这个用户里面是不是包含了很多的像360这样的合作用户,属于我们口讯输入法的自有产品的用户大概是什么样的量级,什么样的增长速度?这是第二个问题。

第三个问题是客户分析系统,我们跟联通也谈了这个问题,您觉得今年上半年这个东西会真正落实吗?

江涛:不好意思,你问的有一些问题涉及到我们B2B现在还不能披露的商业内容,我只能挑一些我现在能说的来讲。确实是中国移动,业界有一个说法,中国移动的3G网络、3G终端相对弱一点,我相信他现在有在大规模布Wi-Fi,在推动4G,我相信这块会逐步迎头赶上。本身讯飞现在跟移动的合作也在同各个方面加速推动这个过程,语音技术随着语音时代的到来,今年以后讯飞跟移动的合作会有一个比较大的动作,已经找到了越来越多的共同点。

主持人:感谢两位嘉宾。刚才台下的同事告诉我时间快到了,但是我还想请大家看段视频。现在描述的是两个机器人的搏斗,是通过语音控制的方式,台下的人在用一个耳麦控制这个机器人。

感谢大家看视频,这个视频要回到最后一个问题上,想请江总跟大家分享一下语音互动的未来。会向哪个领域?

江涛:我觉得用一句话来说,我想用我们3月22号发布会的主题来讲,我相信语音会点亮我们的生活。

主持人:谢谢两位的嘉宾,今天的微论坛到此结束,感谢两位嘉宾,感谢各位观众。如果想知道更多,请关注讯飞3月22号的发布会,在北京。今天微论坛到此结束,谢谢。

原创粉丝点击