科大讯飞刘庆峰:这件事我们坚持了19年,终于做到了

作者:刘庆峰来源:正和岛今年5月,我和我的团队去了MIT(麻省理工学院),和它最大的跨学科研究实验室CSAIL签订战略合作协议,共同探索人工智能研究的前沿领域和更广阔的应用前景。MIT CSAIL的主任Daniela Rus教授评价说:“

作者:刘庆峰

来源:正和岛

今年5月,我和我的团队去了MIT(麻省理工学院),和它最大的跨学科研究实验室CSAIL签订战略合作协议,共同探索人工智能研究的前沿领域和更广阔的应用前景。

image.png

MIT CSAIL的主任Daniela Rus教授评价说:“科大讯飞是最具创新思维的公司,我们非常期待和你们一起在科技之旅中探索。”

我很高兴得到这个评价,我认为,这不仅是对科大讯飞技术创新力量的认可,也是对背后的中国科技力量的认可。

其实在一年前,我们就受到了国际的认可。在《MIT科技评论》给出的“全球50大最具创新力企业”榜单中,科大讯飞有幸被评为全球第六、中国第一,这也是科大讯飞首次入榜。

能在全球人工智能浪潮中,用核心技术和创新力为中国代言,我们倍感荣幸! 

科大讯飞诞生于世纪之交。

1999年,我国的互联网热潮兴起,创新创业的观念在全国兴盛,科大讯飞就在这股大潮中诞生。

image.png

但我们没有追逐浪潮,而是选择了尚处于发展寒冬期的人工智能,一方面是源于我们内心对此的热爱,一方面是我们真切意识到语音在未来人机交互中的重要作用。

如果说创业是时代洪流的推波助澜,那么人工智能就是我们逆流而上选择的结果。

今年是科大讯飞创办的第十九个年头,就像看到自己的孩子成人了一样,我的内心是自豪的。

大学生创业不易,得益于国家的高度重视与支持,为我们提供了良好的创业环境,同时对知识产权加大保护,这才有了我们创业团队的发展。

image.png

我们18个中国科大的大学生也都怀揣着一颗赤子之心,从创业开始,就立志要让中文语音技术掌握在中国人手里,让中文语音技术由中国人做到最好,在智能语音与人工智能领域代表中国在国际上的发声越来响亮。 

历经19年的坚守与奋斗,现在,我们终于做到了。

现在科大讯飞是亚太地区最大的智能语音与人工智能上市公司,成功改写了由外国巨头控制的中国语音市场格局。

更重要的是,我们正在着眼未来的人工智能领域全面布局,2017年底,入选我国首批四大人工智能开放创新平台,并承建了我国首个认知智能领域的国家级重点实验室,未来我们将带着的国家的信任、带着民族的期望、带着我们自己的梦想和初心,持续创新、引领前行!

image.png

我为什么喜欢爬山

很多人都知道,我喜欢爬山,全员登山也成为科大讯飞每年司庆的“保留项目”。

image.png

它和我们创业的过程一样,在开始缓坡时有的人会跑得很快,之后进入艰难的爬坡期会很难受,但坚持下来,就会由难受状态变成通透的状态;到了山顶,一览众山小。

回想创业时的种种,各番场景仍是历历在目。

1998年,当时我还在中国科大求学,和实验室的师兄师弟们一起参加我国的863项目语音合成比赛。这次比赛中我们研发的语音合成系统第一次将我国语音合成评测达到了3分,这让我们很激动。

3分是什么概念呢?当时评测采取5分制,播音员发音为5分,普通人发音为4分,3分即代表听者可以接受,也就是说语音合成技术可以应用了。

当时我面临着出国还是创业的抉择,但我的内心告诉我,这很可能就是产业爆发的前夜,如果出国,我很难短时间内再组建一个这么好的技术团队。更重要的是,当时中文语音市场基本上全部被外国巨头占据,我一直想改变这一点。 

就这样,在改革开放走过20个年头之际,国内互联网创业热潮兴起,政府在政策、资金、舆论等多方面为年轻人提供了良好的创业环境下,我们中国科大6个学生开始行动,最终组成了18个人的创业团队,创办了科大讯飞,我们立志要让中文语音技术掌握在中国人手里,让中文语音技术由中国人做到最好。 

这其中,必有影响一生抉择。后来在和我大师兄张亚勤(微软亚洲研究院(MSRA)创始人之一)的聊天中,我得知,当年我们创业的时候,微软中国研究院最早想挖的一批人就是我们的团队。

1999年,微软首次在中国设立奖学金,叫微软学者奖学金。当时我们工资大概一个月2000块钱,微软学者奖学金是好几万美金,这个条件很让人心动,但微软同时提出要求,让我做一个月的商务intern(实习生)。那时我们已经创业了,我们要做属于中国人自己的核心技术,所以我坚决的回绝了。

这就是我们当年开始创业的大背景,也说明大家真的都很看重这个产业。 

年轻人创业充满想象力,充满激情,没有包袱,这是我非常欣赏的一点,但创业的道路从来没有一帆风顺,我们也不例外。

创业后,我们推出的第一款产品“畅言”就遭遇了滑铁卢,面临资金链几乎断裂、各方纷纷质疑动摇的局面,当时我心理压力也很大,但是我说:“如果不看好语音,请走人!”没办法,枯燥的技术研究就是这样,如果不是发自内心的热爱,是很难坚持下去的。这也是一种登山精神,必须要坚定目标、不改方向,才能一步步地爬到顶峰。

语音产业就是需要10年甚至更长的时间来进行技术积累,研究人员必须要有甘坐板凳十年冷的精神,所以讯飞面对的是一个有希望但无现成路径的全新产业。 

好在2001年,讯飞开始破局。

image.png

2001年,中国的改革开放迎来重大突破,我国正式成为世贸组织一员,对中国所有企业来说这都是前所未有的机遇期;也正是这一年,科大讯飞获得了联想创始人柳传志先生的认可,他把联想进入风投产业后的第一单给予了我们,也成为我们的第一位投资者。

当时柳传志先生到合肥签约,与我们亲切交谈到夜晚11点多,他提出的“建班子、定战略、带队伍” 管理三要素,是我直到今天仍在学习并应用到团队建设的重要经验。

自己搞科研,可以埋头单干,不理任何人;而要做企业,就不能这样任性,企业家必须要建班子、定战略、明方向、带好队伍。

2004年,也就是我们创业的第五个年头,在团队的共同努力下,扛着外界的压力,我们终于实现盈亏平衡,并从2005年至2007年保持了净利润130%的复合增长。

2008年,在国家对科技事业发展的大力支持下、在国家为企业创造的良好的创业环境中,经过近十年的坚守和创新,我们在深交所成功挂牌上市,也因此有幸成为中国第一家大学生创业上市公司。但我们知道,上市绝不是攀登的顶点,而是崭新的起点。 

人工智能浪潮是一个伟大的历史进程,绝不可能一蹴而就。

而今讯飞置身其中,显然还未到达登顶的状态,只能说是已经开始登山,刚克服了爬坡之后的艰难,开始到慢慢适应的状态,但还要继续坚定目标、一步一个脚印的踏实前行。 

开放的浪潮扑面而来,永远会有更新的事物、更大的挑战,这也就意味着必须持续攀登才能勇立潮头。

我也时常鼓励我的员工们去爬山,就是想传达给他们:每时每刻都有一个新的山峰在前面等你去征服;当你快到一个山顶时,还有另一座更大的山峰在前面,这样才有不竭的动力去前行、才有挑战的精神去创新,才能以创业者、颠覆者的激情一起共创未来。

没有核心科技,岂有中国强音

 我记得还我在上大学的时候,和很多同学说,最兴奋的事情就是就可参加比赛,因为我们要拿第一,要超过中国最好的大学和机构,当然后来我们和他们的大多数都在合作了。

我觉得这种不畏竞争、挑战权威、勇争第一的习惯是中国科大基本的办学理念;在科大讯飞的园区,有一座雕塑,两头牛顶着一个地球,我们现在叫它顶天立地,最早叫扭转乾坤。这样的价值观是一路传承下来。

image.png

在讯飞公司大厦最醒目的位置上,刻着这样一句话:“燃烧最亮的火把,要么率先燎原,要么最先熄灭。”

这句话是我在2000年公司年会上说的,就是要时刻提醒自己和整个团队,梦想既然已经点燃,就要全身心的投入战斗。

在智能语音和人工智能产业中,技术革新很快,想要赢得领跑局面就必须从源头技术上保持领先。

如果我们不能保持源头核心技术创新,不能在技术上掌握主动和先进,就如同被别人掐住咽喉,既难受又危险。 

我十分赞成中国人工智能学会会长李德毅院士的观点:“今天,人工智能绝不是到了收获的秋天,而是‘春夏之交’。”

所以当下,我们还必须保持源头技术的创新,不仅要关注应用的“小波浪”,更应关注技术创新的“大波浪”。“大波浪”包括源头技术、创新的算法、配套的芯片等,而“小波浪”是指各种穿戴式设备、APP等应用。

历史上的每一次产业浪潮,都是大波浪和小波浪的叠加模式,任何时候,国家或者行业发展都必须坚持“大波浪”和“小波浪”共同推进的原则。

科大讯飞是一家技术创新型公司,自创业之初就坚持源头核心技术创新、坚持掌握价值链的主导权,不把自己的楼房建在别人的院子里。

2017财年科大讯飞的研发投入增长了61.5%,连续五年研发投入超过销售收入的20%。

我们相信:只有核心技术具备了话语权,企业才有话语权;只有国家和行业在核心技术上有影响力,这个国家才可能在全球有影响力。

正是这种掌握源头技术的决心和对科技产业不可遏制的热爱,促使科大讯飞在语音合成、语音识别、机器翻译、医学影像、人脸识别、自动驾驶图像理解、自然语言理解等方面的国际比赛中,多次刷新全球纪录,仅2017年,科大讯飞拿到7个国际权威赛事的“世界第一”。

此外,目前,我们主持和参与制定的国家标准有2项、国际标准有1项,累计获得国内外的有效专利有 260 件。 

以机器阅读理解挑战赛SQuAD为例,它由斯坦福大学牵头,是在国际上具有极高的权威度的机器自然语言理解比赛,谷歌、Facebook、IBM、微软等全球知名机构全都参加了。

image.png

微软高级副总裁沈向洋说:“真正代表未来人工智能的全球领导者,一定是最先突破了自然语言理解的机构和公司,这样的公司是最权威的”。

我很认可这句话,SQuAD就是这样的比赛, 10万篇英文文章,人看完以后提问题,机器阅读完回答问题,以此证明机器的自然语言理解能力。

微软过去几年一直是全球第一,很值得尊重。但是2017年7月,科大讯飞改写了这个历史,我们当时很高兴。

不到两个月,微软又重新超越了我们。但2017年11月,讯飞再获全球第一。到了12月,又有别的公司拿到第一,但今年1月,我们又重回王者之位。

在今年7月结束的Blizzard Challenge 2018比赛中,在和国内外一流大学和研究院的同场竞技中,科大讯飞报送的参赛系统摘得10个测评打分项目中的9项第一,在自然度、相似度等重要指标中显示出较明显的优势,这也是讯飞获得的“十三连贯”。 

与中国改革开放的宏大进程同步,包括科大讯飞在内的一批自主创业的企业也逐渐站上了国际舞台,这也就意味着必须参与国际竞争。但庆幸的是,我们从来就不惧怕竞争。

当年,和我一起进入中国科大的,还有13个省市的高考状元,在越有压力的情况下我越能释放出自己的潜力,所以从进校第一次摸底考试开始,我就几乎拿到了所有数理学科考试的第一名。

因此有人评价,说我是天生的竞技型人格。

我想不仅是我,科大讯飞人都是如此,科大讯飞最早的基因里就有对创新的追求,就有参与竞争的勇气以及用源头技术创新改变世界的决心。

如果怯于竞争,我想就不会有今天的讯飞。 

在我们的战略发展中,从今年开始,科大讯飞在全球范围内整合源头技术资源,通过鉴赏力、理解力和整合力,以全球技术整合来奠定我们未来在全球人工智能产业领导者地位。

我们希望通过参与国际竞争和合作,用核心技术为中国代言,在世界不断发出“中国强音”,让世界聆听我们的声音。

“最强带货员”背后的梦想

人工智能时代正在加速到来,我们希望通过在源头技术发力,构建一个属于自己的地基。

那是不是技术领先就可以了呢?并不是。拥有了领先的技术,一定要转化成大众切实可感受的产品,才能真正发挥技术的价值,让人们感受中国人工智能的魅力。

在今年的CES大会上,我们做了一个美国前总统奥巴马的语音合成视频,很多美国人都以为是奥巴马本人在讲话。

今年1月,在央视播出的大型纪录片《创新中国》中,我们用机器还原已故配音大师李易老师的声音,首映式上所有的学生集体起立,热泪盈眶。 

说到产品,最“网红”的莫过于讯飞翻译机。

image.png

大家都笑称,说我是“最强带货员”,因为我参加很多活动都会带着它,包括在全国两会的会议间隙与总理交流、在全国两会的代表通道上实测性能,在博鳌亚洲论坛上和中外嘉宾交流。

其实“带货”的不仅是我,2017年我在参加财富全球论坛答谢晚宴时,遇到了广药集团董事长李楚源,他说,他在向外国人推荐王老吉的时候,都是“左手王老吉,右手翻译机”,这也说明我们的翻译机真的很实用。 

这款机器在今年4月全新发布了2.0版,它集我们语音合成、语音识别、机器翻译、自然语言理解等核心技术于一体,可以实现中文与33种语言的实时互译,还支持拍照翻译和方言翻译等模式,最近它还上线了中日、中韩的离线翻译,目前可实现离线的语种达到了4种,是人们口袋里的“翻译官”。

这个小小的机器是我们翻译战略下被精准定位的一款产品,要帮助更多的人打破语言的隔阂、实现文化的交流,也要作为战略落地的一个支点,促成人类语言大互通计划的实现。 

如果上溯十年,回看讯飞翻译机的演进历程,无疑与中国开放发展的脚步同频。

当时做这款产品的初衷就是服务国家的现实需求,在翻译机1.0时我们就推出汉维、汉藏翻译,是为了促进民族交流、民族融合。

伴随着开放发展和全球化的进程,在“一带一路”的倡议下,中国需与沿线国家友好往来,在“人类命运共同体”的愿景下,世界各国各民族需亲密相处,在这过程中,语言沟通无障碍是前提,所以我们又开拓了更多的语种,帮助人们无障碍沟通与交流。

说的更长远一点,我们希望用人工智能技术赋能翻译行业,实现人类语言大互通,让世界感受中国科技力量。 

还记得今年1月份,我去斯坦福大学、麻省理工学院做演讲,那儿的留学生很高兴的跟我说,“因为你们的翻译机,现在我们的父母敢单独出国了。”

这正是我所期望的,我们希望用一部小小翻译机,为人们解决语言沟通障碍,让人们感受到人工智能的魅力,让中国人和中国企业大胆的“走出去”,让中国在国际上的发声越来越响亮!

今年7月,在保加利亚举行的“中国——中东欧国家地方合作成果展”上,总理来到科大讯飞展台前,现场体验了我们的翻译机,并自掏腰包购买,以“国礼”相赠保加利亚总理鲍里索夫。我们感到非常荣幸,这也是国家对我们极大的信任和鼓励。

image.png

我还记得,在讯飞翻译机首发时,一些媒体采用的观点是这是一款会取代翻译官、会让同传下岗的人工智能设备。

这从一定程度上体现了社会普遍的一个疑问:人工智能的时代,胜出的究竟是人类还是人工智能?

早在2016年《科学》杂志就预测,到2045年,全球将有50%的工作岗位由人工智能机器来替代,而在中国这个数据将高达77%。

人工智能时代正在加速到来,可能不用到2045年就会达到这个数据,但我想说的是,人工智能时代,不是人和人工智能的竞争,未来比人类更强大的不是AI,而是掌控AI的人类。 

我们和上海外国语学院高翻学院在2017年10月成立联合实验室,半年多的实验下来,结果令人欣喜。

该院副院长吴刚评价说,讯飞的听见系统、机器翻译对他们的翻译活动帮助很大,而他们一点不担心它会完全取代人工。

最好的模式是什么?人机耦合、分工协作、各抒所长:用讯飞翻译机去做技能单一、简单的工作内容,而人类翻译工作者则可腾出更多精力从事更高级和有创造性的内容,既能提升翻译效率,又能去琢磨如何做到信、达、雅,如何翻译得更高级。

毫无疑问,人工智能会取代一些简单的、重复性的劳动,但同时它也会创造新的工作机会,这是大势所趋。

在我们看来,人工智能的未来最有可能实现的是人机耦合模式,每个人都拥有自己的AI助手,创造更有价值的内容。

在改革开放进行到第40个年头之际,中国承诺进一步深化改革、扩大开放、持续构建“人类命运共同体”,这也就意味着,将有更多的中国元素走上国际舞台、参与国际合作、贡献国际力量、连接世界各国和人民。

交流的无障碍、生产力的充分解放、创新成果的涌现和共享、全球利益的休戚与共将成为大趋势,我很高兴科大讯飞作为龙头企业之一,正在致力于这一大势,让更多人共享科技发展的成果,站在人工智能的肩膀上实现与世界的牵手,开创与AI同行的新时代。

无生态不未来

除了可以使用人工智能的产品,更多的人还会问我:我们能从人工智能发展中获得什么更多的、实实在在的好处?我想这一点,开发者和创业者们最有发言权。 

今年5月,在我们AIUI(全新的人机交互解决方案)3.0发布会上,我们当场让四个开发者用这个平台来开发应用,有四个题目:“程序员字典、我唱你猜、新电影推荐、会场抽奖”,晚上7点半开始、8点半就要现场展示成果。

image.png

这是真实的开发过程,原来我们开发可能需要几个月,后来我们优化变成几周,现在一个小时就可以完成,这就使得开发者的效率极大地提升、成本也就相应降低。   

人工智能时代充满机遇与挑战,也容得下千帆竞发,因此想让更多人参与到人工智能竞争中去,感受人工智能的魅力。

早在2010年,我们就在业界率先发布了讯飞开放平台,全面开放业界领先的核心技术能力,为软硬件开发者降低集成门槛,为企业提供行业解决方案,支持开发者创业,共同用人工智能建设美好世界,这也是我们真正意义上的一次“开放、共享”。 

随着核心技术的提升,目前这一平台的能力也在不断提升,我们称之为“能力星云”。

上面提供了声纹识别、语音合成、人脸认证等能力,同时为了让开发者更好地开发使用,我们提供了二十多种解决方案。

今年,讯飞开放平台计划放新的100项AI能力,打造AI全领域开放平台,不断降低创新门槛,不断提升用户体验,给消费者真正想要的;让开发者可以更好地接入平台能力,更快地开发智能产品,获得更好的创业平台。

我们要帮助更多的创业者在良好的产业生态中成就自己,我们深知,做帝国终有衰落的一天,只有生态才会生生不息。 

我想,我们已无需讨论科大讯飞或者某某企业有多少世界领先,而是我们这个产业集群将如何发展。

人工智能时代的比拼绝不是单个企业的市场,比的是产业链、比的是产业集群,所以我们要把核心技术开放出来,通过人工智能的能力平台来构建整个生态体系。

截至目前(截至2018年7月),讯飞开放平台上已集聚了超过80万的活跃第三方创业团队,日均交互达到46亿次。

这是什么概念?目前在合肥,我们的人工智能平台一分钟可以为全世界300万人提供在线服务,如果我进行一次20分钟的演讲,也就意味着同时就有6000万人已经在这个过程中得到了我们的服务。

我相信,这是属于科大讯飞的平台,更是属于整个AI产业的生态。 

也会有人问我,这些开发者从何而来,中国人工智能产业发展的人才如何培养?

我认为在应用型人才的培养上,可以通过培训体系让现有的AI走下神坛,让计算机、数学专业的研究生和博士生利用半年左右的时间上专门的课程和应用培训,能够成为AI开发型人才。

2017年10月24日,科大讯飞上线的AI大学,是国内首个AI在线学习平台,面向AI兴趣爱好者、学生、个体开发者、创业者、企业级开发者等全社会泛AI群体,提供学习分享和经验交流的机会,目前已有23万学员,今年的目标是50万,我们希望为中国人工智能的人才培养做更多的贡献。 

有了核心技术,又有了平台和人才,我们携手合作伙伴推动智能语音与人工智能技术深入到教育、医疗、政法、智慧城市等多个领域,为越来越多的行业带来创新与变革。

以教育领域为例,我们针对教育全场景研发了“智考、智学、智课、智校”等一系列智慧教育产品,现在已经覆盖全国1.3万多所学校,服务师生数超过8000万,这些产品可以实现个性化精准教学,助力因材施教。

在医疗领域,通过智能语音交互技术减轻医生文书压力,利用智能影像识别技术辅助医生阅片,降低阅片的漏诊率,深度切入医生工作流程,助力医疗事业发展。

image.png

在司法领域,我们研发了全球首个刑事案件智能辅助办案系统,全面应用到侦查、批捕、审查、审判等各个环节,提高办案效率,助力司法公正。

在城市建设上,通过构建“城市超脑”,结合城市管理各领域专家经验,打造行业领先的“互联网+政务服务”、“智慧交通”、“智慧旅游”、“智慧园区”、“智慧管廊”等应用服务。

人工智能在一定意义上推动了人类社会的进程,在万物互联的未来,人工智能还将深刻的影响和改变我们的生活。 

可以说,正是因为开放发展的加速,科大讯飞获得了与时代共进的机遇,也正是因为持续深入的开放,科大讯飞有梦想更有信心成就产业生态的蓝图。

面向未来,在蓬勃的AI浪潮中,科大讯飞绝非孤独的奋斗者,我们愿和开放的中国一起、愿和志同道合的企业和伙伴一起、愿和千万科学家和开发者一起,见证因核心科技而强大的中国,见证人工智能像水和电一样造福人类,见证因为开放创新而改变的时代和每个人。

结  语

今年是中国改革开放40周年。40年上下求索,40年众志成城,40年砥砺奋进,40年春风化雨,40年来,中国创新速度不断加快,科技力量让世界瞩目。

科技的浪潮拍得太快,虽然我们不能准确捕捉它未来的路径和节奏,但人工智能一定是其中可窥一斑而知走向、趋势的关键一点。 

在我们开启与MIT全新合作后的三个月,MIT 校长L.Rafael Reif 近日(8月9日)在《纽约时报》发了一篇社论,其中提到中国的语音识别技术处于世界领先地位,也胜赞了中国的5G技术、量子计算研究等,他对中美科技之间合作的态度是合作共赢,而不是相互抵制、闭门造车。

从科技创新的角度而言,只有开放发展才能实现共赢,这一点,中国40年的发展已深刻阐释,科大讯飞于其中是受益者亦是实践者。 

中国的改革开放已经引起全世界的瞩目,中国的创新发展也已得到世界的认可。

在人工智能时代,中国正在科技关键领域积极进取,努力取得领先地位,在源头核心技术创新上,很多方面已跟全世界并跑甚至部分领域领跑,下一步的关键是如何强调“应用是硬道理”,在应用驱动中让数据迭代,不断进化并反复研究。

我相信,由于人工智能的数据驱动特点,由于中国的用户基础和政府应用创新方面的能力,中国一定能够赢得人工智能的未来。 

心之所向,所以行之所至,我们已走过千山万水,但还需跋山涉水。

国家对科技创新企业的信任与鼓励催人奋进,在可预见的未来,科大讯飞将继续坚持源头核心技术创新,持续迭代核心技术产品,推动更多人工智能技术应用落地,实现在中国用人工智能建设美好世界的愿景。

我们相信,创新的力量只增不减,发展的道路必将永不停息,中国改革开放必将为世界作出大贡献!

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关股票

相关阅读

评论