发头条

fatoutiao.com 互联网运营专业指南

Home /
科大讯飞副总裁李世鹏:AI至少在现在还取代不了人

科大讯飞副总裁李世鹏:AI至少在现在还取代不了人

10月19日,第一届河北国际工业设计周在雄安召开,科大讯飞集团副总裁、讯飞研究院联席院长李世鹏发表演讲。

要点如下:

1、探索人工智能的两种方式和人工智能三部曲。

2、目前的人工智能,实际上是人工的智能。

3、科大讯飞在人工智能领域的技术进展。

4、AI至少在现在取代不了人,是作为人的助手更好更有效率更准确的进行工作。

以下为演讲实录:

大家上午好,我今天站在这个舞台上是代表科大讯飞讲一下科大讯飞在人工智能领域的一些思想。

我们知道人工智能实际上是来势凶猛,而且现在越来越热,不管从投资届、产业届还是政府,都把人工智能当成一个救星,而且我们知道各个国家也许都在基于人工智能制定了很多战略规划,包括美国、中国。我们去年公布了新一代人工智能规划,这件事充分表示了人工智能在未来产业上的一些应用前景。这一点我要提到的是,人工智能跟今天的设计有什么关系呢?其实做设计的人大家都知道,尤其在跟计算机交互里面有一个数据叫做自然交互,自然交互里面核心就是智能的交互,我们科大讯飞在语音上面做了很多事情也是为了帮助人们更好的拥抱各种计算技术。这是我们国家的一个三部曲,到2030年我们试图在人工智能领域占领高地。到底今天的人工智能是怎么回事,是太多泡沫还是确实在改变我们的生活?下面就给大家介绍一下我们的思路,什么叫人工智能?人工智能每个人的定义都不太一样,这是我自己给的比较学术方面的定义。

什么叫人工智能?人工智能对我来讲不是计算方式的革命,以前的计算方式都是人去编程,计算机做事情,今天的人工智能是各种数据自己学习做事情的方式。为什么人工智能最近热,一是大数据、二是强有力的计算能力,包括云计算,还有一个深度学习算法,这三个合在一起催生了今天的人工智能的主流的一些方法。所有事情都不是偶然的,人工智能发展到今天完全是科学技术发展到今天一个自然结果。

探索人工智能有两种方式,一种就是现在主流的根据深度学习跟大数据基础的人工智能方法,这是现在大部分应用里面都在用的一个方法,而且很有效。另外是对人脑和认真科学的研究,这方面其实是刚刚起步,研究了很多年也没有太多进展,最近可能会有一些比较重要的一些进展,但是远远没达到使用的目的。

为什么要从这两个方面研究呢?我们今天大数据深度学习基于了人工智能方法的话,有两个致命的缺点,一是对大数据依赖,二是特别耗能,人脑要工作可能只需要二十瓦的能量,远达不到人脑的计算中心至少要消耗100万瓦的能量,所以从这方面来看对人脑的探索一直在不断进行。

人工智能三部曲,我们大家也知道,计算智能、感知智能、认知智能。感知智能包括今天的语音识别、人脸识别,包括翻译都可以当做感知智能,只不过把一种信息从一种形式翻译到另外一种形式,没有增加新的信息,今天大部分成功的人工智能都是感知智能。认知智能是真正对内容进行了解,这里面就是涉及到深层的,对内容进行了解之后你才能知道怎么样去进行推理,怎么样做一些决定,所以基于这样,对我个人来说,人工智能又分了五个层次,用中文讲是通知、感知、认知、预知和决知。从大数据角度来讲的话,一层比一层依赖数据更多,在顶层的话你可能要知道所有的信息才能作出一些有价值的决定,预知这一层更多的是你向计算机发出指明之前计算机已经猜出来你要做什么事情,这是在认知之后的更高层次,这跟我们今天做用户交互设计也深度密切相关。

数据在人工智能现在的框架里是至关重要的,数据怎么去获得呢?现在很多公司,包括科大讯飞等其他公司,我们有个人工智能资源部,资源部的目的就是在整合各能源数据输送给人工智能学习的引擎里面去,去训练我们的引擎。数据是一个瓶颈,怎么样把很多数据融合在一起这涉及到很多方面,包括怎么拿过来用,怎么合理用,这都是数据互联的标准或者协议。

一致性、连续性,基于上下文、兼容性、完整性、谁来控制数据,是用户还是产生数据的企业还是利用数据的企业,这是很有意思的讨论话题。AI的趋势,实际上今天也提到过,AI今天无疑在各个方面给我们提供了很多便利,提高了很多工作效率,提高了我们识别物体的一些准确度,但是有一个最大的问题就是数据依赖性,所以今天很多传统的在装配线的一些工厂现在转型做成数据标注工厂,信息工厂以前一排一排的流水线,今天是一排一排的电脑,很多年轻人在里面标注数据,尤其在贵州更明显,所谓的人工智能,真正说是人工的智能。

现在确实是这样,你给机器更多需要的资料,他就能取得更多的成绩,这就带来另外一个问题,在这个基于大数据的基础上人工智能方法总有它没有遇到过的一些情况,那么这个情况发生的话机器是没法去控制的。前几年特斯拉就出过几个事故,特斯拉的设计本意是辅助驾驶,没生成自动驾驶,但是人对AI的期望值太高了,所以就造成了一种现象,认为它是自动驾驶。如果有一些情况机器没法去控制的话,人也没法及时接过来,这就造成了很多问题。

基于小数据,像认知科学里面的研究方向是现在也特别热,因为我觉得继人工智能框架的变化最后我们有一个真正智能系统关键的一个因素,另外对于数据的隐私保护,这里面是另外一个问题了。就是说,包括科大讯飞提的一个概念,AI所有过程中人在环路里面,有什么好处呢?今天把人工智能神话了,不太可能,如果是机器在不工作的情况下怎么样很快接入?在机器不工作的情况下,人的接入能不能提供新的数据,怎么优化AI的功能?在欧洲都提这个观点,可能所有的AI系统里面必须有一个开关,如果机器不按照人的思路去做的话,把开关一关他就会正常了,所以这是一个特别重要的一个课题。

这是我对人工智能产业的分类,基本上分成基础技术公司、水平技术工作、垂直应用公司,我觉得今天大部分在做第二种,第一种的话就是基础技术把巨头们霸占,一些新公司都是在这个基础上有市场的垂直应用。但垂直应用它的问题就跟我们前面提到的一样,仍然依赖于大数据,所以你要进到一个垂直领域里面你必须有大数据在后面支撑,数据从哪来,这是首先要考虑的问题。

下面给大家很简单介绍一下科大讯飞在一些人工智能里面的一些技术进展。第一个是我们科大讯飞的合成,我们可以模仿任何人的语音去合成,我们可以讲奥巴马讲的任何话,包括中文。另外就是语音识别,大家知道讯飞在语音识别上面也是国内顶尖的公司,我们的识别率在持续增长,在普通话里面已经达到了98%以上,讯飞的转写系统在各个会议里面充分应用,我们在2015年时第一次的转写准确率就已经超过了人类的转写员。还有一个方面,家里很多老人他们一辈子不说普通话,怎么能让这些人拥抱互联网、拥抱新技术呢?科大讯飞做了方言的语音识别。我们现在可以支持22种方言,很多方言我们达到了90%的准确率。另外在机器翻译方面,机器翻译到今天为止还是感知智能方面的东西,对翻译内容并不是很了解,将来的话一定是对语音内容进行了解。

去年2017年科大讯飞的机器人首次通过了中国医生资格考试,总分600分,机器达到了460分,及格是360分。我们把这些技术也用到了各种场景里面,同时我们也建造了一些生态或者平台来帮助我们的客户来拥抱AI技术,我们的理念是所有的要开放,包括硬件软件、语音服务,还有一些数据平台。我们的AIU平台,2010年把语音技术放在云上提供给成千上万的客户来进行开发,我们现在的开发团队数已经达到了83万,大概有50万应用正在开发或者已经开发,大概有19亿的终端设备在用科大讯飞AI的服务。

硬件方面我们也有很多产品,包括我们最新的墨菲技术,在中国80%以上的机器人都用我们的产品,还有90%以上的家电都在用科大讯飞语音交互系统。实际上是这里面很重要的一块就是数据,数据有三方面,一是用户数据的隐私保护,二是怎么样让数据能够充分融合起来,还有保证数据方的利益,这里面我们把数据的控制性交换给用户,通过一个数据银行的概念把所有的东西都串联起来了。数据最后的保护可能是区块链最终的一个解决方案。

下面是一些具体的应用,我们利用科大讯飞在医生机器人积累的智能,帮助医生发现遗漏或者疏忽的东西,帮助一般医生达到专家水平。在教育方面,我们在图文识别里面能把我们的学生的试卷或者作业通过扫描的方式转升机器能读懂的方式,能自动评价,并不是目的,而是通过评分的过程中能分析到学生到底错在哪里,同时我们把它影射到建的某个学科的知识图谱上面,在这个知识图谱不但一目了然发现这个学生在某个概念上不清楚,甚至说在这个概念不清楚是因为前几个概念也是不清楚,在这样一个个性化的知识图谱的情况下,机器就可以帮助教师制定一些个性化的教育方案,还有给学生布置个性化的教育作业,以后学生作业不是千篇一律,只会选择给学生布置那些并不熟悉的概念或者一些问题,让他去练习,这样的话学生的效率和老师的料率都会提高,同时分数大大提高,这个系统在全国有一万两千多个学校正在使用。

我们一个理念是,AI至少在现在取代不了人,是作为人的助手更好更有效率更准确的进行工作,我今天演讲就到这里,感谢大家!

发表评论

邮箱地址不会被公开。 必填项已用*标注