新加坡国立大学终身教授、快商通首席科学家李海洲日前归国,分享了他关于人工智能、机器学习与人才培养方面的经验。 李海洲教授表示,人工智能未来的研究需要解决三大问题:第一是安全性问题;第二是通用性问题;第三是需要让机器学习人的学习能力。 人工智能究竟有多安全?人工智能可以很准确地识别人脸,但人工智能造出来的人脸,也可以用来攻击人工智能人脸识别系统。可见,未来的身份确认方式,将会向多种生物特征识别的方向发展。 此外,李海洲教授认为,目前人工智能的应用还是专用的,不具有通用性。无法像真实的人一样,环境不同,人工智能的识别率便会受到影响。因此,想要提高识别准确率,需将目前针对某单一环境的专用系统升级为通用系统,提高识别引擎的自我学习能力,才能使其适应不同环境的差异性。这个也是大家在努力的方向。 从1990年博士毕业至今,这30多年里,李海洲坚持自己做语音识别与语言处理的方法。他一直认为,机器学习的基础理论不仅支持了机器的识别工作,而且也是人学习语音与语言的过程;也就是说,人的学习也是一个“机器学习”过程,只是学习的主体不是电脑,而是人脑: “人学习的过程也是通过大数据进行学习,从听人如何发音,到一个音、一个音地学习,然后学会了一种语言,再将第一种语言的知识转移到第二种语言中去。” 这个观点来源于李海洲本人学习多种语言的亲身经历。李海洲的母语是潮州话,上了中学后开始学习普通话。“那时候我觉得学普通话很难很难,但是,当我学习第三种语言、第四种语言、第五种语言时,我就觉得没那么难了,因为我已经有了学习语言的方法。机器学习就是这样,从一个地方学来的东西可以拿给第二个地方用,所以我对机器学习特别有兴趣。” 有感于自身学习语言的经历,在教机器学习时,李海洲总是强调“先了解人是如何学习的,然后再告诉机器应该怎样学习”。这是他多年来的研究心得,即把人的认知过程放在机器学习的研究上。从这一思路出发,李海洲团队在语音识别与语言处理上取得了许多不错的研究成果。 比如,最近他们被顶刊 TASLP 录用的工作(“Target Speaker Verification with Selective Auditory Attention for Single and Multi-talker Speech”)便是来源于对人们日常交流方式的观察,从“双向认知过程”来做语音识别与对话系统。 在人类的交流中,当A在B说话时,无论旁边有多少杂音、B说话的声音多小,A只需要专注听,就一定能听到B的说话声,因为人脑可以“指挥”耳朵听什么、不听什么。但现在的机器在识别目标语者时,性能并不稳定。有时候,如果两三个人在一起同时说话,电脑就无法识别。 第四次工业革命即将来临,世界各国已经认识到人工智能是未来国家之间竞争的关键赛场,因而纷纷争夺这一轮科技革命的制高点。对于中国而言,人工智能的发展是一个历史性的战略机遇,政府创造土壤,企业奋起发力,中国在AI领域的实力与发展优势不断被世界认可。 基于多年海外经历培养出的国际化视角,结合专业判断能力,李海洲教授总结出中国人工智能应用落地的三大优势。 政府推动:在我国,人工智能连续三年被写入总理政府工作报告,并成为促进新兴产业加快发展的新动能。政府的推动与总体规划,完善了人工智能基础设施的建设,并使得各科技企业的技术能够稳步落地。 数据优势:人工智能的发展需要与深度学习和大数据紧密结合,中国在数据资源这一方面的优势,是毋庸置疑的。仅仅在日常生活中,中国近14亿的人口就能产生比全球其他国家更多的数据。这让深度学习有一个用武之地。 企业环境:自2012年深度学习取得重大突破,中国人工智能企业如雨后春笋般生长,激烈的竞争环境下,企业家们必须兼具创新与奋斗精神,才能在大浪淘沙中适者生存。在这样的情况下,中国人工智能技术的创业环境积极向上,为优质的技术和企业家创造了健康的创业土壤。
|