百度王海峰:语言智能的发展将推动AI技术加快落地

2019-04-20 17:24 环球网

【环球网科技综合报道】“理解和运用自然语言是人工智能的核心问题之一。大数据、机器学习、深度学习和知识图谱等技术的发展,正在给语言与智能的发展带来突破。”4月20日,第十四届中国电子信息技术年会上,百度高级副总裁、AI技术平台体系(AIG)和基础技术体系(TG)总负责人王海峰发表题为《语言与智能》的演讲,以翻译为例介绍了人工智能技术的演进,阐释近期语言与知识技术和大数据、深度学习等技术结合带来的突破、行业应用,以及技术趋势和挑战。

王海峰表示,“通俗来讲,人工智能是让机器可以像人一样,具备听觉、视觉、语言、行为能力,可以进行逻辑计算和推理规划,并基于知识学习持续进化。”

众所周知,语言是人类思考的媒介,是人类特有的高级智力活动。早期的简单符号,到甲骨文,到纸质的书,以及现代互联网上的文本,语言文字这一载体让知识得以凝炼和传承,可以说,语言文字促进了人类文明的发展。因此,如何理解和运用自然语言,是人工智能需要解决的核心问题之一。当下,大数据、知识图谱、机器学习、深度学习等技术快速发展,并与自然语言处理密切结合,推动语言智能持续发展和突破,并越来越多地应用于各个行业。

自然语言处理是人工智能皇冠上的明珠,而填补语言鸿沟的机器翻译则是自然语言处理最典型的应用技术之一。王海峰从亲历的机器翻译发展史中以小窥大,梳理介绍了人工智能技术的发展和演化历程。

据了解,王海峰从1993年开始从事机器翻译的相关研究,初期便采用基于规则的方法,在国家“863”评测获得第一。2010年加入百度后,他带领团队融合统计与规则、实例和神经网络等方法,实现了多方面的技术创新,打造出服务亿万用户的百度翻译,并在2015年率先发布互联网神经网络翻译系统。目前,百度翻译可支持全球28种语言互译,覆盖756个翻译方向,超过15万家第三方应用接入百度翻译API,每日翻译字符数超过千亿。

王海峰表示,机器翻译的发展从最初运用规则系统,到统计的机器学习方法,后又解决算法、算力等各方面的问题,不断登上新的台阶。人工智能的发展脉络与此相似,经历多种方法的探索和实践,有过低谷和高潮,总的趋势是在持续进步。

另外,在自然语言处理领域,深度学习模型具有比传统机器学习模型更强的数据学习能力,使得基于深度学习的依存句法分析等自然语言处理系统准确率得到大幅提升。

目前,深度学习领域主要有强化学习、监督学习、无/自监督学习三种学习范式,而无/自监督学习可以类比人类学习,是重要的一种学习方式。

依托深度学习技术的发展,语音、图像等感知技术取得了巨大进步,但认知技术的突破,会越来越依赖知识,需要提升对知识和大规模知识图谱的运用。在物理世界、人类社会和网络空间中,汇聚了大量的多元、异构、多模态的数据,百度借助无标签大数据开放域知识挖掘、知识体系自动扩展、知识整合等技术,基于海量数据构建起了超大规模知识图谱。目前,百度拥有世界上最大的多元异构知识图谱,除了包含数亿实体、千亿级事实,能够满足90%用户需求的实体图谱,针对不同的应用场景和知识形态,百度还建立起关注点图谱、行业知识图谱、POI图谱、事件图谱等多种知识图谱。比如在医疗领域,能够从病历等原始文本中,抽取出实体及多元关系,并进行文本结构化,最终构建起医疗图谱,同时结合医疗大数据、医疗认知计算,应用于医疗临床辅助决策服务中。

语言理解技术持续发展,并通过与知识图谱、深度学习等技术融合,不断提高各种应用的智能化程度。

王海峰在演讲中介绍,百度创新地融合知识图谱、自然语言处理及深度学习技术,研发了能够深刻理解用户意图、精准满足搜索需求、提供更丰富知识内容的智能搜索引擎,并结合语音、图像、AR等感知技术能力,更便捷地与用户交互,为用户提供更精准高效的信息服务。

例如,用户用自然语言搜索“林徽因的丈夫的父亲是谁”,智能搜索引擎能够理解用户的意图,并结合知识图谱以图文并茂的形式把答案“梁启超”精准呈现给用户。又如,用户搜索“上面草字头下面句子的句是什么字”,智能搜索引擎能够为用户提供“苟”的读音、笔画、释义等丰富的信息。

其中,智能客服是结合自然语言处理、知识图谱和语音等技术打造的行业解决方案。在智能客服场景中,基于语音语义一体化技术,百度大脑可以准确识别出用户的话语,理解用户意图,进而通过行业知识图谱的赋能理解业务流程,为用户提供相应的服务。整个服务过程流畅自然,实现了与用户无障碍沟通,提升业务效率并满足用户需求。

王海峰表示,“随着技术发展,我们会越来越深入地理解自然语言、掌握知识,推动人工智能发挥更大的价值,为人类社会发展提供更大的助力。”

责编:连丽敏

版权作品,未经环球网 huanqiu.com 书面授权,严禁转载,违者将被追究法律责任。

阅读数(555
不感兴趣

不感兴趣

  • 广告软文
  • 重复、旧闻
  • 文章质量差
  • 文字、图片、视频等展示问题
  • 标题夸张、文不对题
  • 与事实不符
  • 低俗色情
  • 欺诈或恶意营销
  • 疑似抄袭
  • 其他问题,我要吐槽
*请填写原因

感谢您的反馈,我们将会减少此类文章的推荐