CCF学科前沿讲习班
The CCF Advanced Disciplines Lectures
CCFADL第107期

主题 自然措辞打算理论与运用
2019年10月9-11日
甘肃 敦煌
学术主任:
吴华/Hua Wu 百度首席科学家/Chief Scientist @ Baidu
张奇/Qi Zhang 复旦大学教授/Professor @ Fudan University
万小军/Xiaojun Wan 北京大学研究员/Professor @ Peking University
主理:中国打算机学会
承办:CCF中文信息技能专委
活动日程:
学术专题讲座详细信息
学术专题讲座1
讲者/Speaker:
李磊 字节跳动人工智能实验室总监 / Lei Li, ByteDance AI Lab
周浩 字节跳动人工智能实验室研究员 / Hao Zhou, ByteDance AI Lab
标题:深度文本天生模型
Title:Deep Generative Models for Text Generation
择要:文本天生技能是自然措辞处理中的一项根本技能,在机器写稿、机器翻译、对话、搜索、在线广告等产品上有很多运用。本次讲座将环绕三个方面先容文本天生中的深度天生模型。一是序列到序列的天生,包括最新的Transformer模型以及它在各种文本天生中的改进。二是比序列天生有更多上风的深度模型,包括天生与编码结合的变分自编码模型(VAE)与对抗天生网络(GAN)。VAE要对离散的文本序列学出光滑连续的隐空间,天生时可以从隐空间采样。而GAN可以附加一个与任务有关的判别器,可以天生与终极任务更干系的文本。第三类是可控贝叶斯方法,可以天生更大多样性和可阐明性的文本。末了,我们将先容实际场景中的一些运用,例如故事天生,数据到文本的天生,问题天生等。
讲者简介:李磊博士,现任字节跳动人工智能实验室总监、资深科学家,原百度美国深度学习实验室少帅科学家。上海交通大学打算机系本科,卡耐基梅隆大学打算机系博士,加州大学伯克利分校博士后研究员。曾获2012年美国打算机学会SIGKDD最佳博士论文第二名、2017年吴文俊人工智能技能发明二等奖、2017年CCF精彩演讲者。在机器学习、数据挖掘和自然措辞理解领域于国际顶级学术会议揭橥论文40余篇,拥有三项美国技能发明专利。担当CCF中文信息处理专委委员,2017 KDD Cup、2018KDD Hands-on Tutorial、2019KDDSponsorship联合主席, IJCAI2017和AAAI 2019资深程序委员、EMNLP2019领域主席和NeurIPS、ICML、KDD、IJCAI、AAAI、NAACL、EMNLP等大会程序委员。
周浩博士,2017年博士毕业于南京大学,现任字节跳动人工智能实验室研究员。他的研究兴趣为机器学习以及机器学习在自然措辞理解中的运用,包括句法剖析,机器翻译和文本天生等。他曾多次担当ACL, EMNLP, IJCAI, AAAI 和NeurIPS等会议的程序委员会委员,并在干系的顶级会议如NeurIPS、ACL、EMNLP、TACL上揭橥论文20余篇。目前他的研究事情紧张环绕深度天生模型在自然措辞处理中的运用展开。
学术专题讲座2
讲者/Speaker:
何晓东 京东人工智能研究院常务副院长、IEEEFellow / Xiaodong He, JD AI Research
标题:自然措辞及多模态智能技能进展及家当运用
Title: Natural Language and Multimodal Intelligence, and their Industrial Applications
择要:我将首先简单回顾深度学习技能对语音,措辞,视觉等方面的驱动,然后着重从两个方面磋商了其在自然措辞处理(NLP)方面的前沿研究。措辞智能是人类特有的高等智能。NLP技能可大致分成两个方面:一是如何让AI理解人类,如理解意图,解析语义,识别感情,搜索推举;二是如何让AI能被人类理解,如文本择要、内容天生、话题展开、情绪对话等,另一方面,基于这些根本AI技能,人机对话与交互系统的研究也取得了打破。对话系统每每涉及到NLP的各个核心问题,除了意图理解、状态跟踪、对话管理、回答天生等根本模块之外,我也谈判量在语义解析、知识图谱、机器阅读、情绪和风格表达等前沿方向上的最新研究进展。我还将先容在自然措辞理解和打算机视觉的交叉学科,多模态智能技能领域的一些最新进展,包括措辞与图像的理解、推理和天生。详细而言,我将先容跨措辞和视觉的语义表示建模,然后将先容在图像描述,即理解视觉内容和天生自然措辞描述;视觉问答,即跨自然措辞和视觉实行推理以推断答案;以及笔墨到图像合成,即按照自然措辞描述天生图像等方面的进展。这些事情也展示了AI拥有一定的“想象力”(比如不但能根据笔墨描述去画图,还可以在图片中添补一些笔墨没有描述的细节)。另一方面,人工智能技能的发展也将颠覆许多领域的格局,比如让内容创作平民化。我将回顾几个最近在艺术创造领域利用AI技能的例子,并磋商人工智能会不会融入人类的艺术天下? 同时,我们也比以往更关心这些技能的进步将会如何改变我们的生活。以零售家当为例,我将先容在京东我们如何运用人工智能技能驱动零售从大略的交易转变成更富有体验感的对话式做事。零售的全过程每每包含多个与顾客交互的环节,比如售前导购和售后做事等。在这些有主要代价的任务中,运用前辈的对话式人工智能技能,我们将能够打造可胜任大规模繁芜场景的智能交互对话系统,不仅能迅速解答顾客的问题,还能对情绪化的诉求供应共情的安抚与勾引,从而为顾客供应及时严密的做事。另一方面,智能对话做事技能带来的本钱低落和效率提升还将解锁更多之古人力本钱无法包袱的做事机会,进一步让家当升级。末了,与同学们做一场关于人工智能技能进展与家当影响的开放式对话。
讲者简介:何晓冬博士是京东人工智能研究院常务副院长,深度学习及语音和措辞实验室的卖力人。他还在华盛顿大学(西雅图)、喷鼻香港中文大学(深圳)、同济大学、及中心美术学院任兼职教授和名誉教授。在加入京东集团之前,他曾担当微软雷德蒙德研究院深度学习技能中央的主任研究员和卖力人。他的研究紧张集中在人工智能领域,包括深度学习,自然措辞处理,语音识别,打算机视觉,信息检索和多模态智能。他与互助者在这些领域揭橥了100多篇论文,谷歌学术统计引用数过万次,并多次得到精良论文奖及赢得主要的人工智能方面大赛。他与互助者提出的深层构造化语义模型(DSSM/C-DSSM),分层把稳力网络(HAN),Image CaptionBot,Bottom-Up Attention等算法广泛运用于措辞,视觉,搜索和人机对话等任务。他拥有清华大学和美国密苏里大学的学士和博士学位,并在多个IEEE及ACL的期刊和学术会议担当编委、组委或领域主席。基于其在自然措辞和视觉技能及多模态信息处理方面的贡献,他于2018年底入选IEEE Fellow。
学术专题讲座3
讲者/Speaker:
刘兵 伊利诺伊大学芝加哥分校/北京大学教授,ACM、IEEE、AAAIFellow /Bing Liu, University of Illinois at Chicago (UIC)/PekingUniversity
标题:自然措辞及多模态智能技能进展及家当运用
Title: Natural Language and Multimodal Intelligence, and their Industrial Applications
择要:我将首先简单回顾深度学习技能对语音,措辞,视觉等方面的驱动,然后着重从两个方面磋商了其在自然措辞处理(NLP)方面的前沿研究。措辞智能是人类特有的高等智能。NLP技能可大致分成两个方面:一是如何让AI理解人类,如理解意图,解析语义,识别感情,搜索推举;二是如何让AI能被人类理解,如文本择要、内容天生、话题展开、情绪对话等,另一方面,基于这些根本AI技能,人机对话与交互系统的研究也取得了打破。对话系统每每涉及到NLP的各个核心问题,除了意图理解、状态跟踪、对话管理、回答天生等根本模块之外,我也谈判量在语义解析、知识图谱、机器阅读、情绪和风格表达等前沿方向上的最新研究进展。我还将先容在自然措辞理解和打算机视觉的交叉学科,多模态智能技能领域的一些最新进展,包括措辞与图像的理解、推理和天生。详细而言,我将先容跨措辞和视觉的语义表示建模,然后将先容在图像描述,即理解视觉内容和天生自然措辞描述;视觉问答,即跨自然措辞和视觉实行推理以推断答案;以及笔墨到图像合成,即按照自然措辞描述天生图像等方面的进展。这些事情也展示了AI拥有一定的“想象力”(比如不但能根据笔墨描述去画图,还可以在图片中添补一些笔墨没有描述的细节)。另一方面,人工智能技能的发展也将颠覆许多领域的格局,比如让内容创作平民化。我将回顾几个最近在艺术创造领域利用AI技能的例子,并磋商人工智能会不会融入人类的艺术天下? 同时,我们也比以往更关心这些技能的进步将会如何改变我们的生活。以零售家当为例,我将先容在京东我们如何运用人工智能技能驱动零售从大略的交易转变成更富有体验感的对话式做事。零售的全过程每每包含多个与顾客交互的环节,比如售前导购和售后做事等。在这些有主要代价的任务中,运用前辈的对话式人工智能技能,我们将能够打造可胜任大规模繁芜场景的智能交互对话系统,不仅能迅速解答顾客的问题,还能对情绪化的诉求供应共情的安抚与勾引,从而为顾客供应及时严密的做事。另一方面,智能对话做事技能带来的本钱低落和效率提升还将解锁更多之古人力本钱无法包袱的做事机会,进一步让家当升级。末了,与同学们做一场关于人工智能技能进展与家当影响的开放式对话。
讲者简介:何晓冬博士是京东人工智能研究院常务副院长,深度学习及语音和措辞实验室的卖力人。他还在华盛顿大学(西雅图)、喷鼻香港中文大学(深圳)、同济大学、及中心美术学院任兼职教授和名誉教授。在加入京东集团之前,他曾担当微软雷德蒙德研究院深度学习技能中央的主任研究员和卖力人。他的研究紧张集中在人工智能领域,包括深度学习,自然措辞处理,语音识别,打算机视觉,信息检索和多模态智能。他与互助者在这些领域揭橥了100多篇论文,谷歌学术统计引用数过万次,并多次得到精良论文奖及赢得主要的人工智能方面大赛。他与互助者提出的深层构造化语义模型(DSSM/C-DSSM),分层把稳力网络(HAN),Image CaptionBot,Bottom-Up Attention等算法广泛运用于措辞,视觉,搜索和人机对话等任务。他拥有清华大学和美国密苏里大学的学士和博士学位,并在多个IEEE及ACL的期刊和学术会议担当编委、组委或领域主席。基于其在自然措辞和视觉技能及多模态信息处理方面的贡献,他于2018年底入选IEEE Fellow。
学术专题讲座4
讲者/Speaker:
刘树杰 微软亚洲研究院主管研究员 /Shujie Liu, Microsoft Research Asia
标题:低资源神经机器翻译
Title: Low Resource Neural Machine Translation
择要:随着深度学习研究的深入,神经机器翻译在这几年取得了飞速的发展。对付一些资源丰富的措辞和特定的领域,比如新闻,大规模演习数据相对随意马虎得到,基于其上演习得到的神经机器翻译乃至能够达到与人工翻译相媲美的水平。然而对付小语种或者一些分外的领域,大量的双语数据并不是那么随意马虎得到,导致神经机器翻译的质量大幅低落。如何提高神经机器翻译在低资源翻译任务上的性能成为近几年的热门研究方向。在本讲座中,我将先容几种有效的演习低资源神经机器翻译的方法。详细的,我将先容两种半监督演习的方法:其一是基于双向翻译同等性的原则联合演习从左到右和从右到左的两个翻译模型;其二是基于大规模的单语数据联合演习源措辞到目标措辞和目标措辞到源措辞的翻译模型。其余,如何利用已有的其它措辞的大规模双语数据来提高小语种的翻译质量也是一个非常故意义的研究课题,对此,我将先容一种基于期望最大化的演习方法来将小语种作为两个主流措辞之间的隐含状态,并迭代更新主流措辞和小语种之间的四个翻译模型。末了,我将先容如何在不该用任何双语数据的情形下,利用无监督机器翻译的技能来提高神经机器翻译的质量。
讲者简介:刘树杰,微软亚洲研究院主管研究员。刘树杰分别于2007年和2012年从哈尔滨工业大学得到硕士和博士学位。他的研究方向包括自然措辞处理、语音处理和深度学习。目前从事根本性的自然措辞语音处理的建模、算法,以及创新性的研究事情。他的研究成果被广泛运用于微软产品中,包括Microsoft Translator、 Skype Translator、微软输入法、微软小冰、微软语音做事等。他在国际顶级期刊和会议上揭橥了超过40篇论文,个中包括11篇ACL,6篇AAAI和5篇EMNLP,并合写了高教出版社出版的专著《机器翻译》。
学术专题讲座5
讲者/Speaker:
刘知远 清华大学副教授 /Zhiyuan Liu, Tsinghua University
标题:知识辅导的自然措辞处理
Title: Knowledge-Guided Natural Language Processing
择要:近年来深度学习技能席卷自然措辞处理(NLP)各大领域。作为范例的数据驱动方法,深度学习面临可阐明性不强等难题,如何将人类积累的大量措辞知识和天下知识引入深度学习模型,是改进NLP深度学习模型性能的主要方向,同时也面临很多寻衅。本报告将先容知识辅导的自然措辞处理的最新进展与趋势。
讲者简介:刘知远,清华大学打算机系副教授、博士生导师。紧张研究方向为表示学习、知识图谱和社司帐算。2011年得到清华大学博士学位,已在ACL、IJCAI、AAAI等人工智能领域的著名国际期刊和会议揭橥干系论文60余篇,Google Scholar统计引用超过4000次。承担多项国家自然科学基金。曾获清华大学精良博士学位论文、中国人工智能学会精良博士学位论文、清华大学精良博士后、中文信息学会青年创新奖,入选中国科学青年人才托举工程、中国打算机学会青年学者提升操持。担当中文信息学会青年事情委员会执委、副主任,中文信息学会社会媒体处理专委会秘书长,ACL、EMNLP、COLING、IJCNLP领域主席。
学术专题讲座6
讲者/Speaker:
张敏 清华大学长聘副教授 /Min Zhang, Tsinghua University
标题:个性化推举研究根本与发展趋势
Title: Foundations and Trends for Personalized Recommendation
择要:个性化推举在当前信息消费社会受到越来越多关注。本讲座将包括两个部分:首先先容个性化推举研究的一些根本性问题,包括用户的需求谈论、寻衅性问题以及现有的技能体系;讲座的第二部分紧张先容个性化推举研究中新的研究趋势,包括(但不仅限于)用户满意度与评价、可阐明的推举、基于知识图谱与推理的推举、跨领域异质推举、推举的公正性等,末了与听众一起对未来方向进行磋商。
讲者简介:张敏, 清华大学打算机科学与技能系长聘副教授、博士生导师。紧张研究领域为个性化推举、信息检索、用户建模与剖析。现任打算机系智能技能与系统实验室科研副主任、网络与媒体技能教诲部-微软重点实验室副主任。在主要的国际期刊和会议上揭橥多篇学术论文,包括TOIS、JIR、WWW、SIGIR 、IJCAI 、CIKM、WSDM、RecSys等,Google Scholar引用3500余次,H-index引用值32。已授权专利12项。担当主要国际期刊TOIS编委,国际会议WSDM 2017和EVIA2019程序委员会主席、SIGIR18 短文主席、SIGIR2019讲座主席、WSDM2019研讨会主席等。得到2016年北京市科学技能一等奖、2018高校打算机专业精良西席褒奖等。长期与企业界开展多项互助。
http://www.thuir.cn/group/~mzhang/
报名须知
1、参会用度:ADL 107为NLPCC 2019的Tutorials,可以单独报名,也可以和NLPCC 2019主会联合报名,参会用度如下表。
现场报名,需缴纳报名费4000元(仅支持公务卡,银行卡,不收取现金)。本次ADL 107食宿交通自理。根据交费先后顺序,会员优先的原则录取,额满为止。
2、注册报名办法:
(2)报名链接:http://tcci.ccf.org.cn/nlpcc/2019/index.php
(3)CCF会员报名,请务必填写在有效期内的CCF会员号,否则按非会员对待。
(4)缴费办法有如下两种:
a. 在报名系统中在线缴费或者通过银行转账
b. 银行转账(支持网银、支付宝):
开户行:北京银行北京大学支行
户名:中国打算机学会
账号:0109 0519 5001 2010 9702 028
请务必注明:姓名+NLPCC2019
报名缴费后,报名系统中显示缴费完成,即为报胜景利。
联系
贾爱霞 邮箱:nlpcc@pku.edu.cn 电话:010-82529251
李红梅 邮箱 : adl@ccf.org.cn 电话:010-62562503-18