红宝石hbs0022 - 红宝石国际平台地址

计科讲坛（2022年第十讲）：任务导向型对话系统中对话策略关键技术研究

发布日期：2022-06-08 15:02:52 点击数：

报告题目：任务导向型对话系统中对话策略关键技术研究

报告人 ：赵阳洋

内容摘要：

任务导向型对话系统的研究日益引起学术界和工业界的重视。对话系统以自然语言形式帮助用户完成一个或多个领域特定任务，如餐厅和航班预订、天气查询以及大型服务企业客户服务等，可提高服务的便捷性，减轻客服负担，降低服务成本，在电商与政务服务等领域应用前景广阔。对话策略根据外部环境当前状态，从动作集中选择动作进行响应，其性能的优劣决定了任务型对话系统的成败。对话策略可建模为马尔可夫决策过程（MDP）,用强化学习方法求解。由于任务型对话通常具有更高状态空间和更大动作空间，存在奖励稀疏问题，基于深度强化学习的对话策略学习一直面临收敛缓慢和模型不稳定的问题。模型在训练过程中，尽管采用用户模拟器可部分减轻人工训练的代价，训练的效率问题也仍然是一个技术瓶颈。近五年，本人针对上述问题展开了深入研究，本报告探索人类学习和教育过程，结合深度强化学习和课程学习实现你人脑的互补策略学习模型和自适应课程学习策略模型，以提高对话策略学习效率。

报告人简介：

赵阳洋，女，1995年生，博士研究生。2017年获得广州中医药大学的医学信息工程专业的学士学位，同年保送至华南理工大学软件学院攻读博士学位。2021年11月至今获得国家留学基金委资助在荷兰乌特勒支大学的计算机信息与计算机科学进行联合培养。

长期从事人工智能、自然语言处理、人机对话、强化学习、深度学习和课程学习研究。共发表本领域国际权威/顶级会议及期刊论文11篇，其中以第一作者（含通讯作者）发表论文6篇，包含国际顶级会议/期刊论文5篇. 受理国内发明专利1件;国际顶级会议/期刊论文在投2篇。参与多项国家/省/市自然科学基金面上项目撰写和结题工作，并获得过华南理工大学博士研究生校长奖学金等。

会议时间：2022年6月9日（周四） 16：30

腾讯会议ID: 185-585-782

点击链接直接加入会议：

https://meeting.tencent.com/dm/tQS3TsCzBjba

欢迎广大师生参加！

红宝石hbs0022

下一条：计科讲坛（2022年第九讲）：地球大数据驱动的城市空间信息智能提取研究上一条：计科讲坛 - CCF走进高校系列讲座