摘要
开放型对话是对话系统的一个重要分支,有着极强的应用前景。它不同于任务型对话,具有较强的随机性和不确定性。该文从回复方式驱动对话技术发展这个角度切入﹐进行开放型对话技术发展过程的梳理﹐紧扣序列到序列及其改良模型在对话生成场景中应用的这条主要线索﹐对开放型对话的关键技术进行了探讨和研究。上述研究勾画出了从单轮对话到多轮对话发展的主要研究主线。为进一步探索对话技术发展的内在规律和发展趋势,通过研究发现,基于序列到序列的生成模型在面向多轮对话生成的任务场景时﹐显现出模型实现特点和应用场景不完全匹配的问题。因此﹐在该文的最后v从引入外部知识、改写机制及代理机制三个角度切入﹐初步探索了相关技术针对多轮对话生成的可能改进方向。 ?
4思考与展望 本文以单轮对话到多轮对话的发展为全文的研究主线,进行了三个方面研究工作的综述。首先从回复方式驱动的角度切入进行对话技术发展的梳理。其次紧扣S2S及其改良模型在对话生成场景中的应用,对开放型对话的关键技术进行了探讨和研究。为进一步探索对话技术的未来发展趋势,在本文的最后从引入外部知识、改写机制及代理机制三个角度切入,进行相关技术针对多轮对话生成改进方向的探索与研究。通过相关内容的梳理与分析,进一步思考展望如下: 检索式和生成式算法作为对话生成模型的两种主要方法﹐具有各自的优缺点。检索式模型的回复往往更加可控,并且流畅性也会更加突出﹐总体给人的感觉是“中规中矩”,缺乏语言的多样性和个性化。生成式模型的回复多样性较强,经常会给人“眼前一亮”的感觉,但也时常会冒出一些让人摸不着头脑的话语,可控性较差。如果能将这两种对话生成方式有机结合起来,吸取各自算法上的优势﹐可以在一定程度上提升对话生成的质量。但如何寻找两种生成方式的合适结合点,还需要进一步研究。 对话生成模型情感的引入对于对话质量的提升有着十分显著的作用。对话系统作为一个直接与人对话的系统,若能实现对用户情绪的实时感知,会给人带来极为舒适的对话体验。如果将情感信息与强化学习相结合,可以进一步提升对话系统中情感引入的效果。强化学习时﹐需要机器能接受环境(Environment)的反馈来完成奖励(Reward),从而产生相应的动作( Action),该方式可增强对情感信息的实时感知。因此,情感引入与强化学习的结合研究方向,值得持续关注。
在提问方式上,人们希望的是对话系统能够找到适合自己的提问方式,有利于对话顺利进行下去。机器可能不清楚提问质量的好坏,这个就涉及到了一个重要的因素“语义理解”,也就是说,机器要理解整句话在说什么﹐而不是局限于某个局部,这样才能达到更好的提问效果。同时,在聊天过程中﹐说话者通常不是对上文中提到的东西进行提问﹐而是对与其相关的东西进行提问,这就要求模型在给定的话题下具有一定的知识迁移能力。外部知识的引用(基于知识库﹑知识图谱和文档)可以帮助系统增加“话源”并提升相关内容的迁移能力﹐能够“触类旁通”,灵活地进行话题的延续和转换。所以在对话生成模型中引入外部知识就显得十分重要。其中在引入外部知识的过程中﹐哪些技术的运用可以更好地提升对话生成的效果体验,还需要进行深入探索。
不难发现,在对话生成领域,应用最广的依然是S2S模型及其变种模型,S2S模型是机器翻译领域的重要模型,迁移到单轮对话生成上表现尚可。因为单轮对话与传统的问答系统相似﹐一般表现为一问一答的形式,用户提出问题或发出请求﹐系统识别用户意图﹐做出回答或执行特定操作,这个特点与机器翻译的特点类似﹐有着较强的机械式对应关系。 ?
但是,多轮对话的场景则更加复杂﹐除了问答内容外,还有情感和场景表述,与上下文语义高度相关或不相关交错出现﹐导致了多轮对话的高度复杂性。同时,对话本身所包含的信息也只占总传递信息量的一小部分,更多信息来源于说话人的身份、行为、当前的时间、地点等一系列的外部知识﹐所以多轮对话的信息获取方式也不应当只局限于用户所说的话。因此,传统的S2S模型在多轮对话场景下就显得比较“机械”和“被动”。如果能从心理认知的角度来思考多轮对话生成,探索如何使会话双方的认知空间内容达成同步,或许能够更加满足该应用场景下的需求。 ?
|