最新消息是什么?问题驱动的新闻聊天机器人
发布于 2022-05-20 02:40
聊天机器人提供了交互式信息访问的能力,新闻内容时,互动可以让他们提出清楚的问题,并深入了解选定的主题。但是目前,新闻聊天机器人的功能很少,内容由一般由新闻机构的成员手工制作,并且不能接受自由开放形式的问题。
最近加州大学伯克利分校的研究者提出了一种问题驱动的新闻聊天机器人系统实现方法。研究者通过将来自不同新闻媒体的新闻进行汇聚,然后按照新闻报道的主题进行分组,形成一个个按主题分类的聊天室,然后按主题生成很多预置问题,然后根据会话情况,跟踪,避免信息重复。
界面设计
如上图所示,如(A),在主页会显示当前热门的新闻报道主题,当用户选择其中一个主题进入后,就会进入到特定新闻报道主题的聊天室界面,如(B),在聊天室界面会显示最新的两篇和该主题相关的报道,还会显示三个和该新闻报道主题相关的推荐问题,最后是一个开放式的提问框,可以输入任何开放式的问题,如(C)当用户选择推荐问题或者提问后,系统就会把和问题相关的新闻段落推荐给用户。
数据来源
研究者收集了从从2010年开始,20个国际新闻机构的新闻文章,每天平均的新闻数量大概2,000篇。这些新闻文章被聚类成主题。
算法过程
研究者对Radford 2019年提出的使用SQuAD2.0数据集的问题生成GPT2模型进行了微调,用于产生新闻主题相关的问题。在训练的过程中,模型读进新闻文章段落,并使用模型生成和段落相关的问题。对每个主题的每篇文章的每个段落,使用Beam Search算法产生K个候选问题,然后删除重复的和过长的问题,来减少推荐问题数量。
如上图,构建问题和段落的PQ图,在会话过程中对已做回答的问题和段落做标注,避免推荐重复的答案。
实验验证
对系统进行三种不同的配置场景设置,TopQR:推送三个置信度最高的问题;RANDQR:从生成问题中排查TopQR中推荐的问题,随机推送三个问题。NOQR:不推荐问题。然后让志愿者使用系统,并收集调查表进行数据统计,如上图所示,TopQR场景设置,在各种指标的表现上都比较高。
本文来自网络或网友投稿,如有侵犯您的权益,请发邮件至:aisoutu@outlook.com 我们将第一时间删除。
相关素材