登录 / 注册
IT168服务器频道
IT168首页 > 服务器 > 服务器资讯 > 正文

SS-LSTM深度学习模型 可从对话文本检测情绪

2017-10-13 09:56    it168网站原创  作者: 谢涛 编辑: 谢涛

  【IT168 资讯】在我们人类的交谈中,语句中包涵深层的、潜在的情绪很常见。解读这种潜在的情绪是使人机交互更人性化的关键。不过,在文本中发掘这种潜在的情绪,即便对人类而言也是非常困难的,更不用说那些机器了。

  微软的研究人员正致力于创造一个“更像人类”的AI——Ruuh,其中,检测用户情绪是很关键的一个部分。本文作者Puneet Agrawal 与微软的研究人员Umang Gupta和Radhakrishnan Srikanth合作,以共同应对这一挑战。另外,来自印度理工学院的实习生Ankush Chatterjee也加入了这个机器学习研究任务。

可从对话文本中检测情绪的深度学习模型

  下面给大家介绍一下,他们是如何以一种新颖的方式来检测文本对话中的情感的:

  创造“情感人工智能”的挑战

  准确地发现情绪永远是一个巨大的挑战,对人类也是如此。在谈话中,参与者往往会误解对方试图传递的情感,因为情感表达往往很微妙。轻微的眉毛抬高或快速的傻笑很容易被忽略。同样,音调的突然变化往往很难察觉。

  尽管这些小动作很微妙,很容易被忽略,但它们仍携带着大量的信息,可以为谈话增添背景。例如,发现愤怒或悲伤的情绪可以帮助人类对每一次互动做出适当的反应。为机器提供这种技能有助于在未来创造更有用、更有同情心的“数字代理人”。一种能够检测情绪的机器可以产生真正帮助用户寻求帮助或信息的反应。

  机器已经可以在声音记录和面部画像中检测情感了。然而,如今的人类越来越多地使用消息传递APP进行通信。他们通过这些APP的交互是基于文本的。像Whatsapp和Twitter这样流行的社交应用,可以通过短信息传递信息。如果没有足够的上下文和额外的信息,机器就很难在这种对话中检测到情绪。例如,在阅读“为什么你不发短信给我!”你可以把它解释为悲伤,也可以理解为愤怒。对于机器来说,也存在着同样的歧义。缺乏面部表情和声音的调节使检测情绪成为一个具有挑战性的问题。

  此外,随着数字代理人在我们的社会中越来越受欢迎,这些代理人必须有情绪感知并做出相应的反应。为了解决这个问题,以上研究人员部署了一个深度学习算法。

  人工智能的“训练轮”

  在解决像这样的机器学习问题时,高质量高容量的数据与适当的标签相结合是很重要的。该团队决定以2012年至2015年期间发出的推文形式收集数据。在这一过程中收集的数亿条推文中,有300条是由人类法官单独标记的。

  在3个回合的对话中,我们把每一个都归入四类:快乐、悲伤、愤怒或其他。人类法官使用了文本线索、笑脸符号、表情符号和标点符号作为线索来探测整个场景中的情绪。例如,一个单词后的感叹号经常能表达愤怒(“为什么!”)。同样,微笑或表情符号也能传达幸福,如“:)”。通常,口头暗示也可以表示一种情绪。例如,如果一个人对一篇文章的回应是“there,there”,它可以传达一个需要安慰某人的需要,这可能表明在之前的文章中有悲伤或绝望。

  一旦人类法官删除了这个相对较小的数据集,一个最近的基于邻居的聚类算法被用来自动将更大的集合分类成相应的类别。该团队最终在其他类别中获得了456K的语句,28K表示快乐,34K表示悲伤,36K表示愤怒。

  该团队将大量的数据和适当的标签作为机器学习解决方案的两个“训练轮”。将解决方案称为“情绪和语义长短期记忆模型(SS-LSTM)”。

  顾名思义,这种深度学习模式结合了语义和情感指标,根据它们传达的情感来对文本对话进行分类。为了训练这个模型,该团队使用了微软的认知工具包,将数据分为“训练”和“验证”,基于9:1的比率(训练9组,验证1组)。他们发现训练模型的最优批处理大小是4000。有了这个批处理大小,0.005的学习速度给了他们最好的结果。

  最后,团队决定对模型进行测试,并将其预测能力与其他技术进行比较。他们选择了2016年的2226个从推特上选出来三回合对话测试这个模型。

  结果

  对于这四种情感类别的每一种,SS-LSTM模型在文本对话中检测情感的结果比其他所有已知的技术都要好得多。该模型比单独的LSTM-SSWE (情绪特定词嵌入)和LSTM-GloVe的表现要好。SS-LSTM也比卷积神经网络(CNN)的方法好得多。此外,其深度学习方法比传统的机器学习技术(如朴素贝叶斯、支持向量机和基于梯度的决策树)更好。

  关键的区别在于,该模型能够通过结合语义和情绪指标来检测情绪。换句话说,模型只是“理解”了比其他模型更深层次的对话。

  最终的想法

  网上的对话大多以短信的形式出现。如果没有声音调节或面部表情的辅助,在谈话中发现情绪是很困难的。尽管面临挑战,但创造一个能够检测情绪的数字代理人是非常有用的。未来的数字代理人可能会有更强的能力,如果它们能理解用户的感受并做出适当的回应。他们可以提供情感支持、语境信息,甚至可以产生符合对话气氛的反应。

  通过创建一个在短时间、基于文本的对话中结合语义和情感指标的模型,该团队在检测情绪方面做出了巨大的飞跃。这项工作还没有完成,该团队表示会不断地削减它面临的挑战。

  原文地址:https://blogs.msdn.microsoft.com/msind/2017/10/06/humanizing-artificial-intelligence-ai-with-deep-learning/

  • IT168企业级IT168企业级
  • IT168文库IT168文库

扫码送文库金币

实时热点
编辑推荐
系统架构师大会
系统架构师大会
点击或扫描关注
IT168企业级微信关注送礼
IT168企业级微信关注送礼
扫描关注
首页 评论 返回顶部