Twitch表情中的情绪分析

作者|MartinAnderson
译者|马可薇
策划|凌敏
近年来 , 人们在社交媒体平台上越来越多地使用emoji、表情符号、颜文字、GIF以及各种非文字的表达方式 , 这让数据科学家们在研究全球范围的社会学格局时愈发艰难 , 但从人们公开的发言中还是能找到全球化社会学的一些趋势的 。
尽管在过去的十年里 , 自然语言处理(NLP)是个非常强大的情绪分析工具 , 但它不仅跟不上快速更新发展、跨语言的网络词汇和缩写 , 面对脸书和推特等社交网站上以图为主的帖子也束手无策 。
因为这类研究真正能依靠的超大规模资源只有这些为数不多的大型社交媒体平台 , 所以人工智能必须要做到与时俱进 。
今年七月 , 一篇论文提出了一种新方法 , 该方法利用包含了30000条推文的数据库 , 根据用户发到社交网络博文下的“GIF反应”(见下图) , 对博文引发的情绪进行归类和预测 。 该论文发现 , 这类以图像为主的反应从各方面来说都很容易衡量 , 因为大多数都不会包含情绪分析中的弱势项:讽刺 。
Twitch表情中的情绪分析
文章图片
研究学者们将人们使用的动态表情GIF称作“还原指标” , 并在他们发布于2021的论文中分析其用法 。
2021年上半年 , 波士顿大学带领研究团队通过训练机器学习模型预测推特上可能会流行的梗图 。 2021年八月 , 英国学者们通过研究社交媒体中人们使用表情符号(指图像形式的数字、字母和标点)或emoji(指图像形式的人脸、物品和符号)的趋势对比 , 整合了一个包含七种语言的大型推特情绪数据集 。
Twitch表情中的情绪分析】Twitch颜文字
现在 , 美国的研究者们已经开发出了一种机器学习训练方法 , 可以更好地理解、归类并测量Twitch(国外一游戏直播平台)上不断发展变化的颜文字(emotes)伪词汇 。
颜文字emotes是指Twitch上用来表达情绪、情感或小众笑话的新造词 。 因为其定义便是新造表情 , 所以对于机器学习系统来说 , 最难的并不是对源源不断新产生的新表情进行归类 , 总结的速度恐怕还赶不上他们过气的速度;我们要让机器能更好地理解这些表情背后的结构 , 并开发系统将这些颜表情识别为“临时”的单词或组合短语 , 而其所代表的情感则完全需要依靠上下文情景来判断 。
Twitch表情中的情绪分析
文章图片
与快乐蛙相类似的颜文字 , 简单更改后缀其含义便完全不同了 。
上图来自旧金山的一家社交媒体分析公司中的三位研究者发布的论文 , 《快乐蛙:推断Twitch中新造词背后的情绪含义(https://arxiv.org/pdf/2108.08411.pdf)》 。
爆红后的转型
尽管这些表情新鲜一时又多数短命 , 但Twitch经常会把旧表情素材挖出来回收利用 , 让饱经训练的情绪分析框架判断错误 。 通过追溯表情在演变过程中含义的变化 , 经常会发现他们现在所代表的情感或意图与最初创造时完全是天翻地覆 。
举例来说 , 研究者们注意到由于极右翼对快乐蛙梗图的滥用 , 这个表情几乎完全失去了它在Twitch上最初流行时代表的政治含义 。
快乐蛙的形象和它那句经典的“真不错兄弟(FeelsGoodMan)” , 最初是出现在2005年美国插画家MattFurie的一本漫画中 , 随后在2010年左右变成了极右翼的代表梗图 。 Vox曾在2017年发文称 , 虽然Furie自称与其撇清关系 , 但这种右翼挪用后所代表的含义还是流传了下来 , 但这篇论文背后的旧金山研究人员却并不认同: