3.18 谣言识别的发展趋势
在线社交媒体中的谣言传播涉及到很多不确定的因素,传播的复杂性对谣言识别研究提出了极大的挑战。然而,为了将谣言对人们以及社会的影响降低到最小,应该越快越准确地识别出谣言。谣言识别研究的发展趋势可以概括为以下两个方面。
⑴ 特征提取。谣言识别的关键依据是谣言与非谣言存在的本质区别,以及谣言自身独有的规律特性。虽然已有的工作已经给出了谣言区分于非谣言的许多特征,但都只是研究谣言的某一侧面,并没有系统地给出谣言自身及其传播规律特征,以及这些特征对谣言的影响程度。我们的研究已经发现谣言的传播特征对于谣言的识别有明显的作用,因此,未来的研究应该重点考虑谣言传播的特性和规律,并综合谣言的用户特征以及内容特征,进一步提升谣言识别的准确率。
谣言传播特征包括谣言传播的结构特征、内容特征以及用户特征。这三种传播特征应该和时间维综合考虑研究谣言传播过程中,这些特征是如何随时间的变动而动态变化的。如传播结构特征中传播树的高度和宽度随时间是如何动态变化的;传播内容中包含的情感词等语言特征随时间是如何动态变化的,当传播内容中出现质疑和反驳时是否影响传播树的结构变化;传播的用户处于传播树的不同层级是否有不同的影响力,所有的传播用户是否具有一些共性的特征导致他们更容易相信并传播谣言等。
⑵ 谣言的实时识别。谣言的实时识别对在线社会媒体平台有重要的应用价值。现有的工作主要研究从众多已经传播完的消息中把谣言识别出来,然而,在信息无翼而飞的在线社交媒体环境下,社交媒体平台必须对信息进行实时分析,尽可能早的识别出谣言,将谣言产生的影响降到最小。从传播角度研究谣言的规律特征,为谣言的实时识别提供了基础前提。存在的几个工作[14, 18, 21]已经尝试进行谣言的实时识别,但是谣言识别的效果并不理想,一般是在谣言传播的 15 个小时以后达到理想的准确率。然而,我们的研究发现在转发中存在爆发的消息,谣言有 84.63%、非谣言有 91.58% 的消息在发帖后的 3 个小时内出现爆发。因此,谣言的实时识别应该尽可能在整个谣言事件爆发前识别出谣言。这方面的研究工作还有较大的提升空间,将会成为谣言识别的一个热点。