《中国人工智能学会通讯》——11.4 地理实体的多模态主题特征观点挖掘与情 感分析

11.4 地理实体的多模态主题特征观点挖掘与情 感分析

随着互联网的发展普及和社会媒体服务的兴盛,人们在网络上可以便捷地获取和分享丰富的社会多媒体信息。其结果是,社会媒体平台上聚集了海量的人们对物理实体的评论和情感信息。从大规模的用户生成内容中挖掘实体的主题观点和分析情感是知识挖掘中的重要任务。已有的主题特征观点挖掘的工作主要集中在文本内容处理上[4] 。在多媒体上来挖掘主题特征观点,目前还鲜有研究工作。实际上,一个地理实体的很多主题特征方面都是多模态表达的。比如,对于北京,观察到的地标和雾霾不仅能用文本来表达,还能很具体地用视觉图像来描述。我们称这样的主题特征具有视觉表达性。这种主题特征含有清晰和具体的视觉对应形态。同时,实体的一部分主题特征没有清晰和具体的视觉对应,例如经济、工业等。这样的主题特征不具有视觉表达性,其用文本描述而很难用视觉具体内容来表达。通过对实体的多模态主题的视觉表达性进行建模,并挖掘相应的主题特征及观点情感,能够更好地理解目标实体。本文研究从丰富的地理社会媒体数据中,挖掘一个地理实体的多模态主题特征及对应的观点情感。如图 2(c) 所示,我们形式化地理实体的多模态主题特征和观点挖掘为:输入是一个实体的相关多媒体文档,包括 Flickr 图像、Tripadvisor 评论和新闻文档。换言之,输入文档可以是一张图像、一篇新闻文档或一条评论。文档由视觉和文本特征词以及观点组构成。我们提出一个生成式概率图模型——多模态主题观点挖掘模型(multimodal Aspect-Opinion Model, mmAOM, 如图 2(c))来推断输出。mmAOM 对主题特征和观点词在文档的生成过程进行建模而学习文本和视觉模态之间的关联关系,来区分有视觉表达性的主题特征和非视觉表达性的主题特征,以及主题特征和观点之间的依赖关系来辨别主题特征及相应的观点。模型输出包括学习到的多模态主题特征、文档的主题分布、主题特征对应的观点。由派生的地理实体的多模态主题特征和对应的观点,设计了实体关联可视化和多模态主题特征检索的应用。实体关联可视化是要简洁地在图谱上可视化出实体关联的重要主题特征和对应的用户观点情感。多模态主题特征检索利用主题与观点之间的关联关系进行跨模态观点检索的任务。我们在真实的实体对象数据集中进行实验评价 mmAOM。除了在地理实体对象(北京、伦敦、巴黎、纽约)上实验,也在其他实体做了实验评测,包括人物(纳尔逊曼德拉、史蒂夫乔布斯)和品牌(阿迪达斯、耐克)。实验的结果证明了提出的 mmAOM 模型在挖掘实体多模态主题特征和观点的有效性,以及在可视化和检索方面的实用性。

时间: 2025-01-30 07:41:55

《中国人工智能学会通讯》——11.4 地理实体的多模态主题特征观点挖掘与情 感分析的相关文章

《中国人工智能学会通讯》——6.7 实体链接任务及系统

6.7 实体链接任务及系统 给定一段文本(如"在旧金山的发布会上,苹果为开发者推出新编程语言 Swift"),一个实体链接系统需要通过如下多个子任务来实现实体消歧 [4] . 1 . 识别文档中的实体提及 (mention).这里的提及指的是我们想要链接的对象,如上面例子文本中的提及 {"旧金山","苹果","Swift"}. 2 . 针对每一个提及,识别该提及在知识图谱中可能指向的候选目标实体.例如,上述文本中的提及&quo

《中国人工智能学会通讯》——6.6 实体消歧技术研究

6.6 实体消歧技术研究 实体是文本信息的重要承载,每一段有意义的文本都描述了一组实体及这些实体相互之间的关联和交互.识别并理解文本中的实体信息也就成为了自然语言理解的基础问题之一. 然而,文本中实体信息的理解存在两方面的挑战.首先,文本中的实体名通常具有歧义.例如,给定如下三个包含"苹果"的句子: ● 今 天 上 午 苹 果 由 乔 布 斯 发 布 了 新 一 代iPhone.● 我早餐吃了一个苹果.● 范冰冰在苹果中演的不错. 上述三个句子中的 "苹果"分别指向

《中国人工智能学会通讯》——12.45 k-modes 型算法的类中心表示与收 敛性分析

12.45 k-modes 型算法的类中心表示与收 敛性分析 目前分类型数据的类中心表示方式有单值和多值两种.1998 年,Huang [4] 提出了 k-modes 算法,用 modes 来表示类中心,选择出现频率最高的值代表类,强调主流的属性值代表类,其他值为噪音,是典型的单值表示方式.单值表示方式由于简单易实现且聚类优化模型有很好的数学性质,保证了求解算法的收敛性,但它并不能充分刻画类的特性.San et al [17] 提出了多值表示类的方式,并应用于分类型数据的聚类.在该方法中,类是由

《中国人工智能学会通讯》——第11章 11.1 面向地理社会媒体的挖掘与应用

第11章 11.1 面向地理社会媒体的挖掘与应用 信息技术及互联网的发展,尤其是移动互联网的兴盛,正在深刻地影响改变着人们的生活.社会媒体,一种新型的允许人们创造并分享媒体信息的工具和平台,在近年来得到了飞速的发展,吸引着全球数以亿计的用户参与其中.伴随社会媒体的兴盛,随着地理位置定位技术的发展,基于用户地理位置的服务(Location Based Service, LBS)成为主流应用.用户通过移动设备的 GPS.WiFi.通信基站等方式获取地理位置信息使用各种各样的服务.社会媒体和地理位置的

中国人工智能学会通讯——混合智能概念与新进展

脑科学以阐明脑的工作原理为目标,近年来已成为最重要的科学前沿领域之一.脑功能计算.脑智能模仿再度成为学术界和产业界热议话题[1-4].欧盟.美国.日本相继启动了大型脑研究计划,强有力推动了人们对脑结构.脑功能和脑智能的探索和认识:另一方面,人工智能研究风起云涌,最近一个标志性事件是谷歌的AlphaGo以4:1战胜围棋世界冠军李世石[5],实现了围棋人工智能领域史无前例的突破.2016年9月斯坦福大学发布了<2030年的人工智能与生活>报告[6],全面评估了当前人工智能的进展.挑战.机遇与展望.

中国人工智能学会通讯——机器学习里的贝叶斯基本理论、模型和算法

非常感 谢周老师给这个机会让我跟大家分享一下.我今天想和大家分享的是,在深度学习或者大数据环境下我们怎么去看待相对来说比较传统的一类方法--贝叶斯方法.它是在机器学习和人工智能里比较经典的方法. 类似的报告我之前在CCF ADL讲过,包括去年暑假周老师做学术主任在广州有过一次报告,大家如果想看相关的工作,我们写了一篇文章,正好我今天讲的大部分思想在这个文章里面有一个更系统的讲述,大家可以下去找这篇文章读. 这次分享主要包括三个部分: 第一部分:基本理论.模型和算法 贝叶斯方法基础 正则化贝叶斯推

中国人工智能学会通讯——无智能,不驾驶——面向未来的智能驾驶时代 ( 下 )

到目前为止似乎比较完美,而实际还 存在着一些问题.我们现在看到很多道 路上面,交通标志牌它的分布非常稀疏, 可能每过一两公里才能够检测出来一个 交通标志牌,因为毕竟这个深度学习算 法是目前最完美的,它有时候还会错过 一个交通标志牌,这时候怎么办呢?我 们会发现在路面上也有非常明显的视觉 特征,我只要把路面的这些视觉特征识 别出来进行匹配,其实是有连续的绝对 的视觉参考的.所以我们做的办法是, 把这个路面粘贴起来.这个粘贴的方法 很简单,跟我们手机拍场景图片一样, 我们慢慢移动的时候可以把这个场景

中国人工智能学会通讯——深蓝、沃森与AlphaGo

在 2016 年 3 月 份,正当李 世石与AlphaGo 进行人机大战的时候,我曾经写过 一 篇< 人 工 智 能 的 里 程 碑: 从 深 蓝 到AlphaGo>,自从 1997 年深蓝战胜卡斯帕罗夫之后,随着计算机硬件水平的提高,计算机象棋(包括国际象棋和中国象棋)水平有了很大的提高,达到了可以战胜人类最高棋手的水平.但是,长期以来,在计算机围棋上进展却十分缓慢,在 2006 年引入了蒙特卡洛树搜索方法之后,也只能达到业余 5 段的水平.所以 AlphaGo 战胜韩国棋手李世石,确实是人

中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向 第一个,深度图像分析.目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用.比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能. 第二个,深度视频分析.视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦.当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互. 智