半监督组稀疏表示:模型、算法与应用(ECAI 2016论文精选)| AI科技评论

ECAI 2016是欧洲展示AI科学成果的最佳场所,大会为研究人员提供了很好的机会,去介绍和听取当代最优秀的人工智能研究成果。

半监督组稀疏表示:模型、算法与应用(Semi-Supervised Group Sparse Representation:Model, Algorithm and Applications)

 

摘要:组稀疏表示(GSR)利用了数据中的组结构,并在许多问题上效果很好。 然而,该组结构必须事先手动给出。在许多实际情况下,如分类,样本都是根据他们的标签进行分组的。在这种情况下,构建一个一致的组结构确实不容易。其原因有:1)样本可能被错误地标记;2)标签分配到大数据中非常费时且成本高。在本文中,我们提出并制定了一个新的问题,用半监督组稀疏表示(SS-GSR)支持标记和未标记数据中的组稀疏表示。同时学习一个更强大的组结构,它可以被进一步利用以更有效地代表其他未标记的数据。我们开发了一个模型来解决SS—GSR问题,它基于子空间分割中的流形假设,即同一组中样本特征空间紧密联系在一起且跨越相同的子空间。我们还提出了一个交替算法来解决模型。最后,我们通过大量的实验验证了该模型。

第一作者简介

Longwen Gao

任职:上海市智能信息处理重点实验室,复旦大学计算机科学院博士

研究方向:数据挖掘,人工神经网络,人工智能

相关学术论文:

·“Effectively classifying short texts by structured sparse representation with dictionary filtering”

文章总结及应用场景

本文中,我们提出并制定了半监督GSR(SS-GSR)对含标记和未标记的数据集进行组稀疏表示。它可以克服传统GSR的两大缺陷:1)在GSR中预定义组结构可能与数据中不完全一致;2)GSR中未利用未标记数据的潜在组结构。相比于GSR,SS-GSR可以利用标记数据的先验组结构和未标记数据的组结构信息。相比于SSL方法,SS-GSR可以从数据中自动的学习结构化亲和矩阵,而不是使用一个固定的。

我们将SS-GSR应用于监督和半监督分类任务,验证了SS-GS的有效性和优越性。

via:ECAI  2016

PS : 本文由雷锋网(公众号:雷锋网)独家编译,未经许可拒绝转载!

原论文下载

 

本文作者:章敏

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-19 08:55:44

半监督组稀疏表示:模型、算法与应用(ECAI 2016论文精选)| AI科技评论的相关文章

ECAI 2016论文精选 | 用于改善文字和文本嵌入的聚类驱动模型

ECAI 2016是欧洲展示AI科学成果的最佳场所,大会为研究人员提供了很好的机会,去介绍和听取当代最优秀的人工智能研究成果. 用于改善文字和文本嵌入的聚类驱动模型(Cluster-Driven Model for Improved Word and Text Embedding) 摘要:大多数现有的文字嵌入模型只能考虑文字和与它相近语境之间的关系(例如,十字左右的目标文字).然而,超越相近语义的信息(整体语境),反映了丰富的语义含义,而这通常都被忽略了.本文中,我们提出了一个通用的框架,利用全

新型算法横空出世,AI 大佬亲自为人工智能降火|AI科技评论周刊

本周谷歌再为人工智能增添了一种新型算法,如果能够广泛应用无疑会为企业降低不少成本.就在 AI 离我们越来越近,发展势头愈发猛烈之时,人工智能领军人物之一吴恩达博士公开为产业界写了一封信,意在表明人工智能尚未成熟,我等仍需努力,各行各业想利用 AI 提高自己效益的公司也不要过分迷恋人工智能,它不过是 A 到 B 的一种简单公式而已. 只训练一次数据就能识别出物体,谷歌全新 AI 算法"单次学习" 最近谷歌 DeepMind 团队发现了一种新的方式对深度学习算法进行调整,新算法可以只通过一

从数据算法到人工智能,带你穿越重重迷雾 | AI科技评论周刊

在通向人工智能的道路上,免不了要经常和数据算法打交道.本周AI科技评论从专业角度,详解最新出炉的科学家最常使用的十大算法,以及分析深度学习在数据革命中到底占据什么位置.另外,本周还有Palm之父Jeff Hawkins.人类简史作者Yuval Harari以及微软亚洲研究院院长洪小文从不同的角度带你穿越人工智能学习过程中的重重迷雾. | 最新出炉--数据科学家最常使用的十大算法 基于调查,KDnuggets总结出了数据科学家最常使用的十大算法,它们分别是: 1. Regression 回归算法

PRICAI 2016 论文精选 | 特征选取与实例选取的差分进化算法

特征选取与实例选取的差分进化算法(A Differential Evolution Approach to Feature Selection and Instance Selection)   摘要:由于存储硬件和数据采集技术的不断发展,越来越多数据正被收集.数据的传入流量非常的庞大,以至于数据挖掘技术无法跟上其脚步.收集的数据往往有多余的或不相关的特征/实例,它们会限制分类的性能.特征选取和实例选取是通过消除无用数据来帮忙缓解该问题的过程.本文提出了一系列使用差分进化算法(Different

论文精选 | 流感也能预测——升级版状态滤波算法

SIR模型是传染病模型中最经典的模型,最基本的模型,为传染病动力学的研究做出了奠基性的贡献.其中S表示易感者,I表示感染者,R表示移出者. 预测SIR流行病的升级版状态滤波算法(An Improved State Filter Algorithm for SIR Epidemic Forecasting)   摘要:在流行病建模中,状态滤波在提高传统传染病模型的性能方面是一种很好的工具.我们引入了一种新的状态过滤算法,以进一步提高基于易感者-感染者-移出者SIR)模型最好方法的性能.该算法融合了

opencv3. 1鱼眼镜头畸变模型依据的是哪篇论文? 想找到看看原型

问题描述 opencv3. 1鱼眼镜头畸变模型依据的是哪篇论文? 想找到看看原型 opencv3. 1鱼眼镜头畸变模型依据的是哪篇论文? 想找到看看原型

DT科技评论第12期:谷歌和OpenAI“学生”算法

DT科技评论 Data Technology Review 第 12 期           人民网研究院,阿里云研究中心 本期目录 韩国政府拨款26亿美元支持区块链 大力推广数字货币 Uber完成全球首次无人驾驶卡车送货 谷歌与万事达卡和Visa合作 无缝推广安卓支付 谷歌收购视觉追踪技术公司Eyefluence 拓展VR布局 谷歌和OpenAI"学生"算法让AI学习时不接触原始数据 谷歌发布Google Jameboard产品 改造传统教学白板 地下黑市惊现10万物联网设备组成的僵

lpa 半监督学习 之--标签传播算法

  众所周知,机器学习可以大体分为三大类:监督学习.非监督学习和半监督学习.监督学习可以认为是我们有非常多的labeled标注数据来train一个模型,期待这个模型能学习到数据的分布,以期对未来没有见到的样本做预测.那这个性能的源头--训练数据,就显得非常感觉.你必须有足够的训练数据,以覆盖真正现实数据中的样本分布才可以,这样学习到的模型才有意义.那非监督学习就是没有任何的labeled数据,就是平时所说的聚类了,利用他们本身的数据分布,给他们划分类别.而半监督学习,顾名思义就是处于两者之间的,

基于动态混合高斯模型的商品价格模型算法

1. 背景     作为电子商务网站,淘宝网上的每个商品都有一个价格,该价格从一个很重要的维度上反应出一个商品的品质.但是由于该价格是由第三方卖家自己确定的,因此存在一定的随机性.一个价格过低的商品,其假货的可能性往往较大,比如500元的劳力士手表,或者商品的质量存在问题:同时一个价格过高的商品,可能会失去一个潜在的购买者,也可能会是卖家故意设置高价,以便用户按价格排序时展现在靠前的位置.    因此对一个商品当前价格的合理性进行判断,并根据该商品的属性给出其合理的价格区间,对于规范淘宝网的商品