《中国人工智能学会通讯》——12.8 序列模式挖掘趋势展望

12.8 序列模式挖掘趋势展望

近年来,数据挖掘会议和期刊中将模式与统计结合成为较热门的研究方向[47-49] ,通过统计方法对数据模式进行剪枝、判断模式的“有趣性”成为热点。例如,Nakagawa 等人[50]提出基于统计的安全剪枝规则对数据模式进行剪枝;Tatti [47] 提出的基于概率的划分模型 , 可以根据所预测的“有趣性”对无间隔的频繁情景模式进行排序。此外,在数据库会议和期刊中,面向大规模数据的具有高可扩展能力的序列模式挖掘算法也不断发表[33,51] 。

笔者认为 , 近年来面向大数据需求的序列模式挖掘算法将成为新的研究趋势与热点。首先,学术界普遍承认在传统序列模式挖掘输出的模式数量多,存在冗余。因此,如何减少模式的输出数量,降低冗余度成为面向大数据的特别需求。目前,热门解决方案是引入概率统计的思想初步解决该问题,此方向仍需要更多深入的研究。其次,打破传统的频率框架,设计新的“有趣性”度量,定义适用于特定应用的数据模式也可能是解决冗余问题的一条途径。第三,在新的大数据计算框架下,研究高可扩展的序列模式挖掘算法仍将会是一个主流趋势。与传统并行算法所不同的是,近年涌现出的并行序列模式挖掘算法更加追求任务划分上的负载均衡,充分发挥大数据计算框架的优势,从而取得了性能大幅提升。

时间: 2024-10-04 18:59:31

《中国人工智能学会通讯》——12.8 序列模式挖掘趋势展望的相关文章

《中国人工智能学会通讯》——7.10 总结和展望

7.10 总结和展望 机器阅读理解是自然语言处理的一个子任务,回答这一类的问题需要对文本的深层次含义进行理解建模.该任务属于高级别抽象的认知任务,传统方法还是依靠一些特征工程的手段去对文本语义的一部分做出归纳.深度学习技术在这个领域虽然也有一些工作提出,但是由于受到训练集大小的限制,现阶段取得的成果并不具备优势.就目前的研究成果来看,机器阅读理解的研究未来有三方面值得关注. 第一,首先从统计的角度分析,现有针对问答系统的深度学习技术(如记忆网络.神经图灵机.关注模型)都是需要大量数据才能很好的训

《中国人工智能学会通讯》——3.24 总结与展望

3.24 总结与展望 对于基于分类 / 回归的流行度预测方法来说,尽管对于不同的用户生成内容流行度预测,特征的性能会稍有差别,但从整体上讲,用户生成内容传播过程中的时间特征和底层传播网络特征的预测性能优于用户生成内容自身的内容特征.已有研究仅关注挖掘对预测工作有效的特征,忽略了分析各类特征获取的难易程度.例如,对于预测性能较好的结构特征,其提取过程需要预先获得整个底层用户网络的信息.然而随着在线社会网络规模的逐渐增大和各类社交服务网站对数据的严格限制,底层用户网络的信息往往不容易获得.此外,某些

《中国人工智能学会通讯》——4.25 总结与展望

4.25 总结与展望 计算机的出现为人类科学技术的发展提供了十分强大的工具.随着计算机性能的不断提高,人们不仅希望它能够完成人类难以完成的计算工作,也希望它能够完成过去只有人类才能完成的一些工作.让机器具有类似于人的视觉注意功能是神经生物学.心理学.计算机视觉.图像处理.模式识别.人工智能等多个学科的共同问题.几十年来,各领域的研究者们从未停止过对视觉显著性的关注,并得出了很多具有代表意义的成果,但我们还远不能使机器像人一样"自然而然"的分配注意,进而像人一样进行视觉认知.然而,得益于

《中国人工智能学会通讯》——1.13 总结与展望

1.13 总结与展望 本文对社区问答系统的组成结构.用户获取信息或者分享知识的典型流程,以及热点研究问题进行了简单介绍.从已有的相关研究工作中可以看出,作为一个新兴而实用的互联网应用,社区问答系统已经受到国内外众多研究学者的关注,并取得了非常丰富的研究成果.然而,社区问答系统的研究还有许多问题有待解决,我们认为未来研究可以重点考虑三个方面. 1 . 挖掘类别层次结构的语义信息大部分社区问答系统对用户提交的问题都是按照人工设定好的层次类别体系进行组织的.已有的工作所使用的类别信息都仅仅考虑了问题的

《中国人工智能学会通讯》——3.9 总结和展望

3.9 总结和展望 总的来说,社交网络和社会媒体得到了迅猛发展,积累了大量的用户数据,为海量异构社交网络的研究带来了巨大的机遇.跨网络链接预测成为社会网络研究的一个热点.本文简单介绍了跨网络链接预测的几类问题和解决这些问题的主要模型.然而还有问题值得进一步深入研究,包括模型方面和应用方面. (1)模型方面.目前的研究主要是针对特定领域某一具体问题进行具体分析,从而建立模型.未来的研究可以关注于发掘有效的方法整合异构网络之间的知识概念,挖掘异构网络中链接产生的根本机制.在研究社交网络时,可以进一步

《中国人工智能学会通讯》——9.9 总结与展望

9.9 总结与展望 本文对哈希学习的研究进展和发展趋势进行了简要介绍. 可以看出 , 哈希学习虽然已被广泛关注并在某些应用领域取得了初步成效,但仍然存在很多具有挑战性的问题需要进一步研究和探索.另外,怎样将哈希学习的思想和方法拓展到新的学习场景和应用领域 , 用来解决传统方法在遇到大数据时不能解决的问题 , 将是非常有意义的工作. 例如,很多深度神经网络的参数规模往往很大,在实际应用(尤其是面向移动终端的应用)中需要的存储和计算开销都太大,将哈希学习的思想引入到深度神经网络的学习过程中,用来学习

《中国人工智能学会通讯》——4.8 总结与展望

4.8 总结与展望 大规模城市空间文本数据的产生和人们出行对路网的依赖 , 催生了基于路网的空间关键词查询.这种查询可以为各类基于位置的应用提供非常好的查询支持.随着智慧城市的不断发展和智能交通的日趋成熟,作为一种输入简单.查询多样的查询模式,基于路网的空间关键词查询必然将获得更进一步的发展.与此同时,从研究的角度出发,基于路网的空间关键词查询在以下三个方面值得进一步的研究. (1) 动态路网上的空间关键词查询在现实世界中,由于受交通状况的影响,道路上的通行时间是动态变化的.例如,早晚高峰的通行

《中国人工智能学会通讯》——6.17 总结与展望

6.17 总结与展望 知识图谱是知识工程的一个分支,以知识工程中语义网络作为理论基础,并且结合了机器学习.自然语言处理以及知识表示和推理的最新成果,在大数据的推动下受到了业界和学术界的广泛关注.知识图谱对于解决大数据中文本分析和图像理解问题发挥重要作用.为了理解文本中的自然语言以及理解图像,需要考虑知识图谱的表示和推理.本文介绍了知识图谱的两类推理方法,即基于符号的推理方法和基于统计的推理方法.两种推理方法具有各自的应用场景,并且具有互补性.基于符号的推理方法更多考虑确定性知识的推理,一般通过给

《中国人工智能学会通讯》——8.15 总结与展望

8.15 总结与展望 演化算法作为一类基于种群的启发式随机优化算法已被应用于求解机器学习中的复杂优化问题.本文从学习任务的类型(特征学习.监督学习.非监督学习.强化学习)出发,论述了演化算法在机器学习中的代表性应用,并进一步介绍了演化学习理论分析的最新进展.由于演化算法的复杂性和随机性,对其进行理论分析非常困难,目前演化算法在机器学习中的应用也少有理论分析支持,这使其难以被广泛认可,因此,针对演化算法的理论分析会是未来的一个重要研究方向.