《Splunk智能运维实战》——2.5 找出浏览量来源最多的网站

2.5 找出浏览量来源最多的网站

Web访问日志还能提供有关网站和访问网站用户的更多信息。了解用户来自哪里可以深入了解潜在客户,也许还能告诉我们哪些营销活动更有效果。获取这一信息需要搜索日志数据中referer_domain字段的值。

本节将通过编写一个搜索语句找到浏览量来源最多的网站。

做好准备

本节操作需运行Splunk Enterprise服务器,导入和第1章相同的样本数据。我们已经很熟悉Splunk搜索栏和时间选择器了。

如何操作

按照下列步骤搜索浏览量来源最多的网站:

  1. 登录Splunk服务器。
  2. 选择“搜索和报表”应用程序。
  3. 设定时间选择器为“过去24小时”,在Splunk搜索栏输入下列搜索后单击搜索图标或按Enter键。
  4. Splunk返回表格式列表,按照每个网站提供的推荐访问流量进行排序。
  5. 单击“保存为”,选择“报表”,保存此次搜索结果,将报表命名为cp02_top_referring_websites并单击“保存”。在下一个页面,单击“继续编辑”,回到搜索。

工作原理

将搜索以段的形式分开。

更多内容

本节没有使用top命令,因为这个命令只能提供有限的功能。stats命令远比top命令强大,并且具备很多函数,包括distinct count函数。

使用stats命令代替top命令来搜索浏览量来源排名前十的网站

本节使用stats命令找到了Web访问日志中的所有网站,并按它们的独立推荐访问量将它们排序。如果仅仅显示排名前十位的网站,只需要在搜索语句最后添加head命令,如下所示:

head命令保留了最前面的指定行数。本例中,因为我们进行了降序,所以保留前十行结果也就保留了排名前十的网站。

要理解stats、chart和timechart命令的各种函数功能,可参考Splunk文档,地址为:http://docs.splunk.com/Documentation/Splunk/ latest/SearchReference/CommonStatsFunctions。

另参见

时间: 2024-09-20 16:37:17

《Splunk智能运维实战》——2.5 找出浏览量来源最多的网站的相关文章

《Splunk智能运维实战》——导读

前 言 在这个以科技为中心的世界里,各式各样的机器产生了大量的数据.Splunk因此推出了业内领先的大数据智能运维平台--Splunk Enterprise.这个强大的平台能让用户将机器数据转化为可操作的.非常重要的运维智能. 本书融合了各种实用方法,旨在提供指导和实用知识,以便使读者掌握Splunk Enterprise 6的各种功能,从数据中提取出强大而重要的运维智能. 本书通过简单易学.循序渐进的操作技巧,教授读者如何有效地收集.分析并创建所在环境的运营数据报表.这些技巧将展示如何加快智能

《Splunk智能运维实战》——第1章 游戏时间——导入数据 1.1 简介

第1章 游戏时间--导入数据 1.1 简介 加快运维智能的机器数据有很多不同的形式,来源也各不相同.Splunk可从多种来源收集并索引数据,其中包括Web服务器或商业应用程序创建的日志文件,网络设备生成的系统日志数据,及自定义开发脚本输出的数据.即便数据一开始看上去很复杂,我们也可以借助Splunk轻松地实时收集.索引.转化和呈现数据. 本章将学习一些基本的技巧,掌握如何将所需的数据导入Splunk,介绍如何使用样本数据集来构建自己的Splunk智能运维应用程序.该数据集是由一个虚拟的三层式电子

《Splunk智能运维实战》——1.7 为本书加载样本数据

1.7 为本书加载样本数据 Splunk索引的数据大部分都是实时接收的,但在一些情况下,我们想向Splunk导入一组数据,以便回填缺失丢失或不完整的数据,或者仅仅利用Splunk的搜索和报表工具. 本节将学习如何在Splunk服务器上一次性批量加载本地数据.我们将加载样本数据,并在随后的章节使用它来构建Splunk智能运维应用程序. 样本数据由两个文件组成.第一个文件是access_log,它代表Web层的数据,模拟的是Apache Web服务器.第二个文件是app_log,它代表应用程序层的数

《Splunk智能运维实战》——1.9 定义事件类型和标签

1.9 定义事件类型和标签 Splunk中的事件类型是将数据中共同类型的事件归类的一种方法,这样可以使它们更易于搜索和制作报表.使用事件类型有助于把类似的事件归为同一类.事件类型本质上将数个搜索条件变为字段/值对.标签有助于更高效地搜索事件数据组.我们可以为包括事件类型在内的任何字段/值组合分配标签. 比如,Windows登录事件可以被赋予事件类型windows_logon,UNIX登录事件可以被赋予事件类型unix_logon,VPN登录事件可以被赋予事件类型vpn_logon.以上三种事件类

《Splunk智能运维实战》——1.4 使用脚本输入

1.4 使用脚本输入 智能运维所需的数据并非全部来自日志文件或网络端口.Splunk也可获取命令或脚本的输出,并将其与其他数据一起索引. 脚本输入是针对较难获取数据的一种有效方法.如果收集第三方提供的命令行程序输出的数据,Splunk可定期运行该命令来索引结果.通常来说,脚本输入常用于从某个源抓取信息,而网络输入则等待数据从某个源不断推送. 本节将介绍如何配置Splunk,使其每隔一段时间执行命令并将输出的数据导入Splunk. 做好准备 要进行本节的操作,需要运行Splunk Enterpri

《Splunk智能运维实战》——1.8 定义字段提取内容

1.8 定义字段提取内容 Splunk内置了许多功能,能识别多种常见的源类型,因此能自动识别出数据中的字段.Splunk默认也会提取日志数据中的所有键值对和JSON格式日志中的所有字段.但是原始日志数据中的字段不能直接解释,必须提供给Splunk相关信息使这些字段易于搜索. 随后章节要用到的样本数据包含了作为字段提交给Splunk的数据.大部分原始数据包含Splunk能自动提取的键值对,但需要告知Splunk如何提取代表页面响应时间的这一特殊字段.要进行该操作,需要添加自定义字段提取内容,以便告

《Splunk智能运维实战》——第3章 仪表盘和可视化——让数据闪光 3.1 简介

第3章 仪表盘和可视化--让数据闪光 3.1 简介 前一章介绍了Splunk的搜索处理语言(SPL)以及如何使用SPL来搜索数据并制作报表.本章将以这些知识为基础,使用Splunk的可视化功能让数据更直观.我们将学习如何通过Splunk UI创建仪表盘并添加前一章制作的报表.我们将再创建两个仪表盘,以供本书其他章节使用. 可视化是数据得以最佳呈现的基础.按照人们熟悉的方式可视化数据,就能让用户更好地了解被展示的内容,并正确地理解该如何应对.当使用Splunk来进行智能运维时,会发现几乎所有的报表

《Splunk智能运维实战》——3.2 创建智能运维仪表盘

3.2 创建智能运维仪表盘 在开始学习可视化之前,最好先了解一下创建仪表盘的步骤.本节将使用Splunk Web UI从头开始创建一个仪表盘,在之后的章节将使用到它. 做好准备 本章操作需要运行Splunk Enterprise服务器,并导入第1章中的样本数据,并完成第2章的学习.你应该已经很熟悉Splunk用户界面了. 如何操作 按照下列步骤创建智能运维仪表盘: 登录Splunk服务器. 选择默认的"搜索和报表"应用程序. 从菜单栏选择"仪表盘"链接. 在仪表盘界

《Splunk智能运维实战》——3.10 使用条形图按类别显示平均花销

3.10 使用条形图按类别显示平均花销 整个这一章我们都在制作可视化图表来洞察电子商务网站的智能运维.这对于理解消费者的看法以及驱使他们前来网站的因素也会很有帮助.这一类型的信息通常对产品经理和市场经理来说最有帮助.了解一种产品是否越来越受欢迎,并且/或者这是否会最终给网站带来更多的消费者和更重的负载,也会很有益处. 本节中,将编写Splunk搜索,按照产品类别计算平均花销.随后会在新的Product Monitoring(产品监控)仪表盘上用条形图来形象地呈现这些值. 做好准备 要进行本节操作