2.3 找出最常访问的网页
在第1章导入的数据样本中,其中一个包含了Web服务器的访问日志。这些日志的源类型为access_combined,并且详述了Web应用程序的用户访问的所有页面。我们特别感兴趣哪个页面的浏览次数最多,以便我们了解电子商务Web应用程序的使用情况。它也能帮助我们改进Web应用程序,比如将访问量很少的网页移除,或者重新设计应用程序,使之更高效。
本节将编写一个Splunk搜索语句,来找到给定时间内最常访问的网页。
做好准备
本节操作需运行Splunk Enterprise服务器,导入和第1章相同的样本数据。我们已经很熟悉Splunk的搜索栏和它右侧的时间选择器了。
如何操作
按照下列步骤搜索最常访问的网页。
- 登录Splunk服务器。
- 选择“搜索和报表”应用程序。
- 设定时间选择器为“过去24小时”,在Splunk搜索栏输入下列搜索。然后单击搜索图标或按Enter键。
- Splunk返回网页列表,新字段“count”显示了页面浏览的总次数。
- 单击“保存为”,选择“报表”,保存此次搜索。将报表命名为cp02_most_accessed_webpages,并单击“保存”。在下一个页面,单击“继续编辑”,回到搜索。
工作原理
将搜索以段的形式分开。
更多内容
我们可以在这次搜索的基础上得出更多的结果。
搜索访问量排名前10的网页
我们可以修改本节的搜索语句,用top命令代替stats命令。
默认情况下会显示排名前10的网页:
这里修改了搜索,并用top命令代替了stats命令。默认情况下会显示排名前10的网页。如若想获得排名前20的网页,可限定limit的值,如下所示:
搜索用户最常访问的网页
可以修改本节的搜索语句,并使用stats命令的distinct count (dc)函数来显示用户列表和他们访问的单个网页。
distinct count函数能确定一位用户是否多次访问同一个页面,这种情况只算做一次访问。访问最多不同页面的用户将出现在列表顶端,因为使用了降序。
了解stats命令各种函数的更多信息,可登录:http://docs.splunk.com/Documentation/Splunk/latest/SearchReference/ CommonStatsFunctions。
另参见
时间: 2024-10-28 11:51:19