《Splunk智能运维实战》——1.2　索引文件和目录

1.2　索引文件和目录

从文件和目录输入数据是向Splunk导入数据最常用的方法。这种类型的输入主要是为了索引日志文件。几乎每个应用程序或系统都会产生日志文件，当中包括了我们想搜索和制作报表的很多数据。

Splunk能够持续监控写入现有文件的新数据或添加到目录中的新文件，并且能够实时索引这些数据。根据生成日志文件的应用类型不同，可以将Splunk设定为监控单一文件（基于其位置）或扫描整个目录并监控其中的所有文件。当生成的日志文件包含唯一的文件名（比如名字中含有时间戳）时，后一种配置更常使用。

本节将学习如何配置Splunk来持续监控并索引Splunk服务器上的一个日志文件，这个日志文件的内容会不断增加。本节将专门展示如何监控并索引Linux系统上的messages日志文件（/var/log/messages）。然而，同样的方法也适用于Windows系统上的日志文件，本书也提供了一个示例文件。但请不要用这种方法索引Windows事件日志，因为Splunk有专门的Windows事件输入法。

做好准备

要进行本节的操作，需运行Splunk Enterprise服务器并且有权限访问读取Linux上的/var/log/messages文件。没有其他先决条件。如果使用的不是Linux系统，并且/或者没有权限访问 Splunk服务器上的/var/log/messages，要使用本书提供的cp01_messages.log文件并将其加载到Splunk服务器上一个可访问的目录中。

如何操作

按下列步骤监控并索引文件内容。

1 . 登录Splunk服务器。

2 . 从右上角的主启动器，单击“添加数据”按钮。

3 . 在“选择数据类型”列表中，单击“文件或文件目录”。

4 . 在“索引此Splunk服务器上的所有文件”选项中单击“下一步”按钮。

5 . 选择“索引前预览数据”并输入日志文件路径（/var/log/messages或cp01_messages.log文件的位置）并单击“继续”按钮。

6 . 选择“开始一个新的源类型”并单击“继续”按钮。

7 . 假如你使用本书提供的文件或本地的/var/log/messages文件，数据预览将展示正确分行后的事件及时间戳标志。单击“继续”按钮。

8 . 会弹出“预览设置”框。在源类型输入linux_messages，单击“保存源类型”按钮。

9 . 会出现“源类型已保存”的提示框，选择“创建输入”按钮。

10 . 在“源”部分，选择“从Splunk本次访问的文件或目录中持续索引数据”，并填写数据路径。

如果只是想一次性加载某个文件，可选择“上传并索引文件”。这个选项适合于索引一组数据到Splunk，既可用来回填一些缺失或不完整的数据，也可仅仅为了利用其搜索和报表工具。

11 . 暂且忽略其他设定，直接单击“保存”。然后，在下一个界面中，点击“开始搜索”。在搜索栏，输入下列搜索，时间范围设定为“全部时间”：

在本节中，可直接使用常见的系统日志源类型，不过，创建新的源类型往往是更好的选择。根据数据源不同，系统日志格式可能差异很大。因为像提取字段这样的知识对象是建立在源类型之上的，为所有对象使用单一的系统日志源类型可能会较难搜索到所需的数据。

工作原理

当添加一个新的文件或目录来导入数据时，也就是在后台向inputs.conf文件添加新的配置节。Splunk服务器可包含一个或多个inputs.conf文件，它们位于$SPLUNK_HOME/etc/ system/local或Splunk 应用程序的local目录。

Splunk使用的输入类型是监控器，并被设定为指向某个文件或目录。如果设置对一个目录进行监控，目录中的所有文件都会被监控。当Splunk监控文件时，它会首先从头索引所有能读取的数据。完成后，Splunk将保留上次读取数据的位置记录，如有任何新的数据写入文件，它将读取这个数据并继续记录。这个过程几乎和在UNIX操作系统下使用tail命令相同。如需要监控一个目录，Splunk也会提供很多附加的配置选项，比如将不需要Splunk索引的文件列入黑名单。

若想获取Splunk配置文件的更多信息，请访问 http://docs.splunk.com/Documentation/Splunk/latest/Admin/ Aboutconfigurationfiles。

《Splunk智能运维实战》——1.2　索引文件和目录

1.2　索引文件和目录

《Splunk智能运维实战》——1.2　索引文件和目录的相关文章

《Splunk智能运维实战》——第1章游戏时间——导入数据 1.1 简介

《Splunk智能运维实战》——1.7　为本书加载样本数据

《Splunk智能运维实战》——导读

《Splunk智能运维实战》——1.9　定义事件类型和标签

《Splunk智能运维实战》——1.4　使用脚本输入

《Splunk智能运维实战》——1.8　定义字段提取内容

《Splunk智能运维实战》——第3章仪表盘和可视化——让数据闪光 3.1 简介

《Splunk智能运维实战》——3.2　创建智能运维仪表盘

《Splunk智能运维实战》——3.10　使用条形图按类别显示平均花销

《Splunk智能运维实战》——1.2 索引文件和目录

1.2 索引文件和目录

《Splunk智能运维实战》——1.2 索引文件和目录的相关文章

《Splunk智能运维实战》——1.2　索引文件和目录

1.2　索引文件和目录

《Splunk智能运维实战》——1.2　索引文件和目录的相关文章