简单站内HTML文件搜索程序

程序

    自己写来简单的搜索自己电脑上的技术资料的. 大概的思路就是寻找指定目录下的文本, 然后如果有与关键字相匹配的数据就把文件名返回, 最后把所有搜索结果显示出来. 显示结果类似于baidu/google, 呵呵, 这个是纯粹为了好玩.
 程序代码:

<?php
/**
 * 文件: search.php
 * 功能: 搜索指定目录下的HTML文件
 * 创建: 2005-9-23
 * 作者: heiyeluren <heiyeluren AT gmail.com>
 */

/* 基本函数 */

//获取目录下文件函数
function getFile($dir)
{
 $dp = opendir($dir);
 $fileArr = array();
 while (!false == $curFile = readdir($dp)) {
  if ($curFile!="." && $curFile!=".." && $curFile!="") {
   if (is_dir($curFile)) {
    $fileArr = getFile($dir."/".$curFile);
   } else {
    $fileArr[] = $dir."/".$curFile;
   }
  }
 }
 return $fileArr;
}

//获取文件内容
function getFileContent($file)
{
 if (!$fp = fopen($file, "r")) {
  die("Cannot open file $file");
 }
 while ($text = fread($fp, 4096)) {
  $fileContent .= $text;
 }
 return $fileContent;
}

//搜索指定文件
function searchText($file, $keyword)
{
 $text = getFileContent($file);
 if (preg_match("/$keyword/i", $text)) {
  return true;
 }
 return false;
}

//搜索出文章的标题
function getFileTitle($file, $default="None subject")
{
 $fileContent = getFileContent($file);
 $sResult = preg_match("/<title>.*<\/title>/i", $fileContent, $matchResult);
 $title = preg_replace(array("/(<title>)/i","/(<\/title>)/i"), "", $matchResult[0]);
 if (empty($title)) {
  return $default;
 } else {
  return $title;
 }
}

//获取文件描述信息
function getFileDescribe($file,$length=200, $default="None describe")
{
 $metas = get_meta_tags($file);
 if ($meta['description'] != "") {
  return $metas['description'];
 }
 $fileContent = getFileContent($file);
 preg_match("/(<body.*<\/body>)/is", $fileContent, $matchResult);
 $pattern = array("/(<[^\x80-\xff]+>)/i","/(<input.*>)+/i", "/(<a.*>)+/i", "/(<img.*>)+/i", "/([<script.*>])+.*([<\/script>])+/i","/&/i","/"/i","/'/i", "/\s/");
 $description = preg_replace($pattern, "", $matchResult[0]);
 $description = mb_substr($description, 0, $length)." ...";

 return $description;
}

//加亮搜索结果中的关键字
function highLightKeyword($text, $keyword, $color="#C60A00")
{
 $newword = "<font color=$color>$keyword</font>";
 $text = str_replace($keyword, $newword, $text);
 return $text;
}

//获取文件大小(KB)
function getFileSize($file)
{
 $filesize = intval(filesize($file)/1024)."K";
 return $filesize;
}

//获取文件最后修改的时间
function getFileTime($file)
{
 $filetime = date("Y-m-d", filemtime($file));
 return $filetime;
}

//搜索目录下所有文件
function searchFile($dir, $keyword)
{
 $sFile = getFile($dir);
 if (count($sFile) <= 0) {
  return false;
 }
 $sResult = array();
 foreach ($sFile as $file) {
  if (searchText($file, $keyword)) {
   $sResult[] = $file;
  }
 }
 if (count($sResult) <= 0) {
  return false;
 } else {
  return $sResult;
 }
}

/* 测试代码 */

//指定要搜索的目录
$dir = "./php_Linux";
//要搜索的关键字
$keyword = "sendmail";

$fileArr = searchFile($dir, $keyword);
$searchSum = count($fileArr);

echo "搜索关键字: <b>$keyword</b>   搜索目录: <b>$dir</b>   搜索结果: <b>$searchSum</b><br><hr size=1><br>";

if ($searchSum <= 0) {
 echo "没有搜索到任何结果";
} else {
 foreach ($fileArr as $file) {
  echo "<a href='$file' target='_blank'>". highLightKeyword(getFileTitle($file), $keyword) .
    "</a> - ".getFileSize($file)." ". getFileTime($file) .
    "<br>\n<font size=2>".highLightKeyword(getFileDescribe($file), $keyword) .
    "</font><br><br>";
 }
}

?>

 完全可以用在自己已经生成静态内容的的搜索, 但是程序效率不高. 如果能够适当的加上 索引/缓存 等机制的话, 我想程序会有趣很多.

时间: 2024-12-31 04:47:27

简单站内HTML文件搜索程序的相关文章

Dreamweaver开发ASP实例视频教程(11)简单站内搜索页

dreamweaver|教程|视频教程 本视频教程由本站合作网站陶益数码工作室http://www.ty502.com推出,欢迎大家访问他们的网站. 使用Dreamweaver开发ASP具有不用手工写代码的优点,非常适合初学者建设自己的动态网站.本套教程由我们精心设计奉献给大家,内容包含了文章整站教程.音乐整站教程.图片整站教程.文件上传系统教程.投票系统教程.会员分级管理系统教程和网站后台管理教程等,通过本教程的学习,相信您一定能很快掌握动态网站制作的方法,从代码的枯燥乏味中解脱出来. 教程介

基于ASP的站内多值搜索

  运行环境:IIS脚本语言:VBScript数据库:Access/SQL Server数据库语言:SQL 1.概要:不论是在论坛,还是新闻系统,或是下载系统等动态网站中,大家经常会看到搜索功能:搜索帖子,搜索用户,搜索软件(总之搜索关键字)等,本文则是介绍如何建立一个高效实用的,基于ASP的站内多值搜索. 本文面对的是"多条件模糊匹配搜索",理解了多条件的,单一条件搜索也不过小菜一碟了.一般来讲,有两种方法进行多条件搜索:枚举法和递进法.搜索条件不太多时(n<=3),可使用枚举

Dreamweaver开发ASP实例视频教程(12)复杂站内搜索

dreamweaver|教程|视频教程 本视频教程由本站合作网站陶益数码工作室http://www.ty502.com推出,欢迎大家访问他们的网站. 使用Dreamweaver开发ASP具有不用手工写代码的优点,非常适合初学者建设自己的动态网站.本套教程由我们精心设计奉献给大家,内容包含了文章整站教程.音乐整站教程.图片整站教程.文件上传系统教程.投票系统教程.会员分级管理系统教程和网站后台管理教程等,通过本教程的学习,相信您一定能很快掌握动态网站制作的方法,从代码的枯燥乏味中解脱出来. 教程介

php搜索站内数据库,请教

问题描述 php搜索站内数据库,请教 我想做一个搜索站内数据库的搜索框, 写好了之后打开空空如也,连搜索框和按钮都没有 请问是咋回事 代码如下 搜索 <?php include("conn.php"); $db=new mysql('localhost','root','','sjzl','utf8'); if($_GET[key]){ $sql="select * from message where showname like '%$_GET[key]'"

学习SEO分析网站站内优化

学习SEO分析网站站内优化,对于站长做站内优化其最终的目标就是为了用户体验,良好的用户体验是网站发展的根本,学习SEO分析网站也是最关键的影响因数.而对于能否提高用户体验,则大部分都来自站内优化.所以,对于站长分析自己网站内部优化是否给力,从网站的用户体验是否有良好的提升进行判断,而一般的用户体验则是表现在用户访问页面.用户停留时间.用户的评论留言.用户的分享转载等这些因数可以进行用户体验分析,还可以结合统计工具中的数据进行分析.所以,通过用户体验是否良好,则是最能得出站内优化的效果如何. 学习

关于lucene.net站内搜索的简单问题

问题描述 关于lucene.net站内搜索的简单问题 我做了一个简单的站内搜索,但是创建索引后无法搜索到数据,不知道为什么 #region 创建索引 public void createIndex() { SqlConnection conn = new SqlConnection("server=localhost;database=news;uid=sa;pwd=intellitrans"); FSDirectory directory; IndexWriter writer; s

使用Lucene.NET实现站内搜索

  提到Lucene,想必大家都有所耳闻,已经是数年前就出现的开源技术.很多站点都是利用它搭建自己网站的站内搜索.由于最近也在做数据检索方面的东西,也学习了下Lucene.net的使用. 导入Lucene.NET 开发包 Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎.Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的

使用GoogleAnalytics分析用户站内搜索行为

这次在石互动2008上海SEO大会上讲到通过"分析用户意图"进行精准营销(PPT下载),很多朋友对如何进行分析有些不解.这段时间樂思蜀会在博客中陆续分享一些分析的方法,有兴趣的朋友可以订阅老乐的博客. 今天分享一下用 http://www.aliyun.com/zixun/aggregation/16353.html">Analytics 分析用户在站内的搜索行为,很简单,但数据的参考作用较大.获知用户关注的热点,站内的盲点,便于对网站内容.产品进行相应调整. Anal

利用FrontPage制作站内信息搜索平台

frontpage 对于个人网站,随着网站信息量的增加,我们也需要为网站增设站内.站外搜索引擎方便浏览者的访问和信息检索,不仅如此,增加了站内.站外搜索引擎还可以有效提高网站的档次,使个人网站更具大站风范. 但很多站长都很"畏惧"添加搜索引擎,因为在他们心目中制作一个搜索引擎不仅需要专业的编程知识还要高深的数据库技术等等,其实不然,相信你在看了本文后,一定会觉得:搜索引擎其实很简单! 做信息搜索网站需要什么 1.了解服务器支持的语言,如服务器是否支持FrontPage扩展模块,是否支持