php正则表达式获取标题关键词和内容代码

采集在现在的cms中都常常用到哦,下面我们就来看看关于php 正则表达式 取标题,关键词,内容代码源码哦。

//获取标题
  $inarr = array();
  preg_match("/<title>(.*)</title>/isU",$body,$inarr);
  if(isset($inarr[1]))
  {
   $redatas['title'] = $inarr[1];
  }

//获取关键词
  $inarr = array();
  preg_match("/<meta[s]+name=['"]keywords['"] content=['"](.*)['"]/isU",$body,$inarr);
  if(isset($inarr[1]))
  {
   $redatas['keywords'] = cn_substr(html2text($inarr[1]),30);
  }

//获取摘要
  $inarr = array();
  preg_match("/<meta[s]+name=['"]description['"] content=['"](.*)['"]/isU",$body,$inarr);
  if(isset($inarr[1]))
  {
   $redatas['description'] = cn_substr(html2text($inarr[1]),$cfg_auot_description);
  }

//获取内容
  if($s!='' && $e!='')
  {
   $redatas['body'] = GetHtmlAreaA($s,$e,$body);
   if($redatas['body']!='' && $redatas['description']=='')
   {
    $redatas['description'] = cn_substr(html2text($redatas['body']),$GLOBALS['cfg_auot_description']);
   }
  }
 }
 return $redatas;

时间: 2024-07-29 04:03:07

php正则表达式获取标题关键词和内容代码的相关文章

php 正则表达式 取标题,关键词,内容代码

//获取标题   $inarr = array();   preg_match("/<title>(.*)</title>/isU",$body,$inarr);   if(isset($inarr[1]))   {    $redatas['title'] = $inarr[1];   }   //获取关键词   $inarr = array();   preg_match("/<meta[s]+name=['"]keywords['

求助,c#用正则表达式获取固定网站新闻内容

问题描述 比如说获取百度新闻"www.news,baidu.com"的的内容,该怎么写,现在只写出前半部分,获取了百度新闻网页的源代码,然后怎么用正则表达式来获取新闻列表和内容?有大神能帮忙写一下吗,最好能稍微解释一下,因为刚开始学,一片空白--,谢谢了前半部分: 解决方案 解决方案二:首先,你要确定你要采集的网站的HTML信息,根据HTML信息才能匹配出正则表达式,然后用正则表达式筛选你想要的结果解决方案三:@"<ab[^<>]*?href=['"

js获取鼠标选中的内容代码

结果是写出来了,之前写的时候不兼容火狐,后来看到帖子楼上的一个方法,测试了一下兼容性很好,就引用了: 具体方法我已经整理成文件,可以预览查看效果,也可以直接下载浏览源码:  代码如下 复制代码 <!DOCTYPE html> <html lang="zh-CN"> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8&quo

ASP如何自动获取标题关键词

比如输入标题为:Anycall L768手机客制化的问题. 那么,我们如何通过ASP获取上面的文字的关键词:手机 Anycall 分享阿里西西在制作网站项目中解决些问题的经验心得: 1.建立词库:我们不可能像百度或GG大型搜索引擎那样建立一个大而全的词库,但你可以针对所在的行业关键词进行初始化一个词库数据表,比如把三星,Anycall,诺基亚等这些专业词汇录入到词库数据表里.2.自动获取:在用ASP添加文章操作时,进行匹配词库表里词组,如果标题包含有三星,Anycall这样的关键字时,就可以实现

获取url中部份内容代码

function getpath($url) { $path = parse_url($url,php教程_url_path); $lastslash = strrpos($path,"/"); return substr($path,1,$lastslash-1); }   echo getpath("http://www.111cn.net/blog/entry-title/?standalone=1"); //  代码如下 复制代码 function getp

请教大家一个关于用正则表达式获取HTML内容的问题!

问题描述 我自己写了一个正则表达式,目的是获取HTML文件中<body></body>标签之间内容.程序可以编译,但我用运行的时候就报错了,内容大概如下:Exceptioninthread"main"java.lang.NoClassDefFoundError:Filter/classCausedby:java.lang.ClassNotFoundException:Filter.classatjava.net.URLClassLoader$1.run(Unkn

内容为王 写好标题是提升内容质量的前提

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 很多人都说网站的运营是内容为王,那么什么样的内容才能够算作质量好的内容呢?很多人错误的认为是原创文章就是好的内容,其实这是一种误解,其实内容为王说的是网站内容的价值足够好,能够吸引很多人的关注,这样才能够算作好的网站内容,所以适当的转载和伪原创是非常好的网站建设之道,但是并不是说原创的文章质量就不高,对于草根站长而言,大量的原创文章一定是难以

用JavaScript获取页面文档内容的实现代码_javascript技巧

JavaScript的document对象包含了页面的实际内容,所以利用document对象可以获取页面内容,例如页面标题.各个表单值. <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>js基础</title> </head> <body> <p>一. 用Documen

thinkphp-用weiphp开发微信如何在代码中调用文本回复?然后如何获取用户输入的内容?

问题描述 用weiphp开发微信如何在代码中调用文本回复?然后如何获取用户输入的内容? 用weiphp开发微信如何在代码中调用文本回复?然后如何获取用户输入的内容? 解决方案 微信.NET 微信开发 自动内容回复 ASP.NET C#代码 解决方案二: if(IS_POST){ $token = get_token (); $openid = get_openid (); $item = I('post.item'); $market = I('post.market'); $name = I(