SharePoint搜索爬网第三方网站配置

介绍:SharePoint的搜索着实强大,而且最近用到SharePoint搜索第三方爬网,感觉收获挺大,而且网上资料没找到太多类似的,就小记录一下,分享给大家。

首先,我自己写了一个net页面,里面读取所有我需要内容,充当SharePoint爬网的数据源,对这个页面进行爬网,页面如下图:

然后,打开SharePoint管理中心,搜索设置,新建内容源Crawl,爬网http://moss:9000,如下图。爬网设置可以按照自己的需要进行设置,比如想要爬网页面深度,可以进行设置,我的爬网,只是爬网页面下面的链接,所以深度设置为1;设置完成,先不要爬网,还需要设置爬网规则。

查看本栏目更多精彩内容:http://www.bianceng.cnhttp://www.bianceng.cn/web/sharepoint/

设置爬网规则:

打开爬网规则,设置路径,我的路径是9000端口下的所有页面,所以设置为http://moss:9000/*,当然,你的规则应该按照需要进行设置,可以排除这些路径,也可以包含这些路径,同时,如果有爬网到的任何结果,都可以在这里进行排除。

特别的是,我的页面上的链接,包含“?”问号,所以勾选了对复杂的URL进行爬网,下面的指定认证,可以选择认证的账号,如果需要Form认证的网页,可以设置指定其他内容访问账户【特别:如果登录需要验证码的,SharePoint是无法爬网的】。设置完爬网规则,点击确定保存,然后可以对Crawl内容源进行完全爬网了。

时间: 2024-08-31 18:34:53

SharePoint搜索爬网第三方网站配置的相关文章

SharePoint 搜索爬网第三方网站配置

      介绍:SharePoint的搜索着实强大,而且最近用到SharePoint搜索第三方爬网,感觉收获挺大,而且网上资料没找到太多类似的,就小记录一下,分享给大家.       首先,我自己写了一个net页面,里面读取所有我需要内容,充当SharePoint爬网的数据源,对这个页面进行爬网,页面如下图:       然后,打开SharePoint管理中心,搜索设置,新建内容源Crawl,爬网http://moss:9000,如下图.爬网设置可以按照自己的需要进行设置,比如想要爬网页面深度

SharePoint 2013 对二进制大型对象(BLOB)进行爬网

本文是参考MSDN文档做的示例,SharePoint 2013搜索二进制对象(BLOB),通过外部内容类型的方式将外部数据与SharePoint相关联,修改BCD模型,使SharePoint能够爬网外部数据中的文件流. 步骤,首先就是使用SPD创建外部内容类型,并为外部内容类型添加各种操作:然后,将BCD模型导出,添加方法后重新导入:最后,配置爬网,对外部内容类型进行爬网. 1.首先,用Designer 2013打开站点,点击左上角按钮,创建外部内容类型: 2.输入外部内容类型的名称,点击"单击

百姓网免费开放API获第三方网站青睐

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 全国最大的个人分类信息网站百姓网对外开放API(Application Program Interface)近2个月,获得第一批合作网站的好评. 百姓网是国内老牌分类信息网站,创立初期的梦想是"连接所有生活需求",无论是找工作,找房子,买卖二手车,都可以上百姓网搞定.但发现很多有价值的生活信息散落在线上.线下不同平台,加之

如何为SharePoint搜索创建自定义优化参数

当我们使用SharePoint 2010所提供的搜索功能时,在搜索结果的左侧,有一个搜索结果优化区域.通过这个区域,用户可以进一步的精简搜索结果.比如,仅仅显示类型为Word文件的搜索结果,或者仅仅显示作者为"kaneboy"的搜索结果. 这个优化区域内置了最常见的几个精简项目,包括类型(搜索结果是何种类型).来源(搜索结果来自于哪个网站).作者.修改日期等.如果在文档管理系统中使用了SharePoint 2010新的托管元数据服务中的术语来定义了企业关键字,那么这些关键字也会自动出现

A5营销提醒:近期百度对信息带有“官网”的网站进行降权

随着百度搜索引擎的不断更新与完善,每次的变化百度都可以给广大站长带来意想不到的事情.11.22日笔者有幸参加北京百度沙龙,在本次会议中百度LEE提到,近期会对网站信息带有"官网"的字样将进行降权处理,而"官网"的意思是指网站不是真正的官方网站,含有虚假信息的官方网站,从这点可以看出任何一种网站只准出现一个带有权威性和品牌性的官方网站,而带有"官方"信息的网站将会进行降权,如果数量庞大也会直接影响整个网站. 从这次沙龙会议可以看得出,百度开始严厉打

SEO和第三方网站推广的关键词选择

做网站的SEO或第三方网站免费占领搜索引擎左边推广.最重要的关键是要明白你的目标客户会按照什么关键字来搜索,具体的去推广这些关键字,在搜索引擎里面按照这些关键字搜索占领搜索引擎,而不是按照你公司的名字来搜索全部是你们的信息.所以选择关键字是做这种类型网络营销的关键,而很多学过我们课程的企业,却没有很好的把握.下边把在网络上判断关键词的方法总结下,期望大家刚开始就能找到正确的方式方法,事半功倍: 以下以"钻石"关键字为例,讲解下具体的过程: 1. 到http://www.aliyun.c

大众点评vs丁丁网大型网站优化对比

中介交易 SEO诊断 淘宝客 云主机 技术大厅 先通过爱站看一表面的数据, 三月平均:365 流量预估:IP≈ 1,908,000 PV≈ 12,821,760 dianping 三月平均:1,456 流量预估:IP≈ 486,000 PV≈ 2,123,820 ddmap 域名年龄 5年11个月2天(创建于2005年6月22日) dianping 域名年龄 5年6个月17天(创建于2005年11月8日) ddmap Pr值全部为7 百度 谷歌 雅虎 搜搜 收录数量 11600000 -5150

ASP.NET通过第三方网站Bitly实现短链接地址程序_实用技巧

发微博很久了,或许是我之前没注意,现在特别关注那个微博中的图片链接和URL链接,总给我看不懂但是又那么短的感觉,反正不是我上传的地址,其实这里使用一个短链接服务功能,这里拿出来晒晒. 这里看看是指向淘宝的一个商品页面,链接地址是这样的 ,但是现在在微博中变成了红圈表名的那个样子,似乎看不懂了,而且你点击之后还是到你原有的页面.这里就是使用了短链接程序服务,包括图片等等都是这样,可以缩短url长度. Bitly 是世界上最流行的短链接服务,而且已经免费开放所有功能.点击访问官网 Bitly.com

百度通过开放自身接口,和开心网等大量第三方网站合作

摘要: 腾讯科技讯 8月26日消息,网友王华在百度中输入关键字开心网3个字,令人惊奇的是百度第一个搜索结果就是开心网登录框,输入开心网帐号即可直接登陆. 这种变化令王华感到惊奇. 腾讯科技讯 8月26日消息,网友王华在百度中输入关键字"开心网"3个字,令人惊奇的是百度第一个搜索结果就是开心网登录框,输入开心网帐号即可直接登陆. 这种变化令王华感到惊奇.以往王华登陆开心网或者51.com,必须在搜索后进入上述两个网站才可以登陆.但现在,百度已经彻底成为了开心网们的直接入口. 事实上,这些