Go语言通过http抓取网页的方法_Golang

本文实例讲述了Go语言通过http抓取网页的方法。分享给大家供大家参考。具体实现方法如下：

复制代码代码如下:

package main
import (
"fmt"
"log"
"net/http"
"net/url"
"io/ioutil"
)
//指定代理ip
func getTransportFieldURL(proxy_addr *string) (transport *http.Transport) {
url_i := url.URL{}
url_proxy, _ := url_i.Parse(*proxy_addr)
transport = &http.Transport{Proxy : http.ProxyURL(url_proxy)}
return
}
//从环境变量$http_proxy或$HTTP_PROXY中获取HTTP代理地址
func getTransportFromEnvironment() (transport *http.Transport) {
transport = &http.Transport{Proxy : http.ProxyFromEnvironment}
return
}
func fetch(url , proxy_addr *string) (html string) {
transport := getTransportFieldURL(proxy_addr)
client := &http.Client{Transport : transport}
req, err := http.NewRequest("GET", *url, nil)
if err != nil {
  log.Fatal(err.Error())
}
resp, err := client.Do(req)
if err != nil {
  log.Fatal(err.Error())
}
if resp.StatusCode == 200 {
  robots, err := ioutil.ReadAll(resp.Body);
  resp.Body.Close()
  if err != nil {
   log.Fatal(err.Error())
  }
  html = string(robots);
} else {
  html = ""
}
return
}
func main() {
proxy_addr := "http://183.221.250.137:80/"
url := "http://www.baidu.com/s?wd=ip"
html := fetch(&url, &proxy_addr)
fmt.Println(html)
}

希望本文所述对大家的Go语言程序设计有所帮助。

时间： 2024-09-12 19:51:15

Go语言通过http抓取网页的方法_Golang的相关文章

python使用自定义user-agent抓取网页的方法_python

本文实例讲述了python使用自定义user-agent抓取网页的方法.分享给大家供大家参考.具体如下: 下面python代码通过urllib2抓取指定的url的内容,并且使用自定义的user-agent,可防止网站屏蔽采集器 import urllib2 req = urllib2.Request('http://192.168.1.2/') req.add_header('User-agent', 'Mozilla 5.10') res = urllib2.urlopen(req) html

c语言抓取网页数据的问题

问题描述 c语言抓取网页数据的问题现有一固定网址,我需要从该网址上获取数据并拆分.希望大神能帮我实现,本人并无此类经验,请务必写出完整代码,多谢多谢解决方案 (C语言)ACM中的数据处理问题!C语言数据转换问题C语言一维数据中2[arry]问题解决方案二: (C语言)ACM中的数据处理问题! C语言数据转换问题 C语言一维数据中2[arry]问题解决方案三: http://blog.chinaunix.net/uid-9950859-id-98922.htmlhttp://bbs.csd

php中如何抓取网页图片

PHP是一门很容易上手的Web编程语言.PHP学习成本很低,能够迅速开发各种Web应用,是一个很优秀的工具. 尽管很多人觉得PHP缺点很多,quick and dirty 之类的,但是"这个世界上只有两种编程语言,一种是饱受争议的,一种是没人用的",不是吗?只要能够把事情做好的工具,就是好工具.PHP就是这么一个优秀的语言工具. 01.<?php 02.header('content-type:text/html;charset=utf-8');03. set_time_limi

用Python编写网络爬虫（一）：抓取网页的含义和URL基本构成

一.网络爬虫的定义网络爬虫,即Web Spider,是一个很形象的名字. 把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛. 网络蜘蛛是通过网页的链接地址来寻找网页的. 从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址, 然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止. 如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来. 这样看来,网络爬虫就是一个爬行程序,一个抓

python抓取网页图片

# -*- coding: utf-8 -*- #--------------------------------------- # 程序:网页图片抓取 # 作者:lqf # 日期:2013-08-10 # 语言:Python 2.7 # 功能:抓取网页jpg链接图片 #--------------------------------------- import re import string import sys import os import urllib url="http://tie

PHP使用CURL实现多线程抓取网页_php技巧

PHP 利用 Curl Functions 可以完成各种传送文件操作,比如模拟浏览器发送GET,POST请求等等,受限于php语言本身不支持多线程,所以开发爬虫程序效率并不高,这时候往往需要借助Curl Multi Functions 它可以实现并发多线程的访问多个url地址.既然 Curl Multi Function如此强大,能否用 Curl Multi Functions 来写并发多线程下载文件呢,当然可以,下面给出我的代码: 代码1:将获得的代码直接写入某个文件 <?php $urls

php curl实现多线程抓取网页并同时下载图片

php语言本身不支持多线程,所以开发爬虫程序效率并不高,借助Curl Multi 它可以实现并发多线程的访问多个url地址.用 Curl Multi 多线程下载文件代码: 代码1:将获得的代码直接写入某个文件 <?php $urls =array( 'http://www.111cn.net/', 'http://www.baidu.com/', );// 设置要抓取的页面URL $save_to='test.txt'; // 把抓取的代码写入该文件 $st =

百度抓取网页文件规则最大125K

百度的名字寄托着百度公司对自身技术的信心,另一层含义就是突破"事儿做到九十九度就是做到头"的西方说法,百度就是想要力争做到一百度,做到顶上开花的境界. 百度公司不同于一般意义上的网络公司.它既不是着眼于互联网内容的提供,也不是门户网站,而是一家立足于自主掌握并提供互联网核心技术的技术型公司.在中国互联网经济迅猛发展的今天,百度公司结合世界先进的网络技术.中国语言特色以及中国互联网经济发展的现状,开发出了中国互联网信息检索和传递基础设施平台,并且运用最先进的商业模式,直接为整个中国的互联

PHP抓取网页、解析HTML常用的方法总结

这篇文章主要介绍了PHP抓取网页.解析HTML常用的方法总结,本文只是对可以实现这两个需求的方法作了总结,只介绍方法,不介绍如何实现,需要的朋友可以参考下概述爬虫是我们在做程序时经常会遇到的一种功能.PHP有许多开源的爬虫工具,如snoopy,这些开源的爬虫工具,通常能帮我们完成大部分功能,但是在某种情况下,我们需要自己实现一个爬虫,本篇文章对PHP实现爬虫的方式做个总结. PHP实现爬虫主要方法 1.file()函数 2.file_get_contents()函数 3.fopen()-

猜你喜欢

用PS打造木柄小刀

这把闪电中的小刀看起来是不是很酷?我可以做出来吗?别急,跟我一步步做下去,开始打造属于你自己的那把小刀吧! (注:本例使用PHOTOSHOP7.0制作) 1.建立一个新的图像文档,用浅灰色做背景. 2 ...

两款比较典型的ASP木马防范方法

比较|木马随着ASP 技术的发展,网络上基于ASP技术开发的网站越来越多,对ASP技术的支持可以说已经是windows系统IIS服务器的一项基本功能.但是基于ASP技术的木马后门,也越来越多,而且功 ...

影响产品成败的因素,诠释做成功产品的秘诀

文章描述:让我们的产品更成功. 文 / 马博作者首先分析了影响产品成败的因素,然后对症下药,从战略.规划.战术三个层面,诠释了做一款成功产品的秘诀. 谈到"成功"和"失 ...

看实例学VFP：对表中记录进行定位与查找操作

在VFP中操作表记录时,既可以使用sql语句,也可以使用内置的append.replace.delete/pack/zap等命令并配合一些记录指针定位和数据排序方面的命令及函数来使用,而在vb/vb. ...

我的WCF之旅(13)：创建基于MSMQ的Responsive Service

一.One-way MEP V.S. Responsible Service 我们知道MSMQ天生就具有异步的特性,它只能以One-way的MEP(Message Exchange Pattern)进 ...

PS快速简单打造彩虹糖果文字特效

1.在AI中用矩形画如下间隔的彩虹条. 图01 2.我们来做一个无缝拼接的图案. 把它复制一份拼接,倾斜一定角度,比如10度,然后在最左侧画一条线,切掉它,怎么切?看这里. 图02 把剩下来的部分 ...

wps表格中怎样快速的求和

框选A.B.C.D四格,选好后,用鼠标光标找到工具栏的求和按钮"∑",按一下和就出现在D格内了.这是行里求和,同样,在列里求和也按此法操作:框选1,2,3,4,--最终留一个空 ...

Photoshop肖像修饰技巧之高调人像(上)

效果图前期拍摄时,已经构思好后期将人像照片处理成为高调人像,类似于广告效果,因此灯光布置主要突出人物面部,尽量避免阴影,所以光线很平.拍摄时构图主要根据拍摄前期的准备和构思拍摄的人物面部.因此在 ...

win7如何关闭休眠功能

不管休眠状态会不会使电脑有太大的影响,我们都要学会如何关闭休眠. 操作方法如下 1.点击开始菜单,然后在开始菜单中依次点击所有程序-附件; 2.在附件下找到其中的记事本选项,然后右键点击,选择&q ...

Win8.1系统U盘安装教程

Win8.1系统专业版已经发布了,相信大家都迫不及待想尝尝鲜.目前,大家可以通过微软官方应用商店下载Win8,1系统更新推送(找不到Win8.1系统更新推送的解决办法),或是通过下载Win8.1系 ...

安装打印机驱动找不到unidrv.hlp补丁

如果出现unidrv.hlp补丁找不到,说明文件被丢失或者损坏的情况,那么必须重新下载unidrv.hlp补丁文件,unidrv.hlp下载完成后,然后将其拷贝到路径C:WINDOWSDriver C ...

加密U盘文件夹的快捷方法

加密U盘文件夹的方法: 1.下载"U盘加密精灵2.0",下载解压压缩包到硬盘,将"ue.exe"复制到盘根目录,双击运行程序; 2.在弹出的程序界面,勾选& ...

【转载】关于 Erlang 和 SMP 的一些说明

以下是一些关于 Erlang SMP 实现细节.性能.伸缩性相关一些简单介绍. -=-=-=-=-=- 几周之内还有一个关于多核如何运作以及未来如何发展的更详细的介绍.我打算将一些内容 ...

如何使用Cocos2d-x 3.0制作基于tilemap的游戏：第一部分

程序截图: 本教程将会教大家如何使用Cocos2d-x来做一个基于tile地图的游戏,当然还有Tiled地图编辑器.(我们小时候玩的小霸王小学机里面的游戏,大部分都是基于tile地图的游戏,如坦克大战 ...

JS调用页面表格导出excel示例代码_javascript技巧

使用JS方法调用页面表格导出excel有很大的限制: 1.目前试了几个浏览器,只有IE支持, 2.点击工具---安全---自定义级别---ActiveX 相关选项启用下面是html代码复制代码 ...

编程-实现相册共享功能，数据库表怎么建立，PHP接口怎么实现逻辑?

问题描述实现相册共享功能,数据库表怎么建立,PHP接口怎么实现逻辑? 50C 功能主要是:我往我建立的相册传入相片,只要@我想要和他共享的人,就能在他的账号下建立同样的相册. 解决方案简略的说数 ...

iOS自动重连的过程非常长，超过5分钟

问题描述环信版本:V2.2.0r1 2015-09-23手机版本:iOS9.0复现步骤:1.手机无法通过GSM上网2.连接WIFI,环信正常使用3.关闭WIFI,isConnected为NO4.打开 ...

Oracle 表空间与数据文件

--============================== --Oracle 表空间与数据文件 --============================== /* 一.概念表空间: ...

Spark Streaming 多URL读取

问题描述问题是这样的我现在在用sparkstreaming做一个实时的决策系统,需要通过http请求不同的url并返回实时数据,但是sparkstreaming貌似是从一个url不停地抓数据.如何能 ...

《OpenStack云计算实战手册（第2版）》一2.3 用MySQL配置OpenStack镜像服务

2.3 用MySQL配置OpenStack镜像服务 OpenStack云计算实战手册(第2版) 默认情况下,OpenStack镜像服务,即Glance,被配置使用本地SQL数据库存储.为了弹性扩展,必 ...

Java开源运行分析工具(转)

FProfiler FProfiler是一个非常快的Java profiler.它利用BCEL和log4j来记录每个方法从开始到结尾的日记.FProfiler可以用来在你的应用程序,Servle ...

2014秋C++第11周项目4参考-特殊三位数

课程主页在http://blog.csdn.net/sxhelijian/article/details/39152703,课程资源在云学堂"贺老师课堂"同步展示,使用的帐号请到课 ...

Windows8，为荣誉而战

在智能手机和平板电脑时代,苹果和谷歌两个公司这几年成为产业焦点,各种光环不断叠加.相比之下科技产业领导公司中,曾经被无数程序员向往的微软似乎失去了光彩,尤其是比尔盖茨将公司总裁交给鲍尔默之后,微软好像 ...

c# 列表选中行高亮显示

问题描述列表是一个Listview里面嵌套了一个gridview,数据行存成了datarowview,要让选中的数据行高亮显示.整个软件中,其他地方都可以,唯独这里不可以.不是样式的问题.更改过,没 ...

Android上传文件至服务器

本实例实现每隔5秒上传一次,通过服务器端获取手机上传过来的文件信息并做相应处理:采用Android+Struts2技术. 一.Android端实现文件上传 1).新建一个Andr ...

html中表格table的内容居中显示

在表格td中,有两个属性控制居中显示 align--表示左右居中--left,center,right valign--控制上下居中--left,center,right 这两个属性综合使用, ...

超过800款 Android APP感染“Xavier”恶意软件

在谷歌Play应用市场,超过800款Android应用感染了"Xavier"恶意软件.该恶意软件会静默收集用户数据,并允许远程代码执行. Xavier简介 Xavier是一款恶意广 ...

linux（centos）下SVN服务器如何搭建_Linux

虽然在windows上搭建SVN很简单,但是效能却不高,这当然是和linux相比了.然而在linux上搭建SVN却非常繁琐,所以今天这篇文章就来一步一步教您如何在Centos上搭建SVN. 安装步骤如 ...

急急急！求大神相助啊

问题描述我的版本是10.7这什么情况啊怎么弄求大神相助.. 解决方案解决方案二:不能生成视图

腾讯野心在微信 5.0中的显现

微信 5.0的发布,从2月5日到8月5日,整整六个月,足足刷新了一款热门应用的更新周期. 微信 5.0 作为一个"大"版本,但是新版本却迟至今天才发布,其中内外部权益梳理. ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.022 s.