如何用VC++抓取网页内容.

问题描述

请教一下,如何用VC++抓取网页内容,就是类似网页源文件这种东西。

解决方案

解决方案二:
你google一下VC,httpclient,一大堆的例子。如果要更熟悉一下底层,可以读一读http协议的规范。
解决方案三:
引用1楼iihero的回复:

你google一下VC,httpclient,一大堆的例子。如果要更熟悉一下底层,可以读一读http协议的规范。

你好,我这里有一个例子,但是自己很多地方还不懂,想请教下你。////////////////////////////////////////////////////////////TCPClient.cpp文件#include"InitSock.h"#include<stdio.h>CInitSockinitSock;//初始化Winsock库intmain(){//创建套节字SOCKETs=::socket(AF_INET,SOCK_STREAM,IPPROTO_TCP);if(s==INVALID_SOCKET){printf("Failedsocket()n");return0;}//也可以在这里调用bind函数绑定一个本地地址//否则系统将会自动安排//填写远程地址信息sockaddr_inservAddr;servAddr.sin_family=AF_INET;//servAddr.sin_port=htons(4567);servAddr.sin_port=htons(80);//注意,这里要填写服务器程序(TCPServer程序)所在机器的IP地址//如果你的计算机没有联网,直接使用127.0.0.1即可//servAddr.sin_addr.S_un.S_addr=inet_addr("10.1.141.251");//servAddr.sin_addr.S_un.S_addr=inet_addr("10.1.141.4");servAddr.sin_addr.S_un.S_addr=inet_addr("10.1.141.251");//servAddr.sin_addr.S_un.S_addr=inet_addr("118.145.6.120");//servAddr.sin_addr.S_un.S_addr=inet_addr("60.28.14.149");//newsqqif(::connect(s,(sockaddr*)&servAddr,sizeof(servAddr))==-1){printf("Failedconnect()n");return0;}//接收数据printf("nGetDatafromwwwServer...n");/////////ftsadd//charszText[]="GET/123.htmrn";//charszText[]="GET/index.htmrn";charszText[]="GET/11.htmlrn";//charszText[]="GET/modules/lvyebb/viewtopic.php?&id=31&post_id=44128468&view=1rn";//charszText[]="Get/a/20111116/000154.htmrn";::send(s,szText,strlen(szText),0);//ftsendwhile(true){charbuff[1024];intnRecv=::recv(s,buff,256,0);if(nRecv>0){buff[nRecv]='';printf("%s",buff);}}//关闭套节字::closesocket(s);return0;}

时间: 2024-09-27 12:46:30

如何用VC++抓取网页内容.的相关文章

PHP 用QueryList抓取网页内容

原文:PHP 用QueryList抓取网页内容 之前抓取网页数据都是用Java Jsoup,前几天听说用PHP抓更方便,今天就研究了一下,主要是用QueryList来实现. QueryList是一个基于phpQuery的通用列表采集类,是一个简单. 灵活.强大的采集工具,采集任何复杂的页面 基本上就一句话就能搞定了.   直接拿博客园举例子了,http://www.cnblogs.com/ 我们用QueryList来抓取红框里面的内容     查看网页源代码找到红框的位置 1 <div id=&qu

PHP抓取网页内容的方法

PHP抓取网页内容的方法 PHP抓取页面的内容在实际的开发当中是非常有用的,如作一个简单的内容采集器,提取网页中的部分内容等等,抓取到的内容在通过正则表达式做一下过滤就得到了你想要的内容,至于如何用正则表达式过滤,在这里就不做介绍了,有兴趣的同学可以参考板块:http://111cn.net/articles11.shtml,以下就是几种常用的用php教程抓取网页中的内容的方法. 1.file_get_contents PHP代码 <?php    $url = "http://www.1

ASP.NET抓取网页内容的实现方法

 这篇文章主要介绍了ASP.NET抓取网页内容的实现方法,涉及使用HttpWebRequest及WebResponse抓取网页内容的技巧,需要的朋友可以参考下     本文实例讲述了ASP.NET抓取网页内容的实现方法.分享给大家供大家参考.具体实现方法如下: 一.ASP.NET 使用HttpWebRequest抓取网页内容 代码如下: /// <summary>方法一:比较推荐 /// 用HttpWebRequest取得网页源码 /// 对于带BOM的网页很有效,不管是什么编码都能正确识别

ASP.NET抓取网页内容

原文:ASP.NET抓取网页内容 一.ASP.NET 使用HttpWebRequest抓取网页内容   这种方式抓取某些页面会失败 不过,有时候我们会发现,这个程序在抓取某些页面时,是获不到所需的内容的,有时候甚至返回404的错误提示页,这是什么原因呢? 其实,很多人都忽略了一个问题,那就是服务器默认的浏览器问题.有的服务器默认的浏览器是手机浏览器,那么,当我抓取这个服务器下的网页是,就相当于用手机浏览器来打开网页,而如果要抓取的目标网页没有相应的手机网页的话,就会返回意想不到的结果,有的返回4

零基础写python爬虫之使用urllib2组件抓取网页内容_python

版本号:Python2.7.5,Python3改动较大,各位另寻教程. 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地.  类似于使用程序模拟IE浏览器的功能,把URL作为HTTP请求的内容发送到服务器端, 然后读取服务器端的响应资源. 在Python中,我们使用urllib2这个组件来抓取网页. urllib2是Python的一个获取URLs(Uniform Resource Locators)的组件. 它以urlopen函数的形式提供了一个非常简单的接口. 最简

html-如何用java抓取网页隐藏音频链接

问题描述 如何用java抓取网页隐藏音频链接 我想用java抓取荔枝FM网站上所有的音频文件,但是直接查看网页源码发现找不到页面的音频链接http://www.lizhi.fm/#/25734/20075765977745926,但是我用谷歌的Developer Tools能找到这个链接http://cdn.lizhi.fm/audio/2015/05/16/20075765977745926_hd.mp3,我有点不知道怎么搞了,求帮忙看看什么情况 解决方案 搜索这个页面的data-url 解决

ASP.NET抓取网页内容的实现方法_实用技巧

本文实例讲述了ASP.NET抓取网页内容的实现方法.分享给大家供大家参考.具体实现方法如下: 一.ASP.NET 使用HttpWebRequest抓取网页内容 复制代码 代码如下: /// <summary>方法一:比较推荐  /// 用HttpWebRequest取得网页源码  /// 对于带BOM的网页很有效,不管是什么编码都能正确识别  /// </summary>  /// <param name="url">网页地址" </

Asp 使用 Microsoft.XMLHTTP 抓取网页内容并过滤需要的_应用技巧

Asp 使用 Microsoft.XMLHTTP 抓取网页内容(没用乱码),并过滤需要的内容 示例源码: 复制代码 代码如下: <% Dim xmlUrl,http,strHTML,strBody xmlUrl = Request.QueryString("u") REM 异步读取XML源 Set http = server.CreateObject("Microsoft.XMLHTTP") http.Open "POST",xmlUrl,

如何用java抓取ajax页面的内容?

问题描述 如何用java抓取ajax页面的内容?例如这个页面: http://app.abchina.com/branch/ 中的营业结构查询思路是什么,希望大家给出解答,谢谢! 问题补充:wangqj 写道 解决方案 用htmlparser就可以了,你不用管ajax,和正常页面一样抓就行.实际上你只要知道你要抓取的页面的网址就可以了