JAVA/JSP学习系列之十一(简单的“抓网页”代码)

js|网页

一、前言

  从一个网站上,看到一个“抓网页”的代码,觉得有点意思,但是没有提供源代码,于是,自己想写一个,其实代码比较简单的。

二、代码

<%@ page contentType="text/html;charset=gb2312"%>

<%

String sCurrentLine;

String sTotalString;

sCurrentLine="";

sTotalString="";

java.io.InputStream l_urlStream;

java.net.URL l_url = new java.net.URL("http://www.163.net/");

java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection();

l_connection.connect();

l_urlStream = l_connection.getInputStream();

java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream));

while ((sCurrentLine = l_reader.readLine()) != null)

{

sTotalString+=sCurrentLine;

}

out.println(sTotalString);

%>

三、后记

  虽然代码比较简单,但是,我认为根据这个,可以实现“网络爬虫”的功能,比如从页面找href连接,然后再得到那个连接,然后再“抓”,不停止地(当然可以限定层数),这样,可以实现“网页搜索”功能。

时间: 2024-12-23 20:00:10

JAVA/JSP学习系列之十一(简单的“抓网页”代码)的相关文章

JAVA/JSP学习系列之八(改写MySQL翻页例子)

js|mysql|翻页 一.前言 其实,改写后的JDBC Data-Source是运行在Servlet中的,通过JNDI去查找数据源.我用Orion试的,将本站<JAVA/JSP学习系列之六(MySQL翻页例子) > 简单改写了一下. 二.配置 (1)JDBC 需要将用到的JDBC驱动Copy到[ORION]/lib目录下 (2)data-source 在[ORION]/config/data-sources.xml文件中加入如下: 〈data-source class="com.e

JAVA/JSP学习系列之八(改写MySQL翻页例子)_JSP编程

一.前言 其实,改写后的JDBC Data-Source是运行在Servlet中的,通过JNDI去查找数据源.我用Orion试的,将本站<JAVA/JSP学习系列之六(MySQL翻页例子) > 简单改写了一下. 二.配置 (1)JDBC 需要将用到的JDBC驱动Copy到[ORION]/lib目录下 (2)data-source 在[ORION]/config/data-sources.xml文件中加入如下: 〈data-source class="com.evermind.sql.

JAVA/JSP学习系列之六(MySQL翻页例子)_JSP编程

一.运行前准备 下载了mysql的jdbc驱动(一个jar文件)并加载在CLASSPATH(方法见<JAVA/JSP学习系列之一(JDK安装) >) (如果找不到,请从本站下载) 建一个MySQL数据库test 数据库中有一个表:note,字段为:name(varchar) 二.下载,安装 <%@ page contentType="text/html;charset=gb2312" %> <% java.sql.Connection sqlCon; //

JAVA/JSP学习系列之六_php基础

一.运行前准备 下载了mysql的jdbc驱动(一个jar文件)并加载在CLASSPATH(方法见<JAVA/JSP学习系列之一(JDK安装) >) (如果找不到,请从本站下载) 建一个MySQL数据库test 数据库中有一个表:note,字段为:name(varchar) 二.下载,安装 intPageCount) intPage = intPageCount; %> 姓名 0) { //将记录指针定位到待显示页的第一条记录上 sqlRst.absolute((intPage-1) *

JAVA/JSP学习系列之六(MySQL翻页例子)

一.运行前准备 下载了mysql的jdbc驱动(一个jar文件)并加载在CLASSPATH(方法见<JAVA/JSP学习系列之一(JDK安装) >) (如果找不到,请从本站下载) 建一个MySQL数据库test 数据库中有一个表:note,字段为:name(varchar) 二.下载,安装 <%@ page contentType="text/html;charset=gb2312" %> <% java.sql.Connection sqlCon; //

JAVA/JSP学习系列之七(Orion下自定义Tag)

js 一.前言 (本文译自Orion官方站点) 本文将一步一步介绍在Orion Application Server下定义自己的标签,然后,实现该标签的功能,最后用一个jsp例子测试. 二.建立标签,实现该标签的功能. 1.命名package为:com.acme.mytags(为了和原文相同,我不做改动) package com.acme.mytags; 2.import相关class import javax.servlet.jsp.*; import javax.servlet.jsp.ta

JAVA/JSP学习系列之九(理解构造器)

js 解构造器 构造器和方法的区别 摘要要学习Java,你必须理解构造器.因为构造器可以提供许多特殊的方法,这个对于初学者经常混淆.但是,构造器和方法又有很多重要的区别.原作者:Robert Nielsen 原站:www.javaworld.com 我们说构造器是一种方法,就象讲澳大利亚的鸭嘴兽是一种哺育动物.(按:老外喜欢打比喻,我也就照着翻译).要理解鸭嘴兽,那么先必须理解它和其他哺育动物的区别.同样地,要理解构造器,那么就要了解构造器和方法的区别.所有学习java的人,尤其是对那些要认证考

JAVA/JSP学习系列之二(Tomcat安装)

js 一.前言 对于初学者来说,要执行JSP和Servlet,Tomcat是一个很不错的选择,.Tomcat是Apache组织的产品,sun公司对它的支持也相当不错. 二.下载,安装 下载地址为JAVA官方站点:jakarta.apache.org,国内也比较多. 从这个地址可以下载:http://jakarta.apache.org/builds/tomcat/release/,我下载的是Tomcat32b4版本. 下载完,解压到一个目录,我这里用F:\tomcat32b4作为例子. 三.配置

JAVA/JSP学习系列之二_php基础

一.前言 对于初学者来说,要执行JSP和Servlet,Tomcat是一个很不错的选择,.Tomcat是Apache组织的产品,sun公司对它的支持也相当不错. 二.下载,安装 下载地址为JAVA官方站点:jakarta.apache.org,国内也比较多. 从这个地址可以下载:http://jakarta.apache.org/builds/tomcat/release/,我下载的是Tomcat32b4版本. 下载完,解压到一个目录,我这里用F: omcat32b4作为例子. 三.配置 桌面上