当前位置:  技术问答>java相关

怎样从网页中抓取内容?

    来源: 互联网  发布时间:2015-05-23

    本文导语:  我的想法是先把想抓取的网页存到一个数组或变量里,然后分析数组或变量从中提取需要的信息,可是我不知道相关的函数,能不能告诉我需要用到什么函数,请各位大侠不吝笔墨提出自己的看法。 | ...

我的想法是先把想抓取的网页存到一个数组或变量里,然后分析数组或变量从中提取需要的信息,可是我不知道相关的函数,能不能告诉我需要用到什么函数,请各位大侠不吝笔墨提出自己的看法。

|
URL url = new URL("http://www.csdn.net/");
URLConnection conn = url.openConnection();
BufferedReader in = new BufferedReader(new InputStreamReader(
                                         getInputStream()));

String s = null;
while ((s=in.readLine()) != null)  System.out.println(s);

|
读取网页内容使用java.net包里面的方法
定义URL对象 打开连接 获取数据流 就可以乐

|
你要做搜索引擎吗?
可以试试javax.swing.text.html包下的函数。
使用说明可在java.sun.com下载。

    
 
 

您可能感兴趣的文章:

  • 基于python实现的网络爬虫功能:自动抓取网页介绍
  • 网页抓取工具 PlayFish
  • udp方式抓取网页
  • java抓取网页数据示例
  • python抓取网页内容示例分享
  • 如何 获取抓取一个网页并保存成本地文件
  • python抓取网页中的图片示例
  • JSP抓取网页代码的程序
  • java抓取网页数据获取网页中所有的链接实例分享
  • python 自动提交和抓取网页
  • python抓取网页时字符集转换问题处理方案分享
  • 帮忙调试,一小段抓取网页的C程序!
  • python抓取网页图片并放到指定文件夹
  • C# 抓取网页内容的方法详解
  • c# 抓取Web网页数据分析
  • c# HttpWebRequest通过代理服务器抓取网页内容应用介绍
  • java 抓取网页内容实现代码
  • Socket抓取网页网页
  • C#实现通过程序自动抓取远程Web网页信息的代码
  • c#根据网址抓取网页截屏生成图片的示例
  • python抓取网页图片示例(python爬虫)
  • bash如何读取网页的内容,并根据内容进行不同的操作
  • 怎样把整张网页内容当作一副图形(只能作为图像,因为可能网页中有图)传给控制打印的Java程序?
  • [求助][排错]一段利用socket连接网页,并将网页内容拷贝下来的程序。。。[有一点问题]
  • eidt.jsp对网页进行编辑,网页内容存放在数据库中,其中有些字段用textarea多行编辑框显示,保存提交数据库后,再次对它编辑,那些用多行
  • 通过网址,自动下载网页的内容程序
  • 根据url获取对应的网页内容
  • jquery实现google搜索指定网页内容的代码
  • 请问如何在javascript中动态的指定框架页显示的网页内容。
  • 请问为什么我在linux 9.0下打开.pdf,和.ppt显示不了中文,但是网页的中文内容能显示
  • php 获取远程网页内容简单函数
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • web网页自动跳转方法:Html body onload自动跳转举例
  • linux浏览网页时怎样显示网页中的flash动画?
  • Python获取网页编码的方法及示例代码
  • 为什么我用netscape浏览时,网页不正常(主要是动态网页)碰到分类排序的就显示不了了
  • HTML网页中的html body onload自动跳转方法介绍及自动跳转代码示例
  • 关于session(我停了一会儿没动网页,再在点击网页链接时,session丢失,然后点击IE的刷新,session又有了)这是怎么回事。
  • HTML网页的Meta Refresh自动跳转方法介绍及Meta Refresh自动跳转代码示例
  • C#实现将网页保存成图片的网页拍照功能
  • 中文网页快速去重算法研究
  • 如何在red hat的网页浏览器中浏览使用ipv6协议的网页?
  • VPN虚拟局域网和本地局域网共存(连上vpn后正常打开网页)
  • 各位高手请帮忙,如果我在框架网页中弹出一个新的窗口,在新窗口中执行一定的操作后,怎样让框架网页自动刷新?
  • HTML网页中的javaScript自动跳转方法介绍及javaScript自动跳转代码示例
  • 在样式表中,用submit提交信息到下一个网页,在下一个网页中如何知道该submit的name??谢谢了
  • Python3通过request.urlopen实现Web网页图片下载
  • ★★Linux服务器的网页响应发送给客户端的网页被修改,估计服务器中毒了,怎么办??
  • 网页下载文件期间如何防止用户对网页进行其他操作
  • 批量下载网页图片,网页截图 Chrome 插件 挖一下
  • 网页设计者需要了解的_网页字体大小数据参考
  • 做网页字体大小参考 网页中同字号字体的不同单位对比列表
  • 如何把数据显示到网页上?


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    HTML标签参考手册 iis7站长之家