【小工具】CSDN博客导出工具-Java集成Maven开发

CSDN博客导出工具
之前一直想把CSDN的博客导入到自己的网站中,可是由于博客比较多,后面受朋友老郭启发,就找了个时间用Java开发了这款小工具。

转载请注明出处:http://chenhaoxiang.cn

本文源自人生之旅_谙忆的博客

CSDNBlogExport

CSDN博客导出工具

之前一直想把CSDN的博客导入到自己的网站中,可是由于博客比较多,后面受朋友老郭启发,就找了个时间用Java开发了这款小工具。
Had been trying to CSDN blog into their website, but because of the blog is more, inspired by my friend guo behind, will find a time this kind of small tools with Java development.

only use

直接下载CSDNBlogExport.7z解压使用即可。
Direct download CSDNBlogExport.7z decompression can be used.

经过测试,667篇博客,开50个线程,在54秒左右可以全部导出到文件。
Tested, 667 blog, open 50 threads, in 54 seconds can all exported to a file.

博客文件导出的存储规则是:
软件运行目录\blog\年-月\年-月-日 博客标题名.markdown
Blog file exported storage rule is:
Software running directory/blog/year-month/year-month-day blog title name.markdown

开发

CSDNBlogExport目录下是完整的程序代码
使用了WebMagic爬虫框架,本来自己写HttpURLConnection工具类也能实现的,只是比较耗时,偷个小懒,既然别人有更好的工具,为什么不用呢
技术含量呢,可以说基本没有什么,但是也是花了大半天时间做的。
中间还遇到部分玩家无法导出博客的情况,因为CSDN对于用户的链接命名分了2种情况,当时写的时候没有发现,是测试别人博客的时候发现的,经过半小时解决了这个问题。

虽然很想把这个程序完善,但是由于时间限制还是不能做太多事。
不保证本版本一直能使用下去,如果某天本程序不能使用了(肯定是CSDN对返回的数据进行了处理或者进行了权限控制),请留言或者联系我QQ:619699629或者邮箱:uifuture@uifuture.com
我会利用空闲时间跟上csdn对博客的升级,以保证能继续使用

此版本为1.0版本,希望用的朋友遇到bug,在这里留言或联系我,我会及时修复。

也欢迎朋友加入进来与我一起完善本程序。

本小程序可导出任意CSDN用户的博客,但是仅供学习使用。
免责声明:如果导出博客侵犯他人权益,引起纠纷的,一概与本人无关。

development

CSDNBlogExport directory is a complete program code
Used WebMagic crawler frame, original, write their own HttpURLConnection tools can be achieved only takes time, steal a little lazy, now that people have a better tools, why not
Technical content, it was basically have no what, but also spent most of time to do.
And in case of some players cannot export blog because CSDN links named points to the user for two kinds of circumstances, then write not found, is to test others while on a blog, solved the problem after half an hour.

Although very want to send this application is perfect, but due to time constraints or can’t do too many things.
Does not guarantee that this version has been able to use, if one day can’t use this program (must be CSDN on the returned data processing or access control), please leave a message or contact me QQ: 619699629 or email: uifuture@uifuture.com

I will use free time keep up with the CSDN on updating the blog, to ensure that can continue to use

This version is 1.0 version, hope to meet with friends bug, leave a message or contact me here, I’ll repair in time.
Also welcome friends to join in with me in perfect this procedure.
This small program can export any CSDN user’s blog, but only for the use of learning.
Disclaimer: if the export blog infringement of rights and interests of others, cause disputes, all has nothing to do with himself.

Bug修复记录

2017.7.31:
修复html编辑器写完博客后导出博客不全的bug
现在版本 v1.1
感谢CSDN博主[三名狂客]提出的Bug
>
2017.8.16:
进行版本升级,因为CSDN把一个分页的bug给堵上了,原来的版本不能使用,请下载最新版本2.0
现在版本 v2.0
感谢CSDN博主[龙腾四海365]提出的Bug

本次bug修复后,时间会延长一点,因为我在里面把分页的线程写死了,50个线程,有兴趣的可以自己扩展。
经过测试,在输入50线程时,668篇博客的爬取时间为92S。

2017.9.6:
进行版本升级,部分拥有两个id的CSDN用户无法备份博客,已进行修复,请下载最新版本2.1
现在版本 v2.1
感谢CSDN博主[沐雨浩]提示的Bug

源代码下载地址:

GITHUB项目地址:点我进行访问

如果无法访问,请翻墙哦

本文章由[谙忆]编写, 所有权利保留。
欢迎转载,分享是进步的源泉。

转载请注明出处:http://chenhaoxiang.cn

本文源自人生之旅_谙忆的博客

时间: 2024-07-30 02:00:26

【小工具】CSDN博客导出工具-Java集成Maven开发的相关文章

CSDN博客导出工具 mac

需要先使用CSDN账号登录,可以导出所有的博客文章,添加YAML头信息的时候,会在头信息里面包含文章对应的标签和分类以及原创的标签 自己写的mac版,以后可能会改成js版: GitHub地址

CSDN博客导出工具 Mac By Swift

写这个的目的主要是用于了解Swift语言本身,以及如何与Objc和第三方框架交互 需要先使用CSDN账号来登录,可以导出所有的博客文章,添加YAML头信息的时候,会在头信息里面包含文章对应的标签和分类,以及对应的文章类型(原创.转载.翻译) 开发环境 OS X 10.10,Xcode6 Beta4,由于Beta4较之前版本对Swift更新较大,之前版本编译出报错 使用的第三方框架 AFNetworking GTM RegExCategories Swift与Cocoa和ObjC交互比较简单,只用

自己动手编写CSDN博客备份工具-blogspider

来源:http://blog.csdn.net/gzshun   我之前一直在看lucene,nutch,发现有这么一个现成的小应用,特转来学习下!mark一下. 网络爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫. 网络爬虫最重要的任务,就是从互联网搜索出需要的信息,将网页抓取下来并分析,很多搜索引擎,比如百度,谷歌,后台都有一只很强悍的网络爬虫,用来访问互联网上的网页,图片,视频等内容

CSDN 博客备份工具

前言 核心 登录模块 备份模块 博文扫描模块 演示 如何使用 效果 总结 前言 近段时间以来,听群友博友都在谈论着一件事:"CSDN博客怎么没有备份功能啊?".这其实也在一定程度上表征着大家对于文章这种知识性产品的重视度越来越高,也对于数据的安全提高了重视. 所以我就尝试着写了这么一个工具.专门用来备份CSDN博友的博客. 核心 说起来是核心,其实也就那么回事吧.严格来说也就是一对代码,不能称之为核心啦. 登录模块 为什么需要登陆模块可能是正在看这篇文章的你的第一个疑惑之处. 其实原因

博客备份工具Blog

"在网上飘,哪能不中招",天灾毒祸.密码丢失.服务器当机,甚至是BSP关门倒闭等系统性风险,都有可能让你辛辛苦苦建设起来的博客家园毁之一旦."有备无患",Blog_Backup就是这样一款博客备份工具. 软件名称:Blog_Backup(博客备份工具) 软件大小:2170.00KB 开发语言:Python 运行平台:Windows XP SP2/2003 一.绿色免安装 操作简便 软件作者采用绿色免安装的方式,比较对笔者的味口,对那些功能单一,却硬加个安装程序外套,

博客备份工具 Blog Backup v0.6.1 下载_常用工具

Blog_Backup 是一款功能完善的博客备份软件,支持国内所有大型BSP,可导出内容为多种格式.目前支持的BSP如下:百度空间,新浪博客,和讯博客,Donews博客,博客巴士,天涯博客,MSN空间,搜狐博客,QQ空间,Bokee博客,歪酷博客,网易博客,CSDN博客,ChinaUnix博客,F2Blog,PJBlog,Z-Blog,WordPress.导出内容的格式包括:RSS 1.0,RSS 2.0,Atom 0.3,单个网页(正序.反序),多个网页. 功能特点:支持多个博客,多个空间的同

编写小程序查看CSDN博客信息(ASIHTTPRequest+TFHpple)

转载请注明出处:http://blog.csdn.net/horkychen 作为一个iOS练习,使用ASIHTTPRequest+TFHpple写了个小程序读取CSDN博客的已读等信息.其中ASIHTTPRequest负责发送HTTP Request以获取博客主页,然后使用TFHpple (XPath)解析出指定的HTML元素,然后读取相关的信息. 注意,关于两个库的使用,已经有不少资料了.其中TFHpple会使用search这个方法,现在要使用searchWithXPathQuery替换.

浅谈博客群发工具的利与弊有哪些

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 大家好,很久没来a5了,刚刚过完年,相信大家都还依然沉浸在吃喝玩乐的生活中--废话就不多说了,今天给大家带来的话题是:浅谈博客群发工具的利与弊有哪些.相信用过博客群发工具的朋友都知道,它操作简单,但作用随着时间的推移效果慢慢的下降了,工具就是工具,它不能完全取代人的一切,特别是搞我们seo这行的朋友应该非常清楚指点了,算法在不断的改变,今天能

2016年年终CSDN博客总结

2015年12月1日,结束了4个月的尚观嵌入式培训生涯,经过了几轮重重面试,最终来到了伟易达集团.经过了长达3个月的试用期,正式成为了伟易达集团的助理工程师. 回顾一年来的学习,工作,生活.各种酸甜苦辣,庆幸是有一群支持我的同事小伙伴,他们同样来自尚观IT培训机构,4年前,他们也是一样,怀着自己的理想考上了理想的大学,4年后,怀着自己的理想通过4个月的培训晋升,巩固自己的知识体系,最终也是找到了一份满意的工作,来到了VTECH, 这一年,收获还是非常大的,获得了公司的升职,同时自己的CSDN博客