《根据批量URL生成有书签的pdf文档的解决方案》一文作为一个完整的解决方 案,主要有四个要点
(1)详细描述了解决方案的思路,
(2)提出了一种描述URL的xml文件,称之为h2p文件
(3)根据h2p文件生成pdf文档的工具称为h2p-tool,同时h2p-tool还能对h2p 文件进行编辑,从而制作自己的pdf电子书。
(4)h2p文件是该解决方案的资源文件,收集url是件费时费力的事情,所以 该解决方案还提供了下载h2p文件的链接
H2p是我自己定义的一种xml格式,我私下里是希望这种格式能够被大家接受, 所以我定义了dtd,并且开发了一个编辑h2p文件的工具h2p-tool,而且在javaei 网站上提供了大量的h2p文件作为资源下载。有了h2p,制作自己的pdf电子书将变 得很容易。
如果想让h2p为大家所接受,h2p必须不断的发展。因为现在h2p应用还是很简 单很原始。主要表现在,生成的pdf是原html的完全再现,这是他的优点也是他的 弱点。
说是优点,是因为pdf的呈现效果和在浏览器里风格一样。
说是缺点,是因为既然生成了pdf,我们希望pdf里主要突出文章的主题内容, 而不希望有原来网页里的那么多的图片和广告,而且还希望原来是分页的内容自 动合并到一个pdf里。
所以,就此缺点,我提出两个可能的展望。
(1)制定一种规范,该规范要求网站为每篇博客提供一个为h2p专用的链接( 姑且叫h2p链接吧),根据这个链接打开的博客文章是没有广告的,那么h2p文件 的连接采用这种h2p链接,生成的pdf就没有上述的缺点了。这个想法可能与网站 的盈利相悖,因为如果提供h2p链接,很多人将会之点击h2p链接,这样,就避开 了网站投放的广告。
(2)第二种可能的展望就是,各网站提供一个webservice的编程接口,通过 该编程接口,用程序访问每篇博客文章,这样得到的文章就是没有广告的干净的 文章。
这两种展望的目的主要是为了生成干净的pdf文档,显然,要实现这两个展望 是很困难的,除非大家都很接受h2p这个思路,并且对这种应用很迫切,才会有人 来大力推动。想想rss的普及,那也是一波三折,最终还是因为其便捷的使用模式 而被大家所接受。
私下里是希望大家能接受并喜欢h2p的。