九月星空

日志归档: 2011年09月

新浪读书V.I.P.免费批量下载方法

作者: 2011年09月29日, 分类:Other

工具:UltraEdit(或任意一款能替换字符串的高级文本编辑器)+迅雷

新浪读书收费确实很有一套,采用章节付费的方式,按章节收费的小说不同于收费电影,电影是一次性收费,看或不看就只是一时就能决定,而小说就不同了,新浪读书的VIP图书,先采用开始部分章节免费,一般收费小说都是比较不错的,故事情节引人入胜,让人欲罢不能,但是故事情节看着看着突然必须付费观看了,在其他免费小说网站也很难看到这些收费章节,因为新浪读书的VIP章节都是图片格式,而且查看网页源代码被限制,就算找出了源代码也没有相关图片的线索,图片都是即时生成的名为vipbook_none.gif的空白文件.

所以有些免费小说网站即使有这些章节也都是通过网站或网友购买VIP章节观看截图后上传的,一般都只是有几个VIP章节就没了.故事看了一半看不成了就跟看太监贴没什么区别,其实新浪的收费也不是太贵,千字3分,但是VIP小说一般都七八十万字左右.每章几毛钱看着真不算什么,故事情节就像个圈套不断的诱惑你消费,整本看下来算算一本书要花二十多块,是不是比不打折的正版实体书还贵,实体书还可以想什么时候看就什么时候看..如果会出版我肯定会买实体书,但是有的还只有电子版只能在新浪看..反正我是觉得亏,不过本文的方法开始挺折腾的,怕浪费时间的同学还是绕道而行,多多支持一下正版也好.人家写书也不容易...钱其实都是被新浪赚了去了.

不说废话了,下面说说下载方法:
1.随意找一篇VIP都市小说《地产女老板》为例,小说的页面地址是 http://vip.book.sina.com.cn/book/index_69428.html 这个69428就是本书的编号,页面加载完毕后保存网页.
2.用UltraEdit打开保存的网页文件(保存单页面即可),以VIP章节开始的章节名查找定位到相关的代码处.向前看到第一个<li>标签,把从文档开头到<li>之前的代码都删除掉.

同样的方法用VIP结尾章节名查找定位到代码向后看到第一个</li>标签,把</li>之后到文档末尾的代码都剔除掉.

3.然后开始替换大法(皆是用全部替换).要按顺序来哦...
①首先用 </li>加换行 替换掉 </li>
//使每章节分成一行.
②用 替换掉 换行加<li class="line"></li>
//剔除多余的分割线.等于批量剔除这些代码.
③用 http://vip.book.sina.com.cn/iframe/chapter_img.php?book_id= 替换掉 <li><a href="chapter_
//下载地址的前半部分.
④用 &k=book&n=(*)加一个空格 替换掉 .html" target="_blank">
//下载地址的后半部分 (*)是批量下载能用到的.
⑤用 替换掉 </a><img src="http://www.sinaimg.cn/book/vipbook//book_mj_011.gif" width="21" height="9" alt="VIP章节" /></li>
//剔除源代码中显示VIP图片的代码.
⑥用 69428&chapter_id= 替换掉 69428_
//69428是书的编号.这个是要改动的.

现在替换后每行已经变成了批量下载地址后接文章标题的样子.

其实以上这些繁琐而且手工操作又容易出错的步骤,完全可以写个简单小程序来实现,填写书本编号,程序自动自动下载对应目录页面并分析代码按规律提取VIP章节每章编号并生成每章批量下载的地址,但是可能负面的是被广泛利用的话(免费小说网站用到的几率比较大),伤害到新浪的利益,人家是会采取措施的.

每一个下载地址都对应着每章节中的图片,地址尾部的(*)其实就是1,2,3,4……对应章节中按顺序的每个图片,一般一个页面会有15个左右包含小说文字的图片.
说是批量下载,其实只是一次批量下载一章的小说图片.工作量还是不小的,想免费看小说还只能这么折腾.除非像Linux下面的软件写个脚本让它按我们我想法去下载去重新命名..当然Win下也可以,我们不用迅雷的(*)匹配的批量下载,不过要自己写个小程序,每个章节下载地址生成定量的对应图片地址,我下载试过,大多数都是13个图片,但是下载少了就郁闷了,而这个数字选多了话,迅雷会下载成多余的0kb的php文件.这个数字选15或者20都行,到时排序一下把php文件都删除就行了.这样就能一次批量下载全部VIP章节.

下面迅雷开始上阵.
额外多说一句,如果是打开或者普通下载的方式下载过来这个页面是错误的,这个很正常,新浪肯定是要有限制的,但用迅雷却可以,真是邪门了...迅雷真的很牛,智能挖掘数据还是嗅探啊?还可以有针对性的挖掘?唉..难理解,希望有高人指点.

先进行特殊的设置.
常用设置---任务管理---同时运行的最大任务数 改为 1 ,取消"自动将低速任务移至列尾"(因为下载回来的都是chapter_img*.gif文件,迅雷中非BT下载是不是按顺序下载的,任务超过一的话,后面的图片可能较之于前面的图片下载回来,这样图片命名顺序就乱了,到时候再去折腾比较哪张在前哪张在后是神仙也会疯掉)。

以第一篇VIP章节为例(这是用(*)迅雷批量下载的方式的例子,建议还是用个小程序生成,比这个简单很多,而且一本书一次搞定.但是不是谁都会写程序啊 >_< )...
从之前的文档中复制第一篇VIP章节的下载地址,新建---批量任务,把地址复制进URL.下面选择从1到15(当然保险起见可以选20) 通配符长度 1


然后确定两次,选择保存路径,这个可以新建一个以小说名命名的文件夹,然后每章节也分一个文件夹,文件夹名复制之前文档中地址后面的字串.
然后在选中只从原始地址下载(如果不选择有的图片下载过程中可能出现无资源的情况,然后下载任务就会卡那儿了.)和使用相同配置的选项,然后点击下载就可以一次批量下载一章节的内容了.

当然,那么多步骤完全可以通过写一个程序来实现.比如这样(只是个界面演示),然后所有地址复制到迅雷任务一次性下载.

偷偷看就好,偷看得人多了估计就都没得看了...

2 Comments 更多...

找啥捏?

使用下方搜索框搜索本站:

还没找到你想搜索的东东?那就给哥留言或者联系哥吧!

博客链接

随便看看,不收钱的啊……