langyxxl 发表于 2013-8-25 11:43:14

秀秀1行提取所有thb-wiki上的资源标题

本帖最后由 langyxxl 于 2013-8-25 11:48 编辑

下雨天,呆在家里无聊啊~~

下载th14时发现thb-wiki上的链接是这样的http://down.thwiki.cc/?v=i&i=1674
就把最后的1674换成其他数字,还真能打开。。。。

就想看一下上面有多少资源,写了下面一行shell脚本:
for i in {1..1743}; do echo -n "地址:http://down.thwiki.cc/?v=i&i=$i   标题:   " >>thbwiki.txt; wget -q -O - "http://down.thwiki.cc/?v=i&i=$i" |grep "meta name" |awk-F\" '{print $4}' >>thbwiki.txt; done

得到thbwiki文本内容(前面10行):
地址:http://down.thwiki.cc/?v=i&i=1   标题:   上海爱丽丝幻乐团×黄昏边境 - TH135 东方心绮楼 ~ Hopeless Masquerade.
地址:http://down.thwiki.cc/?v=i&i=2   标题:   上海爱丽丝幻乐团 - TH14 东方辉针城 ~ Double Dealing Character. 体验版
地址:http://down.thwiki.cc/?v=i&i=3   标题:   コココソフト   - さとりのダンジョン王国 - The Heart Of Crossed Memory -
地址:http://down.thwiki.cc/?v=i&i=4   标题:   Alstroemeria Records - DEGENERATE DANCEHALL
地址:http://down.thwiki.cc/?v=i&i=5   标题:   ALiCE'S EMOTiON - Heart of Eternity
地址:http://down.thwiki.cc/?v=i&i=6   标题:   efs -JOKER &
地址:http://down.thwiki.cc/?v=i&i=7   标题:   凋叶棕 - 徒
地址:http://down.thwiki.cc/?v=i&i=8   标题:   EastNewSound - Mindless Act
地址:http://down.thwiki.cc/?v=i&i=9   标题:   発熱巫女~ず - BOUQUET -Grand Finale-
地址:http://down.thwiki.cc/?v=i&i=10   标题:   発熱巫女~ず - Lunar Concerto

文本下载在:http://paste.ubuntu.com/6023714/

GRzhan 发表于 2013-8-25 22:17:23

原来一直觉得平常会个Python什么的在可以实现的功能上已经覆盖Shell脚本了
所以觉得Shell脚本可以不用学
不过确实Shell实现一些功能的确要比Python简单方便快

jingyixx 发表于 2013-8-25 22:29:36

GRzhan 发表于 2013-8-25 22:17 static/image/common/back.gif
原来一直觉得平常会个Python什么的在可以实现的功能上已经覆盖Shell脚本了
所以觉得Shell脚本可以不用学
不 ...

并非所有环境都有python
所以如果要管理服务器,还是要写kshell script的
如果是自己的机器,有不少理由用一种scripting代替shell编程

GRzhan 发表于 2013-8-25 22:48:57

jingyixx 发表于 2013-8-25 22:29 static/image/common/back.gif
并非所有环境都有python
所以如果要管理服务器,还是要写kshell script的
如果是自己的机器,有不少理由 ...

不是所有环境里都有Python是肯定的嗯
不过不少发行版里已经默认装了自己平常用用还是非常方便的
当然没有LZ那样一句话Shell精巧就是了

jingyixx 发表于 2013-8-26 00:04:48

GRzhan 发表于 2013-8-25 22:48 static/image/common/back.gif
不是所有环境里都有Python是肯定的嗯
不过不少发行版里已经默认装了自己平常用用还是非常方便的
当然没有 ...

grep awk wget不是shell builtin
在py里调用也差不多的啊

就算直接用urlopen 然后字符串处理也不会显得笨重

GRzhan 发表于 2013-8-26 15:09:17

jingyixx 发表于 2013-8-26 00:04 static/image/common/back.gif
grep awk wget不是shell builtin
在py里调用也差不多的啊


。。。真的要说builtin的话那剩下的就不多了吧。。。
好吧,那么Python实现起来也很精巧就是了=1012=
页: [1]
查看完整版本: 秀秀1行提取所有thb-wiki上的资源标题