这段时间整理分布式经典论文, 这个自己手工来下载是个很吃力的事情 如果还想要进行一些处理方便使用,比如按引用排序,按年代排序,按作者来分类,这时候写个几十行的小爬虫就很方便了. 一般下载资料,获取峰会材料等等的时候都会用爬虫来处理 过去都是用 python 爬虫, 主要使用 BeautifulSoup 来解析, 用 requests 来请求 现在想试试用 go 处理,今天刚好发挥了作用 因为golang.org被墙, 很多库是没有办法下载的例如 https://godoc.org/golang.org/x/net 没办法 go get golang.org/x/net 了。可以用 go get github.com/golang/net 替代 但是很多库,手工处理太坑了, 写了个小爬虫, 生成了个批处理文件 在 golang.org/x 目录里面执行就获得了素有的库. 批处理
阅读全文…