Python敏感地址扫描和爬取工具_程序员

Python敏感地址扫描和爬取工具

荆门新闻网

2018-03-26 09:11:24

0次

为了方便信息安全测评工作，及时收集敏感地址(初衷是爬取api地址)，所以写了这么个小工具。两个简单的功能（目录扫描和url地址爬取）。

0×02 使用参数: python spider.py -u url -s api -o output.txt -t thread_number #通过爬虫
python spider.py -u url -s dir -f dict.txt -o output.txt #通过目录扫描
0×03 部分函数说明:

防止因末尾斜线、锚点而重复爬取（、、）

爬取规则：

第一个无法爬取页面注释中的地址（<!––>）,第二个无法爬取相对路径和php?id=等类型的地址，古结合两种规则，并排除图片视频类的地址，最后再去重

补全相对地址、防止越界（可爬取子域名，其他地址除外），并验证地址是否能正常访问

地址池

爬取功能，虽然使用了多线程，但还是比较慢，输出结果是爬取完毕的地址

目录扫描和输出到文件

0×04 代码地址:

https://github.com/silience/spider

有帮助

没帮助

上一篇： 挖洞经验 | 看我如何绕过限制访问到Google内部管理系统（价值$13337）

下一篇： 一个土鳖安全工程师的十年奋斗史

栏目索引