在 PyPi 上构建僵尸网络

原文：https://medium.com/hackernoon/building-a-botnet-on-pypi-be1ad280b8d6

或者能够

介绍

在去年 10 月的伦敦 python Dojo 上，我们发现 PyPi 允许用内置模块名注册包。

那又怎样？你可能会问。谁会安装系统软件包？故事大概是这样的:

当我们发现这一点时，我对它作为攻击媒介的可能性非常感兴趣，所以做了几件事:

raise RuntimeError("Package 'json' must not be downloaded from pypi")

完全有可能蹲在 pypi 包上而不上传任何文件。但是通过添加一个空的包，我可以从 pypi 下载统计中跟踪下载。

Pypi 将他们的访问日志(sans 识别信息)上传到 google big query ，这非常棒，让我们可以很好地了解每个包最终在多少个系统上。

大查询说，今年到目前为止(2017 年 5 月 19 日)，我的虚拟包已经被下载了~244k 次，幸运的是它们是良性的，否则就是 40 万台被感染的机器！

一些下载将是人们使用定制的刮刀，其他的可能是自动构建作业，一遍又一遍地运行，但是我使用了一些策略来衡量这些数据的质量:

pypi 下载日志包括一个列installer.name，这看起来相当于一个 HTTP 用户代理字符串，通过只选择 installer.name 为pip的行，我们更有可能计算实际安装，而不是抓取器或其他机器人
另一个专栏:system.release跟踪非常高级的系统版本信息(例如4.1.13–18.26.amzn1.x86_64)通过将此包括在计数中，我们可以看到许多不同类型的安装程序正在下载这些包，这表明不只是少数几个机器人在抓取网站。今年有 31k 个不同的系统版本下载了我的包，相比之下，整个 pypi 总共有 33k 个不同的版本

我使用的查询如下:

实际上，我从未收到过对我邮件的回复，所以过了一会儿，我在一月份的官方 pypi github 问题跟踪器上提出了一个问题。这也没有得到答复。

我目前占用了所有看起来风险最大的系统包名称，并且是用良性包来这样做的，所以我现在看不到披露这些的风险。

黑客中午是黑客如何开始他们的下午。我们是 @AMI 家庭的一员。我们现在接受投稿并乐意讨论广告&赞助机会。

如果你喜欢这个故事，我们推荐你阅读我们的最新科技故事和趋势科技故事。直到下一次，不要把世界的现实想当然！