截图|聊天截图厚码也不安全 大神写了算法分分钟给你还原

讲个恐怖的故事 。
早上跟同事在微信闲谈,聊起了一位女同事最近的变化 。
【截图|聊天截图厚码也不安全 大神写了算法分分钟给你还原】结果他反手就把文字打上马赛克,截图丢进了群里:
截图|聊天截图厚码也不安全 大神写了算法分分钟给你还原
文章图片

还欠欠儿地补了一刀:
@XXX,他说你坏话了呦~
万万没想到,这位同事气势汹汹地走了过来,竟然直接点出了“秘密文字”的内容 。
当时的我是这样的:
截图|聊天截图厚码也不安全 大神写了算法分分钟给你还原
文章图片

见状,这位老师补充道:
都什么年代了,以为打马赛克我就认不出来了?分分钟还原好吧!
……
好奇如我,马上对这个技术展开了一番“调查” 。
(PS:聊天原图在文末揭晓)
如何还原打了马赛克的文字?
还别说,国外一家公司的首席研究员Dan Petro(下文简称Dan),这两天就发布了这么一篇帖子 。
他直接点出了重点:
打马赛克(像素化),是一种非常不好、不安全,而且会泄露敏感数据的方法 。
为了验证他的说法,Dan亲自下场写了一个名为 Unredacter 的工具 。
然后现场演示了一下,这个工具是如何一点一点把打了马赛克的文字还原的:
截图|聊天截图厚码也不安全 大神写了算法分分钟给你还原
文章图片

从上面的示例中,不难看出,即便原文打了厚厚的一层马赛克,在这个工具面前依旧像“裸奔”一样 。
或许你会说,这玩意儿操作起来会很复杂吧?
不不不 。
非常之简单,仅仅是2个步骤:
用npm install安装依赖项
用npm start来启动
截图|聊天截图厚码也不安全 大神写了算法分分钟给你还原
文章图片

虽然在Dan之前,已经有类似的工具存在了,例如 Depix 。
但一个非常现实的问题就是,Depix还原的文字,从视觉效果上并不是很好:
截图|聊天截图厚码也不安全 大神写了算法分分钟给你还原
文章图片

Depix还原出来的文字,有些地方的还是糊糊的 。
因此,国外Jumpsec Lab的一位研究员指出了这个问题,并且还附上了一道比较有意思的挑战:
如果你破解了密码,请联系我们 。
截图|聊天截图厚码也不安全 大神写了算法分分钟给你还原
文章图片

这样的挑战便引起了Dan极大的兴趣,这也就是他开发Unredacter的原因 。
于是,在Unredacter的加持下,Dan顺利攻破了这项挑战:
截图|聊天截图厚码也不安全 大神写了算法分分钟给你还原
文章图片

而后Dan联系上了这位研究员,在邮件的回复中,也证实了Dan的结果是正确的:
截图|聊天截图厚码也不安全 大神写了算法分分钟给你还原
文章图片

不仅如此,Dan还介绍说,像类似用涂抹方式来打的马赛克,无论是在GiMP、Photoshop或者其它编辑器中,结果都是一样的 。
因此,他的破解方法应当是具备一定的通用性 。
当然,生活中我们或多或少都会有“打码”的需求,既然马赛克不安全,那有没有更好的方式呢?