本篇文章2332字,读完约6分钟

酷产品的第一时间免费试玩,还有很多高质量的达人分享独特的生活经验,快来本众测,体验各行业最尖端、最感兴趣、最好的产品吧! 下载地址也可以享受优惠哦!

原标题:被打得很“马赛克”的照片,就这样被放回了ai :雷锋网

《教资》成绩出来了。

不知道大家是否报名参加考试? 合格了吗? 分享了吗?

昨晚,#教师资格证书成绩#话题登上微博热搜排行榜的首位,浏览次数超过21亿次,很多网民在微博上发布了自己的成绩单。

高分合格,准备面试了,很凉快,明年打算更严格。 剩下的单科卡在69 ……

这比较伤心。

但是,更让人心痛的是,不仅教资没有了,还可能因为晒黑泄露了个人新闻。

大家明明对“姓名、身份证号码、准考证号码”等个人敏感的新闻进行了马赛克,却为什么泄露消息,可能会感到奇怪。 你还能恢复吗?

也许真的很好!

同样,昨晚,github前面的ai项目进入了热排行榜,到现在为止已经收获了8.4k星座。

这个ai的第一个功能是去除马赛克,恢复文字密码。

解读ai《密码》

我相信很多人认为镶嵌的话,不会泄露敏感的消息。 因此,我们在微信朋友圈和微博等地公开了社会交流平台,经常可以看到镶嵌的结婚照片、证书照片、成绩照片等。

但事实上,无论是图像、复印还是文字,ai都不难恢复马赛克。

最近一个叫sipke mellema的程序员开发了这个工具。 他在内部文件中通常以像素化的方式显示密码,但没有从这样的图像中恢复密码的工具。 因为这是制作出来的。

让我们先看看效果图

其中,第一行是像素化的加密序列,被严重镶嵌,看不到原始的痕迹。

第二行是用ai还原的密码,密码序列几乎被还原,精度高,稍微推理一下就能得到第三行的原始密码。

那么,这个“不可思议”的ai还原技术是如何实现的呢?

镶嵌是图像像素化解决的手段,已知通过使图像的特定区域的灰度细节恶化、扰乱彩色块,从而达到模糊的图像效果。

像素化在很多行业都被用于模糊图像新闻,线性盒滤波器是比较常见的解决算法。 盒滤波也称为块滤波,使用一个像素盒,用该盒中所有像素的平均值复盖像素。

这样,表情图像被分成4个色块,各色块被色块的平均值复盖,最终成为像素化的表情,但由于失去了原来的消息,所以不能直接反转过滤器。

mellema利用盒过滤器提出了ai恢复算法- depix。

线性盒过滤器是一种明确的算法,将相同的值像素化会生成相同的像素块。 相反,如果使用相同位置的块像素化相同的副本,会得到相同的块值吗?

mellema试图在像素化拷贝中找到匹配的模式,结果确实如此。

具体地说,mellema将各个块或块的组合视为子问题。 这个算法要求相同的背景有相同的拷贝大小和颜色。 这是因为现代复印机也可以添加色调、饱和度和亮度,所以没有选择制作潜在的文字查找表。 也就是说,存在大量的潜在字符。

财讯:被狠狠打了 “马赛克”的图片,就这样被 AI 还原了

要解决字符,mellema采用要解决的字符的bloom数组( de bruijn sequence ),粘贴到同一个容器上,创建截图。 此屏幕快照可以用作类似块的搜索图像,例如:

布鲁姆序列包含要解决的所有字符的两个字符组合。 这非常重要,因为一个块有两个字符重叠。

为了找到合适的匹配,需要搜索图像中相同像素配置的块。 在测试期间,depix算法找不到字符“o”。 在搜索图像中,搜索块包含以下字符“d”,但在原始图像中包含空。

很明显,如果在创建字符碎片整理序列时添加空网格,则会出现算法找不到后续字符的适当块的问题。 空格式和有字母的图像需要更长的搜索时间,但可以获得更好的结果。

在大多数像素化图像中,depix可以找到块的单一匹配结果。 假设这些块是正确的,然后比较周围的多个匹配块,使其与像素化图像的几何距离相同,假设这些匹配也是正确的。

在正确的块越来越不符合几何学后,depix直接输出所有正确的块。 对于多匹配块,depix输出所有匹配的平均值。 depix的输出不完美,但已经好了。

下图显示了包含随机字符的测试图像的脱像素结果,大部分字符都被正确读取了。

最后,mellema开发这个ai项目不是为了窃取新闻,而是需要证明它是为了利用ecb和明文攻击( known-plaintext attacks )的模型来提高新闻保护技术。 我认为他不知道如何破坏现在的保护模式是新闻安全中常见的陷阱。

恢复ai“面部图像”

如上所述,除了文字密码,ai也不会复原脸部照片。

今年6月中旬,杜克大学发布了ai算法—pulse,将低分辨率的面部图像放大了64倍,即使镶嵌,也能清楚地看到面部的毛孔、皱纹、头发。

但是,复原的脸是全新的虚拟脸,实际上不存在。 其中,眼睛、鼻子、嘴等五官是ai根据原图像自己想象的结果。

因此,这种ai技术不能用于身份。 例如,由监视照相机拍摄的焦点不对准、无法判别的图像无法返回到pulse上实际存在的人物像。 但是,在医学、显微镜、天文学、卫星图像等行业有广泛的应用场景。

技术上,与其他超分辨率算法不同,pulse不是遍历lr(low resolution )图像,逐渐追加细节,而是发现与hr对应的lr,用“减少损失( downscale )”的方法进行Sr ( super RR )

其次,pulse生成对抗互联网( gan )进行了模型训练。 gan包括生成器( generator )和分类器( discriminator ),在同一组照片训练中,两者用相互游戏的方法验证输出是否足够真实。

最后,无论是利用ai复原文字密码,还是复原脸部图像,其心都是科技的改善。 但是,这些ai技术不能被一些人用于不良或不正当的用途。

因此,在这项技术迅速发展的今天,保护个人数据特别重要。

标题:财讯:被狠狠打了 “马赛克”的图片,就这样被 AI 还原了

地址:http://www.china-huali.com/cjxw/10923.html