发布日期:2024-11-22 17:55 点击次数:79
赛博照妖镜下裸体,AI 好意思女全变鬼。
来看它的牙。
把图像有余度拉满,AI 东谈主像的牙齿就会变得十分诡异,边界暗昧不清。举座图片的花样也平时,麦克风部分更是奇怪。
对比果真东谈主类相片,则应该是这么的。牙齿是证实的,图片色块皆是均匀一致的。
这个器具依然洞开,东谈主东谈主皆能拿着相片去试试。AI 生成视频中的某一帧,也难逃此大法。
不漏牙的相片也会流露问题。
不外 BTW,这个器具出自 Claude 之手。用 AI 破解 AI,奇妙的闭环。
有一说一,最近 AI 东谈主像太传神又激发了不小磋磨,比如一组大火的“TED 演讲者视频”,其实莫得一个是真东谈主。
不仅仅东谈主脸难以分歧,就连之前 AI 的短板 —— 写字,当前皆能实足以伪乱真。
更要道的是,生成这么的 AI 东谈主像,资本也不高。低至 5 分钟、每 20 秒 1.5 好意思元(东谈主民币 10 块傍边)的价钱即可料理。
这下网友们皆坐不住了,纷纷搞起 AI 打假大赛。近 5 千东谈主来磋磨,这两张图到底哪张是真东谈主。
给出的情理琳琅满目。有东谈主发现笔墨、斑纹细节很轮廓,有东谈主则以为东谈主物眼力很蒙眬……
首先进的 AI 们生成东谈主像有啥规章,渐渐被环球摸索出来了。
不看细节已很难分辨汇总来看,休养有余度大概是当前最快速辨别的方式。AI 群像照在这种方式下流露得愈加透顶。
不外它存在一个问题。淌若图像用 JPEG 算法压缩事后,该方式可能失效。
比如细则这张相片是真东谈主相片。
关联词由于画质压缩以及光泽等问题,东谈主物牙齿也有点暗昧。
是以网友们还列出了更多分辨东谈主像是否是 AI 合成的方式。
第一种方式,通俗说便是依靠东谈主类的知识判断。
由于 AI 学习图像的样子和东谈主类并不一致,不免无法 100% 掌捏东谈主类视角下的视觉信息。形成的限定便是,AI 生成的图霎经常包含与实验宇宙不符之处,这就为图像的鉴别提供了入部属手之处。
用起首的这张图片手脚例子。
从举座上看,东谈主物的皮肤过于光滑,看不到任何的毛孔,这种过于完满的特征反而增多了不果真感。
天然这种“不果真感”并演叨足等同于“作秀”,毕竟经过磨皮处理的图片相通看不到毛孔。但这也并非唯一的判断要素,AI 在图片中留住的与知识的进出也只怕唯惟一处。
本色上,这张图只须稍稍看以下细节,就能看到一个比拟显着的特征 —— 胸牌上方挂钩奇特的集合样子。
还有在高有余度模式下走漏马虎的麦克风,放大之后平直用肉眼也能看出眉目。
更为覆盖的是,头发结尾有几根毛发的位置很不对理,但这么的特征,恐怕步调有列灯谜克级别的办法智商看到了。
不外,跟着生成工夫的向上,能够找到的特征越来越覆盖,亦然一个无法幸免的趋势。
还有一种方式是看笔墨,天然 AI 在字型的描摹上正渐渐克服“鬼画符”的问题,但正确地渲染出有正确本色含义的笔墨还存在一些贫穷。
比如有网友发现,相片中的东谈主佩带的胸牌上,Google 标识的下方临了一瞥字中的两个字母是“CA”,暗意好意思国加州,前边的一大长串应该是城市名。
但本色上,加州根蒂没知名字如斯之长的城市。
除了这些物体自身的细节,还有光泽、暗影等信息也不错用来判断真伪。
这张图片是从一段视频当中提真金不怕火的,在它场地的视频当中还有这么的一帧。在发话器右侧的位置,有一派十分诡异的暗影,这片暗影对应的是东谈主物的一只手,显着 AI 在这里处理得有所欠缺。
说到视频,由于触及前后内容一致性,AI 倒是比在静态图像中更容易走漏鸡脚马脚。
色拍拍欧美视频在线看还有一些特征不算“知识诞妄”,但也体现出了 AI 在生成图像时的一些偏好。
比如这四张图,皆是 AI 合成的“平庸东谈主”(average people),有莫得发现什么共同之处?
有网友暗意,这四张图里的东谈主,莫得一个是笑貌,这点似乎就体现了 AI 生图的某种特征。
针对这几张图而言如实如斯,但这么的判断样子很难形成系统,毕竟不同的 AI 绘图器具,特质也皆不尽交流。
总之,为了应答渐渐向上的 AI,一方面不错加大“列灯谜克”的力度,一方面还不错引入像拉高有余度这么的图像处理工夫。
但淌若这么的“量变”集合得越来越多,肉眼判断也会越来越贫穷,图像有余度可能也有被 AI 攻破的一天。是以东谈主们也在升沉念念路,预见了“以模制模”的方式,用 AI 生成的图片试验检测模子,从图像等分析更多特征。
比如 AI 生成的图像在频谱、噪声分散等方面存在好多特质,这些特质依靠肉眼无法捕捉,但 AI 却能看得很明晰。
天然,也不摒除检测方式过期、跟不上模子变化,致使模子设立者特意进行抵御性设立的可能。比如前文一直在磋磨的这张图片,某 AI 检测器具认为它是 AI 合成的概率唯独 2%。
但 AI 作秀和 AI 检测之间的博弈经过,自身便是一场“猫鼠游戏”。
是以在检测以外,可能还需要模子的设立者也负起一些累赘,举例给 AI 生成的图片打上隐形水印,让 AI 作秀无处遁形。
AI 邪不压正值得一提的是,如上激发心焦的 AI 东谈主像,不少皆是由最近爆火的 Flux 生成 / 参与制作。致使环球依然开动默许,成果太好难以分辨的,便是 Flux 作念的。
它由 Stable Diffusion 原班东谈主马打造,发布才 10 天就在收集上掀翻山地风云。
这些良好的假 TED 演讲相片,皆是出自它手。
还有东谈主用 Flux 和 Gen-3 总共作念出了良好的护肤品告白。
以及多角度的多样合成成果。
它很好解决了 AI 画手、AI 生成图片中笔墨等问题。
这平直导致当前东谈主类分歧 AI 绘图,不可再平直看手和笔墨了,只可盯着蛛丝马迹猜。
Flux 应该是在手部、笔墨等计算上加强了试验。这也意味着,淌若当下的 AI 不绝在纹理细节、色调等方面下功夫试验,比及下一代 AI 绘图模子出来时,东谈主类的辨别方式可能又要失效了……
何况 Flux 照旧开源、札记本电脑上可运行的。不少东谈主当前依然在 Forget Midjourney 了。
从 Stable Diffusion 到 Flux,用了 2 年。从“威尔史小姐吃面条”到“Tedx 演讲者”,用了 1 年。
真不知谈以后为了分辨 AI 生成,东谈主类得想出哪些歪招了……
参考通顺:
[1]https://x.com/ChuckBaggett/status/1822686462044754160
[2]https://www.reddit.com/r/artificial/comments/1epjlbl/average_looking_people/
[3]https://www.reddit.com/r/ChatGPT/comments/1epeshq/these_are_all_ai/
[4]https://x.com/levelsio/status/1822751995012268062
本文来自微信公众号:量子位(ID:QbitAI),作家:明敏、克雷西,原标题《AI 好意思女拔本塞源!赛博照妖镜下集体变“鬼”,AI 代码拆台 AI 生图》
告白声明:文内含有的对外跳转通顺(包括不限于超通顺、二维码、口令等方式),用于传递更多信息,省俭甄选时辰,限定仅供参考裸体,IT之家扫数著作均包含本声明。
上一篇:白丝 抑郁、烦懑十几年后,她在《浪姐5》上与我方妥协
下一篇:没有了