这个功能实在是一个从文本出发的图像天生器,通过大型 Transformer措辞模型来理解文本,然后再依赖扩散模型来实行高保真图像的天生。据谷歌表示,该功能“具有前所未有的逼真度和措辞理解深度”。
不过该功能目前在天生人物图像时存在比较大的漏洞,例如无法很好地牵制色情图像、种族主义以及反社会内容等天生,系统一旦对公众年夜众开放,被滥用的可能性很大,因此在尊重创意自由与社会规管中间找到平衡以前,Imagen将暂时禁止利用。
目前在谷歌的Imagen官网上,已经展示了大量由该功能天生的图像和对应文本,风格从素描再到油画乃至CGI都有涉及。我浏览了一下这个网站,这个功能天生的图像逼真度不能说惊人,只能说毫无出入,一旦开放,对付创意事情者而言将是强有力的工具,大概拍照器材都将被淘汰,有生之年可以期待一下。

以下是部分文本在通过Imagen理解后天生的图像,大家也可以亲自辞官网脑洞一下。(官网在此:https://imagen.research.google)
一个大脑乘坐飞船向月球驶去
在雪地里戴着空手道腰带的火龙果
一副画中有浣熊女王穿着赤色礼服,而画被挂在华美的墙面上
一只柯基在时期广场骑自行车,它戴着太阳帽和墨镜
一对机器人夫妇在埃菲尔铁塔前用餐
玻璃制成的透明鸭子
泰迪熊在参加奥运会400米蝶泳