编段话就能变出一张图片,英伟达不卖显卡改卖艺了?( 二 )
目前现有的图像合成框架里 , 遇到单一类型的需求是没问题的 , 但要是各种不同的需求一起上 , 那AI就当场懵逼了 。。。
而PoEGAN的诞生就是为了解决这一限制 , 它可以识别不同的输入 , 并把它们混合在一起 。
比如这里有一个非常直观的例子 , 当你只选择简笔画的时候 , 画面会按照目前的需求生成一幅图像 。
文章图片
这时我再加上不同的颜色和文字 , 把不同的区域分隔开来 , 画面就会按照需求变成另外一副模样 。
文章图片
而当把详细的文字描述也勾选上 , 此时图像就会在按照要求已经生成的图像基础上 , 进一步满足人们苛刻的要求 。
文章图片
PoEGAN确实很神奇 , 但这项技术也不是最近才出现的 , 英伟达在2019年就搞出来了一个AI技术 , 叫做GauGAN 。
文章图片
名字听上去有点怪 , 但这项技术确实能够让人们以低到不能再低的门槛 , 来让AI生成一幅以假乱真的图片 。
后来GauGAN进化出了GauGAN2 , 同时它带来了一个新的玩法 , 那就是打字画画 。
只要你在文本框上面疯狂敲键盘 , AI就会根据文字自动生成对应的画面 。
文章图片
再往后就是前面提到的缝合怪PoEGAN了 , 这玩意儿进化的速度还真够快的 。。。
总的来讲 , 英伟达的这个新技术确实非常黑科技 , 随便打打字就能生成一张以假乱真的图片 , 这要是放在几年前 , 估计所有人都觉得是在扯淡 。
结果在开发人员一通捣鼓之后 , 还真把这种看着像魔法一样的画面给变成现实了 。
以前需要找一张风景照片 , 要么去版权网站上面找一张 , 要么自己出门拍一张 。
而现在只要让AI生成一下就可以了 , 就算在炎热的夏天也可以轻松搞到一幅雪天美景 。
文章图片
而这个过程 , 基本不会花费任何力气 。
世超估计看到这个技术的绘画、游戏和相关从业人员都高兴得够呛 , 终于不用再累死累活设计背景了 。。。
但是评论区也有摄影师表示担忧 , 以后人们不用再出门就可以制作出美景了 。
无论如何 , 这项技术确实让不少人大开眼界 , 也让世超更加期待未来的创作过程会产生怎样的革新了 。
撰文:百威编辑:面线
图片、资料来源:
YouTube-TwoMinutePapers
NVIDIACorporation-MultimodalConditionalImageSynthesiswithProduct-of-ExpertsGANs
cnBeta-英伟达最新AI技术可将文字转化为逼真的图像
- 诈骗|天天科普反诈骗的我 居然被三句话骗了300块
- 杨昆|对话投资人,医疗赛道的下一个10年机会在哪里?
- 麦克风|“黄鹂智声”完成千万级天使轮融资,专注麦克风端ENC通话降噪
- 电话|推荐你好用的电销机器人系统,中国人不骗中国人
- 百度|如何获得路由器的管理密码?看懂这个操作,密码自己就能设置好
- 音乐播放器|避开这2个误区,日收益300都不在话下,新手做自媒体须知
- iPhone|用实力说话的轻薄本——realme Book增强版
- 税|美国缴税史上第一人!马斯克喊话美国官方:不表示一下?
- 智声|36氪首发|「黄鹂智声」获千万级天使轮融资,基于清华团队核心技术提供ENC通话降噪软硬件产品/解决方案
- excel|换手机怕买贵?记住这两个原则,让你不踩坑就能选到满意的手机