我研究了一下百度AIGC,未来可能遍地都是艺术家( 二 )
现在 , 类似AI“创造世界”这样具有未来主义的描述 , 正在不断接近现实——来自中国的科技公司不甘心只停留在“描绘AI蓝图”这样的境地 , 它们正在用基于AIGC的技术干点漂亮活 。
比如1月10日的2022百度Create大会上 , 开场视频便是数字人希加加在不同维度的Create(创造)世界跑酷穿梭;更有数字人乐队演绎歌曲——从作词、作曲到编排 , 全部是由AIGC生成;整场大会当然有专业制作人员参与 , 但AI这次加入了各个环节之中 , 整个创排过程混合了人类和AIGC的“脑洞” , 使得大会真正具备了“Create”的特性 。
文章图片
Create大会看起来真像一个科技公司的AIGC秀场 , 但其背后技术平台的实力 , 以及“人机共创”的新模式——这甚至可以看做是为“人人都是艺术家”而迈出的最为深远的一步 。
文心大模型如何成为内容生成力?
想象一下 , 若让AIGC创造世界 , 这家伙要学习不同的文化、不同的创作方式、不同的理念 , 也许还要懂点美学概论……
于是工程师们创造了一个可以学习的模型 , 让AI得以更懂艺术创作 。 在百度 , 这个模型叫做文心 。
通过学习 , 文心成为天才 。
比如要拍一部电影 , AI一个“人”便兼职了编剧、导演、演员、摄影师、剪辑师、美术师、服化道等等——这在人类看来是不可能的事情 , AI做起来非常简单 。
现实中 , 作为“天才导演”的AI已经完成一些简单的任务——百度APP里有些视频内容 , 是AI“导演” , 将百家号的图文内容自动转换成视频 。
而更复杂的AIGC学习和生成 , 背后则有着这一套深不可测的方法和逻辑 。
比如在训练“文心ERNIE3.0”中 , 工程师为AI灌注了百科、小说、新闻、戏剧、诗歌等无标注数据——还记得哆啦A梦中有一个放在书页上的转印转知识面包吗?你可以理解工程师不断将印有知识面包喂给文心模型 。
“吃下”百余种不同形知识的文心 , 成为一个真正的“杂学家”——会写摘要、对对联 , 翻译、分类、阅读理解 , 并且掌握了几十类自然语言 。
在另一个模型 , “文心ERNIE-ViLG2.0”中 , 通过训练逐渐成为一位AI美术室、插画师 。 现在 , 你只需要在屏幕上输入一个想法 , AI便可以据此进行创作 , 生成一幅令人惊叹的画作 。
文章图片
AI背后的操纵者 , 总会感慨人工智能的创作成果与他的想法如此接近 , 这恰恰是因为AI学会了分析你的想法 。
工程师为AI学习添加了知识增强的扩散模型——简单说就是 , AI不仅能分析你这段想法中的语义 , 同时能通过拆解描述 , 找到对应的图像 。 不仅如此 , AI还能在图像的底稿、轮廓、着色等不同阶段 , 选择不同网络来进行建模 。
最终 , AI生成的图像 , 不仅精美 , 与人的想法也如此接近 。 与其说这是AIGC的生产力 , 不如说这是机器学习带来的力量 。
所以AIGC真的是一个合格的艺术家 , 从编剧到运镜 , 从桥段设置到画出分镜 , 乃至渲染、剪辑、添加特效 , 这些以往需要超大制作团队才能完成的任务 , AIGC都能轻松应对——毕竟 , 文心模型在权威公开数据集MS-COCO上刷新SOTA效果 , 性能已经远远超过了国际上的同类技术 。
人人艺术家?百度的AI软实力
有一点需要注意 , AI终究是AI , 并不会主动为你做点什么 。
无论AIGC有多么强大 , 驱动其完成各种任务的 , 始终是背后的人 。 而通过AIGC进行创造 , 本质上是让“每个人成为创造世界的艺术家”这一梦想成为现实 。
- 云科技|热搜第一!全国排名第一的App,把网友们整破防了
- 浏览器|爱奇艺限制投屏,或让盗版网站赢麻了!
- AirPods|最便宜的 AirPods 来了,只要 600 元?
- 短视频|运动耳机我选sanag A30S AirRUN第四代360°全景音气传导耳机
- 14年挣了1250亿美元!苹果“遮羞布”被撕碎,外媒吐槽吃相难看
- 三星|消除偏见!带你了解E4与E6屏幕的真实实力
- 马云|近日马云、雷军纷纷退出实控人,释放了哪些信号?
- 风向变了?短短18个月拼下2%份额,外媒:对华为的封锁就是个笑话
- 苹果|年货节开启了线上线下同步共迎新春
- iOS|iPhone14 Pro更新iOS16.3公测版Beta2体验:可以等正式版了