文章图片
文章图片
文本到图像的人工智能系统目前在能力和流行度方面都在蓬勃发展 , 还有什么比它们在世界最热门的应用程序TikTok中的出现更好的证明 。
Tiktok
视频平台最近添加了一种新的效果 , 称为“AI绿屏” , 允许用户输入文本提示 , 然后软件将生成图像 。 然后 , 该图像可以用作视频的背景——对于创作者来说 , 这可能是一个非常有用的工具 。
google
与谷歌的Imagen、OpenAI的DALL-E 2或Midjourney的同名软件等最先进的文本到图像模型相比 , TikTok系统的输出非常基本 。 它只创建相当抽象和旋转的图像;TikTok建议的“海洋中的宇航员”和“花银河”等提示的梦幻性质反映了这种力量 。 相比之下 , 其他模型可以产生真实感图像和复杂连贯的插图 , 看起来像是由人类绘制或绘制的 。
TikTok的模型只产生漩涡、抽象和模糊的图像 。 不是最先进的 , 但可能更好 。
不过 , TikTok模型的局限性很可能是有意的 。 首先 , 更先进的模型需要更大的计算能力 , 这对于公司来说是昂贵和资源密集型的 。 其次 , TikTok拥有超过10亿的用户 , 让所有这些人都有能力创建他们能想象的任何真实照片 , 几乎肯定会产生一些令人不安的结果 。
TikTok
例如 , 我们测试了模型创建裸体和血迹的能力——文本到图像生成器经常试图限制这两种类型的输出 。 根据暴力提示拍摄的照片 , 如“刺杀鲍里斯·约翰逊”和“刺杀乔·拜登” , 产生的大多是抽象的漩涡 , 英国首相的脸几乎可以辨认出来(尽管这名男子熟悉的金发拖把让漫画变得特别容易) 。
模型输出的抽象本质意味着 , 带有挑衅性语言的提示只会产生漩涡 。
同样 , 一个涉及裸体的请求——“海滩上的裸体模特”——会产生主题上合适的颜色 , 包括肉色、沙质橙色和海洋蓝色 , 但不会让牧师脸红 。
试图让模型生成裸体图像是行不通的 。
TikTok的“AI绿屏”的出现值得注意的是 , 它显示了这项技术正以多快的速度进入主流 。 文字到图像人工智能的最新发展周期可以说始于2021 , OpenAI最初发布了DALL-E(有关DALL-E的介绍 , 可以看之前的文章人均艺术家!文本转换为图像 , DALL-E程序创造新世界!) 。 不到两年后 , 这项技术已经通过TikTok等应用程序掌握在数百万人手中 。
【耳机|TikTok提供了一个基本的文本到图像的AI生成器,压力来到了抖音!】
OpenAI公司logo
考虑到这些系统的潜在危害和好处 , 从现在开始 , 事情只会变得越来越陌生 。 你对TikTok在应用中增加文本转换图像的功能有什么看法呢?希望大家在评论区留言讨论 , 更多科技资讯尽在科技译站!
- 音箱|南卡Runner Pro3骨传导耳机,运动者的不二之选!
- 耳机|不认命的丁磊还是妥协了
- 无线耳机|2022 年好用无线耳机:经过测试的高性价比真无线耳机
- |「2022年耳机导购」6款顶级音频品牌真无线蓝牙耳机测评,都是经典
- 无线耳机|在鱼龙混杂的市场有7款真无线蓝牙耳机脱颖而出,每款都是好耳机
- 无线耳机|同事们的真无线耳机大合集,看看有没有你的同款
- 小米科技|三频表现均衡细腻 飞利浦Fidelio L3耳机舒适奢华尽享HiFi
- 诺基亚手机的新家HMDGlobal刚刚宣布了四款新设备|诺基亚2660和诺基亚8210将提供四款平板电脑
- tiktok|Facebook全方位模仿TikTok,它能转型成功吗?
- 本文转自:新民晚报图说:“职”为你来公益带岗直播 来源/采访对象提供(下同)8月18日|“直播带岗”兴起,方便求职者更全面了解用人单位