chatgpt|他做了一个「ChatGPT 杀手」,a16z 抢着投( 三 )


这项技术将通过微妙地调整 ChatGPT 选择的特定单词选择来发挥作用 , 读者不会注意到这种方式 , 但对于任何寻找机器生成文本迹象的人来说 , 这在统计上都是可预测的 。
公司发言人表示 , 「我们将 ChatGPT 作为新研究的预览技术 , 希望能从现实世界的应用中进行学习 。 我们认为这是开发和部署功能强大、安全的 AI 系统的关键部分 。 我们会不断吸取反馈和经验教训 , 」 。


GPTZero 首页|GPTZero

此外 , OpenAI 还联合哈佛等高校机构联合打造了一款检测器:GPT-2 Output Detector 。
作者们先是发布了一个「GPT-2 生成内容」和 WebText 数据集 , 帮助 AI 理解机器语言和人类语言之间的差异 。
随后 , 用这个数据集对 RoBERTa 模型进行微调 , 就得到了这个 AI 检测器 。 其中人类语言一律被识别为 True , AI 生成的内容则一律被识别为 Fake 。
值得一提的是 , RoBERTa 是 BERT 的改进版 。 原始的 BERT 使用了 13GB 大小的数据集 , 但 RoBERTa 使用了包含 6300 万条英文新闻的 160GB 数据集 。
尽管如此 , 还是有不少人认为 , 「AI 文本检测器」注定是一场失败的「军备竞赛」 , 其实际效果并不理想 , 更无法阻挡 ChatGPT 等 AI 语言模型的发展 。
然而 , 尽管 Tian 建立了 GPTZero , 他并不反对使用 ChatGPT 等人工智能工具 , 他认为 GPTZero 应用程序的目的不是阻止这些新技术的使用 , 而是提供一种负责任地使用这些技术的方法 , 并提供必要的保护 。
同时 , 相对于对抗或者禁止一项技术 , 也许更重要的是如何为其使用定下规范和标准 。 例如 , 在广告、影视及娱乐等行业 , 对于 AI 生成类内容的容忍度可能适当提高一些;而在学术、教育和科研领域 , 非常强调准确性和原创性 , 毫无疑问 , 对于 AI 生成内容的容忍度就要低一些 。
【chatgpt|他做了一个「ChatGPT 杀手」,a16z 抢着投】而如何确定 AI 工具使用的「透明度」 , 可能要比研究如何「反 AI」 , 要更有效 , 也更有意义一些 。