AlphaCode惊世登场!编程版“阿法狗”参赛,击败一半程序员( 二 )
文章图片
至于更多的案例 , 可以去AlphaCode网站观摩 。
原理
DeepMind说 , 在Codeforces比赛中所需解决问题的能力 , 已经超出了现有AI系统的能力 。
整个AlphaCode模型的流程如下:
文章图片
用标准的语言建模目标在GitHub代码上预训练一个基于Transformer的语言模型 。 这个模型可以合理地代表人类编写代码的空间 , 大大减少了问题的搜索空间 。
在竞争性编程数据集上微调模型 , 使用GOLD与tempering作为训练目标 , 进一步减少了搜索空间 , 并利用预训练弥补了少量的竞争性编程数据 。
为每个问题从模型中生成非常多的样本 。
对样本进行过滤 , 以获得一小部分候选提交的样本(最多10个) , 在隐藏的测试案例上进行评估 , 方法是利用实例测试和聚类 , 根据程序行为挑选样本 。
总而言之 , 通过将大规模Transformer模型与大规模采样和过滤相结合 , DeepMind在可以解决的问题数量方面取得了重大进展 , 比之前的工作高出一个数量级 。
刷题人士抵触
正如Codeforces创始人所说 , 在编程问题中对算法的发明创造是最难的 。
在全球编程比赛网站上常年排名前几的谷歌工程师PetrMitrichev说:
解决编程比赛问题是一件非常困难的事情 。 它既需要良好的代码技能 , 也需要人类解决问题的创造力 。
AlphaCode不是第一个编程工具 , Codex以及GitHubCopilot都给人留下了深刻的印象 。
但DeepMind认为 , AlphaCode和前辈们大有不同:
最近的大规模语言模型展示了生成代码的惊人能力 , 现在能够完成简单的编程任务 。 然而 , 当对更复杂、看不见的问题进行评估时 , 这些模型的表现仍然很差 , 这些问题需要解决问题的技能 , 而不仅仅是将指令翻译成代码 。
与Twitter上截然不同的是 , Codeforces高手们却多有抵触情绪 。
一位程序员认为:“这个AI真是个菜鸟 。 ”
文章图片
因为AlphaCode只有1238分 , 只相当于一个学生水平 , 一个参加信息学奥赛的中学生也能刷到这个水平 。
虽然DeepMind声称AlphaCode是为了辅助人类 , 但也有程序员开始担心了:
文章图片
现在连刷题的世界都被AI占领 , 本来这里是程序员们切磋的地方 , AI应该适可而止 , 给程序员们留一片净土吧!
参考链接:
[1]https://deepmind.com/blog/article/Competitive-programming-with-AlphaCode
[2]https://alphacode.deepmind.com/
[3]https://storage.googleapis.com/deepmind-media/AlphaCode/competition_level_code_generation_with_alphacode.pdf
【AlphaCode惊世登场!编程版“阿法狗”参赛,击败一半程序员】[4]https://github.com/deepmind/code_contests
- AlphaCode惊世登场!编程版“阿法狗”悄悄参赛,击败一半程序员
- 显卡|配65W i7-12700F和新显卡RTX3050,武极新电脑6399元登场
- 微信8.0.19版闪电登场,新增4个功能,个个都是你想要的
- 国产厂商自研芯片,算力“媲美”苹果A15,首发机皇即将登场!
- 春晚|2022虎年春晚进行时:沈腾马丽登场 网友终于笑出来了
- 春晚|2022虎年央视春晚直播中 第一个语言类节目已登场:网友吐槽中
- Redmi|K50宇宙年后登场!老款Redmi K40春节特惠:12GB顶配版1849元
- 数据库|国产厂商自研芯片,算力“媲美”苹果A15,首发机皇即将登场!
- alienware|2022最值得期待的笔记本ALIENWARE x14终于登场
- 黑鲨手机|游戏手机之父!黑鲨5即将登场:骁龙8性能巅峰旗舰