AI科学语言大模型火了,数学生物样样行,编代码写综述也不在话下( 二 )
所有数据都以一种通用的标记格式进行处理 , 打通各种来源数据之间的壁垒 。 预训练中包含用于特定任务的数据集 , 这就能保证在处理特定任务时能够更加专业 。还有一个问题是:如何设计界面交互?
首先就像上文提到的那样 , GAL能够支持不同类型的任务 。
因此在设计界面交互时便对各种任务进行分类 , 不同的分类会支持不同的类型的数据 。
文章图片
既然GAL拥有高度管理和高质量的科学数据集 , 那和其他模型相比效果如何?
直接上数据!
推理方面 , GAL的优势脱颖而出 , 在数学MMLU(大规模多任务语言理解)上 , 表现要优于Chinchilla , 数学方面 , 表现也优于PalM540B和GPT-3175B 。
文章图片
文章图片
尽管 , GAL并没有经过一般数据集的训练 , 但它在BIG-bench上的表现仍旧优于BLOOM和OPT-175B 。
文章图片
看完之后是不是也心痒痒了 , 先码住再说!
传送门:
https://galactica.org/参考链接:
[1]https://twitter.com/paperswithcode/status/1592546933679476736[2]https://github.com/paperswithcode/galai[3]https://galactica.org/static/paper.pdf—完—
【AI科学语言大模型火了,数学生物样样行,编代码写综述也不在话下】量子位QbitAI·头条号签约
- c语言|iPhone14降价很猛!但溢价依然过高,年末换机更建议选这几款
- 本文转自:中国科学报吸收重金属 还可做板材这波操作把麻类“吸干榨净”▲基于红麻麻骨的无...|这波操作把麻类“吸干榨净”
- 世界青年|科创一线涌动青春力量 来自2022世界青年科学家峰会的观察
- “机器化学家”赋能科学研究
- 国产芯传来消息,南大光电正式宣布,外媒:中国科学家都不睡觉吗?
- 本文转自:新华网未来科学大奖周将于2022年11月24-27日举行|礼赞科学成就 致敬科学精神 2022未来科学大奖周即将开启
- Twitter|何去何从?科学领域的推特(Twitter)用户未来会怎么选择
- 爱施德|何去何从?科学领域的推特(Twitter)用户未来会怎么选择
- 本文转自:中国科学报团队规模、“新鲜”程度、利益驱动、层级结构……什么在影响科研团队创新...|什么在影响科研团队创新能力
- 毒液|点燃好奇——菠萝科学奖褒奖“有趣而严肃”的研究