开源大模型的力量:为AI注入“灵魂”,和你一起玩剧本杀( 三 )


二是 , 吴韶华补充说 , 能开发大模型也是依托浪潮在大规模算力算法上面有多年的持续积累 , 并且有相关的基础 。 基于这些考量 , 浪潮研发并推出了源1.0大模型 。
源1.0大模型专注于NLP(自然语言处理)领域 , 能够创建生成任何具有语言结构的语言表达 , 能够做到包括自动问答、论文撰写、诗歌写作、新闻报道、总结长文本、翻译语言等任务 , 甚至还可以“写”计算机代码 。
开源大模型的力量:为AI注入“灵魂”,和你一起玩剧本杀
文章图片
更重要的一点是源1.0大模型还可以理解文字背后的含义 , 并抽取其中的关键信息 , 如应用于智能客服对话时感知用户情绪 , 更智能地给出回应 。
在发布后不久 , 2021年10月 , 浪潮开源了源1.0 , 并发布“源1.0”开源开放计划 , 在GitHub等开源社区开源了其大模型的模型训练代码、推理代码、应用代码 , 开放API等 , 助力开发者更高效地实现AI应用的开发 。
浪潮不仅开放了相关的代码以及大模型使用的API , 同时还开放出了1TB的语料数据集 , 这些语料数据集是来自当初浪潮训练大模型的基础数据集 。
吴韶华提到浪潮开源源1.0大模型从四个方面为开发者提供支撑或说提升开发者创意实现的效率 。
一是浪潮开源了直接可用的代码示例 , 可以帮助开发者节省各类研发开支 。
二是浪潮源1.0大模型的开源模式之一是向开发者提供大模型API , 显著降低了开发者应用开发的门槛 。
不同知识背景的各行业用户可以驱动大模型创造更多的可能 , 就像剧本杀AI一样 。 用户可以完全通过模型的能力和开发的API就能创造各种不同的任务 , 实现不同内容的交互 , 将部分繁琐的开发流程省略 。
浪潮在降低开发门槛上面还进行了两类探索 , 一个是APIExp的工具 , 让用户直接通过网页与大模型交流 , 一个是研发了一款沙箱工具 , 同样是通过网页直接选择用户所需的创意效果 。
三是浪潮将源1.0大模型相关的训练数据开源 , 能助力用户实现业务模型或代码优化 。 吴韶华举例说 , 有开发者直接利用浪潮开源的数据集来对其模型进行二次训练 , 得到了明显的精度提升 , 训练结果甚至登顶CLUE基准评测榜单 。
四是浪潮会给到利用源1.0大模型的开发者一些持续的支撑 , 进而实现开源社区交流共赢 。 浪潮为开发者提供持续的支持 , 有专门的运营团队与开发者建立联系 , 建立社区 , 增进彼此之间的交流 , 更及时地了解开发者在技术和使用方式上的问题 。
同时浪潮也会第一时间给出相关问题的反馈 。 一些深入的技术问题 , 浪潮会投入专门的研发团队进行进一步的研究和支持 , 交流的成果还会以代码的方式进行开源 。
吴韶华谈道 , 因为源1.0大模型的应用场景多元 , 浪潮目前基于大模型推出了4个面向不同场景的技能模型 。 这四个模型都经过了场景化数据的增强 , 表现精度更好 , 所需算力相对更小一些 。
开源大模型的力量:为AI注入“灵魂”,和你一起玩剧本杀
文章图片
第一个是古文模型 , 可以“写”诗词歌赋 , 同时具备古文解析能力 。 第二个技能模型是对话模型 , 主要面向虚拟人、智能助手场景 。 第三个是翻译技能模型 , 中英文翻译准确度和流畅度上均有不错表现 。 第四个技能模型是问答模型 , 主要是面向智能客服场景 , 该模型具备语义级知识检索能力 , 可以做到多领域支持 。
三、大模型或成元宇宙智能核心 , 源2.0瞄准多模态交互
当了解完剧本杀AI和源1.0大模型后 , 我们还能看到 , 其实这个剧本杀AI开发项目也引发了一些人对于大模型与元宇宙之间关系更多的思考 。