您当前位置：编程技术 >> 编程技术资源

AI大模型落地大考,浪潮交出了怎样的答卷

北京正规看白癜风医院 https://wapjbk.39.net/yiyuanfengcai/zn_bjzkbdfyy/

导读：易用性、开放性已成为大模型新一轮PK的考场。

随着高考成绩公布，AI“做题家”再度引发热议。不久前，浪潮“源1.0”大模型模仿鲁迅、金庸文风成功挑战最难高考作文，并出色完成了文言文阅读，历史、地理等科目考题。

其实，“做题”只是AI大模型的小试牛刀。AI大模型的真正考场在落地应用。因为直面长尾场景和AI开发高门槛等痛点，大模型被视为解决AI落地难的一剂良方。过去两年内大模型雨后春笋般涌现，有实力的科技企业纷纷推出自家的大模型，参数、数据集的规模也不断攀升。

然而，大模型虽好但面临落地应用难题，成为产业界共同的挑战。当下，易用性、开放性成为大模型新一轮PK的考场，不妨看看浪潮“源1.0”大模型交出了怎样的答卷。

大模型，智能时代的算法基础设施

大模型在今天成为产业热点绝非偶然。可以说，它的出现为困境中的AI产业化推开了一扇门。

在大模型出现之前，人工智能模型的通用性不高，一个模型仅专用于特定领域，即“一个模型一个场景”，换个场景就要从0开始重新开发。而且，传统的AI模型开发成本高，周期长，迭代慢，无法适配企业敏捷创新的业务需求。随着AI技术从高频主流场景到低频长尾场景的渗透，场景碎片化与“手工作坊式”开发的矛盾日益加剧，对AI技术提出了挑战，也限制了AI的产业化进程。

大模型提供了一种“预训练大模型+下游任务微调”的全新模式，可以大大提高模型的泛化能力，提高AI的通用求解能力。而且，经过预训练的大模型可以让研究机构和企业“不必从0做起，而是可以在大模型的基础上，从60、或者从90开始做到”。

“大模型最重要的优势是进入大规模可复制的工业落地阶段，只需小样本的学习也能达到比以前更好的效果，且模型参数规模越大这种优势越明显，这能大大降低各类用户的开发使用成本。”浪潮信息AI软件研发总监吴韶华表示。

正是由于出色的泛化能力，大模型被誉为智能时代的算法基础设施。正如发电厂和高速公路一样，大模型将成为各行各业应用AI技术的底座和创新的源头。

目前，在探索大模型落地的道路上，产业界已经做了很多尝试。其中，轻量化做场景适配以及开源开放，已成为行业共识的两大趋势。目前，两个方向都做得好的企业并不多，浪潮是其中之一。

如何让大模型分身有术

将大模型蒸馏成相对轻量的、更垂直的模型，已经成为产业界的普遍做法。其原理是知识蒸馏（KnowledgeDistillation），它是一种基于“教师-学生网络”模式的模型压缩方法，可以将已经训练好的大模型包含的知识，蒸馏提取到另一个小的模型中去。

近日，浪潮基于“源1.0”千亿大模型蒸馏出4个百亿参数规模的技能模型：对话问答技能模型、知识检索技能模型、中英翻译技能模型、古文理解技能模型，在细分领域精确度业内领先，获得权威评测基准CLUE、CUGE榜单榜首，并已在南京智能计算中心成功落地运行。「智能进化论」认为，浪潮的技能模型具有“轻、快、强”的特点。

轻

浪潮技能模型的百亿参数规模，大幅降低了训练、推理、部署的门槛，并极大降低了开发训练成本。相当于巨量模型一下子有了N个轻量化“分身”，可以直接面向对话、问答等主流场景化应用。

快

浪潮技能模型将过去动辄几个月甚至几年的大模型开发训练周期，缩短至不足一个月，加速了企业利用技能模型不断创新的速度。

强

分身是为了更专注，浪潮技能模型在性能上并不减配。4个技能模型在相同任务上可保留98%的大模型效果，在特定领域任务中，甚至能得到比大模型更好的效果，但参数量仅是“源1.0”大模型的1/10，推理速率提升9倍。

在各自领域，浪潮四大技能模型在国际权威测评和榜单中都是学霸。比如，对话问答技能模型（源晓问）在业界权威测评WebQA开放问答数据集及CUGE两项榜单均位居榜首，可广泛应用于虚拟人、智能助手、智能客服等场景。中英翻译技能模型（源晓译）在业内权威WMT数据集及CUGE两项榜单均位居榜首，可轻松应对日常中英翻译任务。知识检索技能模型（源晓搜）在WebQA任务上以55.97%的准确度领先业界，可广泛应用于医疗、法律、保险及娱乐等领域的智能客服、个人助理等场景。

在实际场景中，浪潮四大技能模型的能力已经得到了充分验证。比如，基于业界领先的kdConv多轮对话精度，对话问答技能模型（源晓问）在日常对话场景已经具备相当的情商，达到了“人机难辨”的程度。

此外，正如“三人行必有我师”，技能模型和巨量模型如同身份灵活转换的师生，可以在双方协同中持续进化。通过将执行结果反馈给巨量模型，技能模型和巨量模型的知识与能力可以同步进化，从而实现落地场景越多，模型进化得“越聪明”。

让大模型成为所有人的游戏

如果说，大模型的研发是一场激动人心的游戏，那么它不该只是少数科学家的专利，所有人都应该拥有探索AI想象力的能力。

目前，“源1.0”大模型已经相继完成了模型API、高质量数据集、模型训练代码、推理代码和应用代码等内容的开源开放，在GitHub社区、浪潮源

转载请注明：http://www.abachildren.com/ysty/3510.html

上一篇文章：浅谈攻击溯源的一些常见思路

下一篇文章： PHP和WEB前端谁更好就业