.

AI大模型落地大考,浪潮交出了怎样的答卷

北京正规看白癜风医院 https://wapjbk.39.net/yiyuanfengcai/zn_bjzkbdfyy/

导读:易用性、开放性已成为大模型新一轮PK的考场。

随着高考成绩公布,AI“做题家”再度引发热议。不久前,浪潮“源1.0”大模型模仿鲁迅、金庸文风成功挑战最难高考作文,并出色完成了文言文阅读,历史、地理等科目考题。

其实,“做题”只是AI大模型的小试牛刀。AI大模型的真正考场在落地应用。因为直面长尾场景和AI开发高门槛等痛点,大模型被视为解决AI落地难的一剂良方。过去两年内大模型雨后春笋般涌现,有实力的科技企业纷纷推出自家的大模型,参数、数据集的规模也不断攀升。

然而,大模型虽好但面临落地应用难题,成为产业界共同的挑战。当下,易用性、开放性成为大模型新一轮PK的考场,不妨看看浪潮“源1.0”大模型交出了怎样的答卷。

大模型,智能时代的算法基础设施

大模型在今天成为产业热点绝非偶然。可以说,它的出现为困境中的AI产业化推开了一扇门。

在大模型出现之前,人工智能模型的通用性不高,一个模型仅专用于特定领域,即“一个模型一个场景”,换个场景就要从0开始重新开发。而且,传统的AI模型开发成本高,周期长,迭代慢,无法适配企业敏捷创新的业务需求。随着AI技术从高频主流场景到低频长尾场景的渗透,场景碎片化与“手工作坊式”开发的矛盾日益加剧,对AI技术提出了挑战,也限制了AI的产业化进程。

大模型提供了一种“预训练大模型+下游任务微调”的全新模式,可以大大提高模型的泛化能力,提高AI的通用求解能力。而且,经过预训练的大模型可以让研究机构和企业“不必从0做起,而是可以在大模型的基础上,从60、或者从90开始做到”。

“大模型最重要的优势是进入大规模可复制的工业落地阶段,只需小样本的学习也能达到比以前更好的效果,且模型参数规模越大这种优势越明显,这能大大降低各类用户的开发使用成本。”浪潮信息AI软件研发总监吴韶华表示。

正是由于出色的泛化能力,大模型被誉为智能时代的算法基础设施。正如发电厂和高速公路一样,大模型将成为各行各业应用AI技术的底座和创新的源头。

目前,在探索大模型落地的道路上,产业界已经做了很多尝试。其中,轻量化做场景适配以及开源开放,已成为行业共识的两大趋势。目前,两个方向都做得好的企业并不多,浪潮是其中之一。

如何让大模型分身有术

将大模型蒸馏成相对轻量的、更垂直的模型,已经成为产业界的普遍做法。其原理是知识蒸馏(KnowledgeDistillation),它是一种基于“教师-学生网络”模式的模型压缩方法,可以将已经训练好的大模型包含的知识,蒸馏提取到另一个小的模型中去。

近日,浪潮基于“源1.0”千亿大模型蒸馏出4个百亿参数规模的技能模型:对话问答技能模型、知识检索技能模型、中英翻译技能模型、古文理解技能模型,在细分领域精确度业内领先,获得权威评测基准CLUE、CUGE榜单榜首,并已在南京智能计算中心成功落地运行。「智能进化论」认为,浪潮的技能模型具有“轻、快、强”的特点。

浪潮技能模型的百亿参数规模,大幅降低了训练、推理、部署的门槛,并极大降低了开发训练成本。相当于巨量模型一下子有了N个轻量化“分身”,可以直接面向对话、问答等主流场景化应用。

浪潮技能模型将过去动辄几个月甚至几年的大模型开发训练周期,缩短至不足一个月,加速了企业利用技能模型不断创新的速度。

分身是为了更专注,浪潮技能模型在性能上并不减配。4个技能模型在相同任务上可保留98%的大模型效果,在特定领域任务中,甚至能得到比大模型更好的效果,但参数量仅是“源1.0”大模型的1/10,推理速率提升9倍。

在各自领域,浪潮四大技能模型在国际权威测评和榜单中都是学霸。比如,对话问答技能模型(源晓问)在业界权威测评WebQA开放问答数据集及CUGE两项榜单均位居榜首,可广泛应用于虚拟人、智能助手、智能客服等场景。中英翻译技能模型(源晓译)在业内权威WMT数据集及CUGE两项榜单均位居榜首,可轻松应对日常中英翻译任务。知识检索技能模型(源晓搜)在WebQA任务上以55.97%的准确度领先业界,可广泛应用于医疗、法律、保险及娱乐等领域的智能客服、个人助理等场景。

在实际场景中,浪潮四大技能模型的能力已经得到了充分验证。比如,基于业界领先的kdConv多轮对话精度,对话问答技能模型(源晓问)在日常对话场景已经具备相当的情商,达到了“人机难辨”的程度。

此外,正如“三人行必有我师”,技能模型和巨量模型如同身份灵活转换的师生,可以在双方协同中持续进化。通过将执行结果反馈给巨量模型,技能模型和巨量模型的知识与能力可以同步进化,从而实现落地场景越多,模型进化得“越聪明”。

让大模型成为所有人的游戏

如果说,大模型的研发是一场激动人心的游戏,那么它不该只是少数科学家的专利,所有人都应该拥有探索AI想象力的能力。

目前,“源1.0”大模型已经相继完成了模型API、高质量数据集、模型训练代码、推理代码和应用代码等内容的开源开放,在GitHub社区、浪潮源


转载请注明:http://www.abachildren.com/ysty/3510.html