“百模大战”,既卷模型更卷应用(新鲜出炉)

   □ 本报记者 蔡姝雯 张宣 杨易臻 杨频萍

自ChatGPT横空出世,各类大模型发展如火如荼。近日,国家互联网信息办公室公布最新一批生成式人工智能服务已备案信息,江苏两款大模型通过备案。根据国家网信部门官网公示的信息,自去年8月31日我国首批通过备案的人工智能大模型名单出炉以来,短短一年间,全国已有188款大模型完成备案,来自江苏的大模型占据8席。

大模型快速演进,产业落地“冲锋号”已然吹响。8月底,江苏召开人工智能大模型高质量发展专题会议,举办“人工智能+场景开放”大模型行业应用对接会,加速大模型落地进程。来自江苏的大模型有何特点?未来,大模型如何收获“产业果实”,赋能千行百业?

练全行业“通才”,

   造一领域“专家”

涌入10万人的卖货直播间里,买家提问常被“淹没”在海量评论中。怎样对屏幕中一闪而过的问题点对点精准回复,这是不少商家头疼的事。如今,在江苏汇智智能数字科技有限公司CarrotAI大模型的加持下,只要提前录入商品数据,直播间的数万个问题都能得到“秒回”。该公司CEO孙志明告诉记者,CarrotAI大模型刚刚通过备案,除了智能回复买家问题,大模型还可帮助商家分析直播数据,为其提供智能决策。

大模型是指拥有超大规模参数、复杂计算结构的机器学习模型。与仅能处理单一任务的传统人工智能技术相比,大模型能够为解决各类复杂问题提供底层支持,也被称为人工智能领域的“基座模型”。南京航空航天大学人工智能学院教授李丕绩介绍,大模型分为通用大模型和垂直领域大模型。通用大模型中,除了爆火的ChatGPT、GPT-4o,国外还有Anthropic公司的Claude大模型、Meta公司的LLaMA大模型等,国内则有百度的文心一言大模型、阿里的千问系列大模型等。而江苏通过备案的8款大模型立足企业所在垂直领域业务,用业务数据打造垂域大模型,在各自业务场景中实现降本增效。“比如此次通过备案、由智慧芽信息科技(苏州)有限公司研发的芽仔大模型,提供的是专利服务。”李丕绩说。

“相比之下,通用大模型的开发成本极高,常伴随十亿元甚至百亿元的高昂成本。”李丕绩认为,基础大模型如同“地基”,有不同的训练语料(数据),就可以搭建不同的房子。对于某些应用场景来说,花费较低成本基于开源大模型训练出一个垂域模型,就可能满足用户需求。不少业内人士也表示,随着通用大模型性能提升,其带来的行业进步已经非常有限,而行业大模型性价比高、专业性强,在细分领域的潜力尚未被挖掘,这对众多企业来说是很好的发展机遇。

“深耕垂域大模型,我们已研发出‘专利大模型’和‘生物医药大模型’等。”智慧芽中国区总经理朱亚立介绍,目前“专利大模型”的智能已达到通过中国专利代理师资格考试的水平,“生物医药大模型”的智能则达到通过中国执业药师职业资格考试和美国注册药剂师考试的水平。“未来,我们将持续迭代现有大模型,提供更多智能工具与解决方案,面向材料等更多科技领域推出垂域大模型,加速各行各业科技创新。”朱亚立说。

   深度服务产业,

   激发技术价值

与生产生活中的实际应用场景结合,是发展大模型的必然落点。江苏大模型企业在产品备案后不断丰富应用场景,推出更为精准的AI功能,进一步激发大模型技术价值。

去年6月25日,苏州清睿智能科技股份有限公司发布ArynGPT大模型,公司旗下人工智能老师Ms.Aryn随即接入大模型,以提升外语教学能力。“扎根教育产业,才能结出价值果实。与其‘卷’模型,不如‘卷’应用,满足客户的多样化需求。”清睿智能董事长朱奇峰说,迭代至今,ArynGPT的应用领域已从口语教学延伸到词汇、写作等领域,应用场景从课堂扩展到虚拟平台。目前,清睿智能的ArynGPT大模型已为3600多万中小学生提供服务。

在南京硅基智能科技有限公司的展厅里,一块块显示屏展示着数字人律师、数字人主播、数字人医生、数字人企业家……创始人司马华鹏告诉记者,公司研发的炎帝大模型实现了对真人的高精度“克隆”,可实现短视频创作全程自动化,且在知识电商、专业名医律师IP打造、企业家个人IP塑造以及网红达人经济等多个领域有着广泛应用。“迄今为止,我们已为50多万人创造数字人‘分身’。”司马华鹏介绍,炎帝大模型还开发了延伸功能,比如按小说内容生成短剧电影,极大地提高了创作效率。

去年11月,苏州思必驰科技股份有限公司的东风(DFM)语言大模型完成备案。近期,该公司上线超自然语音合成技术,可基于语音特征离散化技术和大语言模型降低预测连续语音特征的难度,高度还原真人说话细节。思必驰品牌总监赵燕燕介绍,为满足企业高度灵活的个性化需求,大模型的基础能力需要不断与产业进行深度结合。当前,思必驰DFM-2大模型已在智能汽车、智能家居、消费电子等行业落地应用,具备出行规划、复杂指令交互、识别用户意图等功能,让人机交互体验更加自然高效。

   发力垂直应用,

   赋能工业制造

大模型方兴未艾,给产业发展带来新的机遇。李丕绩表示,大模型已在法律、金融、政务、医疗、交通运输、气象等垂直领域进行落地探索,目前挑战较大、业内极为瞩目的是在制造业的应用。业内人士表示,传统行业尤其是重资产行业的数据获取和应用更为复杂,行业大模型仍处在探索阶段。

在江苏重点打造的新能源、集成电路、生物医药等产业,很多企业正与高校合作开发大模型,相关数据和算法如何在工业场景应用是他们当前主要面临的问题。“在制造业中,我们如何构建大模型数据集?如何对业务问题建模?如何对大模型进行验证?”李丕绩说,大模型的稳定性和可靠性在制造业领域至关重要,现有的大模型仍无法完全杜绝“AI幻觉”等负面影响,在制造业场景中难以落地。

朱亚立认为,尚未成熟的AI生态是当前阻挠大模型广泛落地的重要瓶颈之一。他表示,江苏有人才和产业优势,可加大对基础研究的支持投入,推动高校、研究机构与企业开展深度合作,培养更多的AI人才,形成产业集群,提升整体竞争力,加速大模型落地应用,“有关部门可以出台支持政策,鼓励企业在大模型领域的研发与应用,提供资金、税收优惠等支持。”

今年,智慧芽牵头成立了“苏州市专利大模型创新联合体”,项目入选“2024年度苏州市创新联合体立项项目清单”。“我们联合苏州大学、西交利物浦大学、苏州科技大学3所高校共同开展理论研究与技术攻关,得到了苏州市人工智能行业协会的支持,将与企业、政府、服务机构及高校开展相关应用示范,如苏州市知识产权保护中心利用‘专利大模型’为专利审查场景提效的应用项目等。”朱亚立表示,联合体将持续开展关键技术攻关,致力用人工智能、大数据等技术提升原始创新供给能力,辐射和带动更多科技企业技术进步,推动全产业链升级发展,提高产业核心竞争力。

作为将总部落地江苏的企业,思必驰积极参与江苏人工智能科研项目,牵头组建了省人工智能语言计算创新联合体。“我们希望相关部门能够强化分类指导培育,构建‘技术研究—早期验证—产品孵化—场景应用—规模推广—资本助力’的创新产业发展业务闭环,推动产业上下游生态形成业务耦合,形成更大整体。”赵燕燕表示。

生态繁荣,才能推动大模型行业创新发展。苏州完成备案的4款大模型,其开发公司全部来自苏州工业园区。据了解,园区目前有上百家企业从事大模型研发,开发者聚焦人工智能、软件和信息服务、集成电路设计等重点方向,让大模型和算力融入当地“623”产业体系。在南京,玄武大模型工厂今年4月正式揭牌,聚焦人工智能领域创新研发、算力服务、数据应用、生态建设等环节,提升垂直领域大模型发展效能。

相关阅读

添加新评论