发布360智脑大语言模型后,10月底,360智慧生活相关负责人在一场发布会上介绍了进展:利用大模型能力,将训练好的模型拆分成多个不同小模型,供用户下载算法至终端上使用,某款户外球机销量已相较以往同类产品翻倍。
这是大模型技术不断向前演进的案例之一。此外,国内的小i机器人、商汤科技和云从科技等一众科技企业也不断迭代自己的大模型产品。中国绝大部分人工智能企业诞生不超过十年,它们要承受技术突破和商业变现的双重考验。
“沉淀技术就会花掉创业团队无数的时间和精力。从技术到一个产品,到最终满足商业客户的需求,尤其到商业化变现,会有无数的技术团队折戟沉沙。”小i集团董事长袁辉对第一财经记者表示。
“最大的不同”
垂直领域专有模型局限于细分领域或细分场景,通常参数量较小,需要通过人为标注数据“投喂”给模型训练,让模型从中学会规律并表现出智能。自2012年深度卷积神经网络提出,这类通过训练而成的垂直领域专有模型便开始兴起,取代了以往认为基于规则编写算法体现智能的方式。
直到大模型到来再一次改变AI形态。
“以往小模型采用监督训练,需要人为标注数据,行业内拉一个框(标数据)大概8分、1毛钱,要训练模型需要拉几十万个框,训练后的模型面向针对性场景。” 360智慧生活集团副总裁、360视觉云业务线总经理孙浩告诉第一财经记者,大模型的不同在于,大模型基于自监督或半监督训练,用大量数据训练模型,无须标注数据,大模型就能总结规律。只在针对特定场景用行业数据进行模型微调时,需标注一部分数据。随着大模型推出,AI走入新的赛道。
一名熟悉AI视觉模型的技术人士告诉第一财经记者,垂直领域专有模型此前训练复杂度高的缺点突出,体现在算法之间难以共通,针对不同场景的模型需分别训练,同一个模型针对人、宠物等不同检测对象也需分别训练。训练后的模型也只能“认出”特定目标,AI表现难言智能。大模型则避开了以上缺点,能从大量数据中自学习,且易于微调后应用于不同场景,表现出通用性。
垂直领域专有模型所需庞大的数据标注量,曾催生以人力密集为特点的数据标注产业,记者了解到,在大模型兴起后,不仅大模型训练的数据标注需求大幅下降,大模型本身还可用于标注数据,省去人工。
大模型在功能上也“颠覆”了以往的专有模型。孙浩表示,很多传统安防公司和AI公司此前发布了AI产品,在平安城市等项目有较大的落地应用,但几年前,深度学习算法就暴露出场景单一、泛化能力差的缺点。AI对检测目标需单独标注数据并培训算法,传统算法对长尾细分产品需求难以低成本覆盖,在家庭、中小微企业场景的落地表现难及预期。
以360为例,入局大模型后,360智脑-视觉大模型具备了不同以往的功能,包括开放目标检测、视觉问答等,前者基于语言描述检测画面中的特定目标,无需经过数据标注训练,后者能“理解”画面并用自然语言回答提问。360利用大模型的能力,将训练好的模型拆分成多个不同小模型,供用户下载至摄像头等终端。据介绍,端边云融合、大小模型协同后,算法精度提升了35%。
如同360集团一样,人工智能公司纷纷向大模型技术方向进化。
今年的6月,小i机器人发布华藏通用大模型,它在10月份进一步展示了其商业化变现的潜在途径。商汤4月推出“日日新”大模型体系,包括自然语言处理模型“商量”,近日发布了基于“商量”的医疗健康AI大模型“大医”,向医疗健康产业链上下游机构开放服务,推出的产品包括用药助手等。云从则于5月推出“从容”大模型体系。云从董事长周曦此前在业绩沟通会上表示,“从容”大模型后续版本的规划是以百亿模型为主体,走行业落地方向。
“过去人工智能的技术只能在某些特定的行业和场景当中进行赋能,大模型今天可以在同一时间,有机会有能力赋能所有行业。”袁辉表示,“这对于整个人类社会经济的发展,会起到巨大的降本增效效果。我觉得这是大模型跟过往AI最大的不同。”
商业化之难
大模型已经具有破坏科技巨头们原来有盈利模式的“潜力”。ChatGPT4发布之后,令行业震动,部分的原因也是如此。
“大模型出现之前是在网页上投放关键词的广告。但是今天大模型是怎么做的?无论你问什么问题,它只给你一个准确的答案,你的广告怎么投放?搜索引擎超级应用都会面临这一点,那其他的应用呢?”袁辉表示。
国际和国内大模型企业的商业化之路才刚刚开始。
商汤科技的上半年财报显示,今年上半年收入同比增长1.3%,亏损小幅缩小。该公司提到其生成式AI相关收入同比增长670.4%,对集团业务的贡献从2022年的10.4%提升至今年上半年的20.3%。据商汤方面透露,它联合国内多家科研机构,投入了约10000张GPU在大语言模型研发上。
从人工智能的发展历史来看,它的投资巨大,而商业回报一直以来都不乐观。
“人工智能60年以来,两次都失败了。任何一项技术走向社会,一定要创造经济和社会价值。”袁辉认为,“变现,这是整个大模型乃至人工智能行业,过去60年所面临的最大挑战。”
大模型技术还在快速演进,这会带来更多商业化可能。
360、海康威视、大华股份等安防企业,此前都是以AI视觉专有模型为主,进入大模型时代,大语言模型成为他们最早跨入,并尝试商用的领域。360目前已在应用的360智脑-视觉大模型是以大语言模型为基础、融合AI视觉技术而成,率先商用的商汤“商量”是大语言模型,云从“从容”大模型体系也涵盖了大语言模型。
孙浩表示,今年4月meta发布了SAM(Segment Anything Model,分割一切模型),成为视觉领域一个重要事件。东方证券研报称,过去的图像分割为特定任务创建准确的分割模型,通常需要技术专家进行高度专业化的工作,还需大量的领域标注数据。SAM则能实现零样本下对任意图像进行分割,在新的图像领域上即开即用,无需额外训练。
SAM发布后,业界加速探索视觉大模型。GPT 4已增强了视觉等多模态能力,商汤推动“日日新”大模型体系中的 “如影”数字人生成平台和“秒画”文生图创作平台演进,云从“从容”大模型体系也纳入视觉大模型。
孙浩预判,视觉模型的“GPT3时刻”大概需要一年左右的时间才会到来。而未来在视觉大模型领域的竞争,企业是否有足量符合场景的数据供给大模型训练,将显得尤为重要。
中国绝大部分人工智能企业诞生不超过十年,它们必须走过从一张白纸到商业变现的过程。
袁辉判断,这不会是一个浪漫的过程。“沉淀技术就会花掉创业团队无数的时间和精力。从技术到一个产品,到最终满足商业客户的需求,尤其到商业化变现,会有无数的技术团队折戟沉沙。”