大模型的 2024:「天上」的技术,和「地上」的创业者
比特币 · 2024-02-08 09:55:21

文章来源:极客公园

作者:宛辰

图片来源:由无界AI生成

2023 年,OpenAI 引领了科技圈久违的兴奋,创业者感到有奔头的同时,却也随着 AI 模型的一再进化,感受到了压力。

在春节前夕,算力、模型、应用等领域的大模型创业者,齐聚在一场创业者社群的活动上,切磋各自在不断进化的大模型中找到的空间。面对呼之欲出的 GPT-5 和 Llama3,他们也有新的思考。

站在模型层面,差异化很难,方向几乎是明确的——增强推理能力和多模态。也有技术路线的分野,比如阿里云通义实验室智能对话负责人李永彬透露,目前在思考是否能把搜索增强这样的外挂能力,做到模型里,进一步提升模型的可用性。

但站在应用层,多的是非共识和机会。比如,跑得最快的一批创业者,已经实现了一定程度的商业闭环,得出的结论甚至有些意外:「大模型含量」不宜过高。

这群下场做大模型的实干家也谈到了行业内最真实的情况。智谱 AI COO 张帆道出,今天的榜单其实不反映真实问题,GPT-4 可能连榜单前 10 名都进不了。他认为,这种情况下,2024 年一定会发生从模型为王到价值为王的变化。

百川智能联合创始人洪涛则更关心成本,他表示,一年下来苦哈哈做各种私有化项目,到底挣多少钱,其实内心没把握。在这一点上,大家也探讨了云计算厂商能否在整个行业没有商业模式之前,降低算力成本的路径,让该花的钱少一点。

大模型的 2024:「天上」的技术,和「地上」的创业者

近日,阿里云创业者社群在北京举办创业者之夜活动|阿里云

在「创业者之夜」,各位大模型的先行者分享了各自对行业的「预言」;AI 应用的创业者们,也分享了对于大模型的「焦虑」。


01、2024,大模型往哪走?


2023 年,阿里云李永彬游走于大模型业务一线。一整年忙活下来,他发现:最初,大模型让「AI 解决问题」这件事的效果从 20 分提高到 60 分,就能够惊艳所有人,但是对于很多问题,60 分和 0 分差不多。因为在一些应用场景,没办法拿 60 分的产品上线,效果到不了 90 分,客户可能也不会买单。

这也是 2023 年大模型创业者们共同的体感。从兴奋回归到理性,背后是共同的困惑——大模型还不够通用,它会不会像上一波 AI 一样,尽管展现出惊人的能力,但落到场景时仍旧需要逐个项目定制化?

大家自然就产生了 2024 年对大模型的第一个期待——通用能力进一步提升,甚至期待模型在一些复杂场景能直接做到 90 分。

这种可能性不是无迹可寻。IDEA 研究院讲席科学家张家兴认为,从目前 OpenAI、谷歌等大厂对下一代大模型的判断,大模型能解决复杂问题会成为接下来进化的方向。

大模型的 2024:「天上」的技术,和「地上」的创业者

AlphaGeometry: An Olympiad-level AI system for geometry|图片来源:DeepMind 官网

就在两周前,谷歌 DeepMind 推出的 AlphaGeometry(阿尔法几何)AI 系统,已经能在 30 道国际奥数题中做对 25 道,接近人类水平(人类金牌得主平均做对 25.9 道)。像这样能解决奥数级别的几何问题,被视为迈向更先进、更通用 AI 的重要里程碑。在 IDEA 研究院张家兴看来,「奥数就是复杂问题,问题的描述很复杂,求解过程、证明过程也很复杂」,能解决复杂问题是模型变得更通用的表现之一。

阿里云创业孵化事业部总经理李中雨认为,从 GPT-5 目前释放的信息看,模型的泛化能力在提升,解决复杂任务的能力也在提升,甚至接下来 GPT-5 可以解决 15%-20% 人类的任务。

在提升模型的通用性上,也有新思路。

一位来自模型厂商的与会者分享,最近绝大多数企业落地大模型时都会用到 RAG(搜索增强),从而将大模型和私有数据结合起来,提升模型可用性。但作为模型侧的开发者,也在探索算法创新,通过算法创新提高模型的学习能力,把像 RAG 这样的外挂知识库囊括进去,从而减少对模型数据训练的依赖。换言之,通过算法创新,以期让模型像人类学习一样,看一本书就可以理解知识,而不需要看所有书来理解一个问题。

在这一点上,GPT-5 提供了很好的示范。智谱 AI 张帆认为,更强大的推理能力让处理复杂任务成为可能,同时也带来了非常强的泛化能力。模型会在各个行业场景都能有很好的 Zero-Shot、One-Shot 能力(给模型一个例子甚至不给例子,它就可以涌现出对应的能力),从而减少对训练数据的依赖。通过小数据集的训练,就可以把模型引入到更多更垂直的领域。如此一来,可以降低客户使用模型的门槛,增加其可用性。

除了通用性,多模态能力也被期待在 2024 年能有更大突破。

去年底,从 GPT-4 到谷歌 Gemini,已经充分展现了大模型的演进,拓展以大语言模型为核心的更大体系的 AI,必然会涉及多模态能力。

张家兴预判,就像 2022 年底 ChatGPT 的出现,导致 2023 年所有人都在做大语言模型一样,2024 年整个业界可能会聚焦多模态。这并不只是因为多模态能带来更强的能力,更因为多模态的应用场景多,在端侧比如车和机器人的场景,多模态非常重要。

在多模态的技术实现上,也有一些技术融合的新视角。

在多模态领域做探索,中科深智创始人成维忠注意到前段时间图灵奖得主 Lecun 的一个采访,他并不认同现在大家做多模态的技术路线——把图片视频还原为像素,Lecun 认为未来的多模态训练是应该以表征事件为主。

在这一话题的讨论上,与会者一方面认为,ChatGPT 也不是规划出来的,技术路线可能是干出来的,能用今天的技术落地往前走、不断改进是前提。另一方面,尽管路线之争的存在,但也不是不能调和的,有很多中间的路线可以走,是连续的。比如,张家兴分享了 IDEA 内部的实践,称称目标识别等计算机视觉特征是可以作为多模态大模型的输⼊,实践下来的效果⾮常好。

大模型的 2024:「天上」的技术,和「地上」的创业者

从左到右分别是阿里云创业孵化事业部总经理李中雨;智谱 AICOO 张帆;百川智能联合创始人、总裁洪涛;元璟资本管理合伙人刘毅然;IDEA 研究院认知计算与自然语言讲席科学家张家兴、通义实验室对话智能负责人李永彬 | 阿里云


02、2024,大模型如何落地?


如前所述,对于大模型接下来的趋势预判,推理能力和多模态能力的提升成为清晰、明确的目标。但谈到 AI 应用,更多是非共识的思考,创业者一致认为需要在非共识中寻找机会。

就拿大模型落地应用要考虑的第一件事——模型选型来说,目前也还没有达成共识。智谱 AI 张帆笑称,以现在模型评测卷出天际的背景下,「OpenAI 的 GPT-4 都排不到模型评测榜单的前两页」。

的确,几个月以来,不少模型创业者都向极客公园表达了类似的观察:模型评测榜单不反映真实情况。在「模型为王」的愿景下,的确会出现提前让模型「看题」、「背题」来获得高分的情况。但更重要的是,当涉及到千行百业的不同场景,很难用一套标准来评价模型的可用性。

实践过后,大家更认同在一个个真实的具体场景里不断测试评估。比如,猎聘在+大模型的探索上,最大的研发成本就花在测试不同的模型上。猎聘 CEO 戴科彬表示,对于什么场景用什么模型、多大尺寸的模型最高效,没有标准答案,就连评价标准也要根据情况调整。

除了模型选型,模型落地也开始出现一些可操作的判断标准。无论是在原有应用里+大模型,还是一些 AI Native 应用的探索,都出现了能形成商业闭环的可能性。

这里首先要考虑大模型技术分布的独特性。元璟资本管理合伙人刘毅然认为,AI 应用存在巨大的不确定和非共识机会,这与这一波 AI 技术的特点有关。

移动互联网时代,应用的底层基础设施是一样的,都是基于苹果 iOS 和 LBS 定位来做产品。相比之下,大模型应用则是一个个垂直优化的过程,底层模型哪部分用开源版、哪部分微调、调整哪些问题,再视情况优化功能和应用。创业者需要充分懂技术,再做产品的封装,这个过程存在很大优化空间和机会。

这就提出了探索 AI 应用的第一条原则——TPF(技术产品匹配),百川智能创始人王小川在极客公园创新大会 2024 大会上曾提到过这个名词,指的是在现有大模型技术不完美时,先明确「这样一个技术适合什么样的产品」,而不是产品经理洞察市场有什么需求,回来就开始做。

因为从大模型到 AI 应用,「今天最大的挑战不是找到『什么不行』,这件事不难,人人都能够做到。难的是能找到它『什么行』,找到模型能力和业务的最大公约数,变成正向循环。」智谱 AI 张帆认为,这会成为 2024 年大模型落地的重点。

尽管这样的实践可能不是投资人寻找的 AI Native 应用,但是务实地看,通过在可用场景里,基于模型和工程化手段把大模型应用产品化,数据和客户反馈的飞轮会推着 AI 应用向前迭代。百川智能联合创始人洪涛提到了一个有趣的观察,做 AI 应用的创业者甚至觉得以当前大模型技术成熟度,AI 应用「含大模型量」不宜过高。

在游戏领域,昆仑万维集团董事长兼 CEO 方汉有类似的观察。通过纯 AI 大模型直接生成 3D 游戏内容,会造成面数特别多、规格不匹配等问题。这时如果换一个思路,把传统的一些简单动画工具,融合进 AI 大模型的工作流之后,产品的可用性就大大提高。

在他看来,什么好用就用什么,拼出对用户最有价值的工作流,这是作为 AI 应用开发商的价值所在。

看得出,在原有应用里+大模型、探索更好的工作流,是把大模型智力变成生产力最直接的方式。智谱 AI 张帆认为,这也是 2024 年产业关注的重点。

与此同时,一些令人惊艳的 AI Native 应用也开始出现。

就像移动互联网技术下,出现随时随地刷短视频的用户需求一样,大模型技术下也开始出现一些独有的场景。比如一位 AI 应用投资人现场分享了一款还在定向邀测的海外应用 Can of Soup,一款想象力社交软件。用户利用 AI 生成虚拟图像,发布在网站上,互相评论,还可以邀请朋友进行「想象力」共创、点评,这款产品可以类比为「想象力版 Instagram」。

「这款应用在海外 DAU 增长非常快,不知道最后能不能成,但是非常有意义的探索,代表不仅现实的生活可以分享、可以社交,你的想象力也可以被社交,这就是非常典型的 AI 原生的应用,发现了新的行为模式」,他补充说。

除了像 Can of Soup 这样捕捉新技术下的人类新需求,新技术也给熟悉的场景带来了更好的解决方案,为用户带来更易用、好用的体验。

就拿现在最火热的智能体来说,智谱 AI 张帆认为,很多 GPTs 能做的事情非常浅,很难用作生产工具。这些 GPTs 背后的流程大体是按照人的理解逻辑来执行,先做分类、再做模型、再做任务,但是这种智能体运行的方式是受限的,他认为,「严格来讲,这种外挂工程的方式不算是 agent,只是大号的模型应用」。

相比之下,他发现字节跳动在海外推出的 Coze 玩法不一样,同样是 GPTs 类应用,Coze 的模式是利用背后大模型的递归和迭代的能力和表达力,这是更加原生的智能体,效果也更好。

张帆称,这是他看到比较兴奋的方向,能够用更简单的方式、更通用的方式,不需要微调,仅仅用基础的表述就能够解决真正的复杂问题,把从模型到应用之间的 100 公里降到 100 米。但也有前提,像 Coze 这样的原生模式,高度依赖背后的模型能力,模型强大到足够通用,才可以实现。

大模型的 2024:「天上」的技术,和「地上」的创业者

智谱 AI COO 张帆在活动上做分享|阿里云

除了软件类 AI 应用,结合端侧场景的应用也值得期待,尤其机器人领域。说起 2023 年最眼前一亮的应用,张家兴认为是谷歌的 RT-2(Robotics Transformer 2,一款机器人大模型),看到了⽤⾃然语⾔定义任意机器人任务的曙光。他认为,⼤模型在机器⼈领域正在期待 ChatGPT 时刻。

元璟资本刘毅然举了一个例子,过去机器人领域有一些常规,比如用数学规律来描述复杂动态体的运动,现在,大模型对于像这样的数学描述过程有放大作用,但距离大模型真正进入机器人或者手机、车、AI Pin 等硬件,可能还需要些时间。

「天上的大模型能否落在地上的设备上面,是值得期待的」他说道。尽管通用的物理世界大模型的价值最大,是科学家梦寐以求的,但在前面加合适的定语,是创业者今天就可以做、也可以有收获的。难点在于,前面怎么加定语,能符合今天的技术阶段,也能把商业化和产品结合在一起,不停向前进。


03、2024,大模型「基建」的意义


有了对 AI 应用百花齐放的期待和判断,创业者也对整个大模型的技术体系寄予新期待,尤其是数据、算力和开源算法。

数据被视为模型训练、微调等动作产生效果最重要的因素之一。在获取高质量数据上,方汉提出了不同的思考。在他看来,很多大模型有更快的方法获取数据,比如通过用 GPT-4 做「教练」来获得,但是在数据获取方面,团队应该有「长期主义」精神,不然「很难走远」。

大模型的 2024:「天上」的技术,和「地上」的创业者

昆仑万维董事长、CEO 方汉在交流环节分享昆仑万维+大模型的实践|图片来源:阿里云

在对比了全球市场后,昆仑万维方汉认为,垂类数据是中国公司上场和发力的方向。有了垂类高质量数据,才有机会在垂直场景里面做到 SOTA(指前沿、第一梯队的模型),率先获得垂直场景的红利。

在算力层,成本成为主要的关注点。

百川智能洪涛坦言,大模型商业模式的探索有相对长期的试错过程,云计算层面继续突破、摊薄创新成本,是眼下比较关注的方向。

在这一点上,阿里云公共云总裁刘伟光认为云和 AI 的结合会逐渐解决这个问题。

云计算对传统 IT 的意义,和融合AI的意义完全不同。AI 和云是鱼和水,密不可分,二者的结合是 AI 应用的催化剂。同时,云计算能力的不断演进,包括 GPU 算力、配套的计算存储、网络能力的演进,会对 AI 产生非常大的支撑。

「在谈AI原生应用之前,其实有一点被忽略了——AI 是云的原生应用。二者的结合还有很大优化空间」他说道。随着大模型包括 AIGC(应用)更加细分,对算力的需求也会逐渐细分化,而不是简单粗暴地购买算力,这也是阿里云不断探索的事情。

在这一点上,云、端结合的方式也被寄予厚望,昆仑万维方汉认为,降低模型推理成本,要结合端侧推理,手机侧可以做小参数量模型的推理,和云端大参数量模型推理结合起来。

算法层面,Meta 开源的 LLaMA 和 Llama2 为产业模型发展提速,带来了繁荣的开发者生态。不久前,Mistral 创始人也袒露借鉴了 Llama2 的开源模型,但开发者普遍称,Mistral 的效果实际用下来要比 Llama2 更好。

国内模型厂商也越来越多地选择开源模型,但也有创业者表示,不确定国内尤其是大厂开源模型背后的考量,会不会只是一时的。比如,猎聘戴科彬就认为,阿里云开源的 72B 大模型效果非常好,但也好奇其背后的思考。

在创业者之夜上,阿里云市场总裁刘湘雯直面这一提问。她表示,阿里云会持续开源,这并非仅仅为了公益,而是基于对商业的判断。

大模型的 2024:「天上」的技术,和「地上」的创业者

阿里云创业者之夜活动现场|阿里云

在这场创业者活动中,极客公园看到了共识,也看到了更多共识的观点在嘉宾之中激烈碰撞。而这恰恰代表了由大模型引发的新一波 AI 浪潮中所蕴含的机遇。你可以想象,在 20 年前移动互联网刚刚兴起的时候,在类似活动,同样充满了相同的争论和见解。

不同的是,变革的「基建」从运营商,变成了现在以阿里云为代表的云计算厂商。在大模型时代,阿里云不仅要自己下场「摸清」大模型上下游的真实情况,更需要在这样的创业者之夜活动中,和大模型行业的「玩家」共同找到行业发展的方向,根据后者不断变化的需求,增加阿里云「AI 基建」的各种能力,来和创业者们一起成长、成功。

大模型时代,「计算,为了无法计算的价值」有新的内涵,在阿里云举办的创业者之夜活动上,这群先行者率先开始探索最开放的技术体系里,新的变化。

热门资讯热门资讯