7月28日,在2025世界人工智能大会(WAIC)期间,启明创投主管合伙人周志峰在启明创投·创业与投资论坛——创业投资开启AI技术与应用共振周期上,发表主题演讲《技术向上生长,应用向下扎根——AI共振周期暨2025 AI十大展望发布》,并发布了“2025启明创投AI十大展望”。
周志峰判断,今年AI进入“技术与应用的共振周期”,一方面,技术持续向上快速生长,没有明显天花板。另一方面,技术在性能、成本方面变得“可用”,大规模的应用已经开始落地,就像“树根”一样深深扎根、扎实成长,创造巨大的价值。
启明创投主管合伙人周志峰以下是周志峰的演讲实录,有编辑与删节。
一年一度,一期一会。首先特别开心,又能在WAIC启明创投的创业与投资论坛上,跟各位新老朋友,无论是线下参加还是线上看直播的,再次聚在一起。熟悉我们论坛的人都知道,每年都是我来开始这个“序曲”,引出后续的演讲与讨论。
今年我的题目叫“技术向上生长,应用向下扎根”。为什么起这个名字?我记得2023年WAIC我们第一次举办论坛的时候,跟大家分享过我的感受:做AI投资人最大的感受就是“累”。当时美国大模型公司密集发布新模型,我经常凌晨3、4点起床,为了抢那些公司发布会之后有限的邀请码,赶紧去试试最新的大模型技术。去年我说,AI越来越热闹,但在任何一个“大浪潮”热闹的时候,噪音特别多。作为一个投资人,如何“让自己安静下来”、如何真正能够有自己的独立判断、用自己的思考去进行布局,是一件特别不容易的事。而今年,我觉得AI产业又到了一个新的阶段:一方面,技术还在往上快速增长,没有明显的天花板;另一方面,技术在性能、成本方面变得“可用”,我们也看到“应用已经开始大规模落地”,就像“树根”一样深深扎根、扎实生长,在创造巨大的价值。所以今年AI处在一个很特别的阶段——“AI技术与应用的共振周期”。启明创投在整个AI产业链上有很多布局,我们投了很多中国AI企业。我们的信息和观点,并不是“闭门造车”自己想出来的,而是整合了来自产业界“一手信息”的成果,这也是我今天十分钟分享的基础。从投资人角度讲,我依然愿意“累”,因为这是最热门的赛道。
大家可以看看,2025年上半年AI占了全球投资50%以上的份额。一个领域占全球一半的投资,这说明:即使AI大模型产业已经成长了两三年,大家仍然认为“它的潜力依然巨大”。越来越多投资人,用“真金白银去投票”,持续投入到AI中。
过去的半年,很多人在问:“是不是预训练这条路快走到头了,大模型的天花板差不多了?Scaling Law是不是不灵了?”但从资本的“投票”来看,不是这样的。2024年,模型公司拿到了330亿美元,占全年全球风险投资总额的近20%。
这也说明,大模型依然在高速发展。过去12个月,大模型有了很多新突破,比如MOE架构、合成数据、更长的上下文窗口等等。如果让我总结一两个最关键的技术进展,第一个一定是推理能力。以前的大模型是靠几万亿个token做预训练,压缩信息。当你提问或prompt时,它只是把“信息转移”给我们人类用户。而现在,有了推理能力之后,它能做更深入的逻辑思维,“向前推理,向后反思”,具备了非常复杂的一些能力。效果非常明显。去年这个时候,我们在讲GPT-4o,当时,它是最新、最强的模型。但如果用人类智商测试标准,它的成绩不到70分。还记得《阿甘正传》里的主角Forrest Gump吗?他的智商是75,是一位“轻度的智障者”。所以当时的大模型,也只是“人类的轻度智障者”水平,只能做一些简单的应用,做不了复杂任务。但现在,最新的推理模型,比如上周五发布的“阶跃星辰Step-3”模型,智商已达到120左右。这意味着什么?全球80亿人,有87%的人的智商在90-120分之间。也就是说,大模型已经超越了近80%以上人类的智商水平。这是非常重大的进展。
另一个关键是“多模态”。过去,我们说“大语言模型”,但语言只是人类感知和交互的一个维度。如果能融入语音、图像、视频,甚至未来的物联网多维信息,那模型对世界的感知与交互就会变得更加丰富多彩。除了语言主导的基础模型外,图像和视频的生成模型的进展也很大。今年5月,谷歌发布的“Veo 3”,已经能生成非常真实的视频,还能自动加音效、对白、背景噪音,让你感觉“就像是一个真实世界的视频记录”。我们投资的生数科技,也刚刚发布了新一代视频模型。它可以支持输入“最多七个主体”(人、动物、汽车等)的参考图片,且在生成的视频中保持这些主体的“高度一致性”。
再来说说Agent。这是从今年3月开始最火的话题。Agent爆火,其实是因为基础模型能力提升了:上下文窗口更大、能使用外部工具,核心还是“推理能力”的增强。现在甚至出现了“智能体的摩尔定律”——任务处理复杂度每七个月翻一倍。我们可以期待Agent再经历一、两个“七个月周期”后,智能水平会达到怎么样的高度。
今年初,DeepSeek V3和R1模型发布,震惊全球。它在“推理成本”上做得非常好,仅为OpenAI对应模型的5%。此后,全球大模型团队都在用工程优化压低成本。谷歌比DeepSeek又降了不少,阶跃星辰最新模型的推理成本比DeepSeek低很多,在国产芯片上的表现更为出色,推理效率最高可达DeepSeek-R1的300%,从而又实现了推理成本的大幅降低。现在主流的基础模型,即使是完整尺寸大参数量的模型的推理成本也已经降到每百万Token约1美元,比去年下降了近100倍。
讲完AI技术的新突破,我们再看AI应用。大家熟悉的ChatGPT这个产品,是这波AI浪潮的点火器。2023年7月,我们第一次在WAIC召开论坛时,ChatGPT周活用户不到1亿;到2024年夏天举办论坛时是2亿;而现在已经“差不多8、9亿周活用户”了。AI应用发展速度非常快。
哈佛商业评论最近也总结了一个趋势——AI产品从辅助创意走向深层互动。过去我们用AI在做图、写文案时产生创意,参考它的idea。但现在,疗愈陪伴产品成了最常用的使用场景,帮助用户寻找情绪出口,成为一个数字化的陪伴者。
Token调用量也反映了应用热度,比如豆包,12个月内调用量增长了超过100多倍。
AI硬件方面也有进展。我们投的“未来智能”推出的翻译耳机,用户已突破100万。Plaud AI这个华人团队主攻北美市场,也突破百万用户。
人形机器人在中国开始率先落地。比如两周前,优必选(编者注:启明创投投资企业)刚签了全球最大的人形机器人订单;智元机器人与宇树科技也中标了真实落地场景中的商业合同。
还有一个趋势是“全球化”。过去互联网公司是“本地称王,再拓海外”;但现在,AI产品“生而全球”。比如快手的可灵AI,网页端80%流量来自海外。生数科技的视频生成平台Vidu AI,上线3个月用户超1000万,其中80%以上也来自海外。
我们每次分享的最后,也是最重要的环节,我们再次挑战一下自己,跟大家聊聊我们对接下来12个月到24个月的十大展望。
基础模型
展望一:未来12-24个月,200万Token的上下文窗口将成为顶级AI模型的标配。围绕更大上下文窗口展开的更精细、更智能的上下文工程,会成为推动AI模型及应用发展的核心驱动力之一。
多模态模型
展望二:通用视频模型有望在12-24个月内出现,该模型可处理视频模态下的生成、推理与任务理解,促进视频内容生成与交互的革新。
AI Agent
展望三:未来12-24个月,Agent形态将从“工具辅助”走向“任务承接”,首批真正意义上的“AI员工”将进入企业,广泛参与客户服务、销售、运营、研发等核心流程,不再仅作为助手存在,而是具备协同作业、主动反馈、承担OKR等能力,推动从成本工具向价值创造转变。
展望四:多模态Agent将不断走向实用化,能够融合视觉、语音、传感器等多源输入,进行复杂推理、工具调用与任务执行,在医疗、金融、法律等行业率先实现突破。
AI基础设施
展望五:AI芯片领域,将有更多“国设”且“国造”的GPU开启批量交付;与此同时,在3D DRAM堆叠、通算融合发力创新的新一代AI云端芯片,也将在市场中崭露头角。
展望六:未来12-24个月,Token消耗量将提高1至2个数量级,集群推理优化、终端推理优化、软硬协同推理优化成为AI Infra侧降低Token成本的核心技术。
AI应用
展望七:AI交互范式转移将在未来两年内加速到来,伴随用户对手机屏幕依赖的减弱与语音等自然交互方式的重要性上升,将推动AI原生超级应用的诞生。
展望八:垂直场景中的AI应用潜力巨大,越来越多初创公司将凭借行业认知深耕细分领域、快速实现产品与市场匹配,以“Go Narrow and Deep”的策略与大厂形成差异化竞争。
展望九:AI BPO(业务外包)模式将在未来12-24个月实现商业化突破,从“交付工具”走向“交付结果”,并通过“按结果付费”的方式,在金融、客服、营销、电商等流程标准化行业快速扩张。
具身智能
展望十:具身智能机器人将率先在拣选、搬运、组装等场景实现规模化部署,积累大量机器人第一视角数据与带触觉的操作数据,构建“模型-本体-场景数据”的闭环飞轮。这一飞轮将驱动模型能力迭代,最终推动通用机器人迈向大规模落地。
(转自:启明创投)
0 条