大模型领域进入加速发展的第二年,技术迭代与竞争愈发激烈。全球范围内,创新成果层出不穷,文生视频Sora世界模拟器、谷歌Gemini1.5、Meta的V-JEPA等引领风潮。Claude3超越GPT4,OpenAI的GPT5呼之欲出,预示大模型智能新高度。同时,算力与数据资源的紧缺日益显现,企业如奥特曼自研芯片、投资核聚变公司,以储备关键资源。未来,大模型将在更多领域发挥作用,生成能力将更强,应用更广泛。但如何高效利用资源,也是大模型发展需解决的重要课题。大模型领域充满机遇与挑战,需不断创新,以应对未来变革。
中国基础大模型市场正迎来快速洗牌,数量将显著收敛。随着技术迭代和竞争加剧,资源有限、技术薄弱的厂商将面临压力,市场将逐渐由大厂与明星创业企业主导。相比国外,中国市场虽热闹但更显浮躁,而国外市场则更为成熟理性。全球范围内,基础大模型资源整合加速,优势企业崛起。中国市场应借鉴国际经验,注重技术实力与市场前景,实现可持续发展。洗牌虽带来挑战,但也孕育机遇,企业应抓住机遇,迎接挑战,共促行业高质量发展。预计2024年,市场将形成大厂主导、明星创业企业并存的局面,资源更加集中,行业竞争力提升。
根据报道显示,资深研究员聘请门槛高达万卡级别算力,反映大模型对算力的渴求。在“大力出奇迹”的范式下,算力几乎决定智能高度。GPT系列模型所需算力激增,巨头纷纷加大投入。
然而,国内算力市场相对滞后,与国际巨头存在差距。受美国芯片禁令制约,中国难以补充先进算力,国内芯片厂商亦面临产能瓶颈。此外,国产AI芯片软件生态薄弱,适配周期长、成本高,制约大模型训练进度。
因此,万卡算力仅属入门级别。中国需加快自研芯片和软件生态建设,以应对全球AI竞争挑战。
顶尖人才驱动大模型发展,OpenAI等团队的成功即是例证。然而,小团队也能展现高智能,如Character.ai和Mistral,虽人数不多,但核心成员专业深厚,模型表现卓越。因此,大模型能力不仅取决于团队规模,更在于顶尖人才的认知与贡献。
大模型领域,OpenAI选闭源。当前,口碑好的开源大模型多为GPT3.5水平,难以超越闭源。大模型迭代快,小公司和开发者常面临风险。开源更适合应用创新,而非基础模型迭代。受限于算力和算法,开源开发者难贡献于基础大模型迭代,原有集众智模式难以复现。
OpenAI等企业坚定信仰AGI,获得产业界认同。Sora的成功证明了ScalingLaw在视频领域同样有效。OpenAI将ScalingLaw作为核心理念,坚信规模化是魔法,在模型、系统、个人、流程与雄心壮志上的规模化将创造奇迹。对AGI和ScalingLaw的信仰,将决定大模型企业能走多远。
与移动互联网时代APP用户规模相比,中国AI原生APP成长较慢,头部应用刚破千万月活。尽管互联网圈内也有人未使用过这些APP,但头部应用已聚焦文本和图像信息模态生成,且月活用户突破5000万。其中,豆包、文心一言领跑,天工、扮伴-AI绘画及讯飞星火紧随其后。因此,个人应用要想在市场中立足,必须跨越千万月活这一关键门槛,才能持续吸引用户并实现增长。
大模型正转向端侧,在手机等终端上运行AI推理。端侧大模型具备高效数据处理、节省云端成本、威斯尼斯入口保护用户隐私等优势,带来全新交互体验。小米、实在智能等已推出端侧大模型,这些模型旨在成为手机新交互入口,可能使APP沦为后台服务,加剧手机企业与生态内的话语权争夺,使苹果税等更为强势。端侧大模型的发展将深刻影响手机生态和APP的地位。
实在智能手机Agent智能体是典型案例,只需一句话直接传达自己的意图,就可以帮你操作所有电脑、手机的软件完成各类工作和生活的目标任务,通过自主学习和模仿人类的点击和滑动手势,可以在手机上操作App执行各种任务。用户通过语音指令即可完成复杂任务,提高工作生活效率。
大模型提升效率,实现机器自动化新高度。在体验上,大模型让机器更懂人,交互更友好,催生陪伴类APP与亚文化。创造作为大模型天然能力,已在文字、图片等领域广泛应用,激发创新灵感。此外,AI4S领域展现出巨大想象空间,威斯尼斯入口如DeepMind成功合成新化合物。因此,效率、体验与创造共同构成了大模型落地的核心价值,推动其广泛应用与发展。
随着大模型与AIAgent的发展,个人将获得更多智能工具支持,可能拥有多个助理协助工作。这将提升对个人领导力和判断力的要求。一人企业的趋势将深刻影响大企业的组织方式,员工角色将更为多元,如身兼多职。同时,数字员工将成为企业核心竞争力之一,其数量和质量将至关重要。未来,一人企业或将崛起,为企业带来新的组织形式和发展机遇。
科技界对于大模型的态度已分化为技术信仰派与市场信仰派。前者强调AGI和规模定律,坚信模型能力跃升将解锁丰富应用;后者则认为只需将“足够的AI能力”投入商业场景,利用本土数据构筑壁垒。这体现了长期主义与实用主义的争论。随着GPT等模型不断升级,预计2026年将出现GPT6等更强模型,虽未达AGI,但已具备高度商业价值。然而,降低幻觉率仍是技术挑战,需着力解决以促进行业落地。未来,大模型或能给出置信度概率,提升应用效果。三年内,两派之争或见分晓。