大模型2024：从“烧钱”到“赚钱”的急转弯

29 阅读 0 评论 0 点赞 AI创作

在2023年，大模型的竞赛还停留在技术突破和巨额投入的阶段。然而，随着烧钱模式的不可持续性逐渐显现，2024年成为了大模型从“烧钱”转向“赚钱”的关键一年。作为一位长期关注这一领域的观察者，我见证了这一变化，并深刻感受到业界在这一年中所经历的巨大变革。

技术提升与落地并重

与2023年的基础大模型大战不同，2024年，业界不仅继续注重技术提升，更开始重视实际应用的落地。无论是国内还是国外，各大厂商都在积极探索如何将大模型应用于实际场景，以实现商业价值的最大化。

例如，字节跳动在5月率先将国内大模型的市场价格带入“厘时代”，随后文心大模型宣布其两大主力模型ENIRESpeed和ENIRELite全面免费。这一举措不仅降低了使用门槛，也为更多企业和个人提供了尝试大模型的机会。

国内外不同的落地路径

在政策激励下，国内外的大模型落地走出了不同的道路。海外市场上，ChatGPT等大模型通过不断优化用户体验，迅速积累了大量用户；而在国内市场，各大厂商则更加注重行业应用的深度结合。

比如，华为开发的盘古大模型完全面向B端市场，涵盖了交通、工业、建筑、媒体、气象、医药等多个领域。盘古大模型支持十亿级到万亿级参数的不同规模大模型，真正实现了包罗万象的应用范围。

成本控制与开源趋势

直观地从成本上对比，训练671B参数的DeepSeek V3的成本是557.6万美元（约合4070万人民币），而训练一个7B参数的Llama 2则需要花费76万美元（约合555万人民币）。显然，大规模模型的训练成本依然高昂，但开源趋势正在改变这一局面。

近日，国产大模型厂商DeepSeek宣布DeepSeek-V3首个版本上线并同步开源。多项基准测试成绩显示，DeepSeek-V3超越Qwen2.5-72B和Llama-3.1-405B等其他开源模型，并在性能上与GPT-4相当。这不仅为开发者提供了更多的选择，也加速了大模型技术的普及。

融资热潮与竞争加剧

据第一财经记者不完全统计，在国内，2024年“六小虎”至少融了200亿元，而海外3家大模型初创公司更是超过2000亿元。拼资金、拼资源的大战还在继续，烧钱仍然看不到尽头。即便在过去不到一个月的时间，还有三家独角兽大模型企业先后完成了新一轮融资。

12月11日，面壁智能宣布完成新一轮数亿元融资；上周，智谱AI确认完成了新一轮30亿元融资；近日，阶跃星也获得了巨额投资。这些融资事件表明，资本对于大模型领域的热情并未减退，反而愈发高涨。

应用场景的多元化

除了传统的文本生成和对话系统外，大模型在视频生成、游戏开发等领域也取得了突破性进展。巨人网络AI实验室负责人丁超凡表示，视频生成能力有望替代传统游戏生产方式，极大提高游戏发行内容的创作效率。

此外，讯飞星火、智谱清言等大模型虽然以B端为主要业务方向，但也提供大量功能供C端用户使用。这意味着，未来普通消费者也将享受到大模型带来的便利。

展望未来

2024年，大模型从“价格战”杀到了“免费战”，从“烧钱”走向了“赚钱”。这一转变不仅反映了技术的进步，更体现了市场的成熟。作为这一过程的见证者，我对未来充满信心。随着更多应用场景的涌现和技术的不断迭代，大模型必将在更多领域发挥重要作用。