2013年,有评论者提出,通用大型模型的竞争格局可能难以长久维持。时至今日,国内电信服务商在通用大型模型领域的态度调整,正好印证了这一观点。
“百模大战”难长久
自2013年以来,业界分析师普遍预测,考虑到持续的大规模长期成本投入,“百模大战”的持续时间可能不会太长。尽管目前这场竞争依旧激烈,但已有部分厂商显现出退出的苗头。国内电信运营商在通用大模型领域的态度转变,是这一趋势的明显体现。众多行业观察者注意到,今年运营商对其自研模型的宣传力度相比去年有所降低。
运营商态度转变
国内领先的三大电信运营商均已推出自家的通用大型模型。不过,根据业内人士的透露,目前只有一家公司持续加大投入。与此同时,其余两家运营商自本年度起,对通用大模型的产品定位进行了调整,逐步减弱,并开始注重实际业务的应用。某运营商内部知情人士透露,该公司的通用大模型表现不尽如人意,相较于DeepSeek、通义千问等产品,其竞争力不足;同时,现实业务对模型的需求迫切。
研发情况不同
通用大型模型的持续运行耗费了企业大量的计算资源,这一情况在湖北、内蒙古等地的数据中心表现得尤为突出。自今年DeepSeek在国内市场初露锋芒以来,运营商在底层通用大模型的投入决策上产生了动摇。即便投入大量资源进行训练,确保超越DeepSeek的性能水平仍存在较大难度,因此“接入DeepSeek”这一概念已逐渐成为市场宣传中的一个重要术语。
研发成本考量
运用DeepSeek技术,运营商能够有效减少研发成本,同时增强其通用大型模型的应用效能。尽管在宣传材料中通用大型模型并未被过度突出,但它在实际中依然发挥着极其关键的作用,就如同运营商手中的一块衡量硬性标准的考核牌。
聚焦专业大模型
通用大模型的进步遭遇了发展障碍,因此运营商们开始将主要精力投入到针对特定业务领域的专业大模型研发中,以期解决具体问题。在此过程中,海外的电信运营商也在增加对大模型研发的资金投入,然而,他们的关注焦点并不在于通用大模型,而是更加专注于解决自身在网络优化等方面的实际问题。
海外研发方向
众多国际电信企业正致力于打造符合其行业特性的专业大型模型,这一趋势的背后,是由于网络数据的复杂性所驱使,这需要训练出能够领会网络语言的专业电信模型。例如,软银曾对外展示了基于电信大模型的智能体演示,而SK电讯所拥有的模型对电信行业有着独到的见解,这些模型在经过进一步的优化后,有望被整合到产品和服务中。
您对国内电信运营商在通用型及专业型大型模型技术领域的未来发展趋势有何看法?欢迎您在评论区分享您的观点。此外,也别忘了对这篇文章给予点赞并予以转发。