MiniMax副总裁刘华把脉大模型创业新生态:从狂热到冷静,从广度向深度

来源:证券之星   阅读量:7482   

自ChatGPT两年前问世以来,生成式AI迅速引爆全球科技行业,并掀起了一场跨越技术、商业和文化的变革。

它不仅彻底颠覆了人们对AI的认知,也让大模型成为几乎所有科技企业的核心战略。无论是初创公司还是巨头企业,纷纷涌入这一赛道,试图通过大模型抢占下一个科技高地。

然而,经历过去年的市场狂热,行业今年逐渐回归理性,技术门槛的不断提升与市场化进程的减缓,促使一批急于求成的玩家逐步退出舞台。

目前,业界已经形成共识——大模型行业的竞争将不再是广度上的扩张,而是深度上的突破。只有那些具备硬核技术能力、独特产品定位以及可持续商业模式的企业,才能真正站稳脚跟,继续留在这场牌局之中。

因此,基础大模型的赛道最终只会保留少数几家企业。那么,谁会留下?业内普遍认为,除了头部的科技大厂外,市场也会给优秀的创业公司留有一席之地。

而MiniMax无疑是这批大模型创业公司中的佼佼者。一方面,它是行业为数不多在ChatGPT出现之前,就瞄准大模型赛道进行创业的公司;另一方面,它也是率先在大模型商业化层面取得成绩的创业公司之一。据媒体报道,MiniMax的年收入将超过7000万美元。

近日,MiniMax副总裁刘华在接受21世纪经济报道等媒体的采访时,就行业趋势、大模型商业化及未来发展方向等话题,分享了他的观察和思考。

行业趋势:Scaling Law没有放缓

从OpenAI推出ChatGPT之后,全球人工智能进入了一波新的热潮。目前来看,在这新一波人工智能热潮里,中、美两个国家是主要玩家。

“整体而言,美国的大模型行业还是处于领先的地位,但好就好在,从2022年底到现在,中美之间的差距没有拉大,尤其在一些细分领域,比如语音、视频等,我们追赶的速度非常快。”刘华表示。

对于大模型未来的发展,业内有声音认为“Scaling Law在放缓”。对此,刘华指出,“我们没有感受到Scaling Law在放缓,2024年对于MiniMax来讲,依然是大模型飞速发展的一年。”

其认为,今年有更多的模型研发方向涌现,“大模型从一个只会写文章的文科生,变成了一个更全面的大模型”。而从Scaling Law的角度,刘华以前觉得Scaling Law更多在训练上奏效,今年发现,Scaling Law在模型推理上同样有上升空间。

因此,在Scaling Law依然奏效的背景下,大模型仍会保持较快的迭代速度。而MiniMax的大模型研发主要瞄准三个方向:一是继续把多模态做好;二是实现无限长的输入和输出;三是将错误率降低至个位数,比如2%-3%的水平。

刘华称,上一代的GPT系列模型,存在的一个问题就是错误率偏高,大概是30%左右,这导致GPT在一些严肃的生产场景无法适用。所以,大模型要想进入严肃的生产、研发、科研等场景,错误率必须降低至个位数。

商业化:坚持做标准化产品

据刘华介绍,MiniMax的开放平台在20个国家已经实现业务落地,C端产品则已触达超180个国家和地区。

刘华表示,海外的业务市场很大,MiniMax做海外产品主要有两个心得:

首先是因为自研大模型,所以对于用户的反馈,能够在下一代模型研发中进行改进,所以即便是同类产品,用户慢慢也会觉得MiniMax的产品体验会比竞品好一些。

其次,是中国企业拥有工程师红利。“中国的工程师对C端产品的理解比较深刻,同时也比较勤奋,因此跟海外友商相比,我们的迭代速度要快很多”。

虽然相比中国市场,海外C端用户的付费习惯会更好,但对MiniMax而言,中国市场依然重要。

“中国市场的优势,是用户量很大,特别是用户高频的使用,都在帮助MiniMax改进模型”。刘华坦言,在商业变现方面,国内的C端最终确实要考虑流量变现,即做广告。因此,国内的C端产品,能否达到一定的用户量级,很关键。

但刘华也强调,新产品做适量的宣传投放是必要的,但那些单纯以扩大用户总规模为目的的投流,价值不大。“对大模型研发来讲,最重要的是到底有多少用户能留下来且高频地使用产品,只有这种用户,才能够给模型迭代提供非常好的反馈”。

而在B端市场,MiniMax明年的主要目标是希望通过提高模型的推演能力,让其进入更多比较严肃的生产和研发环节。

刘华表示,MiniMax在全球做B端业务,都会按照标准化业务的模式,不太接受本地化、私有化的项目。

“只有标准化的产品,才更符合大模型赛道创业公司的发展”。刘华称,大模型创业公司的研发力量应该主要放在基础大模型的研发上,如果做定制化项目,不仅投入的成本会更多,且落地周期要更慢。

在刘华看来,如果一个模型服务一家公司,需要做非常多定制化需求,那就说明这代模型没有能力去服务它,最好的选择就是抓紧改进迭代模型。

大模型创业:需要不断对技术做创新和突破

对于目前市场讨论较多的“大模型泡沫”话题,刘华向记者表示,市场总体上没有太多泡沫,但之前最大的问题是,太多企业都说自己能做基础大模型,这块一定程度上造成了资源浪费。

“现在整个行业格局正逐渐改善,因为大家意识到,能够做基础大模型的企业没几家”。在刘华看来,最终留下的企业会有优秀的大厂,也会有优秀的创业公司,除此之外,很多企业都要转去做AI应用。

而谈及大厂和创业公司的关系,刘华认为,大厂做大模型肯定有很多优势,但同时,创业公司也能得到大厂的支持,比如MiniMax就得到了腾讯云的支持。

另外,MiniMax也实现了成功的商业化,在这些基础上,刘华认为创业公司继续留在赛道中,持续迭代研发模型的可能性,还是非常大的。

据其介绍,MiniMax目前与腾讯云的合作已经覆盖到模型训练与推理、海量数据处理与管理以及内容安全、全栈安全防护等方面。

腾讯云北区云原生总经理田丰在接受21世纪经济报道记者采访时提到,腾讯云与 MiniMax 早在三年前就建立了合作。“像MiniMax这样的大模型公司客户早期的需求是聚焦在算力、大数据处理,现在对数据存储、数据库、大数据、安全等都有了新的需求。随着业务发展,训练集群、推理集群的规模都在快速扩大。”

“这个规模对我们的组网的能力、集群的运维,都是一个非常大的、全新的挑战,跟原来完全是不一样的”。 田丰介绍,腾讯云为MiniMax 提供了一系列集计算、存储、网络为一体的高性能智算产品,让MiniMax释放更多的精力聚焦在模型本身的训练和工程化上。

刘华也表示,MiniMax一开始对腾讯的需求更多是模型的训练,但随着模型的发展,MiniMax现在也要通过公有云去做业务。

目前,MiniMax在公有云上的业务主要是两种方式:一是API调取;二是在公有云上构建私有化专区。

“特别是在第二种方式上,腾讯给予了我们巨大的支持。我们在做B端业务时,很多客户对数据隐私的要求比较高,这时候我们在腾讯的支持下,开发了云上专区,基于这种模式,许多原本对数据安全有顾虑的企业,也愿意使用大模型服务了,所以这对我们业务推广起到了非常重要的作用。”刘华表示。

当然,大模型创业公司也面临较大的市场挑战,尤其是开源模型的快速发展,很可能给创业公司带来灭顶之灾。

刘华表示,“一个模型如果要提供商业化服务,需要不断对技术做创新和突破,实现更好的产品体验和生态,再用商业化的所得反哺技术。这是我们期待的良性生态。”。

在其看来,当技术突破创新不断加强,产品体验变得越来越好,商业化会是一件自然而然的事,“若无法做到在底层技术上持续创新,那继续研发基础大模型也无意义,不妨将重心转向AI应用领域。”刘华说道。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。