智东西(公众号:zhidxcom)作家|依婷剪辑|漠影
智东西12月5日报说念,2022年ChatGPT面世即万众珍视,又在两个月内得回了1亿注册用户,烽火了巨匠对AI的期待,也让业界看到了AI大模子技艺精深的应用远景。
两年间,AI大模子如棋布星陈般线路。中国信通院数据自大,已毕2024年7月,全球AI大模子数目为1328个(包含兼并企业、兼并模子的不同参数版块),中国大模子数目占比36%。行业对模子的研发和应用也依然从最开动的大谈话模子,走到了多模态模子。而算力、网罗等AI大模子赖以生涯和发展的基础体式,仍需要束缚优化。
在中国大模子插足所谓“洗牌年”的节点上,昨日,智东西等媒体和中国AI大模子独角兽MiniMax副总裁刘华、腾讯云北区云原生总司理田丰进行了疏导。他们从两边公司的相助开赴,谈及了算力、网罗对AI大模子落地应用带来的影响。
一、多模态大模子期待更有性价比的算力MiniMax成立于2021年12月,是“国产大模子六小虎”之一,自主研发了包括万亿参数的MoE文本大模子、语音和音乐大模子、图像大模子、视频大模子在内的多模态通用大模子。
成立于今三年,基于不同模态的通用大模子,MiniMax推出了智能助手“海螺AI”、AI骨子社区“星野”“Talkie”等C端应用;MiniMax灵通平台则为企业和开拓者提供API就业。
采访中,刘华从AI大模子公司的角度开赴,谈到了多模态大模子应用经过中束缚擢升的算力老本问题。
他说,以往的大模子处理的是文本任务,目下的大模子处理的是语音任务、视频任务;用token来计较的话,一个小视频的tokens比一篇著作的tokens逾越太多。如若要让新的技艺落地、让更多的企业或个东说念主能够摄取新技艺,就必须确保大模子能够以十分有性价比的样子处理大边界的输入或输出。
二、大集群并不就是大算力,要优化资源行使率自MiniMax成立以来,腾讯云就与其设置了相助相关,为其提供算力、网罗等基础体式救助。田丰态状两家公司“是一说念手牵手走到今天”,在大模子的发展经过中,“一说念去科罚艰苦,是双向奔赴的一个经过”。
站在云就业厂商的视角,田丰共享了这两三年来我方对客户需求变化的不雅察。
他说,大模子公司客户早期可能需要的是千卡集群,目下可能皆是要上万卡,后续可能会到十万卡,“这个边界对咱们的组网的才气、集群的运维,皆是一个十分大的、全新的挑战,跟正本有余是不相通的”。
田丰拿“网罗”例如。他称,西宾万亿参数的大模子时,传统的网罗公约容易酿成拥挤、高延时。在这个经过中,0.1%的丢包率皆会导致50%的续训恶果的下落;中断收复之后,需要从上一个续训点延续西宾模子,这会给万亿边界的模子西宾酿成十分大的蚀本。
另外,田丰还提到,大集群并不就是大算力,算力不是靠浅易地“堆”出来的,而是需要大皆优化和调动GPU资源的行使率,以及网罗传输通信的恶果。
结语:大模子开启淘汰赛,技艺最终要盈利去赢利整整两年时分,生成式AI走过通用基座大模子的“百模大战”与“价钱战”,靠近落地应用与生意化考研。多模态模子的研发和优化依旧在紧锣密饱读地进行,应用落地并生效跑出生意情状也不能或缺。
AI大模子行业省略已插足淘汰赛阶段,算力、技艺、家具皆成为竞争身分。中国大模子“洗牌年”,大模子公司和云就业厂商们皆在打起精神。
可能就像是田丰在采访中说的:“实施是考研AI的独一圭臬。AI大模子是长跑,投资东说念主和创业者皆需要有信心和耐烦,炫酷的技艺最终照旧要落实到生意化自己,要盈利去赢利。”