- N +

马斯克发全球最大开源模型!3140亿参数的Grok打脸OpenAI了?

马斯克发全球最大开源模型!3140亿参数的Grok打脸OpenAI了?原标题:马斯克发全球最大开源模型!3140亿参数的Grok打脸OpenAI了?

导读:

为了营造网易新闻良好的内容生态环境提升用户体验网易号平台即日起展开辟谣专项行动用户发布上传的内容必须真实可靠准确一切未经证实的虚假信息或具有误导性的信息将被平台及时辟谣及公示要...

为了营造网易新闻良好的内容生态环境,提升用户体验,网易号平台即日起展开辟谣专项行动:用户发布上传的内容必须真实、可靠、准确。一切未经证实的虚假信息、或具有误导性的信息,将被平台及时辟谣及公示。

要闻背景简述

前段时间,马斯克起诉OpenAI并要求开源GPT模型。之后,马斯克在推特上宣布要开源自家公司的大模型。

3月17日,马斯克旗下人工智能公司xAI宣布正式开源Grok-1模型,模型参数达3140亿,是迄今参数量最大的开源大语言模型。

那么,我们可以从Grok-1这一全球最大的开源模型中看到什么启示呢?

以下是王煜全要闻评论:

最近有关马斯克的 真是不断。我们之前介绍过,他成立了一个xAI公司专门做人工智能,现在这公司推出成果了,叫Grok-1大模型。

这个模型有3140亿个参数,是所有开源大模型里参数最多的,所以很多人在惊呼马斯克打脸OpenAI了。

是不是真的打脸OpenAI?我认为可能是反过来的,有可能被OpenAI打脸。

我在这顺便给大家做一堂教学,告诉大家怎么去判断科技产业的未来发展,或者说一个技术到底未来有没有巨大的机会,我相信很多人都想掌握。

还是先给结论,我认为对未来能够有预判主要看两点:一个叫看趋势,另一个叫看模式。

什么叫看趋势呢?就是说任何的技术发展都不是孤立的,往往有一大堆公司相互差距没有那么大,相互伴随着发展,所以从这堆公司的发展来看就能看出趋势来。

那最近的趋势是什么呢?大模型之争还在继续,但是可能到了一个转折点上。

注意最近Anthropic公司推出了Claude 3大模型,它的一些通用性的指标上号称比OpenAI强了一点点,但是在一些专有指标上它强了很多。

这意味着很有可能它并不是大模型胜出了,而是用一些比如说多模态,包括Multi Agents来处理一些事情。

现在很明显人工智能已经往解决实际的应用问题方面去转化了。这种时候看具体的解决问题能力,往往不是看这个模型参数有多大,而是看你有没有相关的一系列的配套的配件,把配件组合起来形成组合拳去解决实际问题。

另外,最近有一个公司叫Cognition,他们强调的就是端到端地解决实际问题的能力。比如,你用他们的AI Devin开发一个程序,或者开发一个游戏,你只需要把指令下完,这个游戏就会完整地开发给你,不需要做任何其他事,它还能帮你挑错,帮你做质量检测。

以前很多人工智能只能解决一个环节的问题,整体的把控包括很多的细节判断还是要人来做。那现在人工智能可以完成完整的工作了。

无独有偶,前一段微软就发了一篇论文,专门讲他们在测试两种不同类型的AI agents。

一种叫APP agent,应用智能体。它解决的是在手机上操作的时候选哪个手机APP。另一个叫作ACT agent,行动智能体。应用智能体选了某个APP了,到APP里面去执行操作就用另一个执行智能体。两类不同的智能体综合起来就能完成一个相对复杂的任务。

所以,有两个大趋势出现了交叉。一个趋势,就是人工智能正在从强调大模型、强调参数、强调性能,转到强调解决实际应用问题。

另一个趋势,我们说2024年开始会出现终端智能。因为终端离每个用户近,尤其是对每个用户的数据收集得比较多,对用户的行为理解会更深刻,那这种时候我在终端就能够更有智能地去帮用户解决问题,这一定是一个发展趋势。

那从终端智能角度上讲,当然更强调解决实际问题了。那这两个趋势融合,你会发现未来很有可能就强调看模式了。

看模式也是说两点。一点就是以前我们说工业革命的模式,尤其是瓦特蒸汽机出来以后,还有人在不断地改进,但是这个性能提升就没那么多了。

按经济学术语来讲,叫边际效益递减,也就是说这种时候再去提升蒸汽机本身的性能就不值当了。

就像今天大模型可能还能提升,但是你提升大模型的性能,可能它的边际效益就不够大了。

那什么时候边际效益能增加?就是要一堆配套的技术,包括像当时的曲轴连杆才能使得蒸汽机能够驱动火车轮船。所以这些配套的技术就特别重要。

那现在的配套技术就是AI Agents,尤其是前一段时间吴恩达提的叫Autonoumous Agent,叫自主化智能体,非常重要。

另一个模式是什么?以前PC硬件主要使用X86结构CPU,当初Intel的CPU可以说是性能最好的。其实到今天很多手机CPU也不能说超过了英特尔的CPU了。

但手机就有一个新的需求,在解决问题的现实场景当中,我需要的并不是足够强大的算力,而是能够随时随地提供算力,甚至说需要能够相对低能耗的算力,别俩小时就没电了。

这种时候,ARM架构的简易指令集CPU变成了主流,也就是后来高通主导的这些CPU。

所以,从过去的历史中可以看到这样一个模式,就是一开始性能是第一位的,但是真到实际应用场景的时候,我们更强调就不是性能,而是解决实际问题了。

现在,手机上需要有智能的时候,就会从云端的强调高性能的大模型,变成了终端的强调在有限算力之下提供一定智能水平的大模型,甚至可能是小模型。

当解决实际问题的时候,你会发现有可能未来的趋势是小模型加上一堆的配套技术,包括和终端上的用户数据、用户互动相结合,它最后的性能甚至会超过大模型。

因为大模型没有那么多的终端用户的数据,尤其是实时的数据,所以它到最后未必能够竞争得过更贴近用户需求的小模型。

所以,从趋势和从模式都能看出来,有可能我们正处在人工智能的一个转折点上,从过去追求性能到现在追求应用,追求解决实际问题。

所以我们得到的结论也是两条。

第一条,即使是马斯克这么聪明的人,离OpenAI也有点远了,对整个人工智能,尤其是生成式人工智能的发展趋势可能理解得就没那么透了,很有可能他是在跟上已经过去的趋势。

马斯克发全球最大开源模型!3140亿参数的Grok打脸OpenAI了?

另一个是给了我们一个重大启示,中国是有机会的。为什么这么说呢?因为如果一味强调模型的性能领先,咱真不一定追得上。

但是,如果是强调解决问题,而且是在有限条件下解决问题,中国有很多很多的高手。想想咱们手机上各种丰富的应用,你就可以想象了。

我们说从2024年开始,手机上会有一大堆的AI原生的APP,就是它有很强的智能性,也有个性化、随身的这样的特点,那么这些很有可能也是中国人制造的。

也就是说,在人工智能时代,我们在应用落地上可能还能领先。当然也是给大家指一个方向,就是如果你要在中国创业做人工智能,我觉得大模型未必是一个好选项,但是贴近用户做应用很可能是有巨大的机会的。

最后,我们也希望把这次评论当做一次演示,希望每一个普通人都不只是看着 ,觉得别人很厉害,别人很牛。而是外行看热闹,内行看门道,看出来这个技术到底如何分析,才知道它的趋势,才知道它的未来发展方向,从而我们也能够把握住技术趋势,成为技术趋势的受益者。

以上是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享。欢迎关注全球风口微信号,报名加入!

王煜全要闻评论,我们明天见!

返回列表
上一篇:
下一篇: