【新智元导读】Llama 3的开源,或将催生数十亿美元新家当。发布不到一周的韶光,全网各种测试微调都开启了。乃至,Llama 3在Groq上的输出速率实现了每秒800个token。
Llama 3出身之后便艳压群雄,开源界已无「模」能敌。
乃至,让网友为OpenAI捏了一把汗!

现在的Llama 3-70B已经一起攀升到大模型排行榜前列,仅次于GPT-4,打败了Claude 3 Opus。
没想到,70B都这么能打,400B切实其实不敢想象。
英伟达高等科学家Jim Fan预言,「GPT-5一定会在Llama 3 400B发布之前出世」!
还有网友认为,「我们现在有了一个顶级的开源竞争者,OpenAI的巨大上风已经不复存在」。
从Llama 1,到Llama 2、代码版Code Llama高调开源,颠覆了全体大模型圈,掀起新模型构建狂澜。
如今的Llama 3,对全天下意味着什么?
数十亿美元新家当将呈现
Hugging Face创始人Clement Delangue称,目前基于Llama 1和2构建的开源模型已有30000多个。
目前,Llama 3是最强大的开源模型,肯定会对生态系统产生重大影响。
在一个总榜上,Llama 3超越了许多的开源、闭源模型。
发布不到一周,AI社区研究者们已经猖獗开启了对Llama 3的测试、微调。
Reddit网友利用Llama 3 70B,非常轻易地制作了一个完美的「饕餮蛇」游戏,并且在苹果测试中表现精良。
但最令人振奋的是,这个模型可以进行微调。
它绝对会猖獗发展。任何中小型公司都可以利用Llama 3 400B将生产力提升到空出息度。
还有人通过HF Chat利用葡萄牙语测试LLaMA 3,结果创造其超出预期,通过了推理测试。
仅用一张英伟达2070显卡,开拓者利用Llama 3 8B升级了本地离线AI。
竟创造,与这个AI助手AniyaAI的对话更有人情味儿了。
目前,一个全新的微调新模型dolphin-2.9-llama3-8b出身了,已在Huggingface上发布。
还有网友在M1 MacBook上利用mlx框架,测试创造llama 3 8b的速率约为95 token/秒。
对付Meta来说,Llama 3不仅仅是一个研究项目。
它更是Meta将AI接入其弘大的运用和做事生态系统计策的关键部分。
小扎在最新采访中透露,Llama 3停滞演习后,仍在学习。Meta之以是停滞演习,是由于须要GPU来开始测试 Llama 4。
值得一提的是,Llama 3的贡献者名单中也有小扎。
AI创业公司Abacus AI的首席实行官表示:
「Llama 3 400B将彻底改变天下,成为一个巨大的加速器!
你可以利用GPT 4-5级别的模型做非常强大的事情。
想象一下,将模型微调为AI年夜夫、AI经理,或AI女友。未来,基于这个根本模型,将会呈现代价数十亿美元的初创公司」!
每秒输出800个token,Llama3惊呆网友
另一边,Groq也第一韶光供应了对Llama3 8B和70B的支持。
网址:https://console.groq.com/docs/models
Groq Cloud供应的支持,可以让大家在没有GPU的情形下利用这两个大模型。
这无疑是对硬件资源不敷、难以运行模型的眇小企业与个人的巨大利好!
并且,Llama3在Groq上的表现也尤为惊艳:模型能以每秒超过800个token的速率运行!
而一贯以来的大模型王者GPT-4和新晋之秀Claude 3 Opus,其天生速率也仅有每秒36 token和18 token!
这险些是革命性的飞跃!
Clamath与Groq的 CEO认为:接下来,Groq将拥有比所有大型科技公司的总和还要多的AI天生能力!
800 token/每秒的速率,意味着大模型将更具本钱效益,并能在更广泛的范围内运用、落地。
而Llama3媲美GPT-4级别的实力,打开了未来AI的无数种可能性。
网友们的亲自体验更是力证了这一点!
首先是大略的从1到500的计数。
GPT-4还在卡顿时,Groq上的Llama3刚一吸收指令就已经完成了任务。
当Llama3已经完成任务半天了,GPT-4连100以内都没计数完。
然后任务难度升级,哀求模型用Python编写饕餮蛇游戏:
Groq上的Llama3不到3秒就结束了战斗,而GPT-4却用了半分多钟才搞定。
接着另一个程序员网友试着让Llama3创建一个用PHP编写的待办事项列表。
指令刚发出就得到了却果,网友大为震荡,评价这次的利用体验:
「就像光速一样。」
同时,在调用多个工具完成任务方面,Llama3的表现依旧惊艳!
调用工具所用韶光小于4秒,面对繁芜的财务问题,回答也仅用了2.9秒。
就连抓取全体网站供应给Llama3,它也可以在短短几秒内就完成相应。
乃至Llama3的8B模型2秒就能让完全的文件从λ-Calculus 转换为惯用的JS......
体验过的网友直接惊呼:「这是什么邪术?」
最让人震荡的是,Groq上的模型还都是免费开放的,团队乃至没有制作付费选项!
在如此精良的性能和强大免费的攻势下,已经有人宣告
「我不会再用GPT-4 Turbo了。」
与Groq上的Llama3的光速相应比较,ChatGPT的缓慢已经引起了大多数用户的不满。
有人制作了利用了Groq上的Llama3后,再切换到ChatGPT上的GPT-4体验的表情包:
更有网友锐评:
「就连Claude都比ChatGPT快!
它的缓慢有时让我昏昏欲睡。」
虽然有人厌倦了ChatGPT的缓慢,但也有人认为GPT较慢的天生反而增加了内容的可读性,也更适宜人机交互。
「快速获取数据的确非常棒!
但较慢的天生有利于内容的可读性和对任务流程的理解,这对用户体验来说更友好。」
此外,也有人认为Llama3的回答准确率不怎么高,不能只看速率不看质量。
OpenAI上风将不复存在?
从Gemini到Claude 3接连叫板,再到类GPT-4级别的开源400B模型预报,GPT-4真的危了!
许多网友纷纭在线催更GPT-5。
据传言,OpenAI有可能在22日(当地韶光周一)有大动作。
由于那天,恰好是奥特曼的生日。
与此同时,OpenAI官方账号还发了一个有着数字「22」标志的王座。
不过比来,奥特曼在采访中曾表示,OpenAI有改进模型的义务,以是我们会把所有初创公司干掉。
但在还没有发布GPT-5之前,初创公司须要有危急感了。
参考资料:
https://x.com/op7418/status/1781602335619494239
https://x.com/verysmallwoods/status/1781479061144940736
https://x.com/svpino/status/1781362565786075525
https://x.com/DrJimFan/status/1781386105734185309