美国韶光周四,OpenAI推出了Canvas功能,还没真正用上呢,不少人看着展示视频就纷纭喊着“炸裂”、“震荡”、以及“这便是AGI终极交互形态”。
作为AI领域的“流量密码”,OpenAI每次发布新产品都会迎来一片叫好,但“一边倒”的热捧真的有理吗?
我们决定不跟风,在拿到Canvas的beta权限并且亲自试用之后,才来和大家分享真实的利用体验。

先说结论:Canvas并不如外界传言般“炸裂”,更不是“AGI的终极交互形态”。
首先,我们来看看Canvas究竟是什么?大略来说,是ChatGPT里一个内置的新交互体验,可以弹出页面以更好地赞助用户进行写作(writing)和编码(coding)。
你可以通过在提示中输入“利用画布(use canvas)”来手动打开,ChatGPT也会在检测到可能有用的场景时,自动打开Canvas。
进入到Canvas的界面,它会在右下角有几个用于写作和编码的快捷键。
对付写作项目,用户可以哀求 ChatGPT 供应编辑建议或长度调度,或者哀求它将一段文本的阅读级别从研究生水平降落到幼儿园水平。它还可以添加“干系的表情符号以强调和着色”。
程序员可以让 ChatGPT 审查他们的代码并添加内联改进建议。它还可以用日志和注释标记您的事情,以帮助调试并使您更随意马虎理解代码。它还能够在 Canvas 模式下修复缺点并将编码移植到不同的措辞,例如 JavaScript、TypeScript、Python、Java、C++ 或 PHP。
更直不雅观的来说,Canvas的推出,就彷佛ChatGPT同时内置了Notion和GitHub Copilot。
听起来很强大是不是?毕竟Notion号称坐拥1亿用户,年营收2.5亿美元,而GitHub Copilot拥有130万付用度户,年营收20亿美元。
仅仅一个Canvas就能同时供应这两种做事,这切实其实便是“终极AGI交互的未来”啊,OpenAI的研究员Karina Nguyen最先在推特上发出了这样的“感叹”。
随后,其他舆论也纷纭跟进,一边倒的站在Karina Nguyen身边。
为什么说Canvas既不足“炸裂”也不是AGI终极交互形态?
我们从触发Canvas这一步提及。
在展示视频里,输入“help me write an api webserver in rust”的prompt之后, ChatGPT自动跳转进入了Canvas界面,并天生了代码,就像VSCode的界面那样。
我复制了一段html代码,并哀求ChatGPT帮我review一下,在输入这些之后,并没有触发Canvas功能,还是勾留在原来的页面。
于是我改变策略,提出了“天生一个用来获取纳斯达克近年来的数据,并进行剖析的Python脚本”这样的prompt。
这次才成功触发了Canvas。
目前,ChatGPT并不能100%准确的识别须要触发Canvas的场景,但你可以通过“use Canvas”或者“open Canvas”之类的非常明确的prompt让它直打仗发。
在周四公布Canvas功能的博客里,OpenAI也承认目前触发Canvas的精确率分别在83%(写作任务) 和 94%(编程任务)。
编程体验不如微软的GitHub Copilot。
在让ChatGPT Canvas天生代码之后,同样的,我哀求微软的GitHub Copilot也基于同样的prompt——“天生一个用来获取纳斯达克近年来的数据并进行剖析的Python脚本”——来天生代码,得到了下面的结果:
两者给出了具备基本功能的代码,但ChatGPT天生的代码看起来更细致一些。
在功能多样性上,我们可以看到Canvas界面的右下角,有五个快捷键,分别是:
1.检讨代码(Review Code):ChatGPT 供应内联建议,以优化和提升代码质量。
2.添加日志(Add Logs):插入日志语句,以便调试和深入理解代码的实行过程。
3.添加注释(Add Comments):向代码添加注释以使其更易于理解。
4.修复缺点(Fix Bugs):检测并重写有问题的代码。
5.移植到措辞(Port to a language):将代码转换为 JavaScript、TypeScript、Python、Java、C++ 或 PHP 等编程措辞。
这些功能GitHub Copilot也都供应,乃至更多。
初体验上,Canvas和GitHub Copilot打个平手。
但真正超越Canvas的地方在于,GitHub Copilot与开拓者的IDE(如Visual Studio Code)深度集成。
GitHub Copilot直接在IDE中事情,为开拓者供应实时的代码建媾和补全。这种无缝衔接大大简化了事情流程,省去了在谈天界面和编辑器之间来回切换的麻烦。
比较之下,Canvas依托于ChatGPT这样一个谈天工具,开拓者仍须要手动将它天生的代码复制粘贴到IDE中,才能运行。
想想看,你是乐意对着一个谈天框苦哈哈地描述你想要的代码,在它天生代码后,手动复制粘贴到IDE里?还是希望在IDE里有个实时跟进的AI助手,在你敲代码的时候默默地随着你的思路,随时蹦出补全建议?
自动补全功能也是开拓者们认为GitHub Copilot优于包括ChatGPT和Claude等供应AI代码编写功能的谈天机器人的地方。
Copilot可以根据开拓者刚刚输入的几行代码自动补全后面的代码,这种“遐想式编程”极大地提高了代码编写速率,而ChatGPT则须要手动描述任务或讯问才能天生相应的代码。
另一方面,GitHub Copilot对项目整体的理解能力是优于Canvas的。GitHub Copilot可以基于全体代码库或项目的高下文来理解代码构造,识别变量、函数、类等内容,而ChatGPT Canvas的代码天生基于当前对话的内容,无法直接读取用户的全体代码文件,因此对项目高下文的理解有限。
而ChatGPT只管在天生代码、阐明观点以及回答编程问题方面表现出色,但在编程效率和与开拓流程的深度领悟方面不如GitHub Copilot,而这正是开拓者最须要的地方。
在笔墨天生方面,它有的功能Notion都有,而且更强。
为了测试Canvas的笔墨生成功能,我让它帮我给一位六年多没见的朋友写一封信,表达我的思念之情。
输入prompt之后,ChatGPT自动触发Canvas界面,并且天生了内容。
邮件内容没有什么可挑剔的地方。在界面的右下角依然是有几个快捷键,分别是:
1.建议修正:ChatGPT 供应内联建媾和反馈。
2.调度长度:根据须要缩短或加长文档。
3.变动阅读水平:调度阅读难度,从幼儿园到研究生水准。
4.终极润色:检讨语法、清晰度和同等性。
5.添加表情符号:加入干系表情符号,增长强调和色彩。
我逐一进行了考试测验,效果如下图:
整体还是挺丝滑的,没什么可以挑剔的。但我转念一想,Canvas的笔墨天生体验离让我感到“炸裂”还是挺迢遥的,我常用的Notion早有这些功能了啊。
于是我让Notion也给我六年不见的朋友写封信,效果也不差。Canvas五个快捷键包含的功能,它也有,并且还有专门针对文档协作管理的更多细分功能。(如下图)
两年前Notion就推出了beta版本的Notion AI,在上周正式向所有用户开放。
Notion AI采取了包括OpenAI的GPT 和Antropic的Claude 在内的多个大型措辞模型,在多样性和灵巧性上显然高于Canvas。
其余,Notion AI与Notion现有的组织、标记和链接工具无缝结合,用户可在同一平台内完成从内容天生到组织的全过程,避免了在多个运用间切换的麻烦;充分利用了Notion平台的协作特性,支持团队成员在共享文档中进行实时协作。
这种无缝集成让用户能在熟习的环境中直策应用 AI 功能,显著提高事情效率,此外,Notion AI 对用户事情环境的深入理解使其能供应更加精准和干系的建议,这是像ChatGPT Canvas这样的独立AI工具难以企及的。
无论是Notion还是GitHub Copilot与Canvas的比拟,都指向了关于AGI遍及的两种紧张发展路径的磋商。
第一种路径由OpenAI、Anthropic等大模型供应商主导。
他们希望将大模型不仅作为根本举动步伐供应,还发展成为一个平台,成为用户打仗各种做事的紧张入口。
这些公司致力于环绕AI构建更多的运用,形成自有生态系统。例如,OpenAI的ChatGPT不再仅仅是谈天机器人,通过插件集成、与文档和API连接,供应生产力工具的多样化做事,最近的Canvas更是OpenAI“野心”的直接表示。
另一条路径则由软件做事商主导,思路是“为运用加上AI”。
在这种模式下,AI作为现有工具的增强功能,而不是一个独立的平台,其浸染在于优化和提升现有软件的智能性和效率。
微软、Google等公司将大模型嵌入莅临盆力工具中,如GitHub、Word、Excel、Google Docs和Google Emails等,使得用户在熟习的事情流中享受到智能赞助,如文本自动天生、数据剖析和智能建议等功能,更加贴近用户需求,提升事情效率。
这种路径强调的是“增强而非替代”——优化已有工具和流程,而不是重新努力别辟门户,创建一个新的平台。目前来看,用户更方向于软件做事商推动的这条路径,由于它依托于大众熟习的工具,无需适应新平台,且实现了无缝的智能化增强。
正因如此,在HackerNews上,开拓者们也普遍表达了类似的意见:
“这(Canvas)很酷,但我希望它能集成到已有的编码和写尴尬刁难象中,而不是作为一个单独的运用程序。”
“如果Apple在Pages等运用中添加类似功能,我一点也不会感到惊异。看来他们对AI的态度是将其集成到现有运用和体验中,而不是制作独立的AI运用。我以为这些独立运用更多是技能演示,展示了可能实现的功能,而不是终极遍及的运用形态。”
估值越高,OpenAI越“焦虑”
本周三,OpenAI宣告完成66亿美元的新一轮融资,估值达到1570亿美元。本轮融资由Thrive Capital牵头,微软、英伟达、软银、阿联酋投资公司MGX等参投。
只管这轮融资标志着OpenAI的估值在九个月的韶光里翻了一番,但也意味着更大的压力还在前头。
翻开《纽约时报》表露的财务数据,就能看出问题所在:今年OpenAI估量能赚37亿美元,听起来不少了吧?可问题是,光是运营本钱和七七八八的开销,就能让公司亏掉50亿美元。
即便收入可不雅观,OpenAI依然“深陷”入不敷出的困境。
更要命的是,投资人也不愿意连续不计回报的“烧钱”了,作为这轮融资的附加条件:公司必须在两年内转型为营利性企业,否则融资将转为债务。
如果无法完成这一转型,OpenAI将面临多重寻衅:现金流紧张、债务包袱加重、融资能力受限,乃至可能导致公司掌握权的改变和创始人股权的稀释。这些潜在风险都将严重影响公司的发展轨迹。
因此,在本轮融资条件公布前,OpenAI已经宣告了架构重组操持,从非盈利向营利部门转型。如今看来,这更像是外部压力下的被动选择。
飞涨的估值也难以粉饰OpenAI对付盈利的焦虑。
Canvas项目的推出是它拓展商业化路径最新的努力,未来我们可能会看到更多类似考试测验。
随着OpenAI增强其技能能力和商业模式独立性,它与微软之间的互助关系或许也会更多的演化为“对抗”,例如Canvas与GitHub Copilot的寻衅便是一个例证。
然而,核心问题依然存在:AGI的规模化运用何时才能真正实现?只有办理这个问题,才能从根本上降落运营本钱、减少亏损。这不仅是OpenAI面临的寻衅,也是全体AI行业必须面对的课题。