谷歌的NotebookLM及其新功能
展示A:谷歌的NotebookLM是一款研究工具,去年该公司以最小的宣扬推出。最近,谷歌通过添加一款名为Audio Overview的AI播客工具来增强NotebookLM,该工具利用户能够在任何主题上创建播客。只需链接到个人资料,如您的LinkedIn个人资料,AI播客主持人便会在九分钟内提升您的自傲心。这个新功能意外地得到了病毒式的盛行。我之前写过关于人们利用它的迷人而独特的办法的文章。
举个例子,我制作了一期播客,重点先容我们125周年纪念的杂志特刊。AI有效地选择了杂志中的主要摘录并总结了其内容。您可以不才面收听播客,体验它所供应的内容。
多模态天生内容的进展
多模态天生内容的领域迅速发展并不断改进。早在2022年9月,我宣布了Meta推出的首个文本到视频模型Make-A-Video。与本日的进展比较,那些早期的视频显得笨拙而过期。最近,Meta宣告了其对OpenAI的Sora的回应,命名为Movie Gen。这个工具利用户能够通过文本提示天生自定义视频和声音,编辑现有视频,并将图像转换为视频。

此外,我们与AI系统的互动办法正在发生变革,对文本输入的依赖在减少。OpenAI的新Canvas界面许可用户与ChatGPT协作项目。用户不再依赖传统的谈天窗口,这须要多轮提示和文本再天生以达到所需输出,Canvas许可用户选择文本或代码的片段进行编辑。
搜索与AI互动的演化
即便是搜索体验也在经历多模态的增强。除了在AI概述中嵌入广告外,谷歌还推出了一项功能,许可用户上传视频并利用语音进行搜索。在谷歌I/O的演示中,该公司展示了用户如何打开谷歌Lens运用,录制一段鱼在水族馆中游动的视频,并对它们提出问题。谷歌的Gemini模型随后将搜索互联网,并通过谷歌的AI天生择要供应答案。
这些功能之间的共同点是涌现了更具互动性和可定制性的界面,许可在各种类型的源材料中运用AI工具。NotebookLM是我在相称长一段韶光内感到惊奇和喜悦的第一个AI产品,这紧张得益于AI声音的独特、真实和令人惊异的特性。然而,只管Audio Overviews在NotebookLM中是一个次要功能,但它的盛行表明AI开拓者每每对用户的共鸣感到不愿定。难以置信的是,ChatGPT本身对OpenAI来说也是一个意外的成功。
我们现在已进入多亿美元的天生AI浪潮。对AI的巨额投资导致内容质量迅速提升。然而,我们尚未找到打破性的运用,这些新的多模态工具是AI公司在天生收入和交付成果方面面临巨大压力的回应。科技公司正在考试测验各种AI工具,以确定哪些会成功。
深度学习:AI天生的图像
AI天生的图像有潜力教导机器人如何有效地行为。