谷歌的 NotebookLM 旨在成为终极写作助手
史蒂文·约翰逊已经写了13本书,涵盖的主题从伦敦霍乱爆发到视频游戏的价值。他曾是电视节目主持人和播客主持人。他是一个主题演讲者,在LinkedIn个人资料中并不需要自称如此。而且现在已经有一年多时间,他成为了谷歌的全职员工,这一身份在我进入位于纽约切尔西办公室时就显而易见了,他带着我的通行证向我展示他的团队所创建的东西。
它被称为NotebookLM,最简单的理解方式是将其视为一个人工智能合作者,可以访问您所有的资料,并指导您完成项目。NotebookLM今年早些时候已经进行了发布,但现在对所有人都可用作为一种“实验” — — 这是谷歌以低风险方式来观察该应用程序的行为和我们与该应用程序互动的方法。
约翰逊通过对软件的终身迷恋找到了通往谷歌的道路,将其视为“一个充满活力的思想伙伴”,一种加快和增强创造过程的工具。当他还在大学时,他对HyperCard产生了痴迷,这是苹果公司开发的一款将知识分解成块并通过链接在信息空间中导航的软件。它预示着互联网存在之前的网络导航方式。“我曾努力将HyperCard变成那个梦想中的工具,但它还不够完善。”他说。最终,他成为Scrivener软件的爱好者,这是一款深受书籍作者欢迎的组合文字处理器和项目组织工具。(我也是一个粉丝。)
当约翰逊在2021年获得OpenAI的GPT-3文本生成器的使用权限时,他意识到人工智能可以提升一代新的思维工具。哦,等等,他自言自语道,我一直心中所想的事情现在将成为可能。甚至在一年前都无法想象的场景突然变得可行。约翰逊还不知道谷歌不仅拥有类似规模的大型语言模型,而且已经在一个与他思考非常相符合的项目上进行了工作。2022年5月,在实验性谷歌实验室部门中,一个小团队给约翰逊发来了冷邮件。他们通过Starline安排了一次会议,这是谷歌实验室的一个项目,可以进行近乎亲密无间的面对面会议。“我基本上和一个全息图交流,并说:‘你知道吗?你追求了整个生命中这个东西?我们终于可以建造出来了’”,约翰逊说道。起初,他成为该小团队兼职顾问,并分享专业作家的工作流程。“这里有四五名工程师、一位真正的作者,请让我们观察他。”这就是Google实验室负责人乔希·伍德沃德对这个过程的总结。最终,约翰逊参与了产品本身的开发,并被吸引到接受全职工作的地步。他在Google实验室的头衔是编辑总监。
NotebookLM,最初被称为Project Tailwind,首先通过从Google Docs或剪贴板中将源材料拖入工具来创建一个数据集。在应用程序消化了所有内容之后,您可以向NotebookLM提问有关您的材料的问题,这要归功于谷歌强大的语言模型技术 — — 部分由其刚发布的升级版Gemini驱动。答案不仅反映了您源材料中的内容,还体现了Gemini对世界更广泛理解的认知。一个关键特性是每个查询答案都附带一组引文报告信息来源的确切位置,以便用户可以检查其输出结果的准确性。
谷歌并不是唯一一个设想让人们创建自定义数据集以便使用LLM进行探索的公司。在OpenAI上个月的开发者日活动中,该公司推出了可以针对特定任务进行调整的个性化迷你GPT。伍德沃德承认存在“核心相似之处”。但他认为NotebookLM更注重提升工作流程,并且旨在提供更高准确度的输出结果。此外,他表示OpenAI产品具有更多个性化特点,而NotebookLM则设计成没有这种做作倾向。
我已经使用NotebookLM玩了几个星期。对我来说,写作过程中最烦人的部分一直是不得不频繁离开我的手稿去找到我需要的确切信息,这些信息可能在一个记录或文档中,我想要参考或引用它们。在写这篇文章时,当我想起约翰逊的正式头衔时,只需请求一下,NotebookLM立即提供了答案。但那只是它更普通的用法之一。更深层次的功能体现在它能够提供关于你所引用材料的分析 — — 不仅仅是事实本身,还有整体描绘出来的画面。在输入完资料后,NotebookLM似乎会自己形成对该主题重要性的看法,并为你提出问题和探索主题提供建议。尽管伍德沃德表示NotebookLM没有个性,但它确实喜欢说话。甚至问一个简单问题像约翰逊的头衔也会得到四个要点列表回答。
因为我的消息来源是三位谷歌员工和一篇公司博客文章,所以 NotebookLM 的输出结果不出所料地反映了谷歌希望世人对 NotebookLM 的看法。在询问有关这些信息源的问题时,我不断提醒该应用程序我并非从谷歌的角度来写作。当我要求 NotebookLM 用最简单的方式描述自己,希望它能帮助我在本文第一段中表达一个简短的描述时,它回答说它钟爱使用项目符号进行列举。我要求它将此缩减为一句话,并避免像公关说明那样读起来。以下是它给出的回答:“NotebookLM 是一个实验性的 AI 动力笔记工具,通过阅读和理解您的文件、生成摘要、回答您的问题甚至帮助您构思新想法来帮助您更快地学习。” 这是一个令人印象深刻且支持着10个引证(citation) 的总结,但没有反映出最重要的观点 — — 我的观点。这很合适,因为提供观点是由我负责。而且我也很高兴 NotebookLM 没有试图用华而不实(可悲) 的语言给人留下深刻印象,因为这也是我的工作。
但是我有一个担忧。NotebookLM的用户,他们只是想快速完成一项良好的工作,可能不会花时间去进行那种需要思考的艰苦工作。他们甚至可能懒得自己研究材料。为什么要花时间呢?你的人工智能伙伴已经比你更仔细地阅读了这些材料,并且已经对它达到了一些很棒的结论,为什么还要费心呢?约翰逊似乎没有像我这样担心这个问题。首先,他指出用户没有义务与应用程序进行概念性讨论:他们可以愉快地使用它来查找某人被标识为标题等内容。但是他明显觉得参与此类对话非常有优势。他对于NotebookLM提供主题建议感到兴奋。而且您甚至可以使用一种模式,在该模式下NotebookLM可以批评您的工作并辩论相反立场。“如果我真正有兴趣获得独特见解,NotebookLM应该能够帮助我减少麻烦”,他说,“甚至可能获得更有趣的见解。” 这让我想知道:现在那个观点将属于谁呢?
随着我们越来越重度地使用更多的人工智能工具,这个问题变得至关重要。在整个2023年里,我一直在思考和写作关于人工智能的内容,现在我可以比NotebookLM更简洁地总结出我的主要担忧。我们的未来将会被协同驾驶(AI作为合作者)和自动驾驶(人类作为AI的助手)之间的紧张关系所定义。后者从狭义上讲,在劳动经济学意义上更高效且更便宜,但也带来了各种麻烦。
指出这一点绝不是对NotebookLM的嘲讽。我只是以我们当前的AI模型无法比拟(至少目前如此)的方式行使我的评论权力。与此同时,史蒂文·约翰逊与他的Google实验室团队合作,已经达到了技术产品的黄金标准 — — 构建了他最渴望自己使用的工具。现在他可以在Google度过更多时间,并且也许会遭受得到你所要求之物带来的诅咒。
时间旅行
史蒂文·约翰逊对思维支持工具的热情始于苹果公司极具影响力的HyperCard软件。在我1988年2月份《Macworld》杂志上的专栏中,我自己也沉思过HyperCard,试图评估这个迷人程序以及通过一种预互联网视角浏览世界信息海洋的概念所拥有的能力。当时,我对这样一个项目是否能够获得资金持怀疑态度,并没有预料到它最终会成为由谷歌推动、其使命是使全球信息普遍可访问的一项自下而上的事业。但是,我确实正确地预见了我们现在在ChatGPT时代面临版权问题。
这个愿景的拥护者队伍很长,从1945年的范纳瓦尔·布什开始,一直延续到特德·尼尔森,他创造了超媒体这个词。苹果董事长斯卡利谈到他相信HyperCard及其后代将使我们摆脱“书籍线性格式的限制”,在许多情况下,“以你思考的方式”链接信息将消除乏味的开头、中间和结尾惯例。我们的小说可能会开始像南美作家胡里奥·科塔萨尔写的《跳房子》这样,该诺贝尔奖得主声称他书中的155章可以按任意几种不同顺序阅读。在超媒体世界中,非虚构类图书不再是从前到后阅读,而是被混合进某个世界信息库,在数百万种方式中与其他相关信息相互链接。引用斯卡利所言,使用这种模式“使用户能够随时召唤出所需信息,并根据需要进行调整”。
这让我觉得是一个不太可能的情景,至少在一些评论员预测的规模上。实现超媒体梦想面临着一项巨大任务:所有世界知识都必须以数据形式输入并上线。
版权和合理使用的问题也必须得到解决,这意味着需要大量律师工时。在一个有太多人无法获得足够食物和住所的世界里,我们的太空计划停滞不前,企业变得精干而高效,每一分闲钱都用于破坏性工具上,很难想象这个数十亿美元项目会真正启动。
毫无疑问,快速获取信息的方式 — — 有朝一日可能被称为HyperCard传统 — — 将改变我们进行研究和获取知识的方式。但在不久的将来,任何变化都将以更加适度的规模发生。与此同时,让我们不要让关于信息高速公路的谈论模糊了我们眼前所见:一个名为HyperCard的绝妙程序。它已经存在,并且是真实可行的,我们所有人都需要努力弄清楚如何充分利用它。
Google’s NotebookLM Aims to Be the Ultimate Writing Assistant
