× 快速导航
新闻资讯
分类
NG体育微软:AI 不抢你工作只当副手
发布日期:2023-06-08 02:55:20

  NG体育乔布斯曾将计算机比作大脑的自行车——人踩上脚踏板,速度就快了几倍;用上电脑,创作效率也成倍提升。在昨夜举办的微软 Build 开发者大会上,微软 CEO 萨提亚·纳德拉(Satya Nadella)重复了这个比喻,“随着 ChatGPT 出现,自行车变成了蒸汽机”。

  过去 4 年,微软向 ChatGPT 开发者 OpenAI 投资了 130 亿美元,拥有独家商业合作权利。而微软靠着 Windows 系统、Office 办公软件等一系列应用,深刻影响着全球数十亿人如何工作,去年从中净获利 727 亿美元,是腾讯的五倍。

  ChatGPT 的诞生颠覆了人们对未来工作的想象,但大语言模型存在缺陷,会一本正经胡说八道,给出错误建议。早已出发的微软,希望进一步扩大优势。

  在 Build 大会上,纳德拉和微软的高管们展示了一个更宏大的规划:如何在人工智能技术有缺陷的情况下,把它融入到微软所有核心业务中,让更多人和人工智能一起工作。

  Copilot(副驾驶)是微软 Build 大会上的关键词。据微软解释,Copilot 是用现代人工智能和大语言模型(如 GPT-4)协助人们完成复杂任务的应用。

  人工智能早已大规模入侵现实世界,每一个社交、电商平台都在用人工智能算法推荐内容和广告、兜售商品。纳德拉上周接受采访说,这是人工智能的自动驾驶时代——人工智能作为一个黑匣子,自主决定最终结果。而微软正在做的事情,代表着人工智能从自动驾驶时代转向了副驾驶时代。

  “虽然(人工智能)发展速度快,但方向正确,人类掌握着更多主导权。” 纳德拉说。“让人类参与其中至关重要,可以充分利用技术带来的好处。” 人工智能大模型仍有缺陷的现在,Copilot 也可以尽可能减少 AI 的负面影响。

  他提醒 Copilot 只是辅助人们工作,而不是取代人们。“它会给你一个不完美的想法,你在这个基础上动手”,毕竟 “有时它是对的,有时也会出错。”

  在 Build 上NG体育,微软副总裁优素福·迈赫迪(Yusuf Mehdi)用 Word 协助起草一份加州的法律合同的 Demo,展示了 Copilot 如何提高工作效率。

  用升级后的 Word 打开通用的合同文本后,点击工具栏右方的 Copilot 按钮,会出现供用户输入需求的对话窗口。用户希望知道法律条款是否符合加州的法规时,Copilot 会调用 WestLaw 插件给出分析。用户希望修改特定责任条款时,Copilot 会调用插件阅读文档,找到特定的段落修改,并给出修改的摘要。“这是一种更有力地起草法律合同的方式,” 迈赫迪说。

  同样,Copilot 是低成本完善人工智能系统的方法:每个用户一边向微软付钱使用软件,一边帮着人工智能更有效完成自己的工作,也帮着人工智能变得更有用NG体育。

  微软的首席技术官凯文·斯科特(Kevin Scott)称,过几年,软件没有 Copilot,就会像今天软件不联网那样匪夷所思。

  事实上,早就有公司做到了这一点。比如特斯拉的 “全自动驾驶”(Full Self Driving)系统,把辅助驾驶系统卖给车主,让他们给出反馈。过去几年,这套辅助驾驶系统给特斯拉贡献了数十亿美元收入,帮助特斯拉的系统变得更强。

  “过去 20 年的科技行业中,我看到的一个错误是,人们经常专注于基础设施,而不是产品。” 斯科特说,他一遍又一遍地提醒微软内部团队这件事。

  “技术是伟大的。它让一大堆不可能、不可行或昂贵的事情变得可能、可行、更便宜。但模型不是你的产品。”

  ChatGPT 和它背后的大模型,吞掉了海量文本数据,但还有许多具体的事情处理不好。比如它很难给出所有数学题的正确答案。今年 3 月,OpenAI 推出 GPT-4 后不久,便上线了插件系统,借助现有的软件和服务生态,绕开它解决不好的问题。当用户寻求解答复杂的数学题时,可以选择计算知识搜索引擎 Wolfram Alpha 的插件,获取准确答案。

  微软把插件视为桥梁,连接公开数据训练的大语言模型和不同公司的保密数据。当用户向人工智能 Copilot 提出特定场景的问题时,由特定公司开发的插件给出更好的回答。

  插件也是微软扩充大模型能力的关键。“你或许经常听到,基础模型很强大,但它不能做所有的事情。”斯科特说,“即使模型本身并不完整或完美,你也可以用插件增强 Copilot 或人工智能应用程序,让它做更多的事情。”

  这也是微软建立人工智能生态的尝试,其庞大的用户基础确保了开发插件对开发者有吸引力。

  ChatGPT 已经成为一个超级入口,它是最快突破 1 亿月活用户的消费级应用(只花了两个月)。据流量监测网站 SimilarWeb 数据,ChatGPT 4 月全球访问量为 17.6 亿次,仅次于 Google、百度和 Yandex 三家搜索引擎。在 Build 大会上,纳德拉宣布的第一个重要进展,就是把 Bing 作为插件接入 ChatGPT Plus 中,未来开放给所有 ChatGPT 用户。

  微软自己的用户数也足够多。据微软发布的一份统计报告,不算盗版用户,全球共有约 15 亿 Windows 操作系统用户、12 亿 Office 办公软件用户。微软和 OpenAI 完全有希望做出来一个人工智能时代的 App Store。迈赫迪说,现在微软和 OpenAI 的系统中已经有 50 多个插件,即将上线的插件有数千个。

  如果说微软用 Copilot 改造业务是为了迎上技术革新的步伐,插件则展示了它希望在这次技术革新中向前一步。

  斯科特说,这些插件就像是数字世界的执行器,可以增强人工智能系统,使其能够行动。演讲最后,他举了一个自己心目中 “传奇” 工程师如何用一次小的技术更新重塑行业的例子,“现在是我们所有人的时刻”,并用一句 “Do Legendary Shit” 作结语,引起整场观众热烈的回应。

  把大模型部署到更多场景中需要更多算力。据 The Information 等媒体报道,在全球 60 多个数据中心部署数十万张 GPU 的微软,因为 ChatGPT 掀起的需求激增而面临算力紧缺的局面。

  斯科特现在负责协调微软的 GPU 预算和调配。他说这个工作 “既糟糕又痛苦”,因为 GPU 根本不够用。在 Build 上,微软的高管们没有明确透露如何解决未来算力可能更加紧缺的问题。

  Google 选择将部分人工智能应用的算力消耗(比如查询和推理)转移至用户的电脑或者手机上。对于个人用户来说,最可靠的计算能力还是手里的手机、家里的电脑。如果你不玩游戏,这些设备中的算力都是冗余的。大模型如果能把这些冗余的计算资源变得有用,不仅可以让数十亿用户分担计算成本,还能推动终端硬件性能继续向前迭代。

  在半个月前的 I/O 开发者大会上,Google 发布了新的大语言模型 PaLM2。PaLM2 分好几个版本,参数最少的版本壁虎(Gecko)可以在手机等移动设备上离线运行。

  参数是大模型从大量数据中提炼的规律和特征。通常情况,参数越大,大模型的能力越强,消耗的算力会越多。Google 已经做到了用更少的参数实现更好的效果。但一个模型的参数如果少到足以在手机上快速运行,能力会有较大折扣,胡说八道的概率会提升。

  微软和 OpenAI 看上去不打算选择这条路。GPT-4 没有参数规模更小的版本、不支持在终端离线运行,OpenAI 跟微软也都没透露将计算转移到本地的相关计划。斯科特在 Build 上介绍 Copilot 的技术体系时,指出微软的基础模型和人工智能基础设施能力,都会通过 Azure 输出。

  按照微软和 OpenAI 目前的设想,运算依然在微软的数据中心完成,用户联网获取答案。但他们预期随着算法进步、硬件迭代,完成一次运算需要的算力会降低。

  OpenAI 曾做过一项研究,2020 年训练一个 AlexNet (一种用于图像识别的卷积神经网络)级别的神经网络所需计算量减少为 2012 年的 1/45,同期由摩尔定律代表的硬件效率提升只能带来 11 倍的成本优化。

  OpenAI 总裁格雷格·布罗克曼(Greg Brockman)在 Build 上说,GPT-4 现在很贵,并不完全可用,但未来会发生变化,仅过去一年 OpenAI 就把 ChatGPT 的成本降低了 90%。他相信类似的降本效率能持续下去。斯科特也跟着强调,那些今天看上去很贵的事情明天可能就便宜下来。

  Google 宣布将用生成式人工智能改造广告业务。当用户搜索时,Google 的大模型会根据搜索关键词生成有针对性的广告标题。

  Adobe 发布了内置 AI 的测试版 Photoshop。用户只需要输入文字,它可以自动修改图片。Adobe 称,这一新功能会在今年下半年在 Photoshop 中全面推广。

  没人能准确判断生成式人工智能究竟将如何重塑人类工作。但可以肯定的是,全球最重要的生产力工具平台都在向这个方向全力投入,从不同角度探索,尽快让改变成为现实。