本月人工智能：二月份人工智能新闻摘要

2024-02-29 08:00:00 · 飞浪 · 亚当·伊普森

本月的头条新闻：AI 的 Sora、用于工作区的 Google Gemini、Gemma、OpenAI 记忆工具（以及有一天失去理智的聊天机器人）。

人工智能最令人兴奋的地方之一也是最令人沮丧的地方——它的发展速度令人难以置信。事实上，它发展得如此之快，以至于很难跟上它的步伐。这是导致 FOMO 的必然原因，尤其是如果你在技术领域工作的话。

这就是我们在此与您一起解决这一问题的原因，我们推出了本月的 AI 系列。只需阅读几分钟，您就可以了解所有重大新闻，从而随时掌握最新动态。

本月人工智能：二月份人工智能新闻摘要

OpenAI 推出了一款逼真的 AI 视频生成器 Sora

“所以你在报道人工智能新闻？Sora，你觉得怎么样？那些人工智能视频太棒了。”

这几乎就是我本月在每场科技活动中的每一次谈话。2 月份，人们完全被Sora所震撼，这是 OpenAI 推出的一款新模型，它可以将您的文本转换成 60 秒长的视频。它还可以制作高分辨率视频（对于在家的人来说，分辨率为 1920x1080）。

现在，尽管 Sora 只是一个研究预览，但它已经让人们大吃一惊，并引起了一些恐慌。为什么？因为这些视频是 100% 假的，这意味着从现在开始，任何视频都可能完全由人工智能生成。事实上，Sora 可以生成奇幻世界的模拟，例如一个不存在的狂野西部村庄的演示。

简而言之：如果以前相信社交媒体上的匿名视频是个坏主意，那么现在就真的是一个非常非常糟糕的想法。

现在，Sora 确实存在一些弱点，OpenAI 也坦然承认了这一点。它并不总是能理解复杂场景的物理原理，比如因果关系。例如，有人咬了一口饼干，但饼干上可能没有咬痕。它还可能混淆空间细节，比如左右、玻璃破碎，或者物体自发出现。

现在，让我们来想一想，这是有史以来最糟糕的人工智能视频。考虑到它现在的出色表现，未来它只会更加出色。

不过，值得指出的是，制作 60 秒的炫酷演示和制作整部电影之间有很大区别。此外，你经常需要大量优化 AI 视频和照片，才能获得精确的细节。除此之外，目前还没有同步音频生成功能，因此必须单独创建和匹配。

Google 将 Bard 更名为 Google Gemini for Workspaces

现在，尽管每个人都在谈论 Sora，但谷歌本月已经发布了很多公告。最大的公告是它公布了对 Microsoft Copilot 的回应，这是一款可以在 Windows、Microsoft 365 应用程序、Bing 和 Edge 中本地使用的聊天机器人。

（好吧，谷歌确实为谷歌工作区推出了 Duet AI，但是......它已经死了，而且从未真正推出过。）

无论如何，这个竞争对手是Google Workspaces 的 Gemini，如果你是一家在 Google Workspace 环境中运营的公司，那么这将是一个大新闻。现在，Google Workspaces 的 Gemini 可让你在 Google Docs、Gmail、Google Slides、Google Sheets 和 Google Meet 等应用中访问 Gemini 聊天机器人。正如你所期望的那样，它可以帮助你进行写作、设计、组织、文本输入和插图。

Gemini 聊天机器人是 Google 对 Bard 聊天机器人的重新命名，并于本月进行了此次改名。现在，如果 Gemini 听起来很熟悉，就像您可能在三个月前就听说过一样，那么您可能确实听说过。Gemini 与Google 于 12 月推出的旗舰 AI 模型同名。

您可能已经在社交媒体视频中看到过这样的场景：人工智能能够从网络摄像头上“看到”一些东西，比如乐谱，并且能够解释它所看到的东西——这就是 Gemini。

还有人声称 Gemini 是第一个能够在 MMLU 任务中超越人类的人工智能。如果你不熟悉这个缩写词——我不会责怪你——它意味着大规模多任务语言理解，它结合了数学、物理、历史、医学和伦理学等 57 个学科。

但有一个警告：实现此功能的型号称为 Gemini Ultra，并且不供公众使用。现在，它可供公众使用。他们以 Gemini Advanced 的名义推出了 Gemini Ultra，您可以通过 Gemini for Google Workspaces 访问它。

现在，我们来谈谈成本。如果您拥有入门套餐，Google Workspaces 的起价为每位用户每月 6 美元，这是您需要的基准（因为如果您没有入门套餐，您显然无法在 Google Workspaces 中使用 AI。）在此基础上，AI 附加组件每位用户每月需额外支付 20 美元，这相当昂贵！您还必须做出一年的承诺，所以不能按月付费。

用户使用量也有限制。用户每月只能使用 Gemini AI 功能一千次。该功能也只适用于将语言设置为英语的用户，因为 Gemini 就是针对英语进行训练的。

有一个 Gemini Enterprise 计划，每月需多支付 10 美元，该计划允许您举行高级会议，并使用 15 种语言的翻译字幕，以及“完全访问和使用 Gemini”，但目前尚不清楚这意味着什么。

谷歌推出 Gemini 1.5 Pro

继续我们的 Gemini 新闻，Google 还宣布了 Gemini 1.5 Pro，可供早期测试。它的标准上下文窗口为 128k，但私人预览版为开发人员和企业客户提供 100 万个令牌。

现在让我来分析一下为什么它如此酷。一百万个 token 意味着它可以记住或处理 70 万个单词 - 你的普通小说是 10 万个单词。这么多的 token 也分解成大约 3 万行代码、11 小时的音频或 1 小时的视频。

Gemini 1.5 pro 也能产生与 Ultra 相当的质量，但消耗的计算资源更少，这非常好，因为它消耗的能源更少，从而节省了资金并创造了更快的迭代周期。

然而，这是一个有点奇怪的决定，因为 Gemini Ultra 是他们新推出的 Gemini for Google Workspaces 产品的卖点，并且在推出一周后，他们表示有一个更华丽的版本，这使得 Ultra 看起来并不像那个Ultra。

谷歌还宣布推出一系列全新无重量机型

谷歌发布了一系列新消息，其中包括Gemma，这是一系列免费的开放式轻量级模型，其技术与功能更强大的 Gemini 模型类似。这些轻量级模型可以在开发人员的笔记本电脑或台式电脑上运行，并且经过精心设计，可与多种框架（以及 Google Cloud，原因显而易见）进行微调。

这可能是为了与 Meta 一较高下，后者自去年 2 月以来一直在发布 LLaMA 和 Llama 2 等开放式模型。Gemma 还与 OpenAI 的 GPT-4 Turbo 形成对比，后者无法在本地运行。

OpenAI 正在测试记忆工具和 ChatGPT 的 @mentions

好了，关于谷歌就说这么多。你可能会问，ChatGPT 怎么样？本月，OpenAI 表示他们正在测试ChatGPT 的内存控制。目前，ChatGPT 无法记住你不同会话中的任何内容，因此你必须重新告诉它发生了什么，就像《海底总动员》中的多莉一样。

但是有了新的记忆功能，你可以要求它记住一些具体的事情，或者让它自己记住细节。所以，如果你说你喜欢它给你的代码片段，或者把会议记录分成要点，或者你拥有一家咖啡店，它在给你回复时会考虑到所有这些因素。以前，你必须使用自定义指令工具手动输入这些信息，这至少可以说是很烦人的。

您可以随时关闭或清除内存。但是，如果您使用临时聊天功能，您的对话不会用于训练 OpenAI 的模型，那么很遗憾您无法使用此功能。您要么承担这种风险，要么放弃使用这项新功能。

此外，ChatGPT 现在具有 @ 提及功能，可以将自定义人物（称为 GPT）带入任何对话中。GPT 通常是为了执行某项任务或了解某个主题而构建的，因此您可以随时拥有一组专注于该任务的 AI 变体。因此，如果您将其中一个设置为厨师或健康顾问，您可以打电话给他们并向他们提问。

另外，另一则新闻是，ChatGPT 疯狂了一天

今年 2 月，ChatGPT 短暂地出现了一些异常，用户报告称，这款人工智能助手给出了意想不到的、杂乱无章的输出。例如，一位用户分享了一个关于狗粮的问题，问题演变成以下形式：

是的。确实如此。无论如何，原因是大型语言模型试图将数字映射到单词，但选错了，产生了毫无意义的单词序列。显然，这是由于推理内核在某些 GPU 配置下产生了错误结果而导致的，现在已修复。

老实说，我对此感到有点难过，因为再也没有令人愉快的废话了。

这就是这个月的全部内容！

我相信，当你读到这篇文章时，人工智能领域已经发生了更多的事情。我相信下个月我们会在《本月人工智能》中介绍它。一如既往，继续保持优秀，大师们！

错过了过去几个月吗？

查看我们之前的“本月 AI”版本，看看您可能错过了什么！

_{免责声明：本内容来源于第三方作者授权、网友推荐或互联网整理，旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有，其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况，请与我们取得联系，我们将尽快进行相关处理与修改。感谢您的理解与支持！}

_查看原文

人工智能

数据科学

阅读全文