本月人工智能：五月份人工智能新闻摘要

2024-06-03 08:00:00 · 飞浪 · 亚当·伊普森

微软的 Copilot AI 笔记本电脑、Github Copilot 扩展、主要参与者的最新模型发布等等。

人工智能发展速度惊人，快得让人感觉自己必须成为一台机器才能跟上它的步伐！我们将本月所有重大新闻汇集到一处，为您提供帮助。只需浏览一下这篇文章，您就可以了解本月所有重大的人工智能发展并随时了解最新情况。喜欢听吗？观看包含所有更新的视频。

微软推出 Copilot+ 型号和 PC

本月，微软发布了 Copilot+，这是一种生成式 AI 模型，它位于笔记本电脑内部，而不是云端。考虑到过去二十年来，我们已经从本地迁移到云端，这似乎有些落后。但通过将其安装在硬件上，延迟显然很低，而且 AI 可以使用所有本地数据来帮助你。例如：

查看你的会议记录并建议在特定时间与你的老板安排一次后续会议
在混乱的本地目录中找到所需的图像
根据你最近与朋友的对话，找到送什么生日礼物的线索

基本上，你为人工智能提供了关于你的背景信息，以便解决你的问题，而这些信息如果提供给基于云的人工智能，至少要以一种安全且高效的方式，则非常麻烦。这个想法是，你笔记本电脑上发生的事情，会保留在你的笔记本电脑上。

当然，这需要强大的处理能力。因此，许多 PC 制造商推出了一种名为 AI PC 的新型笔记本电脑，旨在运行 Copilot+ 等设备上的 AI 应用程序。

那么，如果您想在没有 AI PC 的情况下运行 Copilot+，该怎么办？我的意思是，只要是一台好笔记本电脑，您就可以。您无需跑出去购买一台，只需使用本地版本的 Copilot。它只会很快耗尽您的电池，所以不要拔掉它们的电源。AI PC 的好处是它不会疯狂地耗尽您的电池，而且运行效率更高。未来，预计将有更多 AI PC 成为常态，涌入市场。

GitHub Copilot 扩展

Github 刚刚宣布推出GitHub Copilot Extensions，允许第三方提供商扩展 GitHub Copilot 的功能。结果呢？开发人员可以更高效地开展工作。

现在，如果您是一名开发人员，您可能正在处理与数据库相关的错误。您可能必须跳转到 DataStax 中的审核日志，转到 Sentry 进行错误监控。然后找出解决方案，应用修复程序并在 Azure 中部署。这需要很多麻烦。使用 Copilot Extensions，您可以从 Copilot Chat 调用所有这些工具，执行操作，生成文件和拉取请求。这些扩展将可通过您的所有 Copilot Chats 访问，例如在 Visual Studio、Visual Studio Code 和 GitHub.com 中。

首批扩展中有十几个来自 DataStax、Docker、LambdaTest、Azure、MongoDB 和 Stripe 等公司的扩展。但 GitHub Marketplace 将提供向所有人开放的扩展，并且您将能够使用自己开发的开发人员工具创建私有的 Copilot Extensions。要立即使用 Copilot Extensions，您必须注册有限的公开测试版。

Azure AI Studio 正式发布

说到将所有东西都集中在一个地方，Azure AI Studio 现已全面推出。在这个工作室里，你可以使用视觉和代码优先工具以简化的方式开发和部署 GenAI 应用程序。该工作室是在去年的构建中推出的，但现在已全面开放。

OpenAI 推出 GPT 4o

本月的重磅新闻是OpenAI 发布了 GPT-4o。现在，40 很容易读出来，然后想……“嘿，我是不是错过了其他 36 个 GPT 版本？”但 O 代表 Omni，因为这个新版本可以接受语音、文本和视觉输入。它还可以实时响应音频，从音频和视频中检测用户的情绪状态，并调整其声音以传达不同的情绪。

现在，我要花点时间放纵一下，享受一下“我早就跟你说了”的感觉。早在 2023 年，我就写了一篇文章，创造了“全模式人工智能”一词，用来描述能够将所有五种感官作为输入并进行交互的人工智能。现在，我们正在向这个未来迈进。

现在，OpenAI 的版本还不是全能的——它仍然是多模式的，因为它不能将触觉、嗅觉或味觉作为输入。如果这看起来有些牵强，请阅读我的文章，了解为什么它不会如此。在使用 GPT-4o 后，用户界面仍然阻碍了它像与实时、真正的数字助理交谈一样。但这仍然是一个非常令人印象深刻的进步，当然，如果你正在为你的组织使用 GPT 模型，那么它是另一个更强大的模型供你使用。

开发人员现在还可以在 API 中以文本和视觉模型的形式访问 GPT-4o。与 GPT-4 Turbo 相比，GPT-4o 的速度提高了 2 倍，价格降低了一半，速率限制提高了 5 倍。OpenAI 计划在未来几周内向 API 中的一小部分合作伙伴推出对 GPT-4o 新音频和视频功能的支持。

新的 Google 型号：Gemini 1.5 Flash、Vio、Imagen 3、AlphaFold 3

谷歌本月发布了大量新机型。让我们深入了解一下：

在 Gemini 家族中，他们推出了Gemini 1.5 Flash。如果你是一名需要更低延迟和更低成本的开发人员，那么这款新型号是 1.5 Pro 的一个很好的轻量级替代品。
Veo是OpenAI 的 sora 的竞争对手，它可以根据文本提示创建高质量的视频。
Imagen 3，一个文本到图像的模型，可以制作出一些非常逼真的照片。
AlphaFold 3是一种先进的人工智能模型，它不仅可以预测蛋白质的结构，还可以模拟 DNA、RNA，甚至“所有生命分子”的结构。这将帮助医学、农业、材料科学和药物开发领域的研究人员测试潜在的发现

微软 Phi-3 家族进一步扩展，可在 MAI-1 上运行

微软本月在 Azure 上扩展了 Phi-3 系列，推出了Phi-3-vision，这是一种将语言和视觉功能融为一体的多模态模型。他们还在 Microsoft Azure 上推出了 Phi-3-small 和 Phi-3-medium。

在幕后，微软还在内部开发一种名为MAI-1的新 LLM 模型，该模型显然将拥有 5000 亿个参数。这高于 Llama 3 的 800 亿个参数，但低于 GPT-4 传闻的 1.7 万亿个参数。话虽如此，MAI-1 仍在开发中，尚未正式公布。

其他 AI 新闻……

IBM 现已开源其 Granite 代码模型，该模型经过训练可简化代码流程。据 IBM 称，这些模型通过自动执行常规和复杂的编码任务来提高生产力。如果您想试用它们，可以在 GitHub 上找到它们。
Anthropic 找到了一种新方法来了解法学硕士表面之下发生的事情，破解了 Claude 法学硕士的黑匣子。您也可以通过查看他们的研究论文来深入了解这些奥秘，看看人工智能的神经元是如何激发的。
谷歌推出了SynthID，这是一种为 AI 生成的文本和视频添加水印的工具，以确保真实性并减少错误信息。
而谷歌Deepmind则推出了Frontier Safety Framework，用于指导AI产品的安全开发。

这就是这个月的全部内容！

这就是本月 AI 的总结！如果您想及时了解所有最新消息，请务必关注我们的YouTube 频道。您还可以查看我们的博客，了解有关这些故事等的深入文章。

保持好奇心，保持消息灵通，并且一如既往地保持出色，朋友们！

_{免责声明：本内容来源于第三方作者授权、网友推荐或互联网整理，旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有，其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况，请与我们取得联系，我们将尽快进行相关处理与修改。感谢您的理解与支持！}

_查看原文

人工智能

数据科学

阅读全文