Google Gemini 2.0 发布具有多模式图像和音频输出以及代理 AI 功能

导读谷歌发布了 Gemini 2.0——其最新一代人工智能模型，现在支持代理时代的图像和音频输出以及工具集成。代理人工智能模型代表能够通过自适...

谷歌发布了 Gemini 2.0——其最新一代人工智能模型，现在支持“代理时代”的图像和音频输出以及工具集成。代理人工智能模型代表能够通过自适应决策独立完成任务的人工智能系统。想想自动完成购物或根据提示安排约会等任务。

Google Gemini 2.0 发布，具有多模式图像和音频输出以及代理 AI 功能

Gemini 2.0 将配备多个代理，可以在各个领域为您提供帮助，从在《部落冲突》等游戏中提供实时建议到根据提示挑选礼物并将其添加到购物车中。

与其他 AI 代理一样，Gemini 2.0 中的代理具有以目标为导向的行为。它们可以创建基于任务的步骤列表并自主完成这些步骤。Gemini 2.0 中的代理包括 Project Astra，它被设计为 Android 手机的通用 AI 助手，具有多模式支持和 Google 搜索、Lens 和地图的集成。

Google Gemini 2.0 发布，具有多模式图像和音频输出以及代理 AI 功能

Project Mariner 是另一个可以在网络浏览器中自行导航的实验性 AI 代理。Mariner 现已作为 Chrome 扩展程序向“受信任的测试人员”提供早期预览版。

除了 AI 代理之外，Gemini 2.0 Flash 是 Google 全新 AI 模型的首个版本。目前，这是一个实验性(测试版)版本，与 Gemini 1.0 和 1.5 模型相比，延迟更低、基准性能更好，数学和编码推理和理解能力也更强。它还可以生成由 Google DeepMind 的 Imagen 3 文本转图像模型原生支持的图像。

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

标签：

Google Gemini 2.0 发布具有多模式图像和音频输出以及代理 AI 功能

猜你喜欢

最新文章