双子座1专业版

Gemini 1.5 Pro更新让AI聆听并生成内容

若昂·卢卡斯·巴蒂斯塔头像
通过新的更新,谷歌的人工智能现在可以理解和分析音频。 Imagen 2 现在可以添加和删除图像元素并创建 4 秒的 GIF

A 谷歌人工智能双子座,在本周二(4 月 9 日)期间收到了一项新的创新更新 Google Cloud Next。随着升级, 双子座1.5专业版,获得了理解和分析音频和视频线路的能力,根据输入应用程序的内容生成内容。

最初,该新功能仅适用于 顶点AI, 软件针对 机器学习 (机器学习),程序员和科学家用来开发新的人工智能。

谷歌的人工智能 Gemini 是做什么的?

Gemini 1 pro更新使ia能够监听并生成内容。通过新的更新,谷歌的人工智能现在可以理解和分析音频。 Imagen 5 现在可以添加和删除图像元素并创建 2 秒的 gif
双子座界面。图片:卢卡斯·戈麦斯/Showmetech

O 双子座谷歌的人工智能于去年12月推出, 取代巴德,并因其处理高度复杂任务(从编码到精致的逻辑推理)的能力而脱颖而出。

人工智能的功能可以帮助用户完成最多样化的任务,操作各种文件,除了组织信息之外,还可以组合不同类型的信息。它的功能允许您使用不同的内容格式,包括:

  • 文本;
  • 图片;
  • 音频;
  • 视频;这是
  • 编程语言。

O 双子座 它具有三种具有不同特性的操作模式:

  • 双子座超 — 更大、更有能力执行高度复杂的任务;
  • 双子座 - 最适合扩展各种任务;
  • 双子座纳米 — 移动任务更高效。

Gemini 1.5 Pro更新及其新功能

Gemini 1 pro更新使ia能够监听并生成内容。通过新的更新,谷歌的人工智能现在可以理解和分析音频。 Imagen 5 现在可以添加和删除图像元素并创建 2 秒的 gif
双子座IA。图片:rafares/Shutterstock)

这家科技巨头提出的这一新模型与之前的模型相比取得了重大进步,在性能和对长上下文的理解方面都有所改进。 双子座 1.5 Pro是可供测试的初始版本,针对各种任务进行了优化,计算效率更高,是一个更健壮的版本,能够满足更复杂活动的要求。

此外, 双子座1.5专业版 包含一个实验资源,理论上可以处理最多 1万个代币 对于大型基础模型,这将是革命性的。根据谷歌的说法,这一巨额金额代表 700.000 个单词和 30.000 行代码,这相当于 一小时的视频 ou 11小时的音频.

Gemini 1.5 Pro 中的新工具允许应用程序对上传到网站的视频的图像(帧)和音频(语音)进行推理 谷歌人工智能工作室,这将有利于内容制作。根据官方信息,Google 的 AI 更新已在超过 180国家 通过 Gemini API(葡萄牙语应用程序编程接口),具有前所未有的本地理解音频的能力和促进文件处理的新 API。

该版本还具有新的系统指令和模式功能。 JSON (用于在计算机系统之间交换信息的轻量级数据格式)。谷歌相信新更新的潜力,承诺文本嵌入模型的性能优于具有类似功能的竞争对手。

O 双子座1.5专业版 目前只能通过 顶点人工智能.

Imagen 2 可以创建 GIF

活动期间 Google Cloud Next谷歌又发布了一个重要公告:AI模型 imagen画质2,它可以生成图像和短视频 提示 的文本。这样,就可以从不同的摄像机角度创建长达四秒的 GIF,并显示运动。

这个工具的不同之处恰恰在于探索的可能性 不同角度,场景更具动感,远远超出静态照片和有限动作生成的AI视频。

Vertex IA 中 Imagen 2 的创作示例。视频:谷歌云/YouTube

O imagen画质2 能够以低分辨率生成视频剪辑,也称为实时图像 640 x 360。此外,谷歌正在使用其技术 合成ID 申请一个 隐形水印 在人工智能生成的剪辑和图像中。该公司声称, 合成ID 可以支持编辑甚至压缩,旨在促进 数据安全.

迄今为止,资源 imagen画质2 只能通过 顶点人工智能,现在包括对内部和外部绘画的支持,以及使用 AI 编辑图像的功能,允许您扩展边框或添加/删除图像的特定部分。针对营销专业人士和活动内容创作以及其他广告作品和视频平台的工具。

顶点人工智能

Gemini 1 pro更新使ia能够监听并生成内容。通过新的更新,谷歌的人工智能现在可以理解和分析音频。 Imagen 5 现在可以添加和删除图像元素并创建 2 秒的 gif
顶点人工智能平台。图片:谷歌/复制品

O 顶点人工智能 是一个平台 机器学习 (ML),支持人工智能工具和应用程序的培训和部署,包括定制用于人工智能驱动的应用程序的大型语言模型 (LLM)。

该平台编译了 Google 的多样化功能和应用程序,集成了数据工程、数据科学和数据工程工作流程。 机器学习,通过一组通用工具实现团队之间的协作,并利用 Google Cloud 的优势扩展应用程序。

A 顶点AI 提供了多种训练和部署模型的选项:

  • AutoML 允许您训练表格、图像、文本或视频数据,而无需编写代码或准备数据拆分。
  • 个性化培训使您可以完全控制培训过程,包括使用 框架 首选的 ML 代码、自己的训练编码以及超参数调整选项的选择。
  • 示范园 支持 Vertex AI 模型的发现、测试、定制和部署,包括模型选择和开源资源 (OSS)。
  • A 生成式人工智能 提供多种方式(文本、代码、图像、语音)访问 Google 大型生成人工智能模型。您可以调整 Google LLM 以满足您的需求,并将其部署在您的 AI 支持的应用程序中。

来源: 一触即发, 谷歌开发者, 汤姆的向导, Beebom, 谷歌云

另请参阅:

评论者 格劳孔生命力 在10/4/24。

注册接收我们的新闻:

发表评论

您的电子邮件地址将不会被发表。 必填字段标有 *

相关文章