谷歌人工智能创建的照片

Google 的 AI Imagen 从文本创建图像

维克多帕切科头像
Imagen 是一种工具,可以生成仅包含文本描述的图像,但它可能是随机的

您键入包含详细信息的文本,稍等片刻,然后根据书面描述生成互联网上从未见过的图像。 这就是我们如何解释 图像, 新人工智能 Google 该公司宣布这是一个有趣的选择,应该有助于业界更多地了解 机器学习 (机器学习)。 

新颖性加入了已经完成相同工作的其他人工智能选项,但浏览器公司的进步更大,结果确实令人印象深刻。 查看现在共享的第一个详细信息。 

机器识别 先进

基于人工智能系统, Google Research, 的研究部门 Google, 展示了创建的第一个结果——仍处于原型阶段—— 图像。输入文本时,只需等待该工具从头开始创建图像,无需发送图形参考。这个想法是让该工具通过人工智能资源,仅使用文本输入作为基础即可获得高质量的照片。

由 google imagen 创建的示例图片
谷歌研究中心的工作产生了谷歌图像的第一个原型
(截图:Victor Pacheco/Showmetech)

在与“竞争对手”进行的测试中,例如 DALL-E, VQ-WIN+剪辑 e 潜在扩散模型Google 指出 图像 设法提供更好的结果,这使该工具成为人们关注的焦点,至少目前如此。 谷歌的人工智能工作分 4 个步骤进行,从图像创建到适应更高分辨率。 

文字转图像AI照片制作流程
照片通过四个步骤创建以达到最终结果
(照片:复制/谷歌)

结果令人印象深刻,因为测试是用随机词完成的,例如“泰迪熊在奥运会 400 米蝴蝶中游泳”。 一些测试更进一步,可以看出开发人员在使用 Imagen 进行测试时玩得很开心,查看更多生成的图像: 

  • google text to image AI 生成的照片
  • 一个乘坐火箭前往月球的大脑。
  • 由谷歌图像生成的狗照片
  • 一只长着金色喙的镀铬鸭子在森林里与一只愤怒的乌龟争吵。

 

 

O Google 是近年来在人工智能解决方案上投入最多的公司之一,看看在人工智能方面的进展就知道了 谷歌助理 有一点预览。 个人助理不仅仅是一个激活或停用智能手机功能的简单工具,它已经能够以自然的语气拨打电话,在某些设备上也是如此, 不再需要说 “好的谷歌” 继续对话 与助理。 

期间 谷歌I / O 2022,一个新奇的名字 路径语言模型 (棕榈) 设法用文本解决数学问题,提供结果和信息获取方式的解释。 

谷歌手掌
谷歌在五月初推出了可以解决数学问题的人工智能功能
(照片:复制/谷歌)

公司预计 棕榈 可以用于不同的领域并通过机器学习,甚至学习流利度不高的新语言。 

谁可以使用 图像?

现在,使用 谷歌的人工智能 它没有向公众发布,因为该公司对结果的使用方式有一些担忧。 根据该公司本身的说法,由于创建图像的数据是从“未经策划的网络规模”中获取的,因此文本到图像的 AI 最终可能会提供可能冒犯某些少数群体的结果,甚至更多如果被要求与人合影。 在公布的结果中,没有人的图像,所以我们仍然不知道这在实践中会如何发生。 

由 google imagen 创建的照片示例
工具不会向公众发布,至少在第一时刻是这样
(照片:复制/谷歌)

同时, Google Research 指出训练过滤器被过滤掉了不适当的噪音和内容,例如色情、种族主义侮辱和社会刻板印象。 换句话说:由于人工智能培训是根据互联网上的内容进行的,因此谷歌担心 图像 用于创建引发焦虑或其他问题的图像。 

由 google imagen 创建的照片示例
公司担心人工智能如何被用来生成令人不舒服的照片
(照片:复制/谷歌)

在发布 AI 结果的出版物中,谷歌还向其竞争对手发出信息,要求他们在训练人工智能与人合影时要同样小心。 

您如何看待首次公布的结果? 告诉我们 评论

参见 

查看有关新产品的所有详细信息 在 Google I/O 2022 期间展示的 Google 产品

丰特斯: Google Research l CNET l 谷歌博客


了解更多关于秀美科技

注册以通过电子邮件接收我们的最新消息。

发表评论

您的电子邮件地址将不会被发表。 必填字段标有 *

相关文章