Llama 3 带来了诸如口型同步视频翻译、著名声音等功能。现在是多模式的,目标的人工智能除了与用户自然对话之外,还可以看、说话、理解图像、表格和图表。理解

Llama 3.2 为 Meta AI 带来了口型同步视频翻译、名人声音等功能

卢卡斯戈麦斯头像
现在,Meta 的人工智能是多模式的,除了与用户自然对话之外,它还可以看、说话、理解图像、表格和图表。理解

今天(25)发生了 元连接 2024是负责 Facebook、Instagram 和 WhatsApp 的公司举办的活动,其技术新闻的发布由公司自己呈现 马克·扎克伯格。超越全息眼镜 猎户座,我们仍然看到有关 Llama 3.2 和 Meta AI — 整合了公司所有的社交网络。立即查看 Meta 人工智能的亮点

Llama 3.2 带来的新功能

中小型视觉法学硕士(11b 和 90b)以及适应移动设备的轻量级纯文本模型(1b 和 3b)。图片:元
中小型视觉法学硕士(11B 和 90B)以及适应移动设备的轻量级纯文本模型(1B 和 3B)。图片:元

该系列中两款最大的新型号 骆驼3.2,与 11B 和 90B(分别为 11 和 90 亿)参数,因其对视觉推理任务的支持而脱颖而出,例如理解复杂的文档,包括表格和图表,以及图像标题和基于自然语言描述识别视觉场景中的对象。

一个实际的例子涉及 Llama 3.2 的能力 分析图表 快速回答有关公司指定月份销售业绩的问题。在另一种情况下,模型可能 解释地图,指示路径何时变得更陡或特定路线的距离。这些先进的模型还连接 视觉和语言,能够从图像中提取细节并生成描述场景的标题。

Meta还推出了更轻的型号, 1B和3B参数,适用于智能手机和智能眼镜等小型设备。这些是为了 多语言文本生成和自动命令执行。它们支持开发直接在设备上运行的可定制应用程序,确保完全的隐私,因为数据不会发送到云端。这些应用程序可以汇总传入消息并识别重要项目,以便使用工具调用功能直接发送日历邀请。

在本地运行模型有两个主要优点: 几乎即时响应,由于在设备上直接处理,并且 更大的隐私,避免将敏感数据发送到云端。这样可以控制哪些查询保留在设备上,哪些查询可以由云中的更大模型以清晰、安全的方式处理。

这项工作得到了我们整个 AI 社区合作伙伴的支持。我们要感谢并认可(按字母顺序排列):Accenture、AMD、Arm、AWS、Cloudflare、Databricks、Dell、Deloitte、Fireworks.ai、Google Cloud、Groq、Hugging Face、IBM watsonx、Infosys、Intel、Kaggle、联想、LMSYS、联发科、微软 Azure、NVIDIA、OctoAI、Ollama、Oracle Cloud、普华永道、高通、Sarvam AI、Scale AI、Snowflake、Together AI 和加州大学伯克利分校 – Project vLLM。

元感谢您在您的网站上

新的元人工智能功能

新闻还不止于此! Meta AI 将受益于以下新功能:

WhatsApp、Instagram、Facebook 和 Messenger 上的声音

Meta 邀请用户测试名人的新人工智能声音。图片:meta vo llama 3. 2
Meta 邀请用户测试名人的新人工智能声音。图片:元

马克·扎克伯格 宣布对 Meta 的人工智能助手进行新的更新,现在将提供名人声音,例如 朱迪·丹奇夫人、约翰·塞纳、奥卡菲娜、科甘·迈克尔·凯和克里斯汀·贝尔。这个想法是让互动更加自然和有趣,在平台上提供个性化体验,例如 Facebook, Messenger, WhatsApp e Instagram.

除了新的声音之外,最重要的创新之一是人工智能模型能够 解读照片 以及来自用户的其他视觉信息,扩展交互替代方案,并为每个用户提供更多上下文和相关响应。

查看、解释和编辑图像

用户将能够向人工智能发送照片并请求编辑。图片:元
用户将能够向人工智能发送照片并请求编辑。图片:元

Meta AI 的编辑能力也得到了扩展,使其能够处理 视觉信息。现在可以在行走时拍摄花朵的照片并要求 Meta AI 识别它和/或解释更多有关它的信息,或者做 上传图片 菜品并收到相应的菜谱。

用户还可以执行以下操作 对您的真实照片进行详细编辑 使用日常语言的命令,例如添加或删除元素。此前,此功能仅适用于 Meta AI 生成的图像,但现在可用于 用户拍摄的照片,方便个性化调整。

与功能 Imagine 使用 Meta AI,您将能够将自己插入到故事、动态帖子甚至个人资料照片中 Facebook和Instagram, 分享 AI 生成的自拍照 以互动的方式。人工智能还可以为您的 Instagram 和 Facebook Stories 建议标题。只需选择一张图像,Meta AI 就会建议多个标题选项,让您更轻松地选择最适合您的帖子的选项。

Reels 上的唇形同步配音

目前配音仍受到限制。图片:元
目前配音仍受到限制。图片:元

Meta 目前也在测试 带口型同步的自动视频配音 在 Instagram 和 Facebook Reels 上,从语言开始 英语和西班牙语。此功能将允许用户以其母语观看内容,使其更易于理解和交互。

最初,该功能仅供一小部分创作者使用,但有计划将其扩展到 更多创作者并包含其他语言 不久。这一进步有可能显着增加内容创作者的影响力,使他们的作品能够克服语言障碍并与全球观众建立联系,无论使用何种语言。

可用性

AI Voice 在澳大利亚、加拿大、新西兰和美国仅提供英语版本。图片:元
澳大利亚、加拿大、新西兰和美国的人工智能语音仅提供英语。图片:元

该公司声称, 骆驼3.2 现已在 Meta 平台上提供,但 Meta AI 语音更新除外。这些在澳大利亚、加拿大、新西兰和美国仅提供英文版本。

而你,你对这个消息有何看法?告诉我们 评论!

另请参阅:

元显示 猎户座全息眼镜,在屏幕上显示图像.

信息来自: 目标 [1] e [2].

文字校对: 丹尼尔·库蒂尼奥 (25 / 09 / 24)


了解更多关于秀美科技

注册以通过电子邮件接收我们的最新消息。

发表评论

您的电子邮件地址将不会被发表。 必填字段标有 *

相关文章