AI Weekly #006

🆕 更新了什么？

产品更新：

新增教程：

网站也同步更新了以下文章：

这是苹果开源的一个图像编辑模型，用户可以通过文字提示来编辑任何图像。比如说，“让天空变成粉红色”，或者“在这张照片中加一个恐龙”。模型会根据命令实现改变图片颜色，添减物体或调整、移除图片中的某些元素等操作。

它能按照人类指令进行高质量图像恢复，包括去噪、去雨、去模糊、去雾以及（低光）图像增强等问题。你只需要使用文字描述就能修复和改善图片。比如说，如果你有一张因为雨滴而看起来模糊的照片，你可以告诉它：请去掉照片上的雨滴，但保持图片内容不变”，它就能自动帮你操作。

Gemini Pro 将支持包括中文在内超过 40 种语言和 230 多个国家和地区使用，产品新增图像生成功能和多语言双重检查功能。只需输入描述，例如“创建一只骑着冲浪板的狗的图像”，即可生成对应的图片。

Media2Face 能够根据声音来生成与语音同步的、表现力丰富的 3D 面部动画。同时允许用户对生成的面部动画进行更细致的个性化调整，如情感调整，“快乐”或“悲伤”等。它还能理解多种类型的输入信息（音频、文本、图像），并将这些信息作为生成面部动画的指引。

Boximator 是一个控制视频主体运动轨迹的产品。字节发布的方法是，先圈出图片中的主体，再圈出要移动到位置，即可生成主体从起点到终点移动的视频，支持设置移动路线，支持圈选多个主体。与 SD 视频模型兼容，可作为插件使用。暂无体验网站，目前可以发邮件让项目方给生成视频。

这是一个无代码 AI 图像生成和分析工作流平台，主要解决在电商领域遇到的批量处理图片问题。它提供了一个拖放式的界面，允许用户轻松地创建复杂的图像处理工作流。

它能通过你上传或粘贴的任何文档内容，提供在线链接，帮你朗读在线文章，目前支持五种声音选择。

Galileo 支持文字生成 UI 和图片生成 UI，效果很不错。

Clipdrop 神器能为你轻松搞定抠图烦恼，无论毛发还是细节都能完美抠出。上传图片，一抹即净，马赛克图片也能瞬间变高清。

你可以订阅我们的 newsletter 以及公众号，或者加入 Discord，以获取最新的教程。