AI Weekly #002

🆕 更新了什么？

上周新增教程：:

如何使用 ComfyUI 生成 App 的 logo? (opens in a new tab)：我们的教程教了很多 ComfyUI 的使用方法，但也有一些同学反馈，当想要将 ComfyUI 用在工作上时，又不知道该如何下手。另外，ComfyUI 里有很多小的配置项，教程里也没有一一介绍，有些配置不知道该如何配置。所以，我们决定写一系列的实操教程，通过实际的工作案例来教大家将 ComfyUI 运用到工作当中，同时还会教大家一些使用 ComfyUI 的小技巧，从而帮助大家更好地使用 ComfyUI。
Stable Diffusion 进阶 (opens in a new tab)：增加了 Stable Difffusion XL workflow，通过这个 workflow 可以生成更精致的图片。

教程更新：

ControlNet (opens in a new tab): 更新了 Canny ControlNet workflow。
云端安装 (opens in a new tab): 更新了 Q&A 环节。感谢 Discord 用户 designwill 和 lys623 的反馈。
ComfyUI 基础 ➁ (opens in a new tab): 增加了 Q&A 环节。感谢 Discord 用户 123321123 的反馈。
图生图 (opens in a new tab)：修改了一些错别字。感谢 Github 用户 lys623 的反馈。

🤩 每周 AI 精选

📄 值得关注的论文 & 技术

Mobile ALOHA (opens in a new tab)

由斯坦福大学开发的一款开源硬件产品。技术相对比较复杂，简单理解，用户可以通过控制器控制机器人的机械臂做某个任务（比如做饭），当完成此时超过 50 次后，机器就可以自主模仿，从而自主完成任务。

IP-Adapter-FaceID (opens in a new tab)

这个模型利用面部识别模型的 FaceID 代替 CLIP 图像 embedding，从而更准确地捕捉和再现特定人物的面部特征。

Phi-2 (opens in a new tab)

微软发布最新开发的小型语言模型 Phi-2。Phi-2 仅有 2.7B 参数，但 Phi-2 的性能却超越了分别拥有 7B 和 13B 参数的 Mistral 和 Llama-2 模型。下方截图是 Phi-2 的分数。之所以能做到这种效果，核心原因是微软为了训练这个模型，整理了一个数据质量非常高的数据集。

🛠️ 值得尝试的产品

Convai (opens in a new tab)

Convai 在 CES2024 的 NVIDIA 特别直播中发布了其最新游戏 AI 功能——场景感知和 NPC 互动生成功能。使用此功能，可以让同一场景下的 NPC 的每次对话都不一样，极大提高了游戏的体验。更厉害的是 NPC 现在能和玩家进行语音对话交流。

Magnific AI (opens in a new tab)

最近很火的 AI 图片放大工具，效果非常好。而且最令我吃惊的是开发这款产品的公司只有两个人。

Rabbit (opens in a new tab)

2024 年终于有一款正式对外销售的 AI 硬件产品了。工业设计非常有趣。而且首日销售额达到了 10000 台。

AI Graveyard (opens in a new tab)

每天都有 AI 产品更新，但各位要会不会好奇，又有哪些 AI 产品关停呢？这个网站罗列了很多关停的产品。如果你有开发 AI 产品的想法，不如看看这个列表，看看有没有前辈开发过。

你可以订阅我们的 newsletter 以及公众号，或者加入 Discord，以获取最新的教程。