AI Weekly #002
🆕 更新了什么?
上周新增教程::
- 如何使用 ComfyUI 生成 App 的 logo? (opens in a new tab):我们的教程教了很多 ComfyUI 的使用方法,但也有一些同学反馈,当想要将 ComfyUI 用在工作上时,又不知道该如何下手。另外,ComfyUI 里有很多小的配置项,教程里也没有一一介绍,有些配置不知道该如何配置。所以,我们决定写一系列的实操教程,通过实际的工作案例来教大家将 ComfyUI 运用到工作当中,同时还会教大家一些使用 ComfyUI 的小技巧,从而帮助大家更好地使用 ComfyUI。
- Stable Diffusion 进阶 (opens in a new tab):增加了 Stable Difffusion XL workflow,通过这个 workflow 可以生成更精致的图片。
教程更新:
- ControlNet (opens in a new tab): 更新了 Canny ControlNet workflow。
- 云端安装 (opens in a new tab): 更新了 Q&A 环节。感谢 Discord 用户 designwill 和 lys623 的反馈。
- ComfyUI 基础 ➁ (opens in a new tab): 增加了 Q&A 环节。感谢 Discord 用户 123321123 的反馈。
- 图生图 (opens in a new tab):修改了一些错别字。感谢 Github 用户 lys623 的反馈。
🤩 每周 AI 精选
📄 值得关注的论文 & 技术
由斯坦福大学开发的一款开源硬件产品。技术相对比较复杂,简单理解,用户可以通过控制器控制机器人的机械臂做某个任务(比如做饭),当完成此时超过 50 次后,机器就可以自主模仿,从而自主完成任务。
这个模型利用面部识别模型的 FaceID 代替 CLIP 图像 embedding,从而更准确地捕捉和再现特定人物的面部特征。
微软发布最新开发的小型语言模型 Phi-2。Phi-2 仅有 2.7B 参数,但 Phi-2 的性能却超越了分别拥有 7B 和 13B 参数的 Mistral 和 Llama-2 模型。下方截图是 Phi-2 的分数。之所以能做到这种效果,核心原因是微软为了训练这个模型,整理了一个数据质量非常高的数据集。
🛠️ 值得尝试的产品
Convai 在 CES2024 的 NVIDIA 特别直播中发布了其最新游戏 AI 功能——场景感知和 NPC 互动生成功能。使用此功能,可以让同一场景下的 NPC 的每次对话都不一样,极大提高了游戏的体验。更厉害的是 NPC 现在能和玩家进行语音对话交流。
最近很火的 AI 图片放大工具,效果非常好。而且最令我吃惊的是开发这款产品的公司只有两个人。
2024 年终于有一款正式对外销售的 AI 硬件产品了。工业设计非常有趣。而且首日销售额达到了 10000 台。
每天都有 AI 产品更新,但各位要会不会好奇,又有哪些 AI 产品关停呢?这个网站罗列了很多关停的产品。如果你有开发 AI 产品的想法,不如看看这个列表,看看有没有前辈开发过。
🥰 感谢你的阅读!
你可以订阅我们的 newsletter 以及公众号,或者加入 Discord,以获取最新的教程。