AI Weekly 003

AI Weekly #003

🆕 更新了什么?


我们团队开发了一款体验更友好的 ComfyUI。你可以在这里查看到产品的介绍。如果你对我们的产品感兴趣,欢迎下载 (opens in a new tab)试用,也欢迎加入我们的 Discord (opens in a new tab) 获得最新的消息。

上周新增教程::

🤩 每周 AI 精选

📄 值得关注的论文 & 技术

PhotoMaker:利用多张照片作为身份 ID,获取人物特征,然后创造出一个新的、个性化的人物图像。能根据描述生成符合描述的人物照片。也能把几个不同人的照片特征混合在一起,创造出一个全新的人物形象。还能改变照片人物的性别、年龄和生成多种风格的其他照片,快速逼真,效果自然。

它可以将嘈杂的音频转换为清晰有力的语音,可以去除音频当中的各种噪声和杂音,只留下清晰语音。不仅能去掉噪音,它还可以恢复音频失真和扩展音频带宽。它能让原本的声音听起来更清楚和自然。例如把旧录音磁带变成高清音质,让录音听起来更舒服。对于历史录音或存档音频的复原和恢复工作,Resemble Enhance 提供了一种有效的解决方案,能够使这些音频重获新生。

Adobe Premiere Pro 引入基于文本的 AI 视频编辑功能,由于 AI 的加持使得视频剪辑更快、更智能,例如自动剪辑、内容重组等。支持语音转录功能,自动生成文字稿,简化视频剪辑流程,像编辑文本文档一样编辑视频。还包括自动平衡和匹配视频颜色、自动音量调节、去噪和语音增强、自动字幕、自动转场、自动更改长宽比等。

Byrdhouse AI:一个可以在视频通话中实时翻译 100 多种语言的工具,语音翻译字幕+AI 驱动的实时口译,它可以在会议或聊天时把你的语言转换成另一种语言,还能选择翻译的声音是男是女。自动识别语言并翻译,并且可以编辑翻译后的字幕。还能用不同语言自动帮你生成会议/通话摘要。

🛠️ 值得尝试的产品

Cutout.pro 是由杭州的 LibAI 团队创建的人工智能驱动的图像增强产品,提供肖像裁剪、风格迁移、修复、逆向图像搜索等功能。Cutout Pro 已跻身图像编辑工具分类排名的全球前十,尤其生成证件照很有优势。2023 年 12 月 5 日,其创始团队李白人工智能实验室,在深圳的白鲸出海年会上,凭借旗下的神采 PromeAI(做草图到效果图、意向图到设计图的图像生成)、Cutout.pro 两大出海项目,荣获了“2023 年度企业创新”奖项。


这是一个 AI 财务公司,致力于从头开始用 AI 来变革会计行业,比如重建了核心会计总账,使它更加智能、更高效,并适应当今数字化优先的业务需求,其平台无缝集成了各种重要金融科技工具的实时数据,将静态会计数据转化为实时财务洞察。如果你是会计或者是对财务服务感兴趣的 AI 技术专家,可以借鉴 Puzzle 的模式,去做一个会计的智能 AI,在国内类似于用友或者金蝶财务软件的智能化升级版本。当然用友金蝶也不会闲着,所以你要做好与这些行业巨头进行竞争的准备,用速度来打败他们的规模优势。


Bittensor 是一个为算法模型而搭建的交易市场,在该市场上交易的是算法模型(即机器智能)。因为它包含了现在市场追捧的 AI+Web3 的概念,所以已经达成了加密货币排行榜中,市值第 60 名的地位。当前训练人工智能模型需要大量的数据和算力,由于成本高昂,大公司和研究机构一旦有所突破,大多会自设封闭场域,这无疑阻碍了人工智能开发的复合效应。因此需要有去中心化的全部开源的解决方案。在 AI 的数据、算法、算力三大核心要素中,Bittensor 瞄准了算法方向,通过区块链网络和激励机制,来对不同的算法进行调度和筛选,从而让 AI 领域形成一个自由竞争、知识共享的算法市场。


Botto 是一位诞生于 2021 年 10 月的生成式 AI 艺术家,属于 Botto DAO(去中心化自治组织),并由社区成员共同训练而成,是世界上第一位去中心化自治的 AI 艺术家。它的作品 NFT,放在了加密艺术平台(SuperRare)上拍卖,已经有数千万元人民币的销售收入了。通过提示词来让 AI 生成艺术品已经变得很容易,但是究竟怎样的艺术品是有价值的?AI 本身并不能做这样的价值判断,所以 Botto 创造性地引入了一个 DAO 的机制,由 DAO 成员们投票决定什么作品是有价值的(“群智涌现”),并且这些数据可以训练 AI 艺术家,不断生成新的好作品。



你可以订阅我们的 newsletter 以及公众号,或者加入 Discord,以获取最新的教程。