Google 发布 AI 图像创意工具「Whisk」<a href="https://ziyuanxiong.cn" title="资源熊"> -资源熊 </a>-资源熊

工具介绍

Whisk是Google Labs推出的一款创新的AI图像生成工具，它通过图像输入快速生成并重混创意图片。以下是Whisk的一些主要特点和功能：

图像驱动的生成：Whisk允许用户通过上传图像来确定主体、场景和风格，而不是使用文本提示，这为不擅长撰写文本提示的用户提供了更便捷的方式。
自动生成详细字幕：Gemini模型会自动为用户上传的图像编写详细的字幕描述，这些描述会被输入到Imagen 3模型中，以更好地捕捉图像的关键特征并生成符合用户意图的新图像。
创意重新混合：Whisk能够将不同的主体、场景和风格图像进行重新混合，创造出独特的设计，如数字玩偶、珐琅别针等各种创意产品。
本质捕捉而非复制：Whisk捕捉的是输入图像的本质特征，而不是精确复制，这使得生成的图像具有更多的创意变化空间，但也可能导致结果与用户预期不完全一致。
可编辑提示：用户可以查看和编辑底层的提示信息，以便根据自己的需求对生成的图像进行调整和优化，例如修改颜色、图案等特征。
适用场景：Whisk主要定位于创意探索，旨在帮助用户快速生成和迭代各种创意想法，而非用于精确的图像编辑。
技术原理：Whisk的背后是Google的Gemini视觉理解与描述模型和Imagen 3图像生成模型。Gemini模型负责为用户的图像生成详细的文字描述，这些描述精准捕捉了图片的主题、情感和风格特征。随后，这些描述被传递给Imagen 3模型，该模型基于这些丰富的信息，运用深度学习算法，创造出既符合用户意图又充满惊喜的新图像。
访问方式：目前，Whisk仅对美国用户（美国IP）开放，用户可在labs.google/whisk上使用该工具并提供反馈。

Whisk的推出，标志着Google在图像生成领域的一次重要布局，这款工具不仅简化了图像创作的流程，更在技术上实现了质的飞跃，为用户提供了一种独特的图像生成方法

工具地址

地址：https://blog.google/technology/google-labs/whisk/

使用地址：https://labs.google/fx/zh/tools/whisk

目前仅支持美国（ip）地区

温馨提示：本文最后更新于2024-12-18 23:11:42，某些文章具有时效性，若有错误或已失效，请在下方留言或联系QQ3224592136。

本网站名称：资源熊 Www.Ziyuanxiong.Cn
①本站所有资源免费，收取的费用仅为抵扣人工测试和服务器日常维护带来的消耗成本，请须知。
②本站资源仅用于个人学习和交流，如用于商业使用请选择正版程序。使用非正版程序须在24小时内卸载删除。
③本站部分资源来源网络或者用户投稿，如有侵权请联系删除（ziyuanxiong@foxmail.com）。
④因影视资源、软件资源、模板、插件等程序具有可复制性，一经出售概不退款。
➣如若转载，请注明文章出处：
➣详细的版权声明请点击文章版权声明查看。
**下载/阅读均默认代表您已详细阅读版权声明并同意承担可能造成的所有损失及后果！

THE END