文章来源:AIGC开放社区
2月2日,谷歌在官网对生成式AI产品进行了大更新,包括类ChatGPT聊天助手Bard可以通过文本提示生成图像;
全新的文生音乐平台MusicFX;新的文生图像平台ImageFX;新的文本扩写平台TextFX;在谷歌地图中增加生成式AI功能,用文本提示快速查找路线、店铺等。
值得一提的是,这5大功能目前都是免费使用。其中,文生图像平台ImageFX的功能非常强悍,支持对文本提示中的“关键元素”进行可视化控制。
目前,无论是Midjourney还是DALL·E 3都无法做到(二者无法可视化控制,只能用文本),这对于生成高精准图像、制作连环画等帮助巨大!
Bard支持文生图
文生图像、音乐的多模态功能,对于现在大模型来说已经不是什么新鲜事了,但谷歌一直没有停止追赶OpenAI的脚步。现在,Bard终于能用文本生成图像了,该功能由谷歌自研的Imagen 2模型提供技术支持。
根据「AIGC开放社区」的实际体验,只需要输入文本提示就能生3D、动漫、素描、朋克、写实、油画等风格图像,效果非常棒。
例如,生成一个混乱的炼金术士工作室的图像,充满了冒泡的烧瓶,发光的晶体,以及瓶子内旋转的微小发光世界。
生成一盘令人有食欲,色泽鲜艳的鸡翅。
生成一个蒸汽朋克风格的数字艺术女人图像,放大她的脸部。
需要注意的是,目前该功能已经免费开放,但只能用英文提示才能生成图像。
文生音乐平台MusicFX、文生图ImageFX和扩写平台TextFX
自2023年谷歌发布MusicFX以来,全球用户通过该产品已创造了超1000万条音乐。现在,谷歌对该产品进行了大量优化。
可以创建70秒音乐,音乐样本比之前多3倍等,并且该产品目前免费开放使用。
例如,生成一首90年代的爵士音乐,节奏感非常强。MusicFX可以一次生成4个同类音乐,用户选择最佳那款即可。
ImageFX是谷歌发布的一款纯文生图像平台,同样由Imagen 2模型提供技术支持。使用方法与效果基本和Bard一样,类似OpenAI的DAll-3。
例如,生成一只在火星奔跑的哈士奇,身穿宇航服,面带微笑,非常幸福,3D效果,4K,纹理逼真。
ImageFX比较牛的地方在于,用户可以对所有关键元素的提示词进行选择性修改。
同样以上面这个提示词为例,我们直接可以将“微笑”选择为“沮丧”,就能在不改变环境等情况下直接生成图像内容。
下拉菜单就能进行多种提示词选择。
扩写平台TextFX
还在为写文本内容没灵感烦恼吗?谷歌与Lancaster Fiasco合作推出了扩写平台TextFX,用户只需要提供一句话,甚至一组词就能快速完成文本扩写。
例如,某个夜深人静的夜晚,我独自走在荒废的大街上。TextFX就能快速帮你完成故事内容的扩写。
谷歌地图支持生成式AI搜索
为了帮助用户快速搜索地址、餐厅、健身房等内容,谷歌地图引入了生成式AI功能。
该功能由谷歌的大语言模型提供支持,并结合2.5亿个真实地理位置数据进行了微调。用户通过自然文本问答的方式就能快速完成地图搜索。
此外,还能向谷歌提出一些旅游、拍摄的相关问题,例如,我想拍一组复古婚纱照,旧金山地区有哪些复古氛围非常浓厚的建筑和街道?
目前,该功能在谷歌地图处于测试阶段,谷歌非常看好其应用场景和商业价值。