AI生图黑马,用"小而美"重塑技术格局。当其他AI需要高端服务器时,你的RTX 3060就能流畅生成高质量图像。
输入提示词开始生成
Z-image是于2025年11月发布的高效图像生成基础模型,核心定位是"轻量且高性能"。个人和企业可自由使用、修改并二次分发,搭配官方提供的技术报告和快速入门代码,方便开发者进行二次开发。
高效推理版(已发布)
基础开发版(待发布)
图像编辑版(待发布)
单流扩散Transformer,将文本、视觉、图像VAE令牌统一处理,突破传统双流架构瓶颈
统一旋转位置编码,完美适配文本和图像的多维位置信息
保障千层级网络稳定收敛,解决深层网络梯度问题
压缩推理步骤至8步,结合强化学习修补细节,实现速度与质量兼顾
RTX 4090:生成1024×1024仅需2.3秒
RTX 3060:5年前的显卡也能流畅运行
对比Flux 2,存储空间节省80%
FID分数:7.2(越低越好)
AI Arena排名:全球第四
CVTG-2K准确率:0.8671
精准理解"小桥流水人家"等意境
处理复杂中英文混合指令
突破文字模糊、错字问题
国风茶馆的木质招牌,带清晰"茗香"二字,古色古香的建筑,红灯笼,竹子装饰,清晨阳光斜射
咖啡馆门口的年轻亚洲女性,穿着米色毛衣,温柔的微笑,玻璃门倒影,午后阳光,85mm镜头
赛博朋克风格的城市夜景,霓虹灯广告牌,雨后街道反射,东方元素,未来主义
Z-image擅长处理中英文混合提示,描述更精确
明确"清晰文字"、"字体"效果更好
1024×1024, 8-9步, Guidance 0.0
消费级的RTX 3060显卡即可流畅运行,RTX 4090生成1024×1024图像仅需2.3秒且显存占用13GB。
若出现显存不足:
个人、工作室和企业均可免费商用。二次开发后分发时,需保留版权声明,遵循相关许可规定即可。
生成的图像若用于商业用途,要做好内容审核,避开成人内容、侵权元素等违规内容;同时建议保留生成所用的提示词和参数记录,以便应对可能的版权核查。