202508-05 首个图像生成基础模型 通义千问深夜开源Qwen-Image 支持中英双语 NEW 快科技8月5日消息,今天凌晨,阿里通义千问宣布开源Qwen-Image,一个20B的MMDiT模型。这是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得显著进展。据了解,该模型专注于提升AI在两大核心场景的能力:复杂的文本渲染与精准的图像编辑。功能亮点:强大的文字渲染能力(本次开源)效果领先:在多个文本测评榜单中,文字渲染均获得SOTA。原生渲染:文字是图像生成时直出的,而非后期添加,效果更真实。功能全面:支持中英双语,多变字体,超长段落,超小文字,... Read More >