法微软正式发布第二代图像生成模型MAI-Image-2,该模型迅速在权威评测平台LMArena(原LMSYS Chatbot Arena)的图像生成榜单中攀升至全球第三位,仅次于谷歌的Gemini-3系列模型。
1)核心技术价值:
● 攻克了“文字乱码”这一行业痛点,模型显著增强了处理包含文字的信息图表、演示幻灯片及复杂逻辑图表的能力,文字清晰且无乱码。
● 追求极致的写实主义,能够精准还原自然光影、真实肤色,并构建符合物理规律的逼真环境,减少了创作者的后处理工作。
● 具备电影级构图能力,支持生成具有超现实概念、华丽构图及宏大世界观的超清图像。
2)测试结果:
● 在权威LMArena图像生成模型排行榜中,MAI-Image-2跻身全球第三,仅次于谷歌gemini-3.1-flash-image-preview、OpenAI的gpt-image-1.5-high-fidelity,较初代MAI-Image-1(初始排名第九)实现大幅跃升。
原文链接
https://microsoft.ai/news/introducing-MAI-Image-2/