阿里通义千问推出多模态模型Qwen VLo，引入全新生成机制

业界

2025

06/28

15:42

凤凰网科技

6月28日，阿里云通义千问刚刚发文，宣布推出最新的多模态统一理解与生成模型Qwen VLo。这一全新升级的模型可以进行高质量的再创造，实现从感知到生成的跨越。

官方表示，Qwen VLo采用动态分辨率训练，支持动态分辨率生成。无论是输入端还是输出端，模型都支持任意分辨率和长宽比的图像生成。这意味着用户不再受限于固定的格式，可以根据实际需求生成适配不同场景的图像内容。

此外，Qwen VLo还创新性地引入了一种全新的生成机制：从上到下、从左到右逐步清晰的生成过程。这一机制不仅提升了生成效率，还特别适用于需要精细控制的长段落文字生成任务。

阿里云官方提醒，Qwen VLo属于预览阶段，还有很多不足的地方，在生成的过程可能存在不符合事实、不完全和原图一致的问题，开发团队还在持续迭代。

【来源：凤凰网科技】

THE END

广告、内容合作请点击这里寻求合作

阿里

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

6月6日，阿里开源通义千问3全新的向量模型系列 Qwen3-Embedding（简称千问3向量模型）。

业界

5月22日，2025阿里云中企出海大会在杭州举行，阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在发表主题演讲时表示，阿里云将以战略级投入，加速打造全球云计算一张网。

业界

3月27日，北京时间周四凌晨，阿里巴巴发布通义千问系列的最新旗舰模型Qwen2.5-Omni。

业界

3月26日，宝马集团与阿里巴巴集团今日宣布达成AI领域战略合作，推动AI大语言模型“上车”。

业界

北京时间3月11日，据《华尔街日报》报道，DeepSeek创始人梁文峰已经拒绝了通过其大模型赚快钱的投资提议。

业界