阿里通义千问推出多模态模型Qwen VLo,引入全新生成机制

业界
2025
06/28
15:42
凤凰网科技
分享
评论

6月28日,阿里云通义千问刚刚发文,宣布推出最新的多模态统一理解与生成模型Qwen VLo。这一全新升级的模型可以进行高质量的再创造,实现从感知到生成的跨越。

官方表示,Qwen VLo采用动态分辨率训练,支持动态分辨率生成。无论是输入端还是输出端,模型都支持任意分辨率和长宽比的图像生成。这意味着用户不再受限于固定的格式,可以根据实际需求生成适配不同场景的图像内容。

此外,Qwen VLo还创新性地引入了一种全新的生成机制:从上到下、从左到右逐步清晰的生成过程。这一机制不仅提升了生成效率,还特别适用于需要精细控制的长段落文字生成任务。

阿里云官方提醒,Qwen VLo属于预览阶段,还有很多不足的地方,在生成的过程可能存在不符合事实、不完全和原图一致的问题,开发团队还在持续迭代。

【来源:凤凰网科技

THE END
广告、内容合作请点击这里 寻求合作
阿里
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

北京时间9月12日,据科技网站The Information报道,四位知情人士称,阿里巴巴、百度已开始采用内部自主设计的芯片训练他们的AI大模型,取代了部分英伟达芯片。
业界
9 月 5 日消息,阿里巴巴公益今日宣布,在“人人 3 小时”十周年之际,阿里公益向全体阿里及蚂蚁同学发起一场特别公益活动 ——102 套“马老师(阿里巴巴创始人马云)签名版城市骑士专属制服”公益拍卖。
业界
6月6日,阿里开源通义千问3全新的向量模型系列 Qwen3-Embedding(简称千问3向量模型)。
业界
5月22日,2025阿里云中企出海大会在杭州举行,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭在发表主题演讲时表示,阿里云将以战略级投入,加速打造全球云计算一张网。
业界
3月27日,北京时间周四凌晨,阿里巴巴发布通义千问系列的最新旗舰模型Qwen2.5-Omni。
业界

相关推荐

1
3