阿里巴巴開源首個圖像生成模型Qwen-Image

發佈日期: 6 8 月, 2025 作者: wellchen2020

阿里巴巴旗下的AI團隊通義千問（Tongyi Qianwen，Qwen）繼開源Qwen語言模型、多模態模型Qwen-VL之後，周一（8/4）開源了首個圖像生成模型Qwen-Image。
Qwen-Image採用MMDiT（Masked Multimodal Diffusion Transformer）架構，具備200億個參數，支援使用者輸入文字或圖像以產生圖像，也能控制圖像的樣式，並針對於圖像中嵌入中文及英文進行了最佳化。

發佈留言 取消回覆

發佈留言取消回覆