(相關(guān)資料圖)
2月10日消息,阿里巴巴發(fā)布新一代圖像生成及編輯模型Qwen-Image-2.0。據(jù)介紹,作為千問(wèn)大模型的圖像生成模型底座,Qwen-Image-2.0集生圖和編輯于一體,在AI Arena文生圖評(píng)測(cè)中斬獲1029分,超過(guò)Seedream4.5、Flux2-Max等模型,僅次于谷歌Nano Banana Pro和GPT Image1.5。Qwen-Image-2.0支持1K token的超長(zhǎng)文字輸入和2K高分辨率,可準(zhǔn)確渲染復(fù)雜指令,生成專業(yè)的PPT及信息圖,質(zhì)感媲美專業(yè)級(jí)攝影師;同時(shí),千問(wèn)新模型擁有極強(qiáng)中文漢字渲染能力,數(shù)百字的古文全文幾乎都能完全渲染在圖片中。
據(jù)了解,Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit兩大模型基礎(chǔ)上全新升級(jí),首次將圖像生成和編輯統(tǒng)一到一個(gè)模型中去,以更輕量的模型架構(gòu),實(shí)現(xiàn)了生圖和改圖性能的大幅提升。Qwen-Image-2.0生圖質(zhì)感尤為細(xì)膩,小至老人皺紋的褶皺,大到浩然宇宙,模型生成的人物、自然、建筑等常用圖片都極其逼真。在權(quán)威評(píng)測(cè)AI Arena中,千問(wèn)新模型在圖像生成中得分1029,位列第三;在圖片編輯中得分1034,僅次于Nano Banana Pro。
在中文漢字渲染方面,Qwen-Image-2.0不但可以以多種字體準(zhǔn)確渲染漢字,而且寫得又多又準(zhǔn),效果比 Nano Banana Pro更優(yōu)。千問(wèn)新模型將輸入提示詞擴(kuò)展到1K token,可詳盡描述任務(wù),實(shí)現(xiàn)更專業(yè)的文字渲染,輕松拿捏專業(yè)PPT、高級(jí)海報(bào)、多格漫畫等復(fù)雜圖片,比如以小楷字體幾近完全渲染《蘭亭集序》數(shù)百字的全文配圖,以自然語(yǔ)言生成論文格式配圖的復(fù)雜PPT等。
與此同時(shí),基于Qwen-Image-2.0模型,用戶可與AI協(xié)同創(chuàng)作出更豐富、更實(shí)用的圖片,比如一句話生成宮保雞丁的做法流程圖,杭州兩日旅游攻略圖,4x6的多格漫畫組圖,兒童繪本圖,寫實(shí)風(fēng)格的電影海報(bào),極為逼真的綠色叢林等等;同時(shí),用戶也可上傳數(shù)張圖片進(jìn)行編輯,生成諸如九宮格多手勢(shì)自拍,真人配字表情包,雙人逼真AI合影,詩(shī)詞配圖等。
據(jù)了解,阿里云百煉上已開通API邀測(cè),開發(fā)者也可通過(guò)Qwen Chat免費(fèi)體驗(yàn)新模型。(定西)
關(guān)于我們| 客服中心| 廣告服務(wù)| 建站服務(wù)| 聯(lián)系我們
中國(guó)焦點(diǎn)信息網(wǎng) 版權(quán)所有 滬ICP備2022005074號(hào)-20,未經(jīng)授權(quán),請(qǐng)勿轉(zhuǎn)載或建立鏡像,違者依法必究。