首頁 > 要聞 >

          GAN卷土重來:10億參數(shù)的GigaGAN效果堪比擴(kuò)散模型_今日播報

          2023-04-14 19:58:00 程序員客棧


          (資料圖)

          點藍(lán)色字關(guān)注“機器學(xué)習(xí)算法工程師”

          設(shè)為星標(biāo),干貨直達(dá)!

          自從 DALL·E 2 之后,在圖像生成方面擴(kuò)散模型替代GAN成了主流方向,比如開源的文生圖模型stable diffusion也是基于diffusion架構(gòu)的。近日, Adobe研究者在論文Scaling up GANs for Text-to-Image Synthesis提出了參數(shù)量為10億(1B)的GAN模型:GigaGAN,其在文生圖效果上接近擴(kuò)散模型效果,而且推理速度更快,生成512x512大小圖像只需要0.13s,生成16M像素圖像只需要 3.66s。同時GigaGAN也支持latent空間的編輯功能,比如latent插值,風(fēng)格混合,以及向量運算等。

          GigaGAN改進(jìn)了StyleGAN架構(gòu),采用兩階段訓(xùn)練策略:一個是64x64的圖像生成器和一個512x512的圖像超分2器,其圖像生成器架構(gòu)如下所示(這里也是采用CLIP text encoder來引入text condition):GigaGAN在 LAION2B-en和 COYO-700M數(shù)據(jù)集上訓(xùn)練,其在COCO數(shù)據(jù)集上的FID達(dá)到9.09,超過stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生圖能力,還可以實現(xiàn)可控的合成,比如風(fēng)格混合,如下圖所示:更多效果圖和技術(shù)細(xì)節(jié)見論文https://arxiv.org/abs/2303.05511和網(wǎng)站https://mingukkang.github.io/GigaGAN/

          關(guān)鍵詞

          相關(guān)推薦

          亚洲一区免费观看| 一本久到久久亚洲综合| 亚洲男女内射在线播放| 亚洲精品伦理熟女国产一区二区| 亚洲一区在线观看视频| 亚洲午夜国产精品| 亚洲一区二区三区国产精品无码| 亚洲欧洲日本精品| 亚洲日产2021三区在线| 亚洲国产成人精品电影| 亚洲一卡2卡3卡4卡国产网站| 亚洲六月丁香六月婷婷色伊人| 亚洲成av人片在线看片| 亚洲午夜精品一区二区公牛电影院| 亚洲电影免费观看| 91亚洲性爱在线视频| tom影院亚洲国产一区二区| 国产成人亚洲精品| 亚洲精品无码中文久久字幕| 亚洲国产成人精品无码区花野真一 | 亚洲AⅤ视频一区二区三区| 亚洲成av人片在线观看天堂无码| 亚洲AV蜜桃永久无码精品| 亚洲一区二区三区在线视频| 亚洲人成伊人成综合网久久久| 亚洲精品夜夜夜妓女网| 亚洲韩国—中文字幕| 亚洲婷婷在线视频| 亚洲色丰满少妇高潮18p| 亚洲AV色无码乱码在线观看| 亚洲国产精品成人网址天堂 | 91精品国产亚洲爽啪在线影院| 亚洲精品电影在线| 亚洲 欧洲 日韩 综合在线| 亚洲av无码一区二区三区在线播放 | 亚洲精品综合久久中文字幕| 2020久久精品亚洲热综合一本| 亚洲成av人在线观看网站| 亚洲成aⅴ人片久青草影院| 亚洲午夜久久久久久久久久| 亚洲国产日韩一区高清在线|