偷偷做久久久久网站,久久久久久亚洲精品不卡,亚洲精品偷拍的自拍的,无码毛片内射白浆视频,国产精品小说

Internet Develppment
互聯(lián)網(wǎng)開(kāi)發(fā)& 推廣服務(wù)提供商

我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。

歡迎瀏覽我們的案例。

首頁(yè) > 新聞中心 > 新聞動(dòng)態(tài) > 正文

谷歌AI發(fā)布Muse研究論文 是一種新的文本至圖像生成技術(shù)

發(fā)布時(shí)間:2023-02-14 09:13:31來(lái)源:infoq


圖片來(lái)自網(wǎng)絡(luò )/侵刪

  谷歌 AI 發(fā)布了一篇關(guān)于 Muse 的研究論文,這是一種新的文本至圖像生成技術(shù),它基于掩碼生成(Masked Generative)Transformer,可以生成與 DALL-E 2和 Imagen 等競爭對手相媲美的高質(zhì)量圖片,但是速度要快得多。

  Muse 被訓練為預測隨機掩碼圖像的 token,它會(huì )使用業(yè)已訓練過(guò)的大型語(yǔ)言模型所生成的嵌入式文本。這項工作涉及在離散的 token 空間中進(jìn)行掩碼建模。Muse 使用一個(gè) 9 億個(gè)參數的模型,稱(chēng)為掩碼生產(chǎn) transformer(masked generative transformer),以創(chuàng )造視覺(jué)效果,而不是采用像素空間擴散或自回歸模型。

  谷歌聲稱(chēng),借助 TPUv4 芯片,可以在 0.5 秒內創(chuàng )建一個(gè) 256*256 的圖像,而使用 Imagen 則需要 9.1 秒,根據谷歌的說(shuō)法,Imagen 使用的擴散模型提供了“前所未有的逼真程度”和“深度的語(yǔ)言理解”。TPU,即張量處理單元(Tensor Processing Unit),是谷歌開(kāi)發(fā)的定制芯片,專(zhuān)門(mén)用作 AI 的加速器。

  根據研究,谷歌 AI 已經(jīng)訓練了一系列不同規模的 Muse 模型,參數從 6.32 億到 30 億不等,研究發(fā)現,預先訓練好的大型語(yǔ)言模型,對于生成逼真的高質(zhì)量圖像至關(guān)重要。

  Muse 的性能也超過(guò)了最先進(jìn)的自回歸模型 Parti,因為它使用了并行解碼,在推理時(shí)間上比 Imagen-3B 或 Parti-3B 模型快 10 倍以上,根據使用同等硬件的測試,比 Stable Diffusion v1.4 快 3 倍。

  Muse 創(chuàng )建的視覺(jué)效果與輸入中的各種語(yǔ)義成分相對應,如名詞、動(dòng)詞和形容詞。此外,它還展示了視覺(jué)風(fēng)格和多對象特性的知識,如合成性(compositionality)和基數(cardinality)。

  近年來(lái),由于新的訓練方法和改進(jìn)的深度學(xué)習架構,圖像生成模型有了長(cháng)足的進(jìn)步。這些模型有能力生成非常詳盡和逼真的圖像,在廣泛的行業(yè)和應用中,它們正在成為越來(lái)越強大的工具。
 ?。?a href="http://www.wxlp666.cn">碼上科技)

最新資訊
? 2018 河北碼上網(wǎng)絡(luò )科技有限公司 版權所有 冀ICP備18021892號-1   
? 2018 河北碼上科技有限公司 版權所有.
偷偷做久久久久网站,久久久久久亚洲精品不卡,亚洲精品偷拍的自拍的,无码毛片内射白浆视频,国产精品小说