我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。
歡迎瀏覽我們的案例。
機器學(xué)習模型已經(jīng)變得非常擅長(cháng)生成逼真的人臉,逼真到我可能永遠不會(huì )再相信一個(gè)機器或人類(lèi)是真實(shí)的。這種由英偉達(Nvidia)研究人員開(kāi)發(fā)的新方法可以分離面部的細節層次,并對它們進(jìn)行單獨調整,以此實(shí)現超越其他方法的效果。最終生成的圖像非常非常逼真。
研究人員的 論文發(fā)表在預印本網(wǎng)站 Arxiv 上,其中描述了一種生成和混合圖像(特別是人臉)的新架構,可以“帶來(lái)更好的插值特性,而且也能更好地解析變化的潛在因素”。
這基本上意味著(zhù)該系統能夠更好地意識到圖像之間有意義的變化,并且在各種尺度上都能進(jìn)行引導。舉例來(lái)說(shuō),研究人員的 舊系統 可能生成兩張“不同”的面孔,但除了一個(gè)人的耳朵被擦除以及襯衫顏色不同之外,它們基本上是一樣的。那不是真正的不同,但系統并不知道無(wú)需重點(diǎn)關(guān)注圖像的這些組成部分。
新系統的靈感源自所謂的風(fēng)格轉移,也就是對圖像(比如說(shuō)一張畫(huà))的重要風(fēng)格特征進(jìn)行提取,并應用到另一張圖像的創(chuàng )作當中,如果一切順利的話(huà),最終得到的圖像應該跟原來(lái)的擁有類(lèi)似外觀(guān)。就生成面孔而言,這里的“風(fēng)格”并不是指筆觸或顏色分布,而是圖像的構成(居中,靠左或靠右,諸如此類(lèi))以及臉部的生理特點(diǎn)(膚色、雀斑以及毛發(fā))。
這些風(fēng)格特征或大或小,尺度各異——在非常小的時(shí)候,它可能是面部的單個(gè)特征;在中間的時(shí)候,它可能是鏡頭的構成;在最大尺度上,它就是圖像整體色調之類(lèi)的東西。讓系統對所有這些特征進(jìn)行調整,整張圖像就會(huì )發(fā)生變化;與此同時(shí),僅僅調整一部分可能只會(huì )改變一個(gè)人的發(fā)色,或者是雀斑或面部毛發(fā)的分布。
在最上面的圖像中,我們可以看到面孔是如何發(fā)生徹底變化的,但“來(lái)源”和“風(fēng)格”的明顯標記仍然被保留下來(lái),比如最底下一行的藍色襯衫。在其他情形中,衣服是用整塊布料生成的,就比如中心位置那個(gè)小孩貌似穿著(zhù)和服一樣。它是從哪兒來(lái)的呢?請注意,所有這些都是完全可變的,并不是 A+B=C,而是取決于設置選項的調整方式,A 和 B 的所有因素都存在或都不存在。
這些人臉都不是來(lái)自真實(shí)的人類(lèi),但如果你說(shuō)它們是某個(gè)人設置的個(gè)人頭像,我絲毫不會(huì )起疑。面部生成器現在已經(jīng)能夠不斷地生成外觀(guān)完全正常的人類(lèi)圖像,想想還是有點(diǎn)可怕。下面是更多的例子:
它的效果還不完美,但的確有效。而且,能夠生成的不僅僅是人類(lèi),汽車(chē)、貓和風(fēng)景,這些事物或多或少都符合相同的范式,即擁有可以分離并進(jìn)行單獨再現的小、中、大風(fēng)格特征。對我個(gè)人而言,一個(gè)能夠生成無(wú)限數量喵星人的系統似乎更加有趣。
此外,這些研究人員還發(fā)布了一個(gè)新的面部數據集:70,000 張(經(jīng)過(guò)許可)從 Flickr 采集的面部圖像,全都經(jīng)過(guò)對齊和剪裁。他們使用亞馬遜的眾包服務(wù) Mechanical Turk 清除掉了雕像、繪畫(huà)和其他異常值。鑒于此類(lèi)項目使用的標準數據集主要是明星走紅毯的照片,這應該能夠提供擁有更多變化的面部數據集來(lái)開(kāi)展研究。
?。?a href="http://www.wxlp666.cn">邯鄲網(wǎng)絡(luò )公司)
小米應用商店發(fā)布消息稱(chēng) 持續開(kāi)展“APP 侵害用戶(hù)權益治理”系列行動(dòng) 11:37:04
騰訊云與CSIG成立政企業(yè)務(wù)線(xiàn) 加速數字技術(shù)在實(shí)體經(jīng)濟中的落地和應用 11:34:49
樂(lè )視回應還有400多人 期待新的朋友加入 11:29:25
亞馬遜表示 公司正在將其智能購物車(chē)擴展到馬薩諸塞州的一家全食店 10:18:04
三星在元宇宙平臺推出游戲 玩家可收集原材料制作三星產(chǎn)品 09:57:29
特斯拉加州San Mateo裁減229名員工 永久關(guān)閉該地區分公司 09:53:13