數智人有了“生產工廠”,3分鐘定制一個你的分身?

2023-04-26 20:54:12 來源:市界觀察

打印 放大 縮小

成本降到千元級別、12小時出demo、可自行定制“數字分身”……數智人生產有了可批量復制的“生產工廠”。


(相關資料圖)

4月25日,騰訊云智能小樣本數智人生產平臺首次對外發布,平臺具有訓練樣本小、生產效率高、自動化生產等特性,可以實現“自助式”數智人生產制作。 3分鐘真人口播視頻、100句語音素材,平臺便可通過音頻、文本多模態數據輸入,實時建模并生成高清人像,在24小時內制作出與真人近似的“數智人”。

以知識分享口播視頻生產為例,小樣本數智人可以代醫生、律師等專業人士出鏡,大大節省視頻錄制時間。

數智人的價格、生產周期的下降,離不開通用模型的進步。

曾經訓練每一個數智人,需要幾十小時甚至更長時間的語料、視頻素材,而用通用模型的學習,每一個新的數智人的定制,包括形象、音色等,邊際成本會有所下降,逐漸成為固定成本。同時,數智人的生產周期也大大下降,曾經是以月為級別,如今一天內就能生成。

因為標注數智人的成本較高,騰訊在技術的構建里,引入了自監督機制,“讓數據自己約束自己,可以省掉很多數智人標注時間?!?/p>

騰訊優圖實驗室研究總監汪鋮杰介紹,早期做3D重建時,需要自己設計一套表情,再用3D掃描,才能獲得一個3D人臉,需要花費半個小時到一個小時,一天能夠采集的人的數量有限。而采用了自監督模式后,生成效率就會大大提高,數據量提高后,模型的表達能力也會提升。再通過自監督學習的方式,去消化大量數據,構成預訓練模型。另外,生成模塊中,3D重建渲染出來變成自然圖像,最后也會以自監督學習的模式變成自己學習,達到消化大數據,通用預訓練模型的效果。

另一個降低成本的方式是提高自動化生產能力。比如,原來一個人有50-200多個表情,挨個制作較為麻煩,現在重建算法,自動去生成標準,就能加快整個制作過程。

“小樣本數智人,看到的小,但是背后是大,是基于自監督技術,構建大的數據、大的模型?,F在是3分鐘,可能過幾個月變成1分鐘了,大模型持續去消化更多的數據,模型會變得更大?!蓖翡吔苷f。

目前,“數智人工廠”大多還是面向企業端用戶、特殊名人定制等方向,由于個人投入的商業模式較為模糊,出于算力成本、制作成本等考慮,開放時間未明。

“(C端個人用戶)整體的落地,一個是時間成本,一個是金錢成本,還有一個是穩定性,這三個如果都解決了,對于個人來說做自己的數智分身都是觸手可及的。我們會變成自助式的,客戶可以自己開賬號,下單,購買,上傳素材,自己訓練,確認效果好不好,后續就是一站式的,自己獨立式的生成?!彬v訊云智能數智人產品總經理陳磊說。

撰文 | 趙子坤

編輯 | 董雨晴

關鍵詞:

責任編輯:ERM523

相關閱讀

亚洲精品欧美精品,亚洲人成在线影院,亚洲电影欧美电影有声小说,麻豆九一精品爱看视频在线观看免费
>