2月17日,openAI公司發(fā)布的首款文生視頻的人工智能大模型sora給人工智能市場投下了一枚重磅炸彈,文生視頻這一技術(shù)模式受到廣泛的關(guān)注和討論。
近日,國內(nèi)的文生視頻技術(shù)模式相關(guān)專利亮相公開。2月23日,天眼查專利信息顯示,百度文生視頻專利獲得授權(quán),其專利可以根據(jù)文本內(nèi)容生成視頻。百度申請的該專利名稱為“視頻生成方法、裝置、電子設(shè)備和存儲介質(zhì)”專利,摘要顯示,本公開涉及人工智能技術(shù)領(lǐng)域,尤其涉及增強現(xiàn)實、虛擬現(xiàn)實、計算機視覺、深度學(xué)習(xí)等技術(shù)領(lǐng)域,可應(yīng)用于元宇宙、虛擬數(shù)字人等場景下。具體實現(xiàn)方案為:響應(yīng)于接收到目標(biāo)文本,根據(jù)與其相關(guān)的多個初始時間信息,確定與至少一個目標(biāo)動作標(biāo)簽文本分別對應(yīng)的至少一個第一目標(biāo)時間信息,其中,目標(biāo)文本是利用至少一個目標(biāo)動作標(biāo)簽文本處理初始文本得到的,目標(biāo)動作標(biāo)簽文本與預(yù)設(shè)動作對應(yīng);根據(jù)至少一個第一目標(biāo)時間信息,對目標(biāo)虛擬形象進行渲染,得到至少一個第一視頻片段,其中,第一視頻片段與預(yù)設(shè)動作對應(yīng);根據(jù)至少一個第一視頻片段,生成目標(biāo)視頻。相關(guān)專利自2022年11月30日提交申請,2023年4月7日申請公布,預(yù)估將于2042年11月30日到期。
除百度外,清華大學(xué)也公開了一個文生視頻專利。2月20日,國家知識產(chǎn)權(quán)局網(wǎng)站公告顯示,清華大學(xué)申請的一種定制化多主體文生視頻方法、裝置、設(shè)備及介質(zhì)”專利公布,發(fā)明人為王鑫;朱文武;陳虹。摘要顯示,該申請涉及神經(jīng)網(wǎng)絡(luò)技術(shù)領(lǐng)域,通過多種損失對文生視頻模型的參數(shù)進行優(yōu)化,使優(yōu)化的模型基于文本描述生成視頻中的圖像時,文本描述與定制化主體保持一致,且在每個主體在生成過程中的特征不會發(fā)生混淆的同時消除合成痕跡。
Sora公布不過短短一周不到的時間,文生視頻的技術(shù)應(yīng)用和相關(guān)內(nèi)容產(chǎn)品已經(jīng)鋪天蓋地,就在23日,央視頻發(fā)布消息,中國首部文生視頻AI系列動畫片《千秋詩頌》啟播暨中央廣播電視總臺人工智能工作室揭牌儀式將在23日舉行。官網(wǎng)介紹《千秋詩頌》面向小學(xué)生,是小學(xué)語文課本詩詞動畫故事系列片。
文生視頻技術(shù)是人工生成式AI技術(shù)應(yīng)用的重大突破,也極有可能成為對傳媒相關(guān)領(lǐng)域產(chǎn)生重大影響的技術(shù),當(dāng)下國內(nèi)外科技公司密切關(guān)注并投入研發(fā),人工智能領(lǐng)域巨頭基本上都在致力于開發(fā)文生視頻相關(guān)產(chǎn)品模型和應(yīng)用。目前我們所使用的、能見到的比較成熟的、落地的文生視頻模型諸如Runway、Pika包括近期熱度極高的sora,都是海外科技公司的產(chǎn)品,國內(nèi)的科技公司所研發(fā)的文生視頻專利將會給我們帶來怎樣的人工智能大模型令人期待。
用戶評論