引言
首先,這句話本身就是有問題的,因?yàn)閿?shù)字人直播是有一個悖論的,如果你連真人直播都沒有流量,那么數(shù)字人更假,為什么會有流量呢?
所以數(shù)字人跟流量完全沒有關(guān)系,數(shù)字人只跟你的成本有關(guān)系,所以有沒有流量,還是要看你的玩法。
我們做直播怎樣才有流量呢?學(xué)過我們千川課程的同學(xué)都知道,主要就是一留住人,二有轉(zhuǎn)化,就是你單品要有極致的轉(zhuǎn)化率。
第三個,你要去投隨心推跟千川,還需要你有優(yōu)秀的短視頻素材,通過千川的淺層流量去完成自然流量的撬動。
因?yàn)檫@個話題非常大,今天不展開來講,但是怎么才能有流量,這件事情跟數(shù)字人就沒有關(guān)系。
所以我們?nèi)绻B真人主播都沒有流量,如果你的玩法本身,你的人貨場本身就有問題的話,不管是真人還是數(shù)字人,都不會有流量。
我們先考慮一個問題,就是數(shù)字人會不會違規(guī),或者說如何做出不違規(guī)或者說整體效果更好的數(shù)字人。
我們知道數(shù)字人有一個問題,特別是直播數(shù)字人,就是會被平臺判定為錄播,而且整個效果非常假。
現(xiàn)在的數(shù)字人是可以做到跟真人差不多,其實(shí)很簡單,如果我們把直播間拆分,無非就是場景和人,還有貨。
第一個,你直接通過換背景就能夠把場景的問題解決了。
人這個問題相對來講比較復(fù)雜,因?yàn)閿?shù)字人主要就是做這個人,首先可以通過工具去換人的臉,去破解平臺的人臉識別。
第二個,我們可以去換聲音,通過換聲音去破解音頻的特征。
第三個,就是我們的話術(shù),我們可以直接去錄自己的話術(shù),或者去模仿別人直播間的話術(shù)。
當(dāng)然,推薦整個過程還是自己去錄,然后在直播的時候,目前平臺的規(guī)則是必須要有真人。
就是你的數(shù)字人,必須背后有一個真人去驅(qū)動,不然互動會非常差,所以我們在用數(shù)字人去講解產(chǎn)品的時候,旁邊需要配一個客服。
客服主要就是通過實(shí)時在旁邊回答問題的方式,讓這個直播間整體不要違規(guī)。
乍一聽你可能沒有頭緒,如果你在AI這塊基礎(chǔ)比較弱的話,我們可以把整體的工作做拆解,就是如何生成一個沒有成本的數(shù)字人直播間。
首先,我們要準(zhǔn)備話術(shù)和直播的視頻素材,我們直播基本上都是逐字稿,可以借鑒同行,用AI讓GPT重新寫一遍。
方法很簡單,把同行的直播間直接錄下來,然后轉(zhuǎn)成文本,交給GPT 32K或者claude 100K。
然后讓AI去摘要分析整個直播間話術(shù)的結(jié)構(gòu),然后讓AI根據(jù)這個結(jié)構(gòu)重新寫一遍,然后告訴AI我的產(chǎn)品有什么賣點(diǎn)。
第二個就是數(shù)字人的視頻素材,這有兩個方法,比較偷懶的方法是直接去錄別人的直播間。
直播間錄出來之后,再去換他的背景、換他的臉、換他的聲音、換他的話術(shù),但這個有很多局限,所以還是推薦自己去錄。
我們可以去招一個兼職主播,比如上海200元/時,后面去支一個綠幕,讓他照著你的話術(shù)直播。
然后把整個直播錄下來,這樣你就得到了大概一小時或者兩小時的,有綠幕的,并且有主播的視頻。
這個視頻就是接下來用于我們?nèi)ドa(chǎn)數(shù)字人的原料了,生產(chǎn)數(shù)字人的一個素材,我們可以用這個視頻去生成數(shù)字人的視頻。
我們通過deep face去換臉,通過DDSP去換聲音,然后再通過剪映把整個背景給摳掉,換上自己的背景。
如果你想要做多個直播間,你是可以不停地去換臉,去換不同的臉,不同的聲音,跟不同的背景,去做N個這樣子的視頻。
最后,數(shù)字人的錄播,你可以用obs的推流工具去生成一個虛擬攝像頭開播,當(dāng)然,播的時候一定要有客服在旁邊實(shí)時回答問題。
這樣系統(tǒng)基本上沒辦法判斷你是錄播了,因?yàn)槟阌胁灰粯拥哪槪胁灰粯拥穆曇?,有不一樣的背景,還有不一樣的內(nèi)容。
如果你聽到這留,還是沒有太多頭緒的話,你可以私信我,上個月有一節(jié)講數(shù)字人的公開課,我可以發(fā)給你。
用戶評論