原標(biāo)題:可靈AI數(shù)字人正式登場 極簡操作實(shí)現(xiàn)高質(zhì)輸出
近日,一款名為可靈AI的數(shù)字人產(chǎn)品正式進(jìn)入公眾視野,憑借其精準(zhǔn)的口型同步技術(shù)、細(xì)膩的情緒演繹能力以及跨風(fēng)格角色生成優(yōu)勢,迅速成為數(shù)字人技術(shù)領(lǐng)域的標(biāo)桿產(chǎn)品。用戶僅需上傳一張角色圖片并輸入文字或音頻,即可生成分辨率達(dá)1080p、幀率48FPS的高質(zhì)量數(shù)字人視頻,最長支持1分鐘時(shí)長,覆蓋中英日韓等多語種,價(jià)格低至每秒0.12元,為廣告、電商、教育等行業(yè)提供了高效解決方案。
該產(chǎn)品的核心突破在于“極簡輸入、高質(zhì)輸出”的生成模式。用戶既可上傳自有素材,也能使用內(nèi)置的官方形象庫、AI生圖功能及近百種TTS音色,完成從角色創(chuàng)建到配音的全流程操作。這種“一站式”設(shè)計(jì)大幅降低了技術(shù)門檻,使中小企業(yè)和內(nèi)容創(chuàng)作者無需專業(yè)團(tuán)隊(duì)即可制作高品質(zhì)數(shù)字人視頻。例如,在產(chǎn)品講解場景中,用戶僅需一張商品圖片和一段解說詞,便能快速生成具有專業(yè)表現(xiàn)力的數(shù)字人導(dǎo)購視頻。
在角色表現(xiàn)力方面,可靈AI展現(xiàn)了深厚的技術(shù)積累。實(shí)測案例顯示,當(dāng)輸入一段英文歌曲音頻時(shí),數(shù)字人歌手的唇形與歌詞音節(jié)完美匹配,即使面對快速連讀也能保持精準(zhǔn)同步。更引人注目的是,通過提示詞“眼神專注自信地唱歌”,系統(tǒng)不僅控制了唇部動作,還生成了持麥姿態(tài)、微笑互動等細(xì)節(jié),完整還原了舞臺表演的真實(shí)感。這種“神形兼?zhèn)?rdquo;的演繹能力,突破了傳統(tǒng)數(shù)字人僅實(shí)現(xiàn)音畫同步的局限。
跨風(fēng)格角色生成是該產(chǎn)品的另一大亮點(diǎn)。依托可靈視頻模型的強(qiáng)大泛化能力,系統(tǒng)可處理寫實(shí)人物、動漫形象甚至動物角色。在卡通貓咪唱英文Rap的案例中,數(shù)字人不僅精準(zhǔn)捕捉音頻節(jié)奏,還生成了隨節(jié)奏搖擺身體的自然動作,賦予虛擬角色鮮活的生命力。這種跨越風(fēng)格界限的能力,為內(nèi)容創(chuàng)作提供了更廣闊的想象空間。
情緒與動作的精細(xì)化控制,進(jìn)一步提升了數(shù)字人的表現(xiàn)深度。在表現(xiàn)“憤怒”情緒的測試中,系統(tǒng)根據(jù)提示詞“內(nèi)心全是氣憤,非常生氣”,生成了緊鎖眉頭、緊抿嘴唇、眼神壓迫感等微表情,將抽象情緒轉(zhuǎn)化為具象視覺語言。這種能力源于多模態(tài)理解大模型與視頻生成模型的深度融合,使數(shù)字人不僅能“聽聲音”,更能“懂意圖”,從而精準(zhǔn)規(guī)劃長視頻中的情緒變化、動作設(shè)計(jì)及運(yùn)鏡邏輯。
技術(shù)層面,可靈AI通過交叉注意力機(jī)制實(shí)現(xiàn)音畫高度對齊,結(jié)合強(qiáng)化口型的訓(xùn)練策略,確保多語種、歌唱或快速語速場景下的唇形精準(zhǔn)度。其關(guān)鍵幀控制架構(gòu)采用“先構(gòu)建敘事骨架,再并行生成片段”的方式,在保持角色身份一致的前提下,支持無限長度視頻生成。專業(yè)評測顯示,與行業(yè)知名產(chǎn)品Heygen及即夢數(shù)字人(Omnihuman-1方案)對比,可靈AI在整體效果及細(xì)分維度上均表現(xiàn)優(yōu)異,GSB得分分別達(dá)到1.37和2.39,位居行業(yè)前列。
作為全球領(lǐng)先的視頻生成大模型,可靈AI自2024年6月發(fā)布以來已完成超30次迭代,用戶規(guī)模突破4500萬,生成視頻數(shù)量超2億,并為超過2萬家企業(yè)提供API服務(wù),覆蓋影視、游戲、廣告等多個領(lǐng)域。此次數(shù)字人產(chǎn)品的推出,將進(jìn)一步推動技術(shù)普惠化,助力短視頻制作、電商直播、在線教育等場景實(shí)現(xiàn)規(guī)模化應(yīng)用。
原標(biāo)題:Meta押注人形機(jī)器人軟件賽道,以開放平臺模式謀求行業(yè)生態(tài)主導(dǎo)權(quán) 科
AI2025-09-28 21:15:29
原標(biāo)題:蘋果推出輕量AI模型SimpleFold:簡化結(jié)構(gòu)降成本,助力科研加速發(fā)展 科
AI2025-09-25 19:30:23
原標(biāo)題:宇樹科技王興興:通用機(jī)器人發(fā)展遇阻,開放協(xié)作或成破局關(guān)鍵 在近
AI2025-09-24 20:15:13
原標(biāo)題:華為超節(jié)點(diǎn)+集群破局:撞開算力枷鎖,鋪就中國AI智能新坦途 2005年,
AI2025-09-21 15:45:28
原標(biāo)題:DeepSeek-R1登上《自然》封面 國際頂級學(xué)術(shù)期刊《自然》最新一期封面聚
AI2025-09-18 19:14:51
原標(biāo)題:?支付寶螞蟻AI健康管家AQ上新:拍臉測膚、健康管理、老人服務(wù)一應(yīng)
AI2025-09-13 16:47:11
原標(biāo)題:OpenAI攜手博通自研AI芯片,臺積電代工,預(yù)計(jì)2026年量產(chǎn) 近期,據(jù)國外
AI2025-09-05 21:04:21
原標(biāo)題:柯潔憶戰(zhàn)阿爾法狗:棋手幻滅,AI時(shí)代各行業(yè)需未雨綢繆 在一次由新浪
AI2025-09-04 20:33:17
- 鹿科技—新生活·新科技·新未來
- 關(guān)于我們 | 聯(lián)系我們 | 商務(wù)合作
- 尋求報(bào)道 | 免責(zé)聲明 | 網(wǎng)站地圖
- 申請友鏈 | 加入我們 | 意見反饋
- 投訴建議
- 通過E-mail將您的想法和建議發(fā)給我們
- 稿件投訴:lukejiwang@163.com
- 合作網(wǎng)站:IT人 寵物經(jīng) 學(xué)習(xí)迷 女邦網(wǎng)
- 聯(lián)系我們
- 服務(wù)熱線:400-8558-350
- 官方客服QQ:3083915219
- 微信公眾號:lukejiwang

浙公網(wǎng)安備 33052102000511號














