快手可靈3.0系列模型上線,覆蓋圖/視頻生成及編輯全流程
2026-02-07 18:18 快手

快手可靈3.0系列模型上線,覆蓋圖/視頻生成及編輯全流程23

2月5日,可靈AI正式全球上線3.0系列模型。這套新模型覆蓋了從圖片生成、視頻生成到后期編輯的全流程,其核心目標(biāo)是讓AI生成的內(nèi)容從“能看”走向“專業(yè)可用”。

此次升級最大的突破在于“可控性”。過去使用AI生成視頻,創(chuàng)作者常面臨人物形象不穩(wěn)定、動(dòng)作邏輯斷裂、口型與聲音對不上的窘境,如同“抽盲盒”??伸`3.0通過“All-in-One”的統(tǒng)一架構(gòu),將理解、生成與編輯整合為一個(gè)連續(xù)流程。它引入了“智能分鏡”系統(tǒng),創(chuàng)作者可以通過文字指令,直接控制鏡頭的遠(yuǎn)近、推拉和敘事節(jié)奏,不再需要像過去那樣逐幀拼接。

同時(shí),其“圖生視頻+主體參考”技術(shù),允許用戶上傳參考素材,鎖定特定人物的形象、動(dòng)作甚至音色,確保在復(fù)雜鏡頭切換中角色特征高度統(tǒng)一,解決了長期困擾行業(yè)的“一致性”難題。此外,新模型支持最長15秒的連續(xù)生成,并實(shí)現(xiàn)了中、英、日、韓、西五種語言及方言的精準(zhǔn)口型匹配,大幅提升了視頻的真實(shí)感與沉浸感。

快手在AI領(lǐng)域的布局較早,從2024年6月發(fā)布首個(gè)面向用戶的DiT視頻生成模型,到現(xiàn)在邁入3.0時(shí)代,可靈AI的用戶量已超過6000萬,生成視頻超過6億個(gè),服務(wù)企業(yè)用戶超3萬,年化收入運(yùn)行率達(dá)到2.4億美元。

目前,全球科技巨頭和初創(chuàng)公司都在爭奪AI視頻生成這塊“蛋糕”。比如OpenAI的Sora、Google的Veo,都在追求生成更長、更真實(shí)的視頻。國內(nèi)除了可靈,也有其他公司在做類似嘗試,大家都在解決“生成質(zhì)量”和“可控性”這兩個(gè)核心問題。

行業(yè)方面,AI視頻正在從“生成短片段”向“長視頻、全流程制作”過渡。以前AI只能做一個(gè)幾秒鐘的特效,現(xiàn)在能輔助導(dǎo)演完成分鏡、剪輯甚至角色表演。這種變化,一方面降低了創(chuàng)作門檻,讓普通人也能拍“大片”;另一方面,也對算力、算法提出了更高要求,行業(yè)競爭正從“拼創(chuàng)意”轉(zhuǎn)向“拼技術(shù)落地能力”。

88.jpg