愛詩科技完成3億美元融資,視頻生成賽道進(jìn)入巨頭正面交鋒期
2026-03-12 15:12 愛詩科技

愛詩科技完成3億美元融資,視頻生成賽道進(jìn)入巨頭正面交鋒期23

據(jù)晚點(diǎn)報(bào)道,愛詩科技近期完成3億美元C輪融資,由鼎暉投資領(lǐng)投,超過20家機(jī)構(gòu)參與,創(chuàng)下中國視頻生成領(lǐng)域最大單筆融資紀(jì)錄。

這家成立近三年的公司,2025年底年度經(jīng)常性收入已超過4000萬美元,旗下PixVerse及拍我AI總用戶數(shù)超1億,月活突破1600萬。

愛詩科技創(chuàng)始人王長虎曾擔(dān)任字節(jié)跳動(dòng)視覺技術(shù)負(fù)責(zé)人,完整參與了抖音和TikTok從0到1的視覺技術(shù)架構(gòu)建設(shè)。2023年他創(chuàng)辦愛詩,核心團(tuán)隊(duì)多來自字節(jié)、微軟等科技巨頭。

今年1月,愛詩發(fā)布PixVerse R1,宣稱是全球首個(gè)通用實(shí)時(shí)世界模型,支持1080P分辨率流式視頻生成,用戶可在生成過程中隨時(shí)插入新指令,畫面隨之動(dòng)態(tài)調(diào)整。這一"實(shí)時(shí)交互"的探索路徑,試圖將視頻生成從"結(jié)果導(dǎo)向"轉(zhuǎn)向"過程即體驗(yàn)"。

1.字節(jié)快手兩強(qiáng)并立,創(chuàng)業(yè)公司承壓突圍

字節(jié)跳動(dòng)的Seedance系列是愛詩不得不直面的頭號(hào)對(duì)手。

今年春節(jié)期間,Seedance 2.0爆火出圈,《黑神話:悟空》制作人馮驥給出"當(dāng)前地表最強(qiáng)"的評(píng)價(jià),更具殺傷力的是其商業(yè)化定價(jià)。

3月4日,字節(jié)跳動(dòng)火山引擎公布Seedance 2.0商業(yè)化定價(jià),生成一段15秒的標(biāo)準(zhǔn)視頻對(duì)應(yīng)成本15元,折合每秒1元。這一價(jià)格錨點(diǎn)意味著高保真視頻正在變成像水、電一樣可量化采購的基礎(chǔ)服務(wù)。

字節(jié)的即夢(mèng)AI由剪映團(tuán)隊(duì)孵化,與剪映時(shí)間線及抖音、今日頭條等分發(fā)渠道深度打通,構(gòu)建起"模型+剪輯工具+分發(fā)場(chǎng)景"的完整閉環(huán)。

快手可靈則走通了另一條路。截至2025年7月,可靈全球用戶突破4500萬,累計(jì)生成超2億個(gè)視頻,服務(wù)超過2萬家企業(yè)客戶,累計(jì)收入超1億元。

可靈支持生成1080p分辨率、最長2分鐘的視頻,采用3D時(shí)空聯(lián)合注意力機(jī)制對(duì)物理規(guī)律進(jìn)行建模。其O1系列模型強(qiáng)調(diào)多模態(tài)理解和物理世界的仿真推演,試圖讓模型內(nèi)化重力、流體動(dòng)力學(xué)等規(guī)律。

快手借助可靈已經(jīng)建立起付費(fèi)心智,其會(huì)員體系為創(chuàng)作者提供了明確的商業(yè)化路徑。

面對(duì)這兩座大山,愛詩聯(lián)合創(chuàng)始人謝旭璋坦言有焦慮,但他表示,Seedance 2.0對(duì)愛詩的影響并不明顯,因?yàn)橐曨l生成的市場(chǎng)足夠大,大家還沒到需要正面競爭的階段。

他強(qiáng)調(diào),愛詩的核心用戶是那些第一次用AI做視頻的普通人,而字節(jié)流量最大的視頻產(chǎn)品抖音主要還是做短視頻消費(fèi),兩者定位存在差異。

2.實(shí)時(shí)交互開辟新戰(zhàn)場(chǎng),商業(yè)化驗(yàn)證成為分水嶺

視頻生成賽道的競爭已從"能否生成"升級(jí)為"能否進(jìn)流程、進(jìn)交付"。核心指標(biāo)包括多鏡頭角色一致性、相機(jī)語法精確控制、角色復(fù)用性及音畫一體化成片能力。

AI視頻生成成本已降至約300美元/分鐘,相比傳統(tǒng)影視成本實(shí)現(xiàn)"數(shù)量級(jí)"下降,生產(chǎn)效率提升80%以上。成本的急劇降低催生了AI漫劇等新內(nèi)容形態(tài)的爆發(fā)。

愛詩的差異化打法在于押注"實(shí)時(shí)交互"。PixVerse R1采用Omni原生多模態(tài)架構(gòu),文字、圖像、音頻、視頻在同一Token流中聯(lián)合訓(xùn)練,使模型可理解跨模態(tài)物理關(guān)聯(lián)。

其自回歸機(jī)制確保每幀生成均參考?xì)v史內(nèi)容,支撐長序列穩(wěn)定性;采樣步數(shù)壓縮至1-4步,通過冗余計(jì)算剔除與內(nèi)容感知型算力分配保障質(zhì)量與時(shí)效平衡。

實(shí)測(cè)中,R1可連續(xù)生成包含完整敘事流的視頻,鏡頭邏輯具備自主性,模型具備跨數(shù)十秒的長期記憶能力。這一技術(shù)路徑將視頻從固定的線性播放,轉(zhuǎn)變?yōu)榭梢詫?shí)時(shí)反饋、動(dòng)態(tài)演變的連續(xù)可視化流,其想象空間延展至虛擬社交、沉浸式娛樂甚至生成式游戲。

但R1尚未完全滿足嚴(yán)格定義的世界模型標(biāo)準(zhǔn),測(cè)試中存在轉(zhuǎn)場(chǎng)跳接、角色形象偶現(xiàn)不穩(wěn)定等問題,反映當(dāng)前角色綁定與物理規(guī)則建模仍待強(qiáng)化。

技術(shù)突破需要持續(xù)的算力投入,而這正是3億美元融資要解決的問題。

從行業(yè)視角看,AI視頻的商業(yè)閉環(huán)正在確立。

天風(fēng)證券研報(bào)指出,AI漫劇行業(yè)已完成從0到1的商業(yè)驗(yàn)證,劇目數(shù)與廣告投放呈現(xiàn)跨越式增長特征。

但硬幣的另一面是殘酷的淘汰賽,隨著Seedance 2.0等頂級(jí)模型的發(fā)布,平臺(tái)對(duì)內(nèi)容質(zhì)量的要求水漲船高,低質(zhì)內(nèi)容迅速失去生存空間。

對(duì)于愛詩來說,3億美元是它參與這場(chǎng)盛宴的資本。

但真正的考驗(yàn)在于,面對(duì)字節(jié)跳動(dòng)定下的"1元1秒"商業(yè)化標(biāo)尺,以及快手可靈在專業(yè)創(chuàng)作者心中建立的付費(fèi)心智,愛詩能否憑借實(shí)時(shí)交互的技術(shù)差異化和與中國儒意等產(chǎn)業(yè)方的場(chǎng)景協(xié)同,構(gòu)建起自己的護(hù)城河。

當(dāng)大廠把技術(shù)做成基礎(chǔ)設(shè)施,留給創(chuàng)業(yè)公司的容錯(cuò)空間已經(jīng)越來越窄。

88.jpg