新浪科技訊 9月24日下午消息,火山引擎總裁譚待正式發(fā)布豆包視頻生成大模型。其特性包括高效的DiT融合計算單元、全新設計的擴散模型訓練方法和深度優(yōu)化的Transformer結構,可以實現更充分地壓縮編碼視頻與文本,支持一致性多鏡頭生成,能夠大幅提升視頻生成的泛化能力,譚待表示,豆包視頻生成大模型支持多風格多比例的一致性多鏡頭生成,可應用在電商營銷、動畫教育、城市文旅、微劇本等領域。
此外,譚待表示,豆包大模型發(fā)布以來,使用量爆發(fā)式增長。豆包大模型日均tokens使用量超過1.3萬億,日均生成圖片5000萬張,日均處理語音85萬小時。(羅寧)
責任編輯:江鈺涵
【免責聲明】本文僅代表作者本人觀點,與和訊網無關。和訊網站對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。郵箱:news_center@staff.hexun.com
最新評論