当前位置:首页 > 文化 > 正文内容

视频大模型Vidu全面开放使用:30秒生成,支持动漫风格

admin1年前 (2024-08-07)文化187

视频大模型Vidu全球上线:30秒生成动漫风格视频

视频大模型Vidu全面开放使用:30秒生成,支持动漫风格

7月30日,国产纯自研视频大模型Vidu(www.vidu.studio)正式全球上线,向用户开放文生视频、图生视频两大核心功能。Vidu提供4秒和8秒两种时长选择,分辨率最高可达1080P,用户仅需30秒即可生成一段4秒片段。生数科技推出了Vidu免费版和标准版,免费版支持生成4秒视频,标准版每月7.99美元,可生成4秒和8秒视频,并支持超清、商用、超清后去除水印等功能。

Vidu不仅能够实现常见的写实风格,还新增了动漫风格选项。这一功能不仅保持了动漫风格的一致性,还显著提高了画面的稳定性,解决了其他视频生成工具在“动漫化”过程中常见的画面跳变和风格突变问题。无论是科幻、西部、浪漫还是动画类型的电影,Vidu都能生成符合对应风格的画面片段。此外,Vidu还能生成影视级特效画面,如烟雾、炫光效果、CG特效等。

在“图生视频”板块中,Vidu上线了角色一致性功能,用户可以上传人像图或自定义的角色图,并通过文字描述指定该角色在任意场景中做出任意动作。这一功能简化了视频制作流程,节省了设计和调整角色形象的时间,同时提供了高度的创作自由度。Vidu还能理解和生成提示词中的文字,包括字母、数字等,并能生成文字特效。对于第一人称、延时摄影等镜头语言,Vidu也能精准表达,用户只需细化提示词,即可提高视频的可控性。

生数科技成立于2023年3月,核心团队成员来自清华大学人工智能研究院,首席科学家朱军为清华大学教授。朱军表示,Vidu的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构,完全由团队自主研发。

Vidu的上线标志着视频生成技术的新突破,将为用户提供更加便捷、高效的视频制作体验。

扫描二维码推送至手机访问。

版权声明:本文由文雀网发布,如需转载请注明出处。

本文链接:https://www.360wq.com/index.php/post/592.html

分享给朋友:

“视频大模型Vidu全面开放使用:30秒生成,支持动漫风格” 的相关文章

百度请放心,AI搜索还取代不了你

百度请放心,AI搜索还取代不了你

AI搜索能否彻底颠覆传统搜索引擎?近日,随着OpenAI宣布开放AI搜索引擎SearchGPT的内测,以及国内多家企业纷纷推出AI搜索产品,AI搜索似乎正迎来一场革命。然而,尽管AI搜索在技术上取得了显著进展,其能否完全取代传统搜索引擎仍存在诸多挑战和难题。首先,AI搜索面临的一大问题是准确性与信源...

投资人扎堆“投钱”近20亿元,实控人却滞留海外、掏空资产

投资人扎堆“投钱”近20亿元,实控人却滞留海外、掏空资产

华云数据融资近20亿,实控人却被曝滞留海外、掏空资产?近日,华云数据控股集团有限公司(以下简称华云数据)陷入了“创始人跑路”的风波。据悉,华云数据在吸引了十余家国内知名投资机构及上市公司的投资后,五轮累计融资近20亿元。然而,就在投资人们期待着回报的时候,股东们却举报实控人许广彬潜逃海外,公司资产被...

全球首个亿级参数量地震波大模型“谛听”发布

全球首个亿级参数量地震波大模型“谛听”发布

全球首个亿级参数量地震波大模型“谛听”问世,防震减灾迎来新科技近日,记者从国家超级计算成都中心获悉,全球首个亿级参数量的专业地震数据处理大模型“谛听”日前正式发布,并计划于2024年底进行公测。这一突破性成果标志着地震学研究和防震减灾事业迈入了新的智能化阶段。2023年9月,成都产业集团和成都天投集...

生成式人工智能系统应用员、网络主播等19个新职业“入编”

生成式人工智能系统应用员、网络主播等19个新职业“入编”

19个新职业亮相,揭示经济发展新趋势近日,人力资源社会保障部正式发布了包括云网智能运维员、生成式人工智能系统应用员、用户增长运营师在内的19个新职业,以及直播招聘师等28个新工种,并将其纳入国家职业分类大典。这批新职业和新工种的诞生,不仅反映了经济社会发展的新变化和新趋势,也为劳动者提供了更多就业选...

脑机接口新应用,渐冻症患者用意念控制Vision Pro

脑机接口新应用,渐冻症患者用意念控制Vision Pro

美国脑机接口公司Synchron宣布重大突破:意念控制苹果Vision Pro成为现实近日,美国脑机接口公司Synchron宣布了一项重大突破,其脑机接口(BCI)产品现已兼容苹果公司的头显产品Vision Pro。这一创新使得身体不便的患者能够通过意念来控制苹果的旗舰XR设备,为他们带来了全新的交...

在乌兹别克斯坦,巴扎里能买到一切

在乌兹别克斯坦,巴扎里能买到一切

乌兹别克斯坦的巴扎:喧嚣与浮躁中的文化瑰宝近日,一篇介绍乌兹别克斯坦巴扎的文章引起了广泛关注。文章通过生动的画面和细腻的描写,展示了巴扎这一独特市井场所的魅力和文化价值。巴扎,这个充满生活气息的地方,以其丰富的商品种类和独特的市井氛围吸引了无数游客和商贩。在这里,不仅能买到日常所需的各种商品,还能感...