即梦AI在其官方酬酢媒体平台上近日发布了一段引东说念主注蓄意新功能预报视频,揭示了一项名为OmniHuman的更正多模态视频生成模子。该模子仅需用户输入一张图片和一段音频,即可自动生成一段机动传神的AI视频,这一冲破有望极地面擢升AI短片的分娩效力和视觉质地。
据即梦AI视频号发布的施行截图骄横,OmniHuman是由字节跨越自主研发的闭源模子。该模子约略处理包括肖像、半身照及全身照等不同尺寸的图片输入,并依据用户提供的音频施行,自动为视频中的东说念主物生成相应的作为,如演讲、称许、乐器演奏以及体格出动等。尤为OmniHuman在守护东说念主物视频生成中常见的手势失真问题上,相较于现存期间有了权贵擢升。
不仅如斯,OmniHuman还撑抓动漫、3D卡通等非真东说念主图片的输入,并能保抓这些特定格调及原有的通顺形状,生成的视频后果相同出色。从期间主页上的演示后果来看,OmniHuman所生成的视频仍是具备了高度的当然度和传神感。
伸开剩余52%然则,为严防这项期间被浪费,字节跨越期间团队明确暗示,OmniHuman将不会对外提供下载就业。即梦AI的关联厚爱东说念主表露,尽管OmniHuman模子仍是展现出了细腻的性能,但在生成达到影视真正级别的视频方面,仍有待进一步擢升。因此,该模子撑抓的多模态视频生告成能将领先在即梦平台上以小范畴内测的样式进行调优和完善,并迟缓向更平方的用户通达。
为确保AI期间的正面期骗和积极影响,即梦AI不仅修复了严格的安全审核机制,还将在输出的视频上标注水印以作教唆。这一举措旨在助力视频创作家更好地结束创意抒发,同期确保期间的使用稳妥说念德和法律圭表。
开端:http://www.cnu.com.cn/character/202502/50658.html
发布于:山东省