LatentSync 是字节开源的用于口型同步的扩散模型,只需提供角色视频和要同步的音频即可生成。该模型对硬件的要求适中,仅需 6.5 GB 的 GPU 即可运行,适合大多数开发者和研究人员使用。此外,@fffiloni大佬还提供了一个在线演示可以玩一下。
主题测试文章,只做测试使用。发布者:jovi,转转请注明出处:https://goodux.cn/archives/ai-news/%e5%ad%97%e8%8a%82%e5%bc%80%e6%ba%90-latentsync%ef%bc%9a%e9%ab%98%e6%95%88%e5%8f%a3%e5%9e%8b%e5%90%8c%e6%ad%a5%e6%89%a9%e6%95%a3%e6%a8%a1%e5%9e%8b