字节开源 LatentSync：高效口型同步扩散模型

jovi • 2025年1月6日上午12:00 • • 阅读 6

LatentSync 是字节开源的用于口型同步的扩散模型，只需提供角色视频和要同步的音频即可生成。该模型对硬件…

LatentSync 是字节开源的用于口型同步的扩散模型，只需提供角色视频和要同步的音频即可生成。该模型对硬件的要求适中，仅需 6.5 GB 的 GPU 即可运行，适合大多数开发者和研究人员使用。此外，@fffiloni大佬还提供了一个在线演示可以玩一下。

来源：三花快讯

主题测试文章，只做测试使用。发布者：jovi，转转请注明出处：https://goodux.cn/archives/ai-news/%e5%ad%97%e8%8a%82%e5%bc%80%e6%ba%90-latentsync%ef%bc%9a%e9%ab%98%e6%95%88%e5%8f%a3%e5%9e%8b%e5%90%8c%e6%ad%a5%e6%89%a9%e6%95%a3%e6%a8%a1%e5%9e%8b