Created
Jul 29, 2024 05:48 AM
Favorite
Favorite
Priority
备注
推荐
🌟🌟🌟
类型
AI智能
—1
数字人技术的难点
尽管市面上已有众多商业平台推出了一系列解决方案,但此次,蚂蚁集团的支付宝开源了其数字人技术:EchoMimic。该技术使得人物表情生动多样,动作流畅自然,适用于虚拟主播和人物视频的生成。现在,无需任何费用,用户即可构建一套属于自己的数字人系统!
notion image
—2
阿里开源 EchoMimic 数字人技术
notion image
在音频输入推动下的人像图像动画领域,已经取得了在生成逼真动态人像方面的显著进步。传统方法局限于使用音频或面部关键点将图像转化为视频,虽然它们可以产生满意的结果,但某些问题仍然存在。比如:仅由音频驱动的方法有时可能因为相对较弱的音频信号而不稳定,而仅由面部关键点驱动的方法虽然在驱动上更为稳定,但由于关键点信息的过度控制,可能导致结果不自然。为了解决上述挑战,阿里采用了 EchoMimic 的新方法。EchoMimic 同时使用音频和面部标志进行训练。通过实施一种新颖的训练策略,EchoMimic 不仅能通过音频和面部标志单独生成人像视频,还可以通过音频和选定的面部标志的组合来生成。EchoMimic 已经在各种公共数据集和我们收集的数据集上与其它算法进行了全面比较,无论是在定量还是定性评估中都展示了卓越的性能。额外的可视化效果和源代码可以在 EchoMimic 项目页面上找到。
Github 地址:https://github.com/BadToBest/EchoMimic
官方地址:https://badtobest.github.io/echomimic.html
—3
阿里数字人功能介绍
notion image
  • 动画可通过用户上传的音频来驱动,能够根据音频内容创建人物肖像的动画,例如制作唱歌或说话的视频。
  • 同时该技术支持通过姿势数据来驱动动画,可以根据不同的姿势生成人物肖像的动画效果。
  • 此外还支持音频与姿势的混合驱动方式,可以结合音频和姿势数据共同生成动画。
  • 系统还提供了 WebUI 界面,使得操作更加简便易用。
—4
加我微信
有很多企业级落地实战案例,不方便公开发公众号,我会直接分享在朋友圈,欢迎你扫码加我个人微信来看👇
notion image
⬇戳”阅读原文“,立即预约!
Loading...