欢迎来到东莞市九游体育机械科技有限公司网站,我们竭诚为您提供优质的视觉定位机、制盒机、礼盒机、皮壳机、成型机、贴角机、压泡机等

网站地图手机网站手机网站微信公众号微信公众号微信小程序微信小程序

九游体育机械 9you Machinery

专业的礼品盒装书设备定制厂家集研发生产、销售、售后于一体,支持客户非标定制

  • 联系金先生咨询:

    13925867976

  • 热搜关键词: 视觉定位机 制盒机 礼盒机 皮壳机 成型机 贴角机
    九游体育-可让照片人物“开口说话”,阿里巴巴研究团队推出 AI 框架“EMO”

    信息来源于:互联网 发布于:2024-07-09

    IT之家3月1日消息,阿里巴巴研究团队近日发布了一款名为“EMO(Emote Portrait Alive)”的AI框架,该框架号称可以用于“对口型”,只需要输入人物照片及音频,模型就能够让照片中的人物开口说出相关音频,支持中英韩等语言。  据悉,EMO基于英伟达的Audio2Video扩散模型打造,号称使用了超过250小时的专业视频进行训练,从而得到了相关AI框架。  IT之家注意到,研究团队分享了几段由EMO框架生成的DEMO演示片段,并在ArXiv上发布了模型的工作原理,感兴趣的小伙伴也可以访问GitHub查看项目。5f9b662e-1633-4196-b099-de4316713fea▲图源研究人员发布的DEMO片段  据介绍,该框架工作过程分为两个主要阶段,研究人员首先利用参考网络(ReferenceNet)从参考图像和动作帧中提取特征,之后利用预训练的音频编码器处理声音并嵌入,再结合多帧噪声和面部区域掩码来生成视频,该框架还融合了两种注意机制和时间模块,以确保视频中角色身份的一致性和动作的自然流畅。  研究人员援引一系列实验结果,声称EMO不仅能够产生令人信服的说话视频,还能生成各种风格的歌唱视频,号称“显著优于目前的DreamTalk、Wav2Lip、SadTalker等竞品”。-九游体育入口
    本文标签:九游体育返回
  • 上一篇:九游体育-建设现代化产业体系 实现由机器人大国向机器人强国迈进 下一篇:九游体育-AI 替代人工编辑首战失败,维基百科不再视 CNET 媒体为可靠信源
  • 热门资讯
  • 关于九游体育

    公司简介 荣誉资质 合作伙伴 厂房车间 客户案例
  • 产品中心

    全自动智能制盒机 机械手影像定位机 礼品盒伺服成型机 全自动纸盒贴角机 礼品盒机械非标定制
  • 新闻中心

    公司动态 行业资讯 常见问题
  • 联系方式

    金 坤:13925867976

    金 培 煜:13925867976

    金 鑫:18926882708

    地 址:东莞市道滘镇昌平村百代工业园四栋一楼
  • 扫描进入手机站

    扫描进入手机站