EMO | 通义千问照片唱歌AI

来源:IT之家圈子:AI前沿 2024-05-10 13:17:58 311阅读 举报

EMO终于在4月25日上线了通义千问APP,并向所有用户免费开放。

利用人工智能技术,可以通过输入音频和照片到AI模型中,使得照片中的人物看起来在唱歌或说话,比如让奥黛丽·赫本唱歌《上春山》,陶俑仕女说英文RAP,甚至让爱因斯坦讲中文幽默段子。

不久之前,由于阿里巴巴达摩院发布的一篇论文,这款名为EMO的模型在国内外广受关注,关于该模型产品化进程也备受瞩目。

如今,请打开通义APP,点击进入“全民舞台”频道,即可进入EMO产品页面的“全民唱演”功能。您可以选择歌曲、热门梗、或表情包中的任意一款模板,然后上传您的肖像照片,EMO将会立即为您生成合成视频。

通义APP最新推出了超过80款EMO模板,其中包括流行歌曲《上春山》和《野狼disco》,以及网络热词“钵钵鸡”和“回手掏”等。

目前通义APP暂时无法让用户自定义音频内容,只能从APP提供的预设音频中选择来生成视频。

据悉,EMO是由通用实验室开发的人工智能模型,其所采用的“说话头”技术是目前人工智能生成创作领域的热门技术。

在EMO之前,Talking Head技术都需要对人脸、人头或身体部分进行3D建模。全球同义实验室首先提出了弱控制设计,可以实现通过驱动人像进行口型动作,无需建模。这不仅降低了视频生成成本,还大大提高了视频生成质量。

EMO已经学习和应用了人类情绪表达的技能,可以使音频内容与人物的表情和嘴部动作相匹配,同时将音频语气和情感特征反映在人物微表情中。

今年2月底,通义实验室发布了一篇相关论文,EMO随之成为继SORA之后备受关注的AI模型之一。如今,通义APP让所有人都有机会免费体验这一前沿模型的创造力。

在未来,预计情感技术将广泛应用于数字化人物、在线教育、影视制作、虚拟互动和电子商务直播等领域。

一段时间过后,通义APP的热门产品频繁推出。现象级App“全民舞王”曾在社交平台引发“兵马俑跳科目三”、“金毛跳舞”等热潮,Anmate Anyone这一模型诞生自通义实验室。

最近,通义APP已经推出了超长文档解析、AI编码助手、AI会议助手等免费实用功能。通义大模型正逐渐成为更多用户的顶尖AI助手。


合作联络微:vapehome
链接:https://www.aiddithome.com/p/17359161de612d.html
版权归原作者所有,未经允许请勿转载。若此文章存在违规行为,您可以点击 “举报”

登录 后发表评论
0条评论
还没有人评论过~