EMO | 通义千问照片唱歌AI

EMO终于在4月25日上线了通义千问APP，并向所有用户免费开放。

利用人工智能技术，可以通过输入音频和照片到AI模型中，使得照片中的人物看起来在唱歌或说话，比如让奥黛丽·赫本唱歌《上春山》，陶俑仕女说英文RAP，甚至让爱因斯坦讲中文幽默段子。

不久之前，由于阿里巴巴达摩院发布的一篇论文，这款名为EMO的模型在国内外广受关注，关于该模型产品化进程也备受瞩目。

如今，请打开通义APP，点击进入“全民舞台”频道，即可进入EMO产品页面的“全民唱演”功能。您可以选择歌曲、热门梗、或表情包中的任意一款模板，然后上传您的肖像照片，EMO将会立即为您生成合成视频。

通义APP最新推出了超过80款EMO模板，其中包括流行歌曲《上春山》和《野狼disco》，以及网络热词“钵钵鸡”和“回手掏”等。

目前通义APP暂时无法让用户自定义音频内容，只能从APP提供的预设音频中选择来生成视频。

据悉，EMO是由通用实验室开发的人工智能模型，其所采用的“说话头”技术是目前人工智能生成创作领域的热门技术。

在EMO之前，Talking Head技术都需要对人脸、人头或身体部分进行3D建模。全球同义实验室首先提出了弱控制设计，可以实现通过驱动人像进行口型动作，无需建模。这不仅降低了视频生成成本，还大大提高了视频生成质量。

EMO已经学习和应用了人类情绪表达的技能，可以使音频内容与人物的表情和嘴部动作相匹配，同时将音频语气和情感特征反映在人物微表情中。

今年2月底，通义实验室发布了一篇相关论文，EMO随之成为继SORA之后备受关注的AI模型之一。如今，通义APP让所有人都有机会免费体验这一前沿模型的创造力。

在未来，预计情感技术将广泛应用于数字化人物、在线教育、影视制作、虚拟互动和电子商务直播等领域。

一段时间过后，通义APP的热门产品频繁推出。现象级App“全民舞王”曾在社交平台引发“兵马俑跳科目三”、“金毛跳舞”等热潮，Anmate Anyone这一模型诞生自通义实验室。

最近，通义APP已经推出了超长文档解析、AI编码助手、AI会议助手等免费实用功能。通义大模型正逐渐成为更多用户的顶尖AI助手。

相关问题