阿里在GitHub发布AI大模型新项目，让张国荣“复活”！

阿里在GitHub发布AI大模型新项目，让张国荣“复活”！

news/发布时间2024/5/19 14:41:37

最近，阿里巴巴又推出了一款AI视频新框架——EMO。

特点及官方演示

EMO的功能特点如下：

1.音频驱动的视频生成：根据输入的音频（如说话或唱歌）和参考图像，生成具有表情变化和头部动作的虚拟角色视频。

2.多语言支持：支持多种语言的音频输入，能够为不同语言的歌曲生成相应的表情和动作。

3.表情和动作同步：确保生成的视频中的角色表情和头部动作与音频输入的节奏和情感相匹配。

5.跨文化和多语言应用：在多语言和多文化背景下，为角色提供表演和独白的能力。

最近AI美女的舞蹈非常火，抖音上我们看下其中的效果，这种也是用AI做的。

还有下面这个：

你没看错，以上的视频是由人工智能生成的。这样的视频非常引人注目，能够吸引人的注意。一个博主利用这个美女视频，在短短一周内就吸引了3万多粉丝，并且一个月的收入达到了几千。

是不是非常的惹人注目，吸引眼球？有一个博主通过这个美女视频，在一周时间就收获了3万多粉丝，一个月收益大几千。

音中的发音和语调是生成肖像运动的主要驱动信号。在音频注意层，从输入音频中提取出的特征通过预训练的语音识别模型Wav2vec进行连接，得到每一帧的音频表示嵌入。为了计算运动受未来/过去音频片段的影响，例如说话前的张嘴和吸气，作者通过串联附近帧的特征来定义每个生成帧的语音特征。

大多数模型都会在预训练的文本到图像架构中插入时序混合层，以促进对连续视频帧之间时间关系的理解和编码。受文生视频框架AnimateDiff架构概念的启发，EMO将自关注时序层应用于帧内特征。具体来说，EMO将输入特征图重构，在时序维度上进行自我关注，以有效捕捉视频的动态内容，时序层被插入主干网络的每个分辨率层。

在视频时长方面，受一些方法采用前一个片段结尾的帧作为后续生成初始帧的启发，EMO采用了前一个生成片段的最后n个帧，称之为“运动帧”（Motion frames），将其输入参考网络，以预提取多分辨率运动特征图。在主干网络的去噪过程中，EMO会将时序层输入与预提取的运动特征图进行合并，从而有效确保不同片段之间的一致性。

值得注意的是，虽然主干网络可能会反复多次对噪声帧进行去噪处理，但目标图像和运动帧只需连接一次并输入参考网络。因此，提取的特征会在整个过程中重复使用，确保推理过程中的计算时间不会大幅增加。

项目主页：

https://humanaigc.github.io/emote-portrait-alive/

GitHub地址:

https://github.com/HumanAIGC/EMO

需要代充或者买成品号Plus/Midjourney玩AI创作的可以加v：amo198905或者扫下面二维码加v。私聊预订Plus/Midjourney号，加v时备注：Plus/Midjourney。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.bcls.cn/ysHq/33275.shtml

如若内容造成侵权/违法违规/事实不符，请联系编程老四网进行投诉反馈email:xxxxxxxx@qq.com，一经查实，立即删除！

相关文章

Nginx反向代理和缓存

Nginx反向代理和缓存

一、Nginx反向代理 1.调度和代理的区别： 1.调度基于内核层面，代理基于应用层面 2.代理必须实现一手托两家 3.调度不需要监听任何端口，不需要工作任何应用程序，代理需要工作和上游服务器一模一样的进程 4.调度没有并发上限&am…

阅读更多...

在编程中使用中文到底该不该？？

在编程中使用中文到底该不该？？

看到知乎上有个热门问题，为什么很多人反对中文在编程中的使用？ 这个问题有几百万的浏览热度，其中排名第一的回答非常简洁，我深以为然： 在国内做开发，用中文写注释、写文档，是非常好的习惯&…

阅读更多...

Java练习

Java练习

这个练习我用到了继承，多态和封装。 1.继承： Animal 类是一个抽象类，它有两个子类 Dog 和 Cat。 Dog 和 Cat 分别继承自 Animal 类，因此它们可以使用 Animal 类中定义的属性和方法，同时也可以有自己特有的属性和方法。…

阅读更多...

【御控物联】JSON结构数据转换在物联业务中应用（场景案例二）

【御控物联】JSON结构数据转换在物联业务中应用（场景案例二）

文章目录一、物联网业务场景现状二、物联网业务场景数据交互格式三、JSON格式数据转换案例四、JSON数据格式转换DEMO五、在线转换工具六、技术资料一、物联网业务场景现状目前，市场上多数物联网关与物联平台捆绑售卖，网关采集到设备数据只能按照指定…

阅读更多...

macOS搭建php环境以及调试Symfony

macOS搭建php环境以及调试Symfony

macOS搭建php环境以及调试Symfony macOS搭建php环境以及调试Symfony 古老的传说运行环境快速前置安装环境 php 的安装安装 Xdebug 来调试 php如何找到你的 php.iniXdebug 安装成功创建并调试的 Hello world 安装 PHP Debug 安装 Symfony 安装 Composer安装 Symfony CLI 创建 …

阅读更多...

基于Springboot旅游网站管理系统设计和实现

基于Springboot旅游网站管理系统设计和实现

基于Springboot旅游网站管理系统设计和实现博主介绍：多年java开发经验，专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域作者主页央顺技术团队 Java毕设项目精品实战案例《1000套》欢迎点赞收藏 ⭐留言文末获取源码联系…

阅读更多...

ssm013小型企业办公自动化系统的设计和开发+vue

ssm013小型企业办公自动化系统的设计和开发+vue

小型企业办公自动化系统的设计与实现摘要互联网发展至今，无论是其理论还是技术都已经成熟，而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播，搭配信息管理工具可以很好地为人们提供服务。针对小型企业办公信息管理混乱&am…

阅读更多...

Linux系统----------探索mysql数据库MHA高可用

Linux系统----------探索mysql数据库MHA高可用

目录一、MHA概述 1.1 什么是 MHA 1.2MHA 的组成 1.2.1MHA Node（数据节点） 1.2.2MHA Manager（管理节点） 1.3MHA 的特点 1.4MHA工作原理 1.5数据同步的方式 1.5.1同步复制 1.5.2异步复制 1.5.3半同步复制二、搭建 MySQ…

阅读更多...

时间管理系统的设计与实现|Springboot+ Mysql+Java+ B/S结构(可运行源码+数据库+设计文档)大学生

时间管理系统的设计与实现|Springboot+ Mysql+Java+ B/S结构(可运行源码+数据库+设计文档)大学生

本项目包含可运行源码数据库LW，文末可获取本项目的所有资料。推荐阅读300套最新项目持续更新中..... 最新ssmjava项目文档视频演示可运行源码分享最新jspjava项目文档视频演示可运行源码分享最新Spring Boot项目文档视频演示可运行源码分享 2024年56套包含ja…

阅读更多...

简单工厂模式

简单工厂模式

1.1 面试受挫 package com.lhx.design.pattern.test;import java.util.Scanner;public class Test {public static void main(String[] args){System.out.println("**********************************************"); System.out.println("《大话设计模式》代…

阅读更多...

一则关于Go的高级构建指北

一则关于Go的高级构建指北

本文将探索Golang高级构建技巧，从而有助于创建更高效的二进制文件。构建选项以下是 go build 命令最常用的一些选项： -o: 指定输出文件名。默认输出文件名是主软件包的名称，在 Windows 系统中会自动添加 .exe 后缀。-v: 详细输出。该选项…

阅读更多...

docker--部署（超详版）（五）

docker--部署（超详版）（五）

环境准备：docker，mysql，redis，镜像，nginx 把虚拟机打开，连接xshell，参考博客： https://blog.csdn.net/m0_74229802/article/details/136965820?spm1001.2014.3001.5501 一&#x…

阅读更多...

神经网络：梯度下降法更新模型参数

神经网络：梯度下降法更新模型参数

作者：CSDN _养乐多_ 在神经网络领域，梯度下降是一种核心的优化算法，本文将介绍神经网络中梯度下降法更新参数的公式，并通过实例演示其在模型训练中的应用。通过本博客，读者将能够更好地理解深度学习中的优化算法和损…

阅读更多...

JavaScript动态渲染页面爬取——Selenium的使用

JavaScript动态渲染页面爬取——Selenium的使用

JavaScript动态渲染页面爬取 JavaScript动态渲染得页面不止Ajax一种。例如，有些页面的分页部分由JavaScript生成，而非原始HTML代码，这其中并不包含Ajax请求。还有类似淘宝这种页面，即使是Ajax获取的数据，其Ajax接口中…

阅读更多...

Centos8/linux/虚拟机安装docker

Centos8/linux/虚拟机安装docker

docker分为ce版和ee版，个人使用ce版就行了，别问为什么，问就是ee版收费。这是在线版的，离线版的请参考Centos8离线下载安装docker 1.首先切换到root用户 2.为确保安装时出现不必要的问题，先更新一下yum包 sudo yum…

阅读更多...

Kubernetes(K8S)学习（三）：K8S实战案例

Kubernetes(K8S)学习（三）：K8S实战案例

K8S实战案例一、部署wordpressmysql（NodePort方式）（1）创建命名空间：wordpress（2）创建wordpress-db.yaml文件（mysql）（3）创建pod：mysql…

阅读更多...

springcloud基本使用四（Feign远程调用）

springcloud基本使用四（Feign远程调用）

springcloud创建两个子项目order-server和user-server具体数据信息请查看springcloud前三章 order-server向user-server远程调用数据 order-server引入依赖： <dependency><groupId>org.springframework.cloud</groupId><artifactId>sprin…

阅读更多...

通过mapreduce程序统计旅游订单（wordcount升级版）

通过mapreduce程序统计旅游订单（wordcount升级版）

通过mapreduce程序统计旅游订单（wordcount升级版） 本文将结合一个实际的MapReduce程序案例，探讨如何通过分析旅游产品的预订数据来揭示消费者的偏好。程序概览首先，让我们来看一下这个MapReduce程序的核心代码。这个程序的目…

阅读更多...

Qt中QIcon图标设置（标题、菜单栏、工具栏、状态栏图标）

Qt中QIcon图标设置（标题、菜单栏、工具栏、状态栏图标）

1 exe程序图标概述在 Windows 操作系统中，程序图标一般会涉及三个地方； （1） 可执行程序（以及对应的快捷方式）的图标 （2） 程序界面标题栏图标 （3）程序在任务…

阅读更多...

设计模式之装饰模式精讲

设计模式之装饰模式精讲

概念：动态地给一个对象添加一些额外的职责。装饰器模式侧重于在不改变接口的前提下动态地给对象添加新功能，保持对象结构的透明性，客户端无感知。以一个咖啡制作和装饰的例子来帮助大家理解： public interface Coffee {double…

阅读更多...

推荐文章

最新文章