AI跳舞哪家强?是 AI 努力学习的一种能力
这次,Transformer 参与了舞蹈生成任务。
在艺术领域,AI 有着各式各样的应用,如 AI 生成音乐、AI 绘画。
跳舞,也是 AI 努力学习的一种能力。
此前,以音乐的风格、节奏和旋律作为控制信号来生成 3D 舞蹈动作的 DaceNet 曾红极一时。
如今,DanceNet 迎来了新的挑战者——来自谷歌的最新研究 AI Choreographer:给定一段 2 秒的指导动作,AI 模型可以按照音乐节奏生成一长段自然的舞蹈动作。
生成的舞蹈效果是这样的(遗憾的是动图没有声音):
而和 DanceNet 这些同类研究相比,谷歌新方法的效果更为明显。左边两种方法生成的舞蹈动作像「抽风」,该新方法则更加流畅自然:
值得注意的是,这还是一个基于 Transformer 的模型。
论文地址:https://arxiv.org/pdf/2101.08779v1.pdf
项目地址:https://google.github.io/aichoreographer/
下面让我们看下论文细节:
通过编排与音乐节拍一致的动作模式来跳舞是人类的一项基本能力。舞蹈是所有文化中的通用语言,如今,许多人在多媒体平台上通过舞蹈来表现自己。在 YouTube 上最受欢迎的视频是以舞蹈为主的音乐视频,例如 Baby Shark Dance、江南 Style,在互联网信息传播中,舞蹈成为强大的传播工具。
然而,舞蹈是一种艺术形式,即使是人类,也需要专业培训才能使舞蹈演员掌握丰富的舞蹈动作曲目,创造出富有表现力的舞蹈编排。从计算方面来讲更具有挑战性,因为该任务需要有能力生成一个连续的高运动学复杂度动作,捕捉与伴奏音乐的非线性关系。
在这项研究中,来自南加州大学、谷歌研究院、加州大学伯克利分校的研究者提出了一个基于 transformer 的跨模态学习架构和一个新的 3D 舞蹈动作数据集 AIST++,该数据集用来训练一个生成 3D 舞蹈动作的模型。
具体来说,给定一段音乐和一个短的(2 秒)种子动作(seed motion),本文模型能够生成一个长序列的逼真 3D 舞蹈动作。该模型有效地学习了音乐动作的相关性,并且可以生成不同输入音乐的舞蹈序列。研究者将舞蹈表示为一个由关节旋转和全局平移组成的 3D 动作序列,这使得输出可以很容易地迁移至动作重定向等应用,具体流程如下图 1 所示:
在学习框架方面,该研究提出了一种新的基于 transformer 的跨模态架构来生成基于音乐的 3D 动作。该架构建立在已被证明对长序列生成特别有效的基于注意力的网络 [15, 62, 3, 71]上,并从视觉和语言的跨模态文献 [71] 中获得灵感,设计了一个使用三个 transformer 的框架,分别用于音频序列表示、动作表示和跨模态音频 - 动作表示。其中动作和音频 transformer 对输入序列进行编码,而跨模态 transformer 学习这两种模态之间的相关性,并生成未来的动作序列。
该研究精心设计的新型跨模态 transformer 具有自回归特性,但需要全注意力(full-attention)和 future-N 监督,这对于防止 3D 运动在多次迭代后冻结或漂移非常关键,正如先前关于 3D 运动生成所述[4,3]。由此生成模型为不同的音乐生成不同的舞蹈序列,同时生成长时间的逼真动作,在进行推理时不受漂移冻结的影响。
AIST++ 数据集
为了训练模型,该研究还创建了一个新的数据集:AIST++。该数据集在 AIST(多视角舞蹈视频库) [78]基础上进行构建。研究者利用多视角信息从数据中恢复可靠的 3D 动作。注意,虽然这个数据集具有多视角照片,但相机并未校准,这使得 3D 重建非常具有挑战性。
AIST++ 数据集包含高达 110 万帧伴有音乐的 3D 舞蹈动作,据了解,这是此类数据集中最大的一个。AIST++ 还跨越了 10 种音乐类型、30 个主题和 9 个视频序列,并具有恢复的相机内在特性,这对于其他人体和动作研究具有很大的潜力。
数据集地址:https://google.github.io/aistplusplus_dataset/
该研究创建的 AIST++ 是一个大规模 3D 舞蹈动作数据集,包含大量伴随音乐的 3D 舞蹈动作。其中每一帧都具备以下额外标注:
9 种视角,包括摄像机的内外参数; 17 种 COCO 格式的人类关节位置,包含 2D 和 3D 形式; 24 个 SMPL 姿势参数,以及全局扩展和平移。
下表 1 对比了 AIST++ 和其他 3D 动作与舞蹈数据集,AIST++ 对于现有的 3D 动作数据集是一种补充。
此外,AIST++ 数据集包含 10 个舞种:Old School(Break、Pop、Lock 和 Waack)和 New School(Middle Hip-hop、LA-style Hip-hop、House、Krump、Street Jazz 和 Ballet Jazz),参见下图 3:
基于音乐的 3D 舞蹈生成
问题描述:给定一个 2 秒的动作种子示例 X = (x_1, . . . , x_T) 和音乐序列 Y = (y_1, . . . , y_T'),生成时间步 T + 1 到 T' 期间的未来动作序列 X'= (x_T+1, . . . , x_T'),T' >> T。
跨模态动作生成 Transformer
该研究提出一种基于 Transformer 的网络架构,它可以学习音乐 - 动作关联,生成不凝滞的逼真动作序列。架构图参见下图 2:
该模型具备三个 transformer:
动作 transformer f_mot(X):将动作特征 X 转换为动作嵌入 h^x_1:T; 音频 transformer f_audio(Y):将音频特征 Y 转换为音频嵌入 h^y_1:T'; 跨模态transformer f_cross(h^xy_1:T +T'):学习动作和音频两个模态之间的对应,并生成未来动作 X'。
为了更好地学习两个模态之间的关联,该研究使用了一个深度为 12 层的跨模态 transformer。研究者发现,跨模态 transformer 的深度越大,模型对两种模态的关注越多(参见下图 6)。
实验
定量评估
研究者报告了该方法与两种基线方法在 AIST++ 测试集上的定量评估结果,见下表 2:
动作质量:从上表中可以看出,该方法生成的动作序列关节和速度分布更接近真值动作。
动作多样性:表 2 展示了,相比基线方法,该研究提出的方法能够生成更多样的舞蹈动作。控制变量研究结果表明,网络设计,尤其跨模态 transformer,是带来这一差异的主要原因。研究者将该方法生成的多样化舞蹈动作进行了可视化,参见下图 7:
动作 - 音乐关联:从表 2 中还可以看出,该方法生成的动作与输入音乐的关联性更强。下图 5 中的示例展示了生成动作的运动节拍与音乐节拍能够实现很好地匹配。
但是,在与真实数据进行对比时,这三种方法都有很大的改进空间。这表明,音乐动作关联仍然是一个极具挑战性的问题。
控制变量研究
跨模态 Transformer:该论文利用三种不同设置研究跨模态 Transformer 的功能:1)14 层动作 transformer;2)13 层动作 / 音频 transformer 和 1 层跨模态 Transformer;3)2 层动作 / 音频 transformer 和 12 层跨模态 Transformer。
下表 3 表明跨模态 Transformer 对于生成与输入音乐关联性强的动作至关重要。
如图 6 所示,更深的跨模态 Transformer 能够更加关注输入音乐,从而带来更好的音乐 - 动作关联度。
因果注意力或完全注意力 Transformer:研究者还探索了完全注意力机制和 future-N 监督机制的效果。从下表 4 中可以看出,在使用因果注意力机制执行 20 秒长程生成时,生成动作和真值动作的分布差异很大。对于 future-1 监督设置下的完全注意力机制而言,长程生成期间的结果会出现快速漂移,而在 future-10 或 future-20 监督设置下,模型可以生成高质量的长程动作。
相关阅读
-
Misty为Furhat收购机器人公司Misty Robotics
Misty经历了一段地狱般的旅程。在从Foundry和Venrock筹集了1150万美... -
人物形象丰富多样,AI合成人物商业应用渐热
我是新华社AI合成主播新小浩,我们不仅仅长得像主播本人,还可以不... -
瑞士研究人员进行一个利用人工智能和机...
建筑和施工总是悄悄地处于技术和材料趋势的前沿。因此,特别是在像... -
Alphabet 正致力于将机器人带到办公...
谷歌的母公司 Alphabet 正致力于将机器人带到办公室来执行日常任... -
ModelMesh使开发者能够在Kubernetes之上...
模型服务是AI用例的一个关键组成部分。它涉及从人工智能模型中提供... -
研究人员:85%的人口受到人类活动引起的...
据外媒CNET报道,气候变化已经到来。如果我们不尽快采取行动,它将...
精彩推送
-
女子追尾后 质问前车司机为何刹车:急...
女子追尾后质问前车司机为何刹车:急得直跺脚 -
疑似东风本田2022年新车规划:新一代CR-...
疑似东风本田2022年新车规划:新一代CR-V、思域Type-R要来! -
车载摄像头真有这么香?特斯拉前脚释出...
车载摄像头真有这么香?特斯拉前脚释出大额订单知名日企也官宣入局 -
月薪5000也能买!2021款比亚迪e2试驾体...
月薪5000也能买!2021款比亚迪e2试驾体验:颜值、动力俱佳 -
轴距加长130mm、后排秒变“跑马场”!国...
轴距加长130mm、后排秒变“跑马场”!国产宝马X5长轴版曝光 -
奔驰销量暴跌 德系车在德国卖不动了:...
奔驰销量暴跌德系车在德国卖不动了:买特斯拉的狂增1 3倍 -
领克01被曝疑似虚假宣传?车顶钢材强度...
领克01被曝疑似虚假宣传?车顶钢材强度与宣传不符 -
雅迪电动车征服“中国最冷小镇”成功挑...
雅迪电动车征服“中国最冷小镇”成功挑战极寒天气续航200公里 -
没想到 新蒙迪欧成了中国设计“全球化...
没想到新蒙迪欧成了中国设计“全球化”的见证者 -
行业首家 小鹏超充贯通全国337城:何小...
行业首家小鹏超充贯通全国337城:何小鹏大赞! -
红旗向中国获奖奥运健儿交付11辆H9 直...
红旗向中国获奖奥运健儿交付11辆H9直接赠送和免费使用 -
皇冠轿车中国“复活”!曝一汽丰田将原...
皇冠轿车中国“复活”!曝一汽丰田将原装进口日本皇冠:35万起 -
宝马V12动力最后的荣光!M760i将限量发...
宝马V12动力最后的荣光!M760i将限量发售:起售127万 -
配剪刀门、升降式激光雷达!集度首款概...
配剪刀门、升降式激光雷达!集度首款概念车细节曝光 -
胡润世界八强榜单:特斯拉为唯一上榜车...
胡润世界八强榜单:特斯拉为唯一上榜车企位居第五 -
高速施工封路 大货避让不及撞废轿车:...
高速施工封路大货避让不及撞废轿车:人员全部奇迹生还 -
顺丰快递电动车高速上自燃 拖车紧急卸...
顺丰快递电动车高速上自燃拖车紧急卸车避险 -
马斯克被特斯拉股东起诉 索赔归还130亿美元
马斯克被特斯拉股东起诉索赔归还130亿美元 -
奔驰、吉利联手打造!Smart精灵#1量产版...
奔驰、吉利联手打造!Smart精灵 1量产版上路:取消对开门 -
特斯拉自动驾驶闯红灯撞向思域导致两人...
特斯拉自动驾驶闯红灯撞向思域导致两人死亡:司机被控过失杀人 -
雪铁龙凡尔赛被曝加速抖动 厂商拒不回...
雪铁龙凡尔赛被曝加速抖动厂商拒不回应车主投诉无门 -
女子结婚租到“盗版劳斯莱斯” 商家:...
女子结婚租到“盗版劳斯莱斯”商家:劳斯莱斯是形容词 -
贾跃亭要遵守约定!官方确认FF 91量产...
贾跃亭要遵守约定!官方确认FF91量产时间售价欲超200万元 -
新Mac Pro曝光:将搭载4个M1 Max处理器
据外媒最新报道称,苹果将在今年年底发布新一代Mac Pro,其最顶配... -
EFF基金会要求在iPhone手机中加入关闭2G...
GSM 2G网络已经有30年多年历史了,现在还有很多服务需要2G,但是该... -
三星GalaxyS22+的详细信息曝光:屏幕尺...
1月18日消息,MySmartPrice曝光了三星GalaxyS22+的详细信息。和Gala... -
Intel 12代酷睿i3曝光:超频幅度高达57%
通过超外频的方式,德国大神Der8auer将原本锁频的i5-12400、i5-1260... -
曝苹果SE机型可能会采用5.7英寸或6.1英...
据最新报道,显示屏行业顾问公司DSCC创始人兼CEO Ross Young在社... -
Intel 13代酷睿更新:接口保持不变 主板不兼容
IntelAlder Lake 12代酷睿采用了全新的LGA1700接口,必须搭配600... -
入门款新iPad曝光:可能被改造成支持5G
据最新消息称,苹果将在2022年底发布第十代iPad,在2023年进行更重... -
魅族专利公布一年后 手机终于要用上50W快充
去年年底魅族公布了自家分流式电池充放电控制系统及其控制方法、电... -
微软发布Win7/10/11紧急更新:修复多个W...
今天微软发布了紧急更新,主要是修复多个Windows版本问题,建议用户... -
首批RTX 3050曝光:多光线追踪
据介绍,RTX 3050本次供货主要以电商、线上、直播等平台为主,预测... -
Intel NUC 11廉价版曝光:规格性能实现飞跃
Intel今天为NUC 11迷你机家族增加了新的入门款NUC 11 Essential(... -
《关于紫光集团重整计划获法院裁定批准...
今晚,紫光集团通过官微,正式发布了《关于紫光集团重整计划获法院... -
Intel 13代酷睿曝光:接口与12代酷睿保持一致
据爆料,13代酷睿将会在今年第四季度发布,接口与12代酷睿保持一致... -
西安交大学生私自驾车离校至成都:关大...
西安交大学生私自驾车离校至成都:关大灯驶上草坪绕开检查 -
CEO做对一件事!福特市值首达1000亿美元
CEO做对一件事!福特市值首达1000亿美元 -
欧洲汽车大暴跌!原因太无奈:缺芯+疫情
欧洲汽车大暴跌!原因太无奈:缺芯+疫情 -
马斯克玩“无间道”!特斯拉成香饽饽 ...
马斯克玩“无间道”!特斯拉成香饽饽印度各地官员疯抢 -
爷青回!一汽发布全新企业LOGO:形似新...
爷青回!一汽发布全新企业LOGO:形似新飞冰箱标识 -
特斯拉Model Y USB-C快充模块拆解:遗...
特斯拉ModelYUSB-C快充模块拆解:遗憾砍掉数据传输 -
宁德时代正式发布换电品牌 蔚来回应:...
宁德时代正式发布换电品牌蔚来回应:表示欢迎 -
三星试产4080圆柱形电池:媲美特斯拉468...
三星试产4080圆柱形电池:媲美特斯拉4680、能量密度大增 -
宁德时代玩换电 曾毓群请吃“巧克力”...
宁德时代玩换电曾毓群请吃“巧克力”:1分钟换1块未来适配80%车型 -
中东部地区大面积雨雪、大雾天气!交管...
中东部地区大面积雨雪、大雾天气!交管部门发布驾驶人提醒 -
实测不到6个油 全新丰田汉兰达获CCRT测...
实测不到6个油全新丰田汉兰达获CCRT测评综合得分86 3分 -
宁德时代换电品牌“EVOGO”正式发布:1...
宁德时代换电品牌“EVOGO”正式发布:1分钟全自动换电面向所有汽车 -
谁能抵抗一个会撒娇的萝莉呢?《原神》...
谁能抵抗一个会撒娇的萝莉呢?《原神》首款导航语音上线 -
宁德时代乐行换电正式发布 宣传片惊现...
宁德时代乐行换电正式发布宣传片惊现蔚来网友:砸场子! -
比亚迪全新中型SUV谍照曝光:或为巡洋舰...
比亚迪全新中型SUV谍照曝光:或为巡洋舰05主打DM-i动力 -
iPhone XS Max可降级iOS 14.1,为何...
我们都知道,苹果每次在推送新版iOS之后,都会关闭上一个正式版系统... -
四维图新发布业绩预告:2021年实现扭亏为盈
1月16日晚,四维图新NavInfo官方宣布了其2021年度的业绩预告,该公... -
被炮轰刷新底线!团车闻伟:造车不会儿...
被炮轰刷新底线!团车闻伟:造车不会儿戏邀请李想参加产品发布会 -
零百加速超17秒 40年前经典奥迪被拍卖...
零百加速超17秒40年前经典奥迪被拍卖:最高出价6 7万元 -
“青蛙眼”大灯瞩目!欧拉闪电猫量产版...
“青蛙眼”大灯瞩目!欧拉闪电猫量产版谍照曝光:最快5月上市 -
SIAL国际食品展(上海)启动之际,“中食...
日前,中共中央、国务院印发了《知识产权强国建设纲要(2021—2035年... -
CrowdStrike野外样本增加,进行分布式拒...
根据 CrowdStrike 的威胁遥测数据 ,在 2021 年针对 Linux ... -
2022年会成为Linux桌面元年吗?
2022 年会成为 Linux 桌面元年吗?答案可能依然是否定的,但我们... -
比亚迪半导体MCU曝光:最高工作频率48MHz
今日,据比亚迪半导体公众号消息,继2020年8月推出国内首款集成触摸... -
XPOWER XS70 PCIe 4.0固态硬盘曝光:...
Silicon Power(SP)近日面向玩家,推出了全新的 XPOWER XS70 PCI... -
一加6和一加6T将正式停止官方软件支持
近日,一加海外社区官方人员正式确认,一加6和一加6T的官方支持已经... -
Misty为Furhat收购机器人公司Misty Robotics
Misty经历了一段地狱般的旅程。在从Foundry和Venrock筹集了1150万美... -
曝骁龙8 Plus旗舰Q3曝光:改用4nm工艺Plus版本
按照此前多方消息显示,高通会在今年下半年推出改用台积电4nm工艺的... -
宁德时代进军“换电”市场 注册多个商标
日前,宁德时代官方消息,宁德时代将于1月18日15:30举办发布会,推... -
业界首个!集度汽车机器人车标发布:百...
业界首个!集度汽车机器人车标发布:百度、吉利联合打造 -
比亚迪、中国一汽成立动力电池合资公司...
比亚迪、中国一汽成立动力电池合资公司:产能超百万辆电动车 -
中毒了 中国汽车活化石大变样!新一代B...
中毒了中国汽车活化石大变样!新一代BJ212外形堪比路虎卫士 -
丰田章男用毛笔写下年度汉字“動”!中...
丰田章男用毛笔写下年度汉字“動”!中日文一语双关 -
四缸增程器、零百加速不到6秒!售价50万...
四缸增程器、零百加速不到6秒!售价50万的理想X01买吗 -
富豪驾布加迪德国高速狂飙至417km/h 9...
富豪驾布加迪德国高速狂飙至417km h9分钟能烧干一箱油 -
日本佳能关闭珠海工厂:主要停产数码相...
最近日本相机巨头佳能关闭珠海工厂的消息引发热议,佳能中国已经确... -
外媒:CarKey有望发布 可用iPhone解锁汽车
据国外媒体报道,苹果分析师马克 · 格尔曼(Mark Gurman )表示... -
外媒:LG Innotek将向特斯拉提供价值超...
据国外媒体报道,LG Innotek将向特斯拉提供价值超过1万亿韩元的电... -
Forbes发表观点性文章,揭示2022年量子...
Safe Quantum安全首席执行官兼创始人John Prisco日前在Forbes发表... -
高清概念渲染图曝光 揭开Galaxy Tab...
预计下个月,三星会在 2022 年度首场GalaxyUnpacked 发布会上,... -
中际旭创预计今年全球数通市场光模块需...
中际旭创近日举行了投资者关系活动。中际旭创副总裁、董事会秘书王... -
苹果Safari浏览器Bug曝光:影响使用苹果...
据 MacRumors 报道,根据浏览器指纹识别服务提供商 FingerprintJ... -
14nm显卡性能曝光:追上GTX 1050 功耗为30W
1月17日,景嘉微在投资者关系活动中表示,公司历经十余年发展,成功... -
NVIDIA RTX 3090 Ti功耗曝光:高达48...
今天,某厂商的旗舰型RTX 3090 Ti规格参数被泄露出来,可以看到满... -
外媒:苹果内部讨论传闻已久的VR/AR设备...
据国外媒体报道,苹果产品方面的资深记者日前表示,苹果内部已经讨... -
网友发现新版微信支持搜索后批量删除好友
前不久,iOS版微信率先更新了8 0 17版。除了万众期待的语音消息暂... -
云网融合打造生态系统,产业链企业数量...
近日,Semtech举办媒体沟通会,宣布公司与腾讯云达成协议,LoRa Cl... -
便宜又好用 中国制造的电动车在日本成...
便宜又好用中国制造的电动车在日本成了香饽饽 -
零百加速5.9秒力压埃尔法!全球最速MPV...
零百加速5 9秒力压埃尔法!全球最速MPV岚图梦想家白车身下线 -
比亚迪宋DM-i最强对手!奇瑞星途追风PHE...
比亚迪宋DM-i最强对手!奇瑞星途追风PHEV亮相:亏电油耗4 8L -
真实起火率统计对比:混动车危险系数最...
真实起火率统计对比:混动车危险系数最高、电动车排在燃油车之后 -
全球首款续航破千电动车!广汽Aion Lx...
全球首款续航破千电动车!广汽AionLxPlus冬季媒体实测:最高960Km -
四缸增程器、续航800公里!理想X01路测...
四缸增程器、续航800公里!理想X01路测谍照曝光:售价约50万买吗 -
比丰田埃尔法还豪华 红旗全新MPV内饰曝...
比丰田埃尔法还豪华红旗全新MPV内饰曝光:二排座椅是亮点! -
配坦克300同款档杆、一体式双联屏!哈弗...
配坦克300同款档杆、一体式双联屏!哈弗酷狗内饰曝光 -
“元宇宙”热火蔓延车圈!中国车企首个N...
“元宇宙”热火蔓延车圈!中国车企首个NFT拍卖到来:送真车一辆 -
零下35℃雪天在特斯拉里过夜:10万km电...
零下35℃雪天在特斯拉里过夜:10万km电池坚持了一天半 -
被李想炮轰后 团车CEO首次回应:别成为...
被李想炮轰后团车CEO首次回应:别成为自己最记恨的那波人 -
印度提议本国生产所有车型 至少配备六...
印度提议本国生产所有车型至少配备六个气囊!网友:远超中国标准 -
实测1067马力超官方数据!最强特斯拉Mod...
实测1067马力超官方数据!最强特斯拉ModelS动力测试结果出炉 -
威马汽车私自“锁电”引众怒 173名车主...
威马汽车私自“锁电”引众怒173名车主联名发律师函向厂家维权 -
比长城还会玩!上汽大众凌度L公开征求昵...
比长城还会玩!上汽大众凌度L公开征求昵称:辣馒头、麻辣烫在内 -
宁德时代进军“换电”市场 注册“巨无...
宁德时代进军“换电”市场注册“巨无霸换电块”商标 -
大众集团全球销量出炉 超大众成行业榜首
随着大众集团全球销量出炉,一年一度的汽车行业榜首之争一锤定音。...