训练数字人_数字人训练方案_数字人定制训练_费用明细
训练数字人:方案、定制与费用明细
随着科技的不断发展,数字人逐渐走进我们的视野并在众多领域发挥着重要作用。无论是在娱乐、客服,还是新闻播报等方面,数字人的身影越来越常见。那么,如何训练数字人呢?
首先来看看数字人训练方案。不同的平台和技术有着不同的要求。比如OpenBayes教程中的GeneFace++,前期准备工作就很关键。要准备一段3 - 5分钟的视频,这个视频有诸多要求,画面得清晰且是正方形尺寸(zuihao为512512大小),背景zuihao为纯色,人物面部要清晰且占比大、正面,采集画面zuihao在肩部以上,人物动作幅度适中,音频还不能有杂音,视频名称zuihao用英文。准备好视频后,要经过一系列的操作步骤,像登录平台、克隆教程、选择算力等,Zui后导入视频,选择训练步数开始训练。
腾讯云的“数智人”产品则只需要3分钟真人口播视频和100句语音素材,平台就能通过音频、文本多模态数据输入,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人”。
还有一些数字人训练需要更多的数据准备。像快手的人工智能数字人训练师翟雨佳在训练数字人关小芳时,一开始就需要准备几十万条数据,这些数据包含人工手写的高质量数据和模型生成的基础数据,同时还要设计编排几千字符的提示词Prompt,包含人格和爱好等内容,通过不断优化补充训练数据来让数字人变得更聪明。
再说说数字人定制训练。在数字人的“形象”方面,无论是动作、表情还是口型等都需要具有高还原度的拟真效果。有的数字人制作过程中采用了三维重建、TTSA+音视频驱动技术、ARKit表情识别和AIGC等多项核心技术,还配备多种克隆模式来保证数字人在外观上的逼真程度。对于2D真人形象定制,有的会提供规范的SOP录制手册,方便用户自助完成训练素材的录制、编辑和上传,实现高拟真度的形象表达。
在“声音”上,也有不同的定制等级。基础版可以在线使用,系统自动分配20句文案简单录制,30分钟就能捕捉关键声纹特征克隆人声。轻量定制版基于多种算法,15 - 30分钟有效音频就能高保真还原音色,还能指定音色情绪。
Zui后,关于数字人训练费用明细。目前并没有一个统一的标准。不同的训练方案、不同的平台,其成本可能会有很大差异。有的平台可能会根据使用的算力、训练的时长、定制的功能等多方面因素来计算费用。像OpenBayes平台,新用户使用特定邀请链接注册可获得一定时长的免费算力,但如果超出可能就需要付费获取更多资源用于数字人训练。
数字人的训练是一个多方面综合考量的过程,无论是训练方案、定制训练还是费用,都需要根据具体的需求和目标来进行选择和规划。