> 新闻  > 返回

魔珐科技发布具身智能3D数字人开放平台

编辑:叶子
2025/11/3 7:58:26
数字展示在线
10月29日,魔珐科技(Xmov)正式推出具身智能3D数字人开放平台——魔珐星云。该平台旨在将AI交互从当前以“文本框”为主的单一模式,全面升级为融合语音、表情、动作等多模态交互的智能数字人,开启人机交互新篇章。

发布会上,魔珐科技创始人兼CEO柴金祥教授指出,近年来AI在智能化方面取得显著进展,不仅能写文章、编程序,还能做决策,并调用各种API成为智能体。然而,AI仍存在重大缺陷——缺乏身体。魔珐星云正是要解决这一问题,将AI从无形变为有形,赋予其身体,实现从“大脑”到“完整个体”的进化。

柴金祥教授在创立魔珐科技前,已是美国工科名校TAMU计算机科学和工程系的终身教授及博士生导师。二十余年来,他始终致力于具身智能3D数字人技术的研发与突破。魔珐星云平台的推出,正是希望为开发者提供成熟、高效的基础设施,避免重复建设,让更多应用能够集成先进的AI数字人交互能力。
那么,何为“具身智能3D数字人”?柴金祥教授给出了明确定义:它首先具备“大脑”,即当前的大语言模型,拥有推理、决策能力,并能调用各种API智能体执行任务;其次,具备“具身”,即拥有一个身体或形象,可以是超写实3D数字人、二次元风格、卡通形象,甚至是游戏角色;最后,拥有身体后,还需具备表达能力,包括语音、动作、表情和手势。这样的具身智能3D数字人,实现了“有大脑、能办事、有形象、能表达”。

在柴金祥教授看来,当前大模型在垂直领域已具备足够的智能,能够处理事务、回答问题。而魔珐科技要解决的是:能否为AI赋予身体,使其有形象、能表达?今天发布的星云平台,正是魔珐科技给出的答案,让所有开发者能够调用其能力,为AI赋予身体与表达能力。

技术突破:打破铁三角难题

柴金祥教授坦言,要实现大规模开发与应用,为AI赋予身体与表达能力,仅凭强大的算法或大模型是不够的。在与客户和用户的交流中,他们发现以下六点至关重要:

首先,质量是关键。数字人的形象需逼真,无论是二次元、卡通还是超写实风格。其次,表达能力必须自然流畅,包括语音、动作和表情。此外,由于是实时互动,响应速度至关重要。人类感知的响应时间通常在1.5至2秒内,因此质量与响应时间共同构成了终端体验的核心。然而,即便体验良好,也未必能实现大规模推广。

以智能3D数字人应用于在线场景为例,将其从文本聊天机器人升级为有形象的陪伴助手,需支持数万甚至数十万的并发用户,这就意味着并发能力成为关键挑战。另外,成本、多终端适配、国产信创支持也同样重要。当前语言模型的Token成本仍较高,直接影响普及。终端设备不仅限于高端电脑或云端服务器,还包括医院终端屏、桌面陪伴屏等,其芯片能力较弱。若无法在此类设备上运行,规模化便无从谈起。同时,不同屏幕的算力差异巨大,魔珐希望服务或陪伴能跨终端实现。最后,就是国产信创支持,需确保数字人能在国产芯片上运行。

然而,要同时兼具这6点实属不易。高质量、低延迟需高算力与精细美术,成本自然高昂;低成本、低延迟则往往牺牲质量。这是一个棘手的平衡难题。
魔珐科技通过文生多模态3D大模型与技术实现路径的协同突破,解决了这一问题。模型层面,星云平台通过自研的全球首个文生多模态3D大模型,直接将文本/语音转换为语音、动作、表情、手势等多模态的3D表达信号。架构层面,则进行云-端拆分。在云端,只生成轻量级的动作和语音参数,极大降低下行带宽;在端侧,通过AI解算模块,将这些参数实时转化为画面。
此外,魔珐科技自2018年起积累了大量高质量的3D动画数据,成为其模型训练的关键壁垒。每一条数据都需要强动画制作能力的团队进行标定与审核,成本高达每秒千元,为模型的高质量输出奠定坚实基础。

最终,魔珐星云平台不仅在模型层实现了语义到身体语言的突破,更在系统层完成了性能、成本与延迟的协同创新。

六大优势,构建全链路交互体系

目前,魔珐星云在核心技术指标上拥有六大优势:

采用超写实3D数字人技术,实现语音、表情与动作的高质量实时自然生成;
驱动延迟压缩至500ms以内,交互时可随时打断;
具备千万级设备并发驱动能力;
低成本,结合AI端侧渲染技术,可在百元级芯片上运行;
适配多场景应用需求,支持超写实、二次元、卡通等多元角色风格;
完全兼容国产信创芯片体系。
魔珐星云在具身驱动领域,基于文本输入即可实时生成3D数字人的语音、表情及全身动作,精准驱动屏幕数字人或实体机器人。此外,在视频生成和语音合成领域,魔珐星云同样表现优异。

总体来看,星云平台构建了从实时驱动到内容创作的全链路能力体系,不仅推动传统显示屏向“AI具身智能交互屏”演进,还助力人形机器人从执行基础操作的“蓝领”进阶为具备交流服务能力的“白领”与智能伙伴。这一技术突破或将重塑人机交互产业格局,为数字经济注入新动能。

应用场景广泛,推动屏幕与机器人“能说会动”


魔珐星云不仅为大语言模型与AI Agent提供了“身体”与“表达界面”,更将推动各类终端设备向具身智能体演进。从手机、平板、电脑到商显屏幕、电视、车载大屏,任何屏幕都可以升级为能自然交互的具身智能体,从被动信息载体变成主动交流和服务入口。
同时,平台能力也延伸至机器人领域,赋予人形机器人更自然的语音、眼神与手势交互能力,使其从执行基础操作的“蓝领”进阶为具备服务与交流能力的“白领”伙伴。在教育、客服、法律、销售、导游等众多领域,魔珐星云可提供低成本、高效率、规模化的交互式具身智能服务。
对于开发者、系统集成商及生态伙伴来说,均可基于魔珐星云快速构建各类应用,涵盖App、小程序、Web端、智能座舱、零售展厅等多种场景。

柴金祥教授在现场宣布,魔珐星云将面向全球开发者全面开放,“我们希望全球的开发者能够加入到我们的具身智能3D数字人的生态中,让每一块屏幕、每一个应用、每一个终端,都有一个具身3D智能数字人!”

商业化进程启动,百家客户正在测试


商业化方面,据柴金祥教授透露,已有上百家企业客户正在测试魔珐星云平台,其中部分已经付费,展现出强烈的市场兴趣与商业化潜力。
发布会上,最先嗅到商机的是显示器制造商。过去几年,显示器行业陷入了内卷:分辨率越来越高、价格越来越低,但缺乏真正能撬动应用场景的创新。光屿智联CEO冯晨表示,有了星云平台,公司可以在原有的屏幕上给出更多交互方案,为用户带来超越预期的震撼体验。
深耕LED显示屏多年的万屏时代CEO黄锴认为,魔珐星云的发布将极大拓宽整个显示器行业的市场边界,“我们作为大屏基座提供商,与多家头部数字人公司合作。但整个行业产品质量参差不齐,成本高,服务不稳定。数字人能力的局限束缚了行业发展,大家都在低水平重复造轮子。”他形容魔珐星云是“行业中的六边形战士”:“有了魔珐星云提供的具身智能底层能力,未来行业可以打造广告一体机、会议一体机,还有银行、医院等多种场景。市场潜力巨大,未来可期。”
声明:本文部分图片、音频、视频来源于网络搜索,版权归原作者所有,如有侵权请联系我们予以删除。
相关推荐

网站地图

项目咨询 广告合作 电脑版 电话:0755-23761247