发布会上,魔珐科技创始人兼CEO柴金祥教授指出,近年来AI在智能化方面取得显著进展,不仅能写文章、编程序,还能做决策,并调用各种API成为智能体。然而,AI仍存在重大缺陷——缺乏身体。魔珐星云正是要解决这一问题,将AI从无形变为有形,赋予其身体,实现从“大脑”到“完整个体”的进化。
柴金祥教授在创立魔珐科技前,已是美国工科名校TAMU计算机科学和工程系的终身教授及博士生导师。二十余年来,他始终致力于具身智能3D数字人技术的研发与突破。魔珐星云平台的推出,正是希望为开发者提供成熟、高效的基础设施,避免重复建设,让更多应用能够集成先进的AI数字人交互能力。那么,何为“具身智能3D数字人”?柴金祥教授给出了明确定义:它首先具备“大脑”,即当前的大语言模型,拥有推理、决策能力,并能调用各种API智能体执行任务;其次,具备“具身”,即拥有一个身体或形象,可以是超写实3D数字人、二次元风格、卡通形象,甚至是游戏角色;最后,拥有身体后,还需具备表达能力,包括语音、动作、表情和手势。这样的具身智能3D数字人,实现了“有大脑、能办事、有形象、能表达”。
在柴金祥教授看来,当前大模型在垂直领域已具备足够的智能,能够处理事务、回答问题。而魔珐科技要解决的是:能否为AI赋予身体,使其有形象、能表达?今天发布的星云平台,正是魔珐科技给出的答案,让所有开发者能够调用其能力,为AI赋予身体与表达能力。
技术突破:打破铁三角难题
柴金祥教授坦言,要实现大规模开发与应用,为AI赋予身体与表达能力,仅凭强大的算法或大模型是不够的。在与客户和用户的交流中,他们发现以下六点至关重要:首先,质量是关键。数字人的形象需逼真,无论是二次元、卡通还是超写实风格。其次,表达能力必须自然流畅,包括语音、动作和表情。此外,由于是实时互动,响应速度至关重要。人类感知的响应时间通常在1.5至2秒内,因此质量与响应时间共同构成了终端体验的核心。然而,即便体验良好,也未必能实现大规模推广。
以智能3D数字人应用于在线场景为例,将其从文本聊天机器人升级为有形象的陪伴助手,需支持数万甚至数十万的并发用户,这就意味着并发能力成为关键挑战。另外,成本、多终端适配、国产信创支持也同样重要。当前语言模型的Token成本仍较高,直接影响普及。终端设备不仅限于高端电脑或云端服务器,还包括医院终端屏、桌面陪伴屏等,其芯片能力较弱。若无法在此类设备上运行,规模化便无从谈起。同时,不同屏幕的算力差异巨大,魔珐希望服务或陪伴能跨终端实现。最后,就是国产信创支持,需确保数字人能在国产芯片上运行。
然而,要同时兼具这6点实属不易。高质量、低延迟需高算力与精细美术,成本自然高昂;低成本、低延迟则往往牺牲质量。这是一个棘手的平衡难题。魔珐科技通过文生多模态3D大模型与技术实现路径的协同突破,解决了这一问题。模型层面,星云平台通过自研的全球首个文生多模态3D大模型,直接将文本/语音转换为语音、动作、表情、手势等多模态的3D表达信号。架构层面,则进行云-端拆分。在云端,只生成轻量级的动作和语音参数,极大降低下行带宽;在端侧,通过AI解算模块,将这些参数实时转化为画面。
此外,魔珐科技自2018年起积累了大量高质量的3D动画数据,成为其模型训练的关键壁垒。每一条数据都需要强动画制作能力的团队进行标定与审核,成本高达每秒千元,为模型的高质量输出奠定坚实基础。
最终,魔珐星云平台不仅在模型层实现了语义到身体语言的突破,更在系统层完成了性能、成本与延迟的协同创新。
六大优势,构建全链路交互体系
目前,魔珐星云在核心技术指标上拥有六大优势:
采用超写实3D数字人技术,实现语音、表情与动作的高质量实时自然生成;驱动延迟压缩至500ms以内,交互时可随时打断;
具备千万级设备并发驱动能力;
低成本,结合AI端侧渲染技术,可在百元级芯片上运行;
适配多场景应用需求,支持超写实、二次元、卡通等多元角色风格;
完全兼容国产信创芯片体系。
魔珐星云在具身驱动领域,基于文本输入即可实时生成3D数字人的语音、表情及全身动作,精准驱动屏幕数字人或实体机器人。此外,在视频生成和语音合成领域,魔珐星云同样表现优异。
总体来看,星云平台构建了从实时驱动到内容创作的全链路能力体系,不仅推动传统显示屏向“AI具身智能交互屏”演进,还助力人形机器人从执行基础操作的“蓝领”进阶为具备交流服务能力的“白领”与智能伙伴。这一技术突破或将重塑人机交互产业格局,为数字经济注入新动能。
应用场景广泛,推动屏幕与机器人“能说会动”

同时,平台能力也延伸至机器人领域,赋予人形机器人更自然的语音、眼神与手势交互能力,使其从执行基础操作的“蓝领”进阶为具备服务与交流能力的“白领”伙伴。在教育、客服、法律、销售、导游等众多领域,魔珐星云可提供低成本、高效率、规模化的交互式具身智能服务。
对于开发者、系统集成商及生态伙伴来说,均可基于魔珐星云快速构建各类应用,涵盖App、小程序、Web端、智能座舱、零售展厅等多种场景。
柴金祥教授在现场宣布,魔珐星云将面向全球开发者全面开放,“我们希望全球的开发者能够加入到我们的具身智能3D数字人的生态中,让每一块屏幕、每一个应用、每一个终端,都有一个具身3D智能数字人!”
商业化进程启动,百家客户正在测试

发布会上,最先嗅到商机的是显示器制造商。过去几年,显示器行业陷入了内卷:分辨率越来越高、价格越来越低,但缺乏真正能撬动应用场景的创新。光屿智联CEO冯晨表示,有了星云平台,公司可以在原有的屏幕上给出更多交互方案,为用户带来超越预期的震撼体验。
深耕LED显示屏多年的万屏时代CEO黄锴认为,魔珐星云的发布将极大拓宽整个显示器行业的市场边界,“我们作为大屏基座提供商,与多家头部数字人公司合作。但整个行业产品质量参差不齐,成本高,服务不稳定。数字人能力的局限束缚了行业发展,大家都在低水平重复造轮子。”他形容魔珐星云是“行业中的六边形战士”:“有了魔珐星云提供的具身智能底层能力,未来行业可以打造广告一体机、会议一体机,还有银行、医院等多种场景。市场潜力巨大,未来可期。”