时间: 2025-05-28 01:06:42 | 作者: 餐厅布草
近来,我国人工智能学会发布2024年度“吴文俊人工智能科技奖”公告,京东科技人工智能团队凭仗“多模态交互式数字人关键技能及工业使用”项目荣获我国智能科学技能最高奖——吴文俊人工智能科技奖的特等奖,也是本年度仅有的特等奖。
这是京东集团继2021年“产品智能匹配关键技能及在营销中的使用”和2022年“使命型智能对话交互关键技能及大规划工业使用”之后的又一次获奖,再次展示了京东在AI研制技能与工业使用领域的继续抢先性。
多模态交互式数字人技能集语音、语义、形象等多模态技能于一体,存在许多的技能应战,一直是国内外研讨的前沿技能领域。在本次获奖项目中,京东科技人工智能团队在以下三方面完成了技能打破:
京东多模态交互式数字人才能继续位居世界抢先水平,并在2024年首先敞开职业规划最大的商业化使用,到现在,已服务9000+商家,累计为商家带来出售增量超140亿。2024年4月,采销东哥AI数字人完成了高传神、高牢靠、极低错觉率的新水平。2024年京东618期间,包含格力总裁董明珠、洁丽雅总经理“毛巾少爷”石展承、名创优品CEO叶国富等21位总裁数字人空降京东直播间,与数千家品牌商,一起发明了史上一日并行尖端规划的数字人直播事情。在京东11.11、年货节等场景,数字人与个护美妆、家电家居、母婴宠物等品牌发生化学反应,继续带来千人千面的直播交互体会。
近期,京东言犀数字人技能再度进化。京东科技人工智能团队打造的数字人通用的基座大模型,经过语音组成大模型LiveTTS及通用数字人大模型LiveHuman,仅需输入自然言语或1秒视频/相片,即可生成4K超高清、100%口型匹配的数字人,完全离别数字人制造对线下拍照、建模与耗时练习的依靠。
LiveTTS语音组成基座模型:根据20万小时数据练习的分散模型,完成“零样本”声响组成与多语种情感染输出,音色类似度较其它头部厂商高出1.3倍、字符错误率(CER)下降最高5.12%;
LiveHuman数字人基座模型:立异性的人体过渡帧生成技能,处理多片段联接卡顿难题,在遮挡、大视点、动态布景、多人直播等极点条件下仍有流转体现。
这一系列打破将单个数字人出产所带来的本钱从数万元拉低至两位数,较线%,标志着数字人从“专业东西”正式成为“普惠出产力”。这将为广告资料批量生成、新媒体投进、个人IP打造等场景使用拆掉技能藩篱,走向工业级使用。
作为一家兼具实体企业基因和特点、先进数字技能和才能的新式实体企业,京东20多年来继续深耕供应链,用人工智能等数智化技能全面衔接和优化社会出产、流转、消费、服务等一切的环节。从零售功率提升到工业生态构建,京东一直饯别“以实助实”的途径。到2024年末,京东系统在基础科学和研制技能上已累计投入近1400亿元,先后推进大言语模型、语音辨认及组成、数字人等一系列人工智能共性关键技能建造,并大范围的使用于零售、物流、工业、健康、政务等工业场景,助力千行百业实数交融,完成高质量开展。
面向未来,数字人仅仅京东众多技能立异版图中的一小部分。京东正加快推进AI构建新质出产力,让每个企业甚至个人都能更高功率、更低门槛拥抱AI。