言犀大模型,完整工具链助力创造产业价值

[复制链接]
作者: zhaoyuac09 | 时间: 2024-4-26 08:43:08 |
0 38

1928

主题

1928

帖子

5784

积分

研究生

Rank: 9Rank: 9Rank: 9

积分
5784
发表于 2024-4-26 08:43:08| 显示全部楼层 |阅读模式
13日,2023京东全球科技探索者大会暨京东云峰会上,京东正式发布千亿级大模型“言犀”,支持多模态。与一般的通用大模型相比,言犀的产业属性更强,因为除70%通用数据外,它还融合了30%供应链原生数据。官方同时表示言犀还有更强泛化能力、更多安全保障,将深入零售、物流、金融、健康、政务等知识密集型与任务型产业场景,解决各种产业实际问题。京东集团技术委员会主席、京东云事业部总裁曹鹏在发布会上表示,京东云实施“三步走”策略,基于内部实践构建通用大模型,经由高复杂场景逐步大规模迭代,最终将大模型能力向真实商业场景开放。
为配套产业应用,京东还推出了一套言犀的完整工具链,包括言犀AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等产品,其中言犀AI开发计算平台和向量数据库,被京东比作大模型的“训练营”和“弹药库”。京东集团CEO许冉在发布会上提出,大模型的价值由算法、算力、数据、应用产业厚度等多项因素决定。“大模型真正实现自己的价值,一定是在产业应用中。”这一理念贯穿了整场大会。

一、言犀的差异化能力
发布会上曹鹏表示,训练言犀时用京东原生数据集,带来了商品推荐、金融政策、理财规则、物流体验等领域的能力。相较别家的通用大模型竞品,言犀对于零售、健康、物流、金融等领域有更深入的理解,而这些也都是京东自家经营多年的业务。“数据集上的差异可以让京东在擅长的行业里提供差异化的模型能力。对其他企业来讲,大模型是产品,从一开始就会考虑大模型用什么形式对外提供服务。对我们来讲,大模型是工具,我们想的是怎么产生价值,再进一步对外提供服务。我们一直在寻找在哪些产品、哪些系统、哪些场景里能够真正把大模型用起来。现在大模型已经从探索研究院走出来了,变成京东集团的底层能力。”
很明显的一点,京东此次的言犀,所有技术研发都围绕着“供应链”这个中心,技术对京东来说是工具与手段,而非一味追求的目标。单一的大模型技术再先进也无法直接产生价值,技术只有与场景相结合才能产生实际价值。如果达不到降本增效、改善体验、优化服务等效果,再优质的大模型始终还是玩具。
基于言犀的出色能力,京东物流发布了“京东物流超脑”,针对供应链全链路提供辅助决策、运营优化以及一线作业智能助手等能力。此外针对仓库布局问题,在模型中输入今年“双11”大促的效率布局拥堵点,系统经过分析会回复导致效率拥堵的具体原因,以及具体解决办法,这极大的节约了传统方式的成本,特别是在调研、分析、测试等处还常有额外或隐性成本。而在电商营销场景,京东云的“优加”AIGC内容营销平台可以更好地理解商品特征,从而帮助商家自动生成相关的商品文本或图片等营销素材,进而提升商家的营销工作效率。
言犀配套的开放计算平台,利用了京东在零售、物流、健康、金融等行业多年积累的优质数据,通过算法工具集成,并整合了京东技术团队开发的上百种训练和推理优化工具,结合低代码应用平台,为客户提供从数据建设到模型应用的一站式服务。用户完成从数据准备、模型训练到模型部署的全流程所需的时间还不到一周。之前需要几十名科学家团队的工作,现在只需要区区几个算法人员,通过平台模型加速工具优化,节约90%的推理成本。

二、大小兼顾效果绝佳
根据发布会上京东云官方的介绍,此次发布的言犀并非京东一时兴起。两年前京东云就推出了十亿级参数的K-PLUG,为京东零售数千种商品累计生成文案超过30亿字,人工审核通过率超95%。去年又推出百亿级参数的Vega,服务京东物流一站式数智化供应链数据管理平台,助力各家企业级用户降本增效。如此看来,今年的言犀的确是顺理成章的,不论是发布时间还是千亿级的参数量级。
对于言犀,曹鹏显得自信满满,表示说“我们并不一味强调用一个千亿参数大模型去覆盖所有应用。原先,针对不同类目的商品会调用不同客服与不同模型做回复,现在用一个大模型就可以完成基础的语义理解和多轮对话。但要回答一些具体问题,比如商品保修政策、售后体验等,就不能用大模型而要换成精度更高的小模型,这个时候我们就会进一步调用小模型,回答客户的问题。”
依托言犀,京东还在发布会上公布了两大服务平台,包括全新升级的优加DaaS和言犀智能服务平台,以及面向零售、金融、城市、健康、物流五大业务领域的行业解决方案。目前,言犀智能服务已经应用于12345热线、银行数字员工、专家诊断场景等严肃场景,且已有供应链金融科技、产业协同、数据中台等数十个数字化场景,服务了百座城市、两千余家大型企业、超过250万家中小微企业、近家金融机构。

三、未来几何
曹鹏同时也表示,随着未来算力进一步提升、成本不断下降,千亿级大模型的训练和推理成本也会下降,响应速度更高。大模型的快速流行也导致算力需求猛增,2021年京东在重庆组建了天琴α超算集群,900个机柜服务器在重庆广阳岛上持续运转,算力充裕,为超级深度学习、可信AI、量子机器学习等提供算力支撑。
对于大模型的应用实践,京东也提出了明确的“三步走”规划。目前,京东云已经基于内部实践构建了通用大模型。官方预计在明年初,京东将大模型能力向外部严肃商业场景开放。在严肃的商业场景里,如果大模型在智能客服中回答错误或是客群筛选不精准,就会导致巨大损失。所以要探索无缝结合大模型以及经验模型、对抗模型等小模型,既利用大模型的泛化性、逻辑性优势,又使用原有的小模型,不同模型承担不同职责,真正达到最佳效果。
大模型赛道火了半年多,京东虽然迟到了但终究没有缺席。言犀链接:https://yanxi.jd.com


来源:
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回列表 返回顶部