迈向智能世界白皮书 - 数据存储

集团网站选择区域/语言

返回主菜单

集团网站

企业业务网站

运营商业务网站

消费者业务网站

华为云业务网站

数字能源业务网站

返回主菜单

选择区域/语言

搜索历史

清空

迈向智能世界白皮书

数据存储

数据是数字化到数智化
成功转型的关键要素

数据带动数字化和智能化相互加速

金融完善多源异构海量数据管理，加强数据安全合规建设
运营商 盘活海量数据，助力高效训练，使能大模型行业落地
政务共建跨部门数据流动，保护敏感数据，助力政通人和
制造唤醒历史沉睡数据，增强全流程生产效率
电力加强多维度、高频率数据采集和安全留存，促进电力供需精准预测
科研教育 围绕高性能、可靠安全的数据供应，构筑反向赋智的基石
医疗打通诊疗数据共享，保护数据安全，维护病患隐私

行业数智化呼唤高质量数据和高效数据处理

数据觉醒是从数字化向智能化演进的必经之路，在模型训练、推理过程中，通过激活业务闲置数据、唤醒历史归档数据，应对数据匮乏的挑战。
为了确保人工智能的持续进化，必须聚焦于高质量训练数据的收集和管理。

数据生成与合成

通过数据生成与合成，让数据为数智化而生，有效帮助AI大模型高速发展。
数据生成：从数据生成/采集的现场、格式、频率，到业务全流程数据和面向未来的数据留存周期五个维度，探索如何生成、采集、留存更多高质量数据供AI使用。
数据合成：合成数据是对真实原始数据的有益补充，可以应对数据稀缺、隐私保护等关键挑战。

数智时代，数据存储需要从极致性能、高扩展性、数据韧性、数据编织、全新数据范式、绿色节能六个维度不断优化，才能充分提升数据处理效率，释放数据生产力。

数智化时代数据基础设施展望与建议

展望解读

以存算分离架构部署AI-Ready数据基础设施，加速智能涌现。

AI大模型从NLP走向多模态，数据规模持续增长，数据类型日趋复杂。同时，伴随AI大模型算力集群规模越来越大，算力利用率持续降低。数据存力成为AI 持续高速增长的关键。

通用大模型的数据质量和规模不佳、缺少行业实时信息等问题，让AI推理过程中容易产生AI幻觉。

建议举措

1采用存算分离架构，分别部署智能算力和存力，各自按需演进

2数据基础设施具备横向扩展能力，性能随容量线性增长

3数据基础设施支持多协议，且协议之间互通