


数据带动数字化和智能化相互加速
-
金融 完善多源异构海量数据管理,加强数据安全合规建设
-
运营商 盘活海量数据,助力高效训练,使能大模型行业落地
-
政务 共建跨部门数据流动,保护敏感数据,助力政通人和
-
制造 唤醒历史沉睡数据,增强全流程生产效率
-
电力 加强多维度、高频率数据采集和安全留存,促进电力供需精准预测
-
科研教育 围绕高性能、可靠安全的数据供应,构筑反向赋智的基石
-
医疗 打通诊疗数据共享,保护数据安全,维护病患隐私
行业数智化呼唤高质量数据和高效数据处理
数据觉醒


- 数据觉醒是从数字化向智能化演进的必经之路,在模型训练、推理过程中,通过激活业务闲置数据、唤醒历史归档数据,应对数据匮乏的挑战。
- 为了确保人工智能的持续进化,必须聚焦于高质量训练数据的收集和管理。
数据生成与合成


- 通过数据生成与合成,让数据为数智化而生,有效帮助AI大模型高速发展。
- 数据生成:从数据生成/采集的现场、格式、频率,到业务全流程数据和面向未来的数据留存周期五个维度,探索如何生成、采集、留存更多高质量数据供AI使用。
- 数据合成:合成数据是对真实原始数据的有益补充,可以应对数据稀缺、隐私保护等关键挑战。
数据效率


- 数智时代,数据存储需要从极致性能、高扩展性、数据韧性、数据编织、全新数据范式、绿色节能六个维度不断优化,才能充分提升数据处理效率,释放数据生产力。
数智化时代数据基础设施展望与建议
展望解读
以存算分离架构部署AI-Ready数据基础设施,加速智能涌现。
AI大模型从NLP走向多模态,数据规模持续增长,数据类型日趋复杂。同时,伴随AI大模型算力集群规模越来越大,算力利用率持续降低。数据存力成为AI 持续高速增长的关键。
通用大模型的数据质量和规模不佳、缺少行业实时信息等问题,让AI推理过程中容易产生AI幻觉。
建议举措
1采用存算分离架构,分别部署智能算力和存力,各自按需演进
2数据基础设施具备横向扩展能力,性能随容量线性增长
3数据基础设施支持多协议,且协议之间互通
