作为AI三要素之一,数据的积累和质量对AI大模型的训练起到了决定性作用。
训练数据生产过程主要包括四个环节:设计、采集、加工(数据标注)及质检。其中,数据标注需要识别语音、图像、文本、视频等原始数据,并添加标签为机器学习模型指定上下文,帮助其做出准确的预测。
艾瑞咨询数据显示,包括数据采集、数据处理(标注)、数据存储、挖掘等模块在内的AI基础数据服务市场,将在未来数年内持续增长,到2025年,国内AI基础数据服务市场的整体规模预计将达到101.1亿元,增速将达31.8%(2024-2025年)。