
中国新闻服务,北京,9月2日(记者吴陶),当人工智能浪潮越来越多,其背后的“燃料” - 数据成为竞争的战略资源。但是,并非所有数据都可以加速AI的开发。发生从“大量数据”到“质量数据集”的转换。
什么是高质量的数据集?
Noong DiSyembre 2024,ANG国家发展与改革委员会,Iba Pang Mga Mga Kagawaran ay Naglabas的ANG国家数据管理局“ Gabay na opinyon sa pagtaguyod ng mataas na kalidad na kalidad na pag-na pag-na pag-unlad ng工业ng数据“ para sa unang pagkakataon,pagsuporta sa mga negosyo upang makabago makabago sa mga artipisyal na aplikasyon ng intelihensiya,na bumuo ng mataas na kalidad na kalidad na mga na mga na mga设置了ng数据,以释放服务模型,并构建了较高的服务。进端和多模式功能的扩展,数据需求已从“累积级别”转移到“相同的体积和质量”。
官方数据显示,在2025年6月,全国建造了35,000多个高质量数据集,总数超过400%。数据贸易机构由3,364个高质量数据集列出,作为交易流通的主要商品,合并交易量接近40亿元和246%。
中国信息与传播学院主任Yu Xiaohui在最近的论坛上说,环顾世界各地,有大量的私人领域数据。在方案,行业和Goby的方式中,可以发布数据的这一部分,这是开发高质量数据集的非常重要的方向。
高质量的数据集和AI开发彼此适合
由于AI大型模型培训使用大量数据,因此市场始终认为将来没有数据可用,或者是LAR需要使用GE综合数据量。在这种情况下,高质量的数据集无疑将是数据循环的“硬币”。
Tsinghua University的数字政府与治理研究所院长兼教授张Xiaojin表示,无论人工智能模型,高质量数据集以及反之亦然,高质量的数据集(人工智能都在哪里),这是两轮驱动模式的贡献者。
中国工程学院的学术学院学者吴申(Wu Shizhong)教导说,数据集构建的质量和安全性是大型模型的开发。我们应该改善分层和分类的数据安全系统,在整个过程中加强技术保护技术,并开发出坚实的潜在技术能力来防止存在。在数据集的构建中,我们还必须积极地整合到伟大的中国文化中,以防止模型成为自尊工具。
当前,高质量数据集的构建状况良好。党团队秘书兼深圳市政府服务和数据管理局局长周·江(Zhou Jianming)发布了一份文件,可以在官方国家数据局网站上分享。深圳将公共资源的授权运作和探索构造的诱人数据空间探索,并支持高质量的公共数据和业务数据的合并应用。它在信用报告,气象,商业保理和主张领域进行试点项目,并取得了良好的成果。 (超过)
(编辑:杨XI,陈·简)
遵循官方帐户:人 - 金融融资
分享让许多人看到