
主管单位: | 国家市场监督管理总局 |
主办单位: | 中国标准化研究院 中国标准化协会 |
国内刊号: | CN11-5811/T |
国际刊号: | ISSN1674-5698 |
创刊时间: | 1964年 |
出版周期: | 月刊 |

DOI:10.3969/j.issn.1674-5698.2025.10.010
作者:朱勋程;赵忆宁;李宁;黄典一;李瑜敏;冯斯佑;杨俊;杨敏
关键词:统一社会信用代码;数据质量提升;NGBoost
Author:ZHU Xuncheng;ZHAO Yining;LI Ning;HUANG Dianyi;LI Yumin;FENG Siyou;YANG Jun;YANG Min
Keywords:unified social credit code; data quality improvement; NGBoost
摘要:
【目的】随着社会信用体系建设的深入推进,法人和其他组织统一社会信用代码(以下简称为统一代码)作为信用信息治理的核心要素,其数据完整性不足问题日益凸显,制约了信用评估与监管效能。当前统一代码数据库存在混合型数据缺失问题,亟须系统性补全治理。【方法】针对混合型属性缺失问题,本文提出采用NGBoost构建概率预测模型实现混合型数据补全。【结果】构建了混合型缺失数据补全模型,提升了统一代码数据的完整性、准确性与场景适配性。【结论】研究成果为破解信用信息治理中的数据质量瓶颈提供了新的技术路径,对完善信用基础设施、挖掘数据资产价值具有重要的理论指导意义与实践应用价值。
Abstract:
Objective] With the in-depth promotion of the construction of the social credit system, the unified social credit code becomes the core element of credit information governance. However, the lack of integrity of the unified social credit code data emerges, which has constrained the effectiveness of credit assessment and supervision. Currently, the unified social credit code database has the problem of mixed-type data missing, so it is urgently necessary to conduct systematic completion and governance. [Methods] Regarding the problem of mixed-type attribute missing, this paper proposes to use NGBoost to build a probability prediction model to achieve mixed-type data completion. [Results] This paper has constructed a mixedtype missing data completion model, so as to improve the completeness, accuracy and scene adaptability of the unified social credit code data. [Conclusion] The research results provide a new technical path for solving the data quality bottleneck in credit information governance, and have important theoretical guiding significance and practical application value for improving the credit infrastructure and extracting the value of data assets.
引用格式:朱勋程,赵忆宁,李宁,等.信用信息治理中混合型缺失数据补全方法探索:以统一社会信用代码为例[J].标准科学,2025(10):73-78.
基金项目:本文受云南省市场监督管理局科技计划项目“基于机器学习的统一社会信用代码数据补全关键技术研究”(项目编号:2023YSJK01);云南省科技厅科技计划项目“技术创新人才培养对象项目朱勋程”(项目编号:202405AD350104)资助。
作者简介:朱勋程,学士,正高级工程师,研究方向为大数据分析和标准数字化转型。 赵忆宁,通信作者,学士,高级工程师,研究方向为标准信息检索、统计、分析及应用。 李宁,硕士,高级工程师,研究方向为标准化研究与应用。 黄典一,硕士,工程师,研究方向为标准化研究和标准数字化管理。 李瑜敏,硕士,助理工程师,研究方向为标准化研究和数据分析。 冯斯佑,硕士,助理工程师,研究方向为标准数字化。 杨俊,硕士,高级工程师,研究方向为标准化和信息化研究及管理。 杨敏,硕士,工程师,研究方向为数字标准技术。
主管单位: | 国家市场监督管理总局 |
主办单位: | 中国标准化研究院 中国标准化协会 |
国内刊号: | CN11-5811/T |
国际刊号: | ISSN1674-5698 |
创刊时间: | 1964年 |
出版周期: | 月刊 |