一、制定背景和意义
当前,全球正经历着以人工智能、大数据为代表的新一轮科技革命与产业变革,数字经济已成为推动经济社会高质量发展的核心引擎。我国高度重视这一历史性机遇,顶层设计层面持续加码,先后颁布了《新一代人工智能发展规划》、《关于构建数据基础制度更好发挥数据要素作用的意见》以及《数字中国建设整体布局规划》等一系列具有里程碑意义的战略纲领。这些政策明确要求,要充分发挥数据作为关键生产要素的价值,推动人工智能与实体经济深度融合,赋能传统产业转型升级,构筑国家竞争新优势。企业信用评价作为现代金融体系稳健运行的基石和市场经济秩序的重要支撑,其本身的数字化、智能化水平直接关系到社会信用体系的效能与公信力。在此国家战略宏图指引下,信用评价行业亟需拥抱新技术、革新方法论,以应对日益复杂的经济环境和海量异构的数据挑战。因此,制定一项专门指导大语言模型这一前沿AI技术在信用评价领域应用的团体标准,是积极响应国家号召、顺应技术发展浪潮的必然要求,旨在为行业提供明确的技术应用方向,确保其发展路径与国家战略同频共振。
尽管信用评价行业历经多年发展已形成相对成熟的体系,但在数字化浪潮冲击下,其内在的局限性日益凸显。传统的信用评价报告撰写严重依赖评价师的人工操作,从海量数据的收集、清洗、归类到分析、研判乃至成文,整个过程耗时费力、成本高昂,且难以保证报告的及时性。更重要的是,人工主导的模式不可避免地受到主观判断、经验差异乃至疲劳程度等因素的影响,制约了评价结果的客观性与一致性。与此同时,随着企业数字化转型的深入,数据要素本身的管理能力、安全水平、应用价值已成为衡量企业信用状况和未来发展的关键维度,而传统评价体系在捕捉和评估这些“数据信用”维度上存在明显短板,未能充分反映企业在数字经济时代的新型风险与价值。另一方面,大语言模型技术的出现,虽然为高效处理非结构化文本数据、提升分析效率、生成高质量报告内容带来了革命性希望,但其在信用评价这一严肃领域的应用仍处于“摸着石头过河”的初级阶段。缺乏统一的规范导致诸多风险与挑战:数据来源的合法合规性如何保障?模型生成的“幻觉”内容或事实错误如何甄别与控制?算法可能存在的偏见如何避免以确保评价公平?模型输出结果的可追溯性与可审计性如何实现?这些问题的存在,不仅可能放大技术应用的风险,甚至可能损害信用评价的权威性。因此,制定本标准具有极强的行业紧迫性,旨在为业界提供一套公认的应用框架,破解传统瓶颈,规范技术应用,防控潜在风险。
鉴于此,编制《企业信用评价 大语言模型工具应用指南》具有重要的现实意义。本文件旨在为信用评价机构提供一套科学、系统的指导框架,帮助其规范地使用大语言模型撰写企业信用评价报告。通过明确信息输入、模型调用、结果输出与调整、系统集成以及持续优化等方面的要求,本指南能够帮助信用评价机构更好地发挥大语言模型的优势,使得企业信用评价报告的撰写过程合法合规、高效准确,从而提升信用评价的整体质量和效率。
通过本文件的实施,有望推动信用评价机构更加积极地探索和应用大语言模型技术,提高企业信用评价报告的撰写水平,促进信用评价行业的数字化转型和创新发展,为信用经济的健康发展提供有力支持。
二、标准范围
本文件确立了运用大语言模型工具进行企业信用评价的基本原则,提供了应用场景及流程等方面的指导与建议。
本文件适用于信用评价机构运用大语言模型工具开展企业信用评价工作。
三、标准主要内容
本文件提供了基于大语言模型的信用评价流程,并针对运用场景梳理了技术流程、合规原则。本文件适用于信用评价机构基于大语言模型开展信用评价工作。
第2至4章给出了基于大语言模型的信用评价服务所涉及的术语和定义、总则以及评价框架。这些章节为信用评价机构提供了基础概念、基本原则和整体框架,确保评价过程合法合规、准确可靠。
第5章对运用场景及流程进行了详细描述,明确了大语言模型在信用评价服务中的运用场景,包括客服沟通、尽职调查、分析评估、报告撰写,以及八个作业场景,包括商务沟通、征求意见、调查提纲设计、资料收集与整理、宏观及行业环境分析、定性及定量指标评估、辅助报告撰写、辅助审核。同时,本章还系统介绍了包括明确任务信息、信息输入、模型调用、结果输出与调整等关键环节在内的应用流程,为信用评价机构在大语言模型的实际运用中提供了清晰的流程框架。
第6章强调了在使用大语言模型之前,需明确任务所属的运用场景、作业环节、输入输出信息类型、任务呈现形式及响应速度需求等关键信息。这一环节是确保后续流程顺利进行的基础,有助于根据任务特点进行有针对性的大语言模型应用设计。
第7章阐述了输入信息的整备工作,包括开发信息输入界面、预处理不同类型输入信息、检查信息准确性、筛选与任务相关的信息以及对输入数据进行标注等。同时,还介绍了提示词设计的重要性,指出需根据任务目标设计合适的提示词模板,以提高大语言模型的输出质量。
第8章介绍了模型调用策略的设计,包括根据任务需求选择合适的模型调用方式(如本地部署、云端部署或第三方API接口)、选择适合的大语言模型以及调整模型参数。这一章节强调了根据任务特点灵活选择模型和参数的重要性,以平衡输出结果的准确性、效率和成本。
第9章明确了评价机构需对大语言模型输出的结果进行全面审核和优化调整,包括检查结果的完整性、准确性、合规性、逻辑性,排查大语言模型幻觉与错误引用,并对涉及敏感信息的数据进行脱敏或屏蔽,确保最终结果合法合规、科学可靠,以及对输出结果进行润色和更新。这一环节是确保信用评价报告质量的关键步骤,体现了勤勉尽责原则的要求。
第10章提出了将大语言模型与信用评价机构现有系统进行集成的方法,以及建立持续优化机制的重要性。包括检索增强生成(RAG)技术、通过API接口等方式实现系统集成、确保输出结果与其他系统兼容、建立反馈与记录机制。这一章节旨在推动信用评价机构不断提升大语言模型的运用效果,以适应技术发展和业务需求的变化。
第11章提出评价机构宜建立持续优化机制,对各作业环节的大语言模型运用效果进行定期评估和优化调整。一是建立实时监控机制,将大语言模型运用过程中发现的问题及时进行记录。二是建立大语言模型运用评价体系,对大语言模型在任务中的输出结果质量、响应速度、资源占用等方面表现情况进行定期评价。三是结合记录的问题和评价结果,对信息标注、模型调用策略设计、模型选取、模型参数设置等方面进行持续优化改进。四是关注大语言模型行业动态和技术创新,及时对大语言模型进行更新。
四、标准发布信息
《企业信用评价 大语言模型工具应用指南》团体标准由上海市信用服务行业协会于2025年9月23日发布,于2025年10月1日实施。
