更新时间:作者:佚名
大家好,提质增效,AI赋能工业企业软件开发创新相信很多的网友都不是很明白,包括也是一样,不过没有关系,接下来就来为大家分享关于提质增效,AI赋能工业企业软件开发创新和的一些知识点,大家可以关注收藏,免得下次来找不到哦,下面我们开始吧!
赵子武华为混合云研发生产线总监

2024年,基于华为Cloud Stack混合云的CodeArts将迎来全新升级,新增盘古研发大模型支持的CodeArts Snap智能开发助手,提供代码生成、研发知识问答、单元测试、代码讲解、代码注释、代码调试、代码翻译、代码检查等八项核心功能,帮助开发者端到端提升研发效率20%以上。
会上,赵子武详细介绍了CodeArts Snap智能开发助手的三大关键竞争力:
华为Cloud Stack构建了一套完整的开发工具链、基础方法和自动化平台。基于1.5万亿开源研发数据和华为各产品线代码,精挑细选500亿枚优质研发数据Token。
基本方法包含三个内容:第一模型的语料质量。只有提出清晰、高质量的问题,拥有大量正确的背景知识,能够清楚地表达自己的需求,最终的输出结果才是正确的。二是清洗数据质量高,清洗过程有序,数据有保障。三是基本评价方法。训练出来的代码生成模型必须有明确的评价标准和相对中立、专业的评价方法,而不是依赖于主观评价。
基本方法到位后,CodeArts Snap 还建立了两个自动化工具平台,一个是自动化数据清洗平台,另一个是自动化模型评估平台,支撑持续高效的运营,保证模型训练的持续优化。
良好的评估机制可以对模型进行强化学*。基于这套强化学*逻辑,开发大型模型的代码生成能力可以更强。我们使用内部和外部循环来迭代优化我们的训练数据,以便模型在训练时变得更加智能。
外循环是指用户使用时,系统会收到用户的评价和反馈,比如是否接受完整的结果、拒绝或部分接受。将这些数据集注入到下一次训练迭代中,*提高了训练结果的准确性。
内循环是一个工具,将构建自动化测试和评估,以不断自动评估和加强学*。
大模型能否很好地输出想要的结果的前提是它能被理解。用户的问题是基于自然语言认知提出的。 CodeArts Snap 有大量已知的API 调用可以使用。基于丰富的知识库,可以找到相似的实现、相关的数据库表结构、相关的类和项目上下文,并自动补充相关的背景信息。另外,大模型传达的信息非常复杂和丰富,包括各种步骤、需求描述、数据库表、第三方组件的接口、使用的框架以及来自历史项目切片的类似代码。这时候大模型已经接受了足够的知识输入,他就会给出最终的结果。这样,他听得越清楚,推理的结果就越准确。