代码注释数据治理研究取得进展行业新闻

热点新闻

代码注释数据治理研究取得进展

2022-07-27 22:00 浏览:657 搜索引擎搜索“广企汇”
温馨提示：为防找不到此信息，请务必收藏信息以备急用！联系我时，请说明是在广企汇看到的信息，谢谢。

展会网站大全

报名观展合作

近日，中国科学院软件研究所互联网软件技术实验室在代码注释数据治理方面取得进展。该研究针对当前代码注释大数据质量治理难的问题，通过分析4个大规模代码注释基准数据集，归纳出12种类型的噪声数据并研发了基于规则的代码注释数据噪声清理工具，能够高效、精准地自动治理代码注释数据质量，为代码注释自动生成模型形成高质量数据提供保障，有效促进现有的代码注释自动生成模型提升性能。

代码注释自动生成技术旨在减轻人工编写注释代码的工作量，从而提高软件开发效率。目前主流的代码注释生成模型大多采用深度学习框架，模型的有效性依赖大规模高质量数据集。然而现实中基准数据集主要采集自真实的开源项目代码，其数据质量如何尚无研究深入分析。

针对上述问题，科研人员检测了4个基准数据集中的噪声，发现这些数据集中均广泛存在噪声数据，噪声数据占比最低31%，最多高达到65%；定义了12种类型的噪声数据并给出了具体示例；并研发了基于规则的代码注释数据噪声清理工具，治理准确率达到97.5%。科研人员对比了清理前后的3个最新代码注释自动生成模型，发现去除噪声后，模型的性能普遍提升了21%-27%。

相关研究成果以Are We Building on the Rock? On the importance of Data Preprocessing for Code Summarization为题，被软件工程领域会议ESEC/FSE 2022录用。研究工作得到国家重点研发计划的支持。

代码注释数据质量分析方法框架

来源：中国科学院软件研究所

展开全文+

发布人：83a3**** IP：117.173.23.*** 举报/删稿

展会推荐

第17届中国西安国际糖酒食品博览会
西安市2025-09-12 至 2025-09-14

2025中国（宁波）五金机电进出口博览会
宁波市2025-11-14 至 2025-11-16

2025第三十一届广州酒店用品展览会
广州市2025-12-18 至 2025-12-20

2025年德国斯图加特金属板材加工技术展blechexpo
北京市2025-10-21 至 2025-10-24

2025上海服装供应链 2025上海纺织面辅料展
上海市2025-12-17 至 2025-12-19

2026第23届中国(青岛) 国际食品加工和包装机械展览会
青岛市2026-05-29 至 2026-05-31

2025安徽纺织机械展-中国国际纺织机械及印花工业展览会
合肥市2025-10-25 至 2025-10-27

有事群里找民警安徽铜陵“微信找警”提升基层治理精准度
2022-07-27浏览:1937

7月27日疫情防控最新消息！
2022-07-27浏览:1366

民权县关于新增2例无症状感染者行程轨迹的通告
2022-07-28浏览:1252

旧衣服回收有哪些技巧
2022-07-28浏览:2789

香港公布2022年授勋名单获授勋衔和嘉奖人数为特区成立以来最多
2022-07-27浏览:1338

“祝妈妈，我考上大学啦！”
2022-07-27浏览:1535

止痛药当“祖传秘方”卖给老年人涉案金额700余万元
2022-07-27浏览:1143

7月27日三分钟新闻早知道
2022-07-27浏览:2057

阳宏电源生产的变频电源一般分为哪几种规格？
2022-07-27浏览:2549

荆门机械CE认证公司MD指令认证公司
2022-07-27浏览:1986

东莞蓝牙设备SRRC证书办理流程
2022-07-27浏览:1993

綦江发电机出租（本地/租赁）綦江发电机租赁公司綦江资讯
2022-07-27浏览:2921

泰国蓝莓干进口哪家清关公司可以代理,干果坚果报关公司
2022-07-27浏览:2568

昆山回收DDR3内存
2022-07-27浏览:2257

深圳坪山新区保税区保税仓库出租
2022-07-27浏览:3702

@2022届高校毕业生，24365就业平台再推出三大专场招聘
2022-07-26浏览:1875

入住8家电竞酒店的35间客房，不是为了打游戏
2022-07-26浏览:1447

国家电网公司党组理论学习中心组开展集体学习
2022-07-26浏览:4350

单位犯罪起诉数量明显下降，涉案企业合规改革试点成效初显
2022-07-26浏览:1344

三亚私募基金公司注册要点（资料清单）
2022-07-26浏览:2608

让朕来说2句

评论

收藏

点赞

转发