搜文章
推荐 原创 视频 Java开发 iOS开发 前端开发 JavaScript开发 Android开发 PHP开发 数据库 开发工具 Python开发 Kotlin开发 Ruby开发 .NET开发 服务器运维 开放平台 架构师 大数据 云计算 人工智能 开发语言 其它开发
Lambda在线 > 技术最前线 > GitHub 超过半数是重复代码

GitHub 超过半数是重复代码

技术最前线 2017-11-30


http://www.solidot.org/story?sid=54614


GitHub 的一个使命是共享代码,所以发现其平台上重复代码比例高达七成并不是令人吃惊的事情。


8 名研究人员组成的国际团队原计划并不是测量 GitHub 上的重复代码,而是调查不同克隆库之间的文件差异,结果发现了惊人比例的文件级复制,因而改变了研究方向。


研究人员发现,GitHub 上 4.28 亿文件中只有 8500 万是唯一的。研究报告发表在 OOPSLA SPLASH 会议上。



  • JavaScript 是克隆最多的环境,94% 的 JavaScript 文件是复制的;

  • 73% 的 C++ 文件是重复的,

  • 而 Python 程序则是 71%

  • Java 是其中最独特的,但重复比例也达到了 40%


英文全文:https://www.theregister.co.uk/2017/11/21/github_duplicate_code/

报告全文:https://dl.acm.org/citation.cfm?doid=3152284.3133908&preflayout=flat



觉得这条资讯有帮助?请转发给更多人

关注 技术最前线 看 IT 要闻

淘口令复制以下红色内容,再打开手淘即可购买

范品社,使用¥极客T恤¥抢先预览(长按复制整段文案,打开手机淘宝即可进入活动内容)

版权声明:本站内容全部来自于腾讯微信公众号,属第三方自助推荐收录。《GitHub 超过半数是重复代码》的版权归原作者「技术最前线」所有,文章言论观点不代表Lambda在线的观点, Lambda在线不承担任何法律责任。如需删除可联系QQ:516101458

文章来源: 阅读原文

相关阅读

关注技术最前线微信公众号

技术最前线微信公众号:topitnews

技术最前线

手机扫描上方二维码即可关注技术最前线微信公众号

技术最前线最新文章

精品公众号随机推荐