1. G-repo 通过定义筛选条件,在 github 上收集数据集并执行预处理。

    G-Repo: a Tool to Support MSR Studies on GitHub

    1. LibVCS4j 挖掘 VCS(Git、Mercurial 和 Subversion),跟踪源代码文件的更改历史记录,可以集成于现有的分析工具(例如,检测源代码文件中的代码异味的工具),执行相应的数据分析功能。

    LibVCS4j

    1. TNM 挖掘 Socio-Technical Data,反映开发人员在版本控制系统 (VCS) 中的活动痕迹,构建开发人员在 VCS 中的协作网络。

    TNM: A Tool for Mining of Socio-Technical Data from Git Repositories

    1. Makar 帮助开发人员从多源数据(邮件列表、Stack Overflow (SO) 和 Quora)中寻找信息,该工具提供了各种数据提取和预处理方法,以支持研究人员进行可重复的多源研究。

    Makar: A Framework for Multi-source Studies based on Unstructured Data

    1. MIMESIS Eclipse IDE 插件,它捕获了开发人员在处理编程任务时与 IDE 进行的几乎所有交互,这使我们能够全面跟踪开发人员的行为,例如,是否以及何时执行了解决给定任务所需的代码编辑,更有趣的是,导致开发人员这样做的先前步骤是什么。

    Recording, Visualising and Understanding Developer Programming Behaviour

    1. RefDiff 1.0 基于静态分析和代码相似性的启发式组合来检测 13 种众所周知的重构类型。

    RefDiff 1.0

    1. RefDiff 2.0 基于1.0设计基础上,实现多语言的支持,重新设计其核心以使用独立于语言的模型和改进的检测启发式方法。

    RefDiff 2.0

    1. DepOwl 帮助用户防止兼容性故障的实用工具。

    DepOwl: Detecting Dependency Bugs to Prevent Compatibility Failures