收集 PR 总数
423,732
1h 0 / 24h +1,411
有效 SWE 总数
28,585
1h 0 / 24h +720
整体处理成功率
6.7%
Valid SWE / Collected PRs
difficulty_score 均值
5.76
median 5.7,count 28,540
语言进度
| 语言 | 收集 PR | 过去 1h | 过去 24h | 有效 SWE | 过去 1h | 过去 24h | 处理成功率 |
|---|---|---|---|---|---|---|---|
| Cc | 28,202 | 0 | +77 | 7,734 | 0 | +335 | |
| C++cpp | 43,066 | 0 | +160 | 1,853 | 0 | +20 | |
| Gogo | 87,517 | 0 | 0 | 4,407 | 0 | +79 | |
| Javajava | 59,883 | 0 | +36 | 2,604 | 0 | +25 | |
| JavaScriptjs | 30,786 | 0 | +61 | 3,666 | 0 | +7 | |
| Pythonpy | 68,032 | 0 | +258 | 2,518 | 0 | 0 | |
| Rustrust | 50,386 | 0 | 0 | 2,469 | 0 | +34 | |
| TypeScriptts | 55,860 | 0 | +819 | 3,334 | 0 | +220 |
fix.patch 复杂度
| 语言 | Valid SWE Count | Avg fix.patch lines | Avg fix.patch hunks | Avg fix.patch files |
|---|---|---|---|---|
| C | 7,734 | 281.32 | 15.40 | 4.94 |
| C++ | 1,853 | 332.83 | 11.23 | 4.46 |
| Go | 4,407 | 271.79 | 14.97 | 4.97 |
| Java | 2,604 | 169.54 | 10.83 | 4.41 |
| JavaScript | 3,666 | 73.31 | 6.22 | 2.76 |
| Python | 2,518 | 135.78 | 9.99 | 3.44 |
| Rust | 2,469 | 254.62 | 12.66 | 4.02 |
| TypeScript | 3,334 | 160.46 | 9.08 | 4.09 |
统计方法说明
难度打分 difficulty_score
读取每个有效任务目录的 solution/fix.patch、tests/ 和 instruction.md,由 src/swegen/scoring.py 使用零 API 静态评分。
当前公式采用 log-scale 连续评分,避免中等规模 patch 过早变成 hard。权重为:patch_scope 38%、logic_complexity 32%、context_breadth 15%、test_complexity 10%、instruction_complexity 5%。
label 阈值:easy <= 4.0,medium <= 7.0,hard > 7.0。
Tags 生成与展示
tags 不是看板现场计算的,而是在 swegen 构建任务时由 LLM 根据 PR 信息生成,并写入 task.toml 的 [metadata].tags。
prompt 要求 tags 按三段式生成:编程语言、项目层级/领域、框架/库名或具体主题。看板只读取已有 task.toml 并统计每个语言的 tag 出现次数和占比。
fix.patch 统计
patch 统计来自每个有效任务的 solution/fix.patch,并按语言扩展名过滤代码文件,口径与 upload_march_swe_to_hf.py 的 code-only 统计保持一致。
Avg fix.patch lines 统计代码文件 diff 中新增/删除行数;Avg fix.patch hunks 统计 @@ hunk 数;Avg fix.patch files 统计涉及的代码文件数。
difficulty_label 分布
| 语言 | easy / medium / hard | easy | medium | hard |
|---|---|---|---|---|
| C | 735 / 5189 / 1802 | 735 | 5,189 | 1,802 |
| C++ | 320 / 1159 / 370 | 320 | 1,159 | 370 |
| Go | 369 / 3247 / 785 | 369 | 3,247 | 785 |
| Java | 346 / 1660 / 595 | 346 | 1,660 | 595 |
| JavaScript | 593 / 2724 / 348 | 593 | 2,724 | 348 |
| Python | 211 / 1725 / 561 | 211 | 1,725 | 561 |
| Rust | 260 / 1444 / 763 | 260 | 1,444 | 763 |
| TypeScript | 342 / 2528 / 464 | 342 | 2,528 | 464 |
difficulty_score 概览
| 语言 | count | min | p25 | median | mean | p75 | max |
|---|---|---|---|---|---|---|---|
| C | 7,726 | 2.4 | 4.9 | 5.9 | 5.91 | 7.0 | 9.2 |
| C++ | 1,849 | 2.5 | 4.4 | 5.6 | 5.60 | 6.8 | 9.0 |
| Go | 4,401 | 2.6 | 4.9 | 5.8 | 5.81 | 6.7 | 9.1 |
| Java | 2,601 | 2.8 | 4.7 | 5.8 | 5.80 | 6.9 | 9.2 |
| JavaScript | 3,665 | 2.6 | 4.4 | 5.2 | 5.28 | 6.1 | 9.2 |
| Python | 2,497 | 2.6 | 4.9 | 5.8 | 5.90 | 6.9 | 8.9 |
| Rust | 2,467 | 2.7 | 4.9 | 6.2 | 6.10 | 7.4 | 9.0 |
| TypeScript | 3,334 | 2.7 | 4.6 | 5.5 | 5.58 | 6.4 | 8.9 |
全局 Top Tags
library12,937 (45.3%)
backend8,786 (30.8%)
cli3,986 (14.0%)
frontend1,671 (5.9%)
testing1,189 (4.2%)
react889 (3.1%)
http885 (3.1%)
framework767 (2.7%)
embedded567 (2.0%)
cpp395 (1.4%)
networking359 (1.3%)
async321 (1.1%)
kubernetes255 (0.9%)
graphql229 (0.8%)
postgresql224 (0.8%)
eslint217 (0.8%)
parsing204 (0.7%)
aws182 (0.6%)
kernel173 (0.6%)
compiler171 (0.6%)
angular171 (0.6%)
firmware170 (0.6%)
quic166 (0.6%)
git165 (0.6%)
json162 (0.6%)
redis149 (0.5%)
aem147 (0.5%)
security142 (0.5%)
rust141 (0.5%)
tls138 (0.5%)