收集 PR 总数
423,933
1h 0 / 24h +1,612
有效 SWE 总数
28,665
1h +8 / 24h +800
整体处理成功率
6.8%
Valid SWE / Collected PRs
difficulty_score 均值
5.76
median 5.7,count 28,620
语言进度
| 语言 | 收集 PR | 过去 1h | 过去 24h | 有效 SWE | 过去 1h | 过去 24h | 处理成功率 |
|---|---|---|---|---|---|---|---|
| Cc | 28,202 | 0 | +77 | 7,734 | 0 | +335 | |
| C++cpp | 43,066 | 0 | +160 | 1,878 | +3 | +45 | |
| Gogo | 87,608 | 0 | +91 | 4,420 | 0 | +92 | |
| Javajava | 59,889 | 0 | +42 | 2,605 | 0 | +26 | |
| JavaScriptjs | 30,786 | 0 | +61 | 3,666 | 0 | +7 | |
| Pythonpy | 68,083 | 0 | +309 | 2,518 | 0 | 0 | |
| Rustrust | 50,436 | 0 | +50 | 2,479 | +5 | +44 | |
| TypeScriptts | 55,863 | 0 | +822 | 3,365 | 0 | +251 |
fix.patch 复杂度
| 语言 | Valid SWE Count | Avg fix.patch lines | Avg fix.patch hunks | Avg fix.patch files |
|---|---|---|---|---|
| C | 7,734 | 281.22 | 15.40 | 4.93 |
| C++ | 1,878 | 333.87 | 11.42 | 4.52 |
| Go | 4,420 | 271.40 | 14.94 | 4.96 |
| Java | 2,605 | 169.48 | 10.83 | 4.41 |
| JavaScript | 3,666 | 73.31 | 6.22 | 2.76 |
| Python | 2,518 | 135.78 | 9.99 | 3.44 |
| Rust | 2,479 | 254.45 | 12.67 | 4.02 |
| TypeScript | 3,365 | 160.09 | 9.10 | 4.09 |
统计方法说明
难度打分 difficulty_score
读取每个有效任务目录的 solution/fix.patch、tests/ 和 instruction.md,由 src/swegen/scoring.py 使用零 API 静态评分。
当前公式采用 log-scale 连续评分,避免中等规模 patch 过早变成 hard。权重为:patch_scope 38%、logic_complexity 32%、context_breadth 15%、test_complexity 10%、instruction_complexity 5%。
label 阈值:easy <= 4.0,medium <= 7.0,hard > 7.0。
Tags 生成与展示
tags 不是看板现场计算的,而是在 swegen 构建任务时由 LLM 根据 PR 信息生成,并写入 task.toml 的 [metadata].tags。
prompt 要求 tags 按三段式生成:编程语言、项目层级/领域、框架/库名或具体主题。看板只读取已有 task.toml 并统计每个语言的 tag 出现次数和占比。
fix.patch 统计
patch 统计来自每个有效任务的 solution/fix.patch,并按语言扩展名过滤代码文件,口径与 upload_march_swe_to_hf.py 的 code-only 统计保持一致。
Avg fix.patch lines 统计代码文件 diff 中新增/删除行数;Avg fix.patch hunks 统计 @@ hunk 数;Avg fix.patch files 统计涉及的代码文件数。
difficulty_label 分布
| 语言 | easy / medium / hard | easy | medium | hard |
|---|---|---|---|---|
| C | 735 / 5189 / 1802 | 735 | 5,189 | 1,802 |
| C++ | 320 / 1171 / 383 | 320 | 1,171 | 383 |
| Go | 369 / 3258 / 787 | 369 | 3,258 | 787 |
| Java | 346 / 1661 / 595 | 346 | 1,661 | 595 |
| JavaScript | 593 / 2724 / 348 | 593 | 2,724 | 348 |
| Python | 211 / 1725 / 561 | 211 | 1,725 | 561 |
| Rust | 260 / 1450 / 767 | 260 | 1,450 | 767 |
| TypeScript | 345 / 2547 / 473 | 345 | 2,547 | 473 |
difficulty_score 概览
| 语言 | count | min | p25 | median | mean | p75 | max |
|---|---|---|---|---|---|---|---|
| C | 7,726 | 2.4 | 4.9 | 5.9 | 5.91 | 7.0 | 9.2 |
| C++ | 1,874 | 2.5 | 4.4 | 5.6 | 5.62 | 6.8 | 9.0 |
| Go | 4,414 | 2.6 | 4.9 | 5.8 | 5.81 | 6.7 | 9.1 |
| Java | 2,602 | 2.8 | 4.7 | 5.8 | 5.80 | 6.9 | 9.2 |
| JavaScript | 3,665 | 2.6 | 4.4 | 5.2 | 5.28 | 6.1 | 9.2 |
| Python | 2,497 | 2.6 | 4.9 | 5.8 | 5.90 | 6.9 | 8.9 |
| Rust | 2,477 | 2.7 | 4.9 | 6.2 | 6.10 | 7.4 | 9.0 |
| TypeScript | 3,365 | 2.7 | 4.6 | 5.5 | 5.58 | 6.5 | 8.9 |
全局 Top Tags
library12,957 (45.3%)
backend8,816 (30.8%)
cli3,999 (14.0%)
frontend1,688 (5.9%)
testing1,206 (4.2%)
react907 (3.2%)
http896 (3.1%)
framework773 (2.7%)
embedded567 (2.0%)
cpp396 (1.4%)
networking359 (1.3%)
async324 (1.1%)
kubernetes255 (0.9%)
graphql229 (0.8%)
postgresql226 (0.8%)
eslint217 (0.8%)
parsing204 (0.7%)
aws182 (0.6%)
kernel173 (0.6%)
angular173 (0.6%)
compiler171 (0.6%)
firmware170 (0.6%)
quic166 (0.6%)
git165 (0.6%)
json162 (0.6%)
redis154 (0.5%)
aem147 (0.5%)
security142 (0.5%)
rust141 (0.5%)
tls138 (0.5%)