Skip to content

Releases: alloevil/github-discovery

v1.3.0 — Fraud Detection + Scoring Verification + Unit Tests

Choose a tag to compare

@alloevil alloevil released this 25 Jun 10:28

🎉 GitHub Discovery v1.3

✨ 新增模块

🛡️ 批量刷量检测 (fraud_detection.py)

  • 检测同一 owner 下多个仓库(≥3)同时出现
  • 检测同一 owner 短时间内多个仓库 Star 暴涨
  • 检测仓库描述高度相似(模板批量创建)
  • 三项可叠加,最高扣分 -40

📊 评分验证 (verify_scoring.py)

  • 回测历史推荐,验证高分项目是否真的火了
  • 计算 Precision / Recall / F1 / Lift 指标
  • 支持 --days 30--threshold--score-high 参数
  • 初步测试:高分精度 65%,F1=0.788

✅ 单元测试套件

  • 117 个测试,全部通过
  • 覆盖 6 个核心模块:sources / scorer / dedup / feedback / quality / fraud_detection
  • 所有网络请求 Mock,不依赖外部 API
  • pytest 运行:python -m pytest tests/ -v

📖 README 全面完善

  • 添加 GitHub Actions / License / Stars badges
  • 详细的项目结构说明
  • 开发指南(本地运行 / 运行测试 / 添加数据源)
  • 贡献指南(Contributing)

🔧 修复

  • Star 真实性检测:去掉「单人高星 -8 分」的误伤规则,只检测真正高置信度的刷量模式

📊 完整评分体系(满分 100)

维度 分值 说明
加速度 40 Star 增速、加速趋势
质量 30 年龄、语言、许可证、内容完整性
反垃圾 30 Fork 比率、描述质量
代码质量 +20 README、CI、commit 频率
Star 可疑 -15 1天内1000+ Star、无描述暴涨
用户反馈 ±10 👍👎 投票
批量刷量 -40 同 owner 多仓库、模板描述

🚀 运行测试

pip install pytest
python -m pytest tests/ -v

📊 回测验证

python scripts/verify_scoring.py --days 30

v1.2.0 — Full Optimization

Choose a tag to compare

@alloevil alloevil released this 25 Jun 08:54

🎉 GitHub Discovery v1.2

🚀 全面优化

1. 跨天去重(7 天窗口)

  • 记录每次推荐的仓库和时间
  • 7 天内不重复推荐同一仓库
  • 自动清理 30 天前的历史记录

2. 代码质量信号(+20 分)

  • README / LICENSE / CI 配置检测
  • 最近 commit 频率
  • Issue/PR 活跃度
  • 质量分最高 +20 分

3. Star 真实性检测(反垃圾)

  • 单日 Star 增长 >500 且年龄 <3 天 → 标记可疑(-15 分)
  • 单人仓库 Star >200 → 标记可疑(-8 分)
  • 防止 Star 刷量仓库进入推荐

4. 用户反馈融入评分

  • 👍 反馈 → 评分 +10 分
  • 👎 反馈 → 评分 -10 分
  • 反馈数据持久化到 data/feedback.json

5. 全局投票持久化

  • 投票数据存储到 data/feedback.json(GitHub 仓库内)
  • 不再依赖 localStorage,跨设备同步

📊 评分体系(满分 100)

维度 分值 来源
加速度 40 Star 增速、加速趋势
质量 30 年龄、语言、许可证
反垃圾 30 Fork 比率、内容完整性
代码质量 +20 README、CI、commit 频率
Star 可疑 -15 单人高星、暴涨检测
用户反馈 ±10 👍👎 投票

🔧 下一步

  • AI 摘要(LLM 生成推荐理由)
  • 个性化标签
  • 全局投票 API

v1.1.0 — New Sources + User Feedback

Choose a tag to compare

@alloevil alloevil released this 25 Jun 08:45

🎉 GitHub Discovery v1.1

✨ 新增功能

📡 新数据源(+2)

  • Reddit /r/programming — 从热门帖子中提取 GitHub 链接
  • Rising Detection — Fork/Watch 增速异常检测,捕捉早期信号

👍👎 用户反馈系统

  • 每条推荐可投票(👍/👎)
  • 投票数据 localStorage 持久化
  • 反馈融入评分算法(±10 分调整)
  • 报告中显示用户反馈信息

🔧 改进

  • 邮件暗模式适配(Apple Mail / iOS)
  • 完整 HTML 结构(DOCTYPE + head + color-scheme)
  • README 更新

📊 数据源总览

数据源 信号类型
GitHub Trending 热度
GitHub Search 新高星
Hacker News 社区推荐
Reddit 讨论热度
Rising 早期信号

🚀 下一步

  • AI 摘要(LLM 生成推荐理由)
  • 个性化标签(前端/AI/DevOps)
  • 全局投票持久化(替代 localStorage)

v1.0.0 — GitHub Discovery

Choose a tag to compare

@alloevil alloevil released this 25 Jun 08:16

🎉 GitHub Discovery v1.0

每日自动发现热门 GitHub 仓库,在它们爆发之前。

✨ 核心功能

  • 🔍 多源采集:GitHub Trending + Hacker News + Star History
  • 📊 智能评分:加速度 + 质量 + 反垃圾,三维度 100 分制
  • 📬 邮件订阅:每日推送精选仓库到邮箱
  • 🎨 GitHub Pages:赛博朋克风格在线展示
  • 📧 暗模式适配:Apple Mail / iOS 暗模式完美显示

🔧 最近修复

  • 邮件暗模式:添加 color-scheme meta 标签,防止客户端自动反转颜色
  • 订阅确认邮件:新用户订阅后立即收到确认邮件
  • GitHub 同步修复:修复 subscribers.txt 不存在时的 404 错误

🚀 使用方式

  1. Fork 本仓库
  2. 在 Settings → Secrets 配置 RESEND_API_KEY
  3. 启用 GitHub Actions
  4. 访问 GitHub Pages 查看每日报告

📦 订阅

在页面上提交邮箱即可订阅每日推送,支持退订。