目录

Github 2024-05-07 Python开源项目日报 Top10

根据Github Trendings的统计,今日(2024-05-07统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言项目数量
Python项目10
Dart项目1
C++项目1

yt-dlp: 一个增强版的youtube-dl分支

  • 创建周期:1184 天
  • 开发语言:Python
  • 协议类型:The Unlicense
  • Star数量:64607 个
  • Fork数量:5309 次
  • 关注人数:64607 人
  • 贡献人数:385 人
  • Open Issues数量:1422 个
  • Github地址:https://github.com/yt-dlp/yt-dlp.git
  • 项目首页: https://discord.gg/H5MNcFW63r

yt-dlp是youtube-dl的一个分支,具有额外的功能和修复,重点是添加新功能和补丁,同时与原始项目保持最新。它包括详细的安装说明,更新/发布文件,依赖关系,编译,使用和选项,配置,格式选择,修改元数据,插件,嵌入示例等。它还集成了SponsorBlock,用于标记/删除YouTube视频中的赞助部分,并更改了默认格式排序选项,以获得更高分辨率和更好的编解码器。

Home Assistant | 本地控制和隐私优先的开源家庭自动化项目

  • 创建周期:3773 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:65862 个
  • Fork数量:26697 次
  • 关注人数:65862 人
  • 贡献人数:402 人
  • Open Issues数量:2874 个
  • Github地址:https://github.com/home-assistant/core.git
  • 项目首页: https://www.home-assistant.io

Home Assistant是一个开源的家庭自动化项目,它优先考虑本地控制和隐私。它由全球的爱好者和DIY爱好者社区支持,非常适合在Raspberry Pi或本地服务器上运行。

openpilot: 开源驾驶辅助系统

  • 创建周期:2601 天
  • 开发语言:Python, C++
  • 协议类型:MIT License
  • Star数量:45553 个
  • Fork数量:8203 次
  • 关注人数:45553 人
  • 贡献人数:440 人
  • Open Issues数量:297 个
  • Github地址:https://github.com/commaai/openpilot.git
  • 项目首页: https://comma.ai/

/images/commaai-openpilot-0.png

openpilot是一个开源的驾驶辅助系统,为250多种支持的汽车品牌和型号提供自适应巡航控制、自动车道居中和驾驶员监控等功能。它需要支持的设备、软件、兼容的汽车和汽车线束才能使用。开发对GitHub上的贡献是开放的,并且已经采取了安全和测试措施。用户数据默认收集,但可以禁用,软件以MIT许可证发布,并附有一定的赔偿要求和免责声明。

多平台爬虫工具

  • 创建周期:282 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:2419 个
  • Fork数量:451 次
  • 关注人数:2419 人
  • 贡献人数:8 人
  • Open Issues数量:24 个
  • Github地址:https://github.com/NanmiCoder/MediaCrawler.git

这个开源项目提供了针对小红书、抖音、快手、B站、微博等平台的爬虫工具,可以抓取视频、图片、评论、点赞、转发等信息。项目使用playwright搭建桥梁,保留登录成功后的上下文浏览器环境,并通过执行JS表达式获取一些加密参数,从而简化了核心加密JS代码的复现和逆向难度。

MemGPT: 创建和部署具有长期记忆和自定义工具的有状态LLM代理

  • 创建周期:206 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:9143 个
  • Fork数量:1003 次
  • 关注人数:9143 人
  • 贡献人数:65 人
  • Open Issues数量:209 个
  • Github地址:https://github.com/cpacker/MemGPT.git
  • 项目首页: https://memgpt.readme.io

/images/cpacker-memgpt-0.png

MemGPT 是一个开源项目,可以创建和部署具有长期记忆和自定义工具的有状态LLM代理。它支持长期记忆管理,连接到外部数据源(如PDF文件)以供RAG使用,并定义和调用自定义工具(如谷歌搜索)。此外,MemGPT还允许将代理部署为服务,从而在支持的LLM提供者上运行多用户、多代理应用程序。

Flet: 在Python中构建实时应用程序的框架

  • 创建周期:775 天
  • 开发语言:Python, Dart
  • 协议类型:Apache License 2.0
  • Star数量:9283 个
  • Fork数量:358 次
  • 关注人数:9283 人
  • 贡献人数:56 人
  • Open Issues数量:384 个
  • Github地址:https://github.com/flet-dev/flet.git
  • 项目首页: https://flet.dev

/images/flet-dev-flet-0.png

Flet是一个框架,它使开发人员能够轻松地在Python中构建实时网络、移动和桌面应用程序,而无需前端经验。

ScrapeGraphAI: 一次抓取即可

  • 创建周期:101 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:1898 个
  • Fork数量:154 次
  • 关注人数:1898 人
  • 贡献人数:16 人
  • Open Issues数量:8 个
  • Github地址:https://github.com/VinciGit00/Scrapegraph-ai.git
  • 项目首页: https://scrapegraph-doc.onrender.com/

/images/vincigit00-scrapegraph-ai-0.png

ScrapeGraphAI是一个开源的网页抓取Python库,利用LLM和直接图逻辑创建用于网站、文档和XML文件的抓取管道。用户只需指定要提取的信息,库就会为您处理提取过程。

Logfire - 简单而强大的可观测性平台

  • 创建周期:13 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:794 个
  • Fork数量:17 次
  • 关注人数:794 人
  • 贡献人数:12 人
  • Open Issues数量:32 个
  • Github地址:https://github.com/pydantic/logfire.git
  • 项目首页: https://docs.pydantic.dev/logfire/

/images/pydantic-logfire-0.png

Logfire是由Pydantic团队构建的可观测性平台,提供简单而强大的仪表板、以Python为中心的洞察、SQL查询、OpenTelemetry集成和Pydantic集成。

Kolmogorov-Arnold 网络 (KAN) 的高效纯 PyTorch 实现

  • 创建周期:4 天
  • 开发语言:Python
  • Star数量:395 个
  • Fork数量:25 次
  • 关注人数:395 人
  • 贡献人数:1 人
  • Open Issues数量:2 个
  • Github地址:https://github.com/Blealtan/efficient-kan.git

这是 Kolmogorov-Arnold 网络 (KAN) 的高效纯 PyTorch 实现,旨在通过重新构建计算来减少内存成本,并使计算变得简单直接的矩阵乘法。该存储库还讨论了稀疏化问题,并提出了对权重进行替代 L1 正则化的选择,以及包括每个激活函数的可学习比例的选项。最新更新包括更改某些参数的初始化,以改善在 MNIST 上的性能。

大型语言模型引导的模拟到真实转移

  • 创建周期:4 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:376 个
  • Fork数量:24 次
  • 关注人数:376 人
  • 贡献人数:1 人
  • Open Issues数量:3 个
  • Github地址:https://github.com/eureka-research/DrEureka.git

该项目研究了使用大型语言模型(LLMs)来自动化和加速模拟到真实设计,以便将在模拟中学习的策略转移到现实世界。它旨在消除任务奖励函数和模拟物理参数的手动设计和调整,从而使流程更快速且减少人力成本。该方法在四足动作和灵巧操纵任务上显示出与现有人工设计配置竞争力,并且能够在不需要迭代手动设计的情况下解决新颖的机器人任务。