目录

Github 2024-06-10 开源项目周报 Top15

根据Github Trendings的统计,本周(2024-06-10统计)共有15个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言项目数量
Python项目8
Jupyter Notebook项目2
Go项目2
C++项目1
Shell项目1
Lua项目1
JavaScript项目1
MDX项目1
C项目1
HTML项目1

Python - 100天从新手到大师

  • 创建周期:2234 天
  • 开发语言:Python, HTML, Jupyter Notebook
  • Star数量:149435 个
  • Fork数量:51212 次
  • 关注人数:149435 人
  • 贡献人数:12 人
  • Open Issues数量:712 个
  • Github地址:https://github.com/jackfrued/Python-100-Days.git

/images/jackfrued-python-100-days-0.png

Python-100天从新手到大师是作者骆昊的一个项目。收到反馈称基础部分(前15天的内容)对新手来说比较困难,因此建议提供配套视频进行讲解。最近,作者重新制作了基础部分的内容,名为’Python-Core-50-Courses’。

Syncthing: 开源持续文件同步工具

  • 创建周期:3789 天
  • 开发语言:Go
  • 协议类型:Mozilla Public License 2.0
  • Star数量:59188 个
  • Fork数量:3995 次
  • 关注人数:59188 人
  • 贡献人数:307 人
  • Open Issues数量:372 个
  • Github地址:https://github.com/syncthing/syncthing.git
  • 项目首页: https://forum.syncthing.net/

Syncthing是一个开源的持续文件同步工具,允许用户在多个设备之间安全高效地同步文件。它提供了分散和点对点的架构,确保了数据传输的隐私和安全。

初学者的生成式人工智能(第2版)

  • 创建周期:259 天
  • 开发语言:Jupyter Notebook
  • 协议类型:MIT License
  • Star数量:25764 个
  • Fork数量:16105 次
  • 关注人数:25764 人
  • 贡献人数:50 人
  • Open Issues数量:17 个
  • Github地址:https://github.com/microsoft/generative-ai-for-beginners.git
  • 项目首页: https://microsoft.github.io/generative-ai-for-beginners/

《初学者的生成式人工智能(第2版)》是由微软云倡导者提供的一门全面的18课程,教授一切开始构建生成式人工智能应用所需的知识。

我的电视 - 安卓电视直播软件

  • 创建周期:40 天
  • 开发语言:C
  • Star数量:649 个
  • Fork数量:124 次
  • 关注人数:649 人
  • 贡献人数:1 人
  • Open Issues数量:23 个
  • Github地址:https://github.com/lizongying/my-tv.git

我的电视是一个开源的安卓电视直播应用,内置了直播源。

QEMU/KVM上的macOS支持项目

  • 创建周期:3133 天
  • 开发语言:Python, Shell
  • Star数量:18950 个
  • Fork数量:1770 次
  • 关注人数:18950 人
  • 贡献人数:8 人
  • Open Issues数量:5 个
  • Github地址:https://github.com/kholia/OSX-KVM.git

该项目支持在QEMU/KVM上运行macOS,支持OpenCore、Monterey、Ventura和Sonoma。现在提供商业支持以避免垃圾问题,无需Mac系统。README.md文件记录了创建虚拟Hackintosh系统的过程,所有包含的blob和资源都可以通过说明重新派生。商业支持选项可通过电子邮件获得,项目赞助商可访问私人OSX-KVM存储库和直接支持。该项目还提供Content Caching的帮助,支持在Proxmox上工作以及离线macOS安装。

DuckDB - 高性能分析数据库系统

  • 创建周期:2173 天
  • 开发语言:C++
  • 协议类型:MIT License
  • Star数量:18540 个
  • Fork数量:1549 次
  • 关注人数:18540 人
  • 贡献人数:321 人
  • Open Issues数量:348 个
  • Github地址:https://github.com/duckdb/duckdb.git
  • 项目首页: http://www.duckdb.org

DuckDB是一个高性能的分析数据库系统,旨在快速、可靠、便携且易于使用。它提供了丰富的SQL语言方言,支持诸如相关子查询、窗口函数、排序规则和复杂类型等高级功能。DuckDB可作为独立的CLI应用程序使用,并且具有针对Python、R、Java、Wasm等的客户端,与pandas和dplyr等包深度集成。

Fabric: 用人工智能增强人类能力的开源框架

  • 创建周期:40 天
  • 开发语言:Python, JavaScript
  • 协议类型:MIT License
  • Star数量:5128 个
  • Fork数量:406 次
  • 关注人数:5128 人
  • 贡献人数:22 人
  • Open Issues数量:2 个
  • Github地址:https://github.com/danielmiessler/fabric.git

/images/danielmiessler-fabric-0.png

Fabric 是一个开源框架,旨在利用人工智能增强人类能力。它提供了将问题分解为组件的哲学,并提供了一种提示的框架方法。该框架包括快速入门指南、设置 fabric 客户端、使用模式、创建 fabric mill、结构、组件、CLI-native 特性、直接调用模式、示例以及主要贡献者的详细信息。

GitKraken制作的高度可定制的Shell提示渲染器

  • 创建周期:1916 天
  • 开发语言:Go, MDX
  • 协议类型:MIT License
  • Star数量:14894 个
  • Fork数量:2250 次
  • 关注人数:14894 人
  • 贡献人数:346 人
  • Open Issues数量:20 个
  • Github地址:https://github.com/JanDeDobbeleer/oh-my-posh.git
  • 项目首页: https://ohmyposh.dev

/images/jandedobbeleer-oh-my-posh-0.png

这个项目是一个开源的、高度可定制的、低延迟的跨平台/Shell提示渲染器。它是使用GitKraken制作的,充满了爱。

LazyVim: Neovim配置的懒人方式

  • 创建周期:506 天
  • 开发语言:Lua
  • 协议类型:Apache License 2.0
  • Star数量:13257 个
  • Fork数量:894 次
  • 关注人数:13257 人
  • 贡献人数:152 人
  • Open Issues数量:83 个
  • Github地址:https://github.com/LazyVim/LazyVim.git
  • 项目首页: https://lazyvim.github.io/

/images/lazyvim-lazyvim-0.png

LazyVim是由lazy.nvim提供支持的Neovim设置,旨在使用户轻松定制和扩展其配置。它提供了根据需要调整配置的灵活性,同时也提供了预配置设置的便利性。

Aider: 与 GPT-3.5/GPT-4 协作编辑代码的命令行工具

  • 创建周期:340 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:8553 个
  • Fork数量:868 次
  • 关注人数:8553 人
  • 贡献人数:16 人
  • Open Issues数量:74 个
  • Github地址:https://github.com/paul-gauthier/aider.git
  • 项目首页: https://aider.chat/

Aider 是一个命令行工具,可通过 GPT-3.5/GPT-4 实现与本地 git 仓库中的代码进行协作编程。它允许直接编辑本地源文件中的代码,并以合理的提交消息提交更改。Aider 独特之处在于它能够请求对现有的较大代码库进行更改。它提供了各种功能、使用示例、教程视频、聊天中的命令、技巧、安装说明、语音转代码功能、常见问题解答,以及 Discord 社区。

Mamba: 具有选择性状态空间的线性时间序列建模

  • 创建周期:88 天
  • 开发语言:Python, Cuda
  • 协议类型:Apache License 2.0
  • Star数量:6804 个
  • Fork数量:522 次
  • 关注人数:6804 人
  • 贡献人数:9 人
  • Open Issues数量:110 个
  • Github地址:https://github.com/state-spaces/mamba.git

Mamba是一个专注于具有选择性状态空间的线性时间序列建模的开源项目。该项目由Albert Gu和Tri Dao介绍,论文可在https://arxiv.org/abs/2312.00752找到

Transformers.js:网络上的最先进机器学习

  • 创建周期:482 天
  • 开发语言:JavaScript
  • 协议类型:Apache License 2.0
  • Star数量:8264 个
  • Fork数量:458 次
  • 关注人数:8264 人
  • 贡献人数:28 人
  • Open Issues数量:200 个
  • Github地址:https://github.com/xenova/transformers.js.git
  • 项目首页: https://huggingface.co/docs/transformers.js

Transformers.js 是一个开源项目,可以在网络上实现最先进的机器学习。它允许在浏览器中直接运行 🤗 Transformers,无需服务器。该库在功能上等同于 Hugging Face 的 transformers python 库,并支持自然语言处理、计算机视觉、音频和多模态领域的各种任务。它使用 ONNX Runtime 在浏览器中运行模型,并提供了使用 🤗 Optimum 将预训练的 PyTorch、TensorFlow 或 JAX 模型轻松转换为 ONNX 的功能。

LitGPT: 高度优化的LLM预训练、微调和部署工具

  • 创建周期:348 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:6410 个
  • Fork数量:684 次
  • 关注人数:6410 人
  • 贡献人数:66 人
  • Open Issues数量:165 个
  • Github地址:https://github.com/Lightning-AI/litgpt.git

LitGPT是一个命令行工具,允许用户使用闪电关注、FSDP、4位、LoRA等最先进的技术来预训练、微调和部署大型语言模型(LLMs)。它基于高度优化的配置和训练配方,用于训练开源LLMs,重新实现了模型架构和训练配方,以消除抽象层,确保Apache 2.0合规性,并优化性能,实现更快的训练和更低的成本。

MiniCPM-V 和 OmniLMM: 图文理解的开源多模态大模型系列

  • 创建周期:78 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:861 个
  • Fork数量:49 次
  • 关注人数:861 人
  • 贡献人数:8 人
  • Open Issues数量:10 个
  • Github地址:https://github.com/OpenBMB/MiniCPM-V.git

MiniCPM-V 和 OmniLMM 是面向图文理解的开源多模态大模型系列。它们接受图像和文本输入,并提供高质量的文本输出。MiniCPM-V 2.0 版本能够处理任意长宽比的图像,具有 180 万像素,实现了类似 Gemini Pro 的场景文字识别能力和与 GPT-4V 相当的低幻觉率。OmniLMM-12B 模型在多个基准测试中优于同规模的其他模型,并实现了比 GPT-4V 更低的幻觉率。

视频翻译配音工具

  • 创建周期:252 天
  • 开发语言:Python
  • 协议类型:GNU General Public License v3.0
  • Star数量:6555 个
  • Fork数量:751 次
  • 关注人数:6555 人
  • 贡献人数:5 人
  • Open Issues数量:20 个
  • Github地址:https://github.com/jianchang512/pyvideotrans.git
  • 项目首页: https://pyvideotrans.com

/images/jianchang512-pyvideotrans-0.png

这是一个视频翻译配音工具,可以将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。它支持多种语音识别和文字翻译模型,允许保留背景伴奏音乐,并且支持多种语言。主要用途包括翻译视频并配音、音频或视频转为字幕、批量字幕创建配音、批量字幕翻译、音频、视频、字幕合并、从视频中分离出音频以及下载YouTube视频。它提供了预打包版本和源码部署的详细说明。