目录

Github 2024-07-01 开源项目月报 Top15

根据Github Trendings的统计,本月(2024-07-01统计)共有15个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言项目数量
Python项目6
JavaScript项目3
C++项目2
PHP项目1
Blade项目1
非开发语言项目1
C#项目1
Lua项目1
Go项目1
MDX项目1
Jupyter Notebook项目1

从零开始构建你喜爱的技术

  • 创建周期:2156 天
  • Star数量:253338 个
  • Fork数量:24043 次
  • 关注人数:253338 人
  • 贡献人数:116 人
  • Open Issues数量:319 个
  • Github地址:https://github.com/codecrafters-io/build-your-own-x.git
  • 项目首页: https://codecrafters.io

/images/codecrafters-io-build-your-own-x-0.png

这个存储库是一本精心编写的、逐步指南的汇编,可以从零开始重新创建各种技术,如3D渲染器、区块链/加密货币、游戏、操作系统、Web浏览器等。它旨在帮助用户通过理解和构建自己喜欢的技术来掌握编程。

初学者的生成式人工智能(第2版)

  • 创建周期:259 天
  • 开发语言:Jupyter Notebook
  • 协议类型:MIT License
  • Star数量:25764 个
  • Fork数量:16105 次
  • 关注人数:25764 人
  • 贡献人数:50 人
  • Open Issues数量:17 个
  • Github地址:https://github.com/microsoft/generative-ai-for-beginners.git
  • 项目首页: https://microsoft.github.io/generative-ai-for-beginners/

《初学者的生成式人工智能(第2版)》是由微软云倡导者提供的一门全面的18课程,教授一切开始构建生成式人工智能应用所需的知识。

ComfyUI:强大而模块化的稳定扩散GUI

  • 创建周期:399 天
  • 开发语言:Python, JavaScript
  • 协议类型:GNU General Public License v3.0
  • Star数量:25663 个
  • Fork数量:2741 次
  • 关注人数:25663 人
  • 贡献人数:90 人
  • Open Issues数量:1263 个
  • Github地址:https://github.com/comfyanonymous/ComfyUI.git

ComfyUI是一个开源项目,提供强大而模块化的稳定扩散图形用户界面(GUI)、API和后端,具有图/节点界面。它允许用户使用基于图/节点/流程图的界面设计和执行高级稳定扩散管道。

Coolify: 开源自助云平台

  • 创建周期:1112 天
  • 开发语言:PHP, Blade
  • 协议类型:Apache License 2.0
  • Star数量:10527 个
  • Fork数量:567 次
  • 关注人数:10527 人
  • 贡献人数:80 人
  • Open Issues数量:59 个
  • Github地址:https://github.com/coollabsio/coolify.git
  • 项目首页: https://coolify.io

/images/coollabsio-coolify-0.png

Coolify是一个开源且可自行托管的替代品,可替代Heroku、Netlify和Vercel等云平台。它可以帮助用户通过SSH连接在自己的硬件上管理服务器、应用程序和数据库,包括VPS、裸金属和树莓派。该平台旨在在使用个人服务器时提供云的便利性,确保没有供应商锁定,并使用户即使停止使用Coolify也能保留对其资源的控制。

DuckDB - 高性能分析数据库系统

  • 创建周期:2173 天
  • 开发语言:C++
  • 协议类型:MIT License
  • Star数量:18540 个
  • Fork数量:1549 次
  • 关注人数:18540 人
  • 贡献人数:321 人
  • Open Issues数量:348 个
  • Github地址:https://github.com/duckdb/duckdb.git
  • 项目首页: http://www.duckdb.org

DuckDB是一个高性能的分析数据库系统,旨在快速、可靠、便携且易于使用。它提供了丰富的SQL语言方言,支持诸如相关子查询、窗口函数、排序规则和复杂类型等高级功能。DuckDB可作为独立的CLI应用程序使用,并且具有针对Python、R、Java、Wasm等的客户端,与pandas和dplyr等包深度集成。

Open-Sora: 构建自己的视频生成模型

  • 创建周期:17 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:1151 个
  • Fork数量:96 次
  • 关注人数:1151 人
  • 贡献人数:6 人
  • Open Issues数量:10 个
  • Github地址:https://github.com/hpcaitech/Open-Sora.git

/images/hpcaitech-open-sora-0.png

Open-Sora是一个开源项目,允许用户构建类似于OpenAI的Sora的自己的视频生成模型。它提供了创建自定义视频生成模型所需的工具和资源。

Fabric: 用人工智能增强人类能力的开源框架

  • 创建周期:40 天
  • 开发语言:Python, JavaScript
  • 协议类型:MIT License
  • Star数量:5128 个
  • Fork数量:406 次
  • 关注人数:5128 人
  • 贡献人数:22 人
  • Open Issues数量:2 个
  • Github地址:https://github.com/danielmiessler/fabric.git

/images/danielmiessler-fabric-0.png

Fabric 是一个开源框架,旨在利用人工智能增强人类能力。它提供了将问题分解为组件的哲学,并提供了一种提示的框架方法。该框架包括快速入门指南、设置 fabric 客户端、使用模式、创建 fabric mill、结构、组件、CLI-native 特性、直接调用模式、示例以及主要贡献者的详细信息。

GitKraken制作的高度可定制的Shell提示渲染器

  • 创建周期:1916 天
  • 开发语言:Go, MDX
  • 协议类型:MIT License
  • Star数量:14894 个
  • Fork数量:2250 次
  • 关注人数:14894 人
  • 贡献人数:346 人
  • Open Issues数量:20 个
  • Github地址:https://github.com/JanDeDobbeleer/oh-my-posh.git
  • 项目首页: https://ohmyposh.dev

/images/jandedobbeleer-oh-my-posh-0.png

这个项目是一个开源的、高度可定制的、低延迟的跨平台/Shell提示渲染器。它是使用GitKraken制作的,充满了爱。

LazyVim: Neovim配置的懒人方式

  • 创建周期:506 天
  • 开发语言:Lua
  • 协议类型:Apache License 2.0
  • Star数量:13257 个
  • Fork数量:894 次
  • 关注人数:13257 人
  • 贡献人数:152 人
  • Open Issues数量:83 个
  • Github地址:https://github.com/LazyVim/LazyVim.git
  • 项目首页: https://lazyvim.github.io/

/images/lazyvim-lazyvim-0.png

LazyVim是由lazy.nvim提供支持的Neovim设置,旨在使用户轻松定制和扩展其配置。它提供了根据需要调整配置的灵活性,同时也提供了预配置设置的便利性。

Marker: 快速准确的PDF转Markdown工具

  • 创建周期:218 天
  • 开发语言:Python
  • 协议类型:GNU General Public License v3.0
  • Star数量:10397 个
  • Fork数量:502 次
  • 关注人数:10397 人
  • 贡献人数:4 人
  • Open Issues数量:48 个
  • Github地址:https://github.com/VikParuchuri/marker.git

Marker是一个开源工具,可以快速准确地将PDF转换为markdown。它支持各种类型的文档、所有语言,并且可以移除页眉、页脚和其他文档附加信息。此外,它还可以格式化表格和代码块,提取并保存图片,将大多数方程式转换为LaTeX格式。Marker可以在GPU、CPU或MPS上运行。

Transformers.js:网络上的最先进机器学习

  • 创建周期:482 天
  • 开发语言:JavaScript
  • 协议类型:Apache License 2.0
  • Star数量:8264 个
  • Fork数量:458 次
  • 关注人数:8264 人
  • 贡献人数:28 人
  • Open Issues数量:200 个
  • Github地址:https://github.com/xenova/transformers.js.git
  • 项目首页: https://huggingface.co/docs/transformers.js

Transformers.js 是一个开源项目,可以在网络上实现最先进的机器学习。它允许在浏览器中直接运行 🤗 Transformers,无需服务器。该库在功能上等同于 Hugging Face 的 transformers python 库,并支持自然语言处理、计算机视觉、音频和多模态领域的各种任务。它使用 ONNX Runtime 在浏览器中运行模型,并提供了使用 🤗 Optimum 将预训练的 PyTorch、TensorFlow 或 JAX 模型轻松转换为 ONNX 的功能。

MiniCPM-V 和 OmniLMM: 图文理解的开源多模态大模型系列

  • 创建周期:78 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:861 个
  • Fork数量:49 次
  • 关注人数:861 人
  • 贡献人数:8 人
  • Open Issues数量:10 个
  • Github地址:https://github.com/OpenBMB/MiniCPM-V.git

MiniCPM-V 和 OmniLMM 是面向图文理解的开源多模态大模型系列。它们接受图像和文本输入,并提供高质量的文本输出。MiniCPM-V 2.0 版本能够处理任意长宽比的图像,具有 180 万像素,实现了类似 Gemini Pro 的场景文字识别能力和与 GPT-4V 相当的低幻觉率。OmniLMM-12B 模型在多个基准测试中优于同规模的其他模型,并实现了比 GPT-4V 更低的幻觉率。

视频翻译配音工具

  • 创建周期:252 天
  • 开发语言:Python
  • 协议类型:GNU General Public License v3.0
  • Star数量:6555 个
  • Fork数量:751 次
  • 关注人数:6555 人
  • 贡献人数:5 人
  • Open Issues数量:20 个
  • Github地址:https://github.com/jianchang512/pyvideotrans.git
  • 项目首页: https://pyvideotrans.com

/images/jianchang512-pyvideotrans-0.png

这是一个视频翻译配音工具,可以将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。它支持多种语音识别和文字翻译模型,允许保留背景伴奏音乐,并且支持多种语言。主要用途包括翻译视频并配音、音频或视频转为字幕、批量字幕创建配音、批量字幕翻译、音频、视频、字幕合并、从视频中分离出音频以及下载YouTube视频。它提供了预打包版本和源码部署的详细说明。

StableSwarmUI: 模块化稳定扩散Web用户界面

  • 创建周期:402 天
  • 开发语言:C#, JavaScript
  • 协议类型:MIT License
  • Star数量:3341 个
  • Fork数量:289 次
  • 关注人数:3341 人
  • 贡献人数:17 人
  • Open Issues数量:33 个
  • Github地址:https://github.com/Stability-AI/StableSwarmUI.git

StableSwarmUI是一个模块化的Web用户界面,旨在使强大的工具易于访问,注重高性能和可扩展性。目前处于测试版状态,并计划进行进一步的开发和改进。该用户界面适用于初学者和高级用户,提供主要的生成选项卡界面和舒适的工作流选项卡等功能。该项目欢迎贡献和建议,以增强其功能和功能。

使用Kaldi和onnxruntime的语音识别、文本转语音和说话人识别功能

  • 创建周期:669 天
  • 开发语言:C++
  • 协议类型:Apache License 2.0
  • Star数量:2230 个
  • Fork数量:270 次
  • 关注人数:2230 人
  • 贡献人数:68 人
  • Open Issues数量:137 个
  • Github地址:https://github.com/k2-fsa/sherpa-onnx.git
  • 项目首页: https://k2-fsa.github.io/sherpa/onnx/index.html

这个开源项目利用下一代Kaldi和onnxruntime提供了语音识别、文本转语音和说话人识别功能,无需互联网连接。它支持嵌入式系统、Android、iOS、树莓派、RISC-V、x86_64服务器,并与多种编程语言兼容,包括C/C++、Python、Kotlin、C#、Go、NodeJS、Java、Swift、Dart、JavaScript和Flutter。该项目包括语音识别、语音合成、说话人验证、说话人识别、口语语言识别、音频标记、语音活动检测和关键词识别等功能。