目录

Github 2024-02-20 Python开源项目日报 Top10

根据Github Trendings的统计,今日(2024-02-20统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言项目数量
Python项目10
JavaScript项目1

稳定扩散Web UI

  • 创建周期:512 天
  • 开发语言:Python
  • 协议类型:GNU Affero General Public License v3.0
  • Star数量:117672 个
  • Fork数量:23480 次
  • 关注人数:117672 人
  • 贡献人数:430 人
  • Open Issues数量:1812 个
  • Github地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

稳定扩散Web UI是基于Gradio库的浏览器界面,用于稳定扩散。

GPT/GLM等LLM大语言模型实用化交互接口

  • 创建周期:337 天
  • 开发语言:Python
  • 协议类型:GNU General Public License v3.0
  • Star数量:51717 个
  • Fork数量:6732 次
  • 关注人数:51717 人
  • 贡献人数:74 人
  • Open Issues数量:184 个
  • Github地址:https://github.com/binary-husky/gpt_academic.git
  • 项目首页: https://github.com/binary-husky/gpt_academic/wiki/online

/images/binary-husky-gpt_academic-0.png

该项目为GPT/GLM等LLM大语言模型提供实用的交互接口,特别优化论文阅读/润色/写作体验。它采用模块化设计,支持自定义快捷按钮和函数插件,同时支持Python和C++项目剖析和自译解功能,以及PDF/LaTex论文翻译和总结功能。此外,它还支持并行问询多种LLM模型和本地模型,以及接入通义千问、deepseekcoder、讯飞星火、文心一言、llama2、rwkv、claude2、moss等。

ComfyUI:强大而模块化的稳定扩散GUI

  • 创建周期:399 天
  • 开发语言:Python, JavaScript
  • 协议类型:GNU General Public License v3.0
  • Star数量:25663 个
  • Fork数量:2741 次
  • 关注人数:25663 人
  • 贡献人数:90 人
  • Open Issues数量:1263 个
  • Github地址:https://github.com/comfyanonymous/ComfyUI.git

ComfyUI是一个开源项目,提供强大而模块化的稳定扩散图形用户界面(GUI)、API和后端,具有图/节点界面。它允许用户使用基于图/节点/流程图的界面设计和执行高级稳定扩散管道。

少样本语音克隆的高质量TTS模型

  • 创建周期:9 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:4367 个
  • Fork数量:411 次
  • 关注人数:4367 人
  • 贡献人数:24 人
  • Open Issues数量:65 个
  • Github地址:https://github.com/RVC-Boss/GPT-SoVITS.git

该项目专注于使用最少的语音数据来训练高质量的文本到语音(TTS)模型,实现少样本语音克隆。该项目的GitHub页面上提供了演示视频。

Magika: 深度学习文件类型检测工具

  • 创建周期:182 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:4865 个
  • Fork数量:211 次
  • 关注人数:4865 人
  • 贡献人数:12 人
  • Open Issues数量:72 个
  • Github地址:https://github.com/google/magika.git
  • 项目首页: https://google.github.io/magika/

Magika是一种人工智能驱动的文件类型检测工具,利用深度学习准确识别文件类型。它采用自定义、高度优化的Keras模型,在单个CPU上实现毫秒级的精准文件识别。在评估中,它在检测100多种内容类型时实现了超过99%的精度和召回率。Magika被大规模应用于增强谷歌用户的安全性,通过将文件定向到适当的安全性和内容策略扫描器,例如Gmail、Drive和安全浏览。

LLM标记化的最小BPE算法代码

  • 创建周期:4 天
  • 开发语言:Python
  • 协议类型:MIT License
  • Star数量:4042 个
  • Fork数量:250 次
  • 关注人数:4042 人
  • 贡献人数:6 人
  • Open Issues数量:4 个
  • Github地址:https://github.com/karpathy/minbpe.git

该项目’minbpe’提供了常用于LLM标记化的字节对编码(BPE)算法的最小清洁代码。它包括两个标记器,‘BasicTokenizer’和’RegexTokenizer’,以及一个’RegexTokenizer’,它进一步通过正则表达式模式分割输入文本,这是GPT-2论文中引入的,作为GPT-4的标记化的一部分。该项目还包括一个脚本’train.py’,用于对输入文本进行标记器训练,并将词汇保存到磁盘以进行可视化。

大世界模型(LWM)- 通用大背景多模态自回归模型

  • 创建周期:12 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:3981 个
  • Fork数量:296 次
  • 关注人数:3981 人
  • 贡献人数:3 人
  • Open Issues数量:17 个
  • Github地址:https://github.com/LargeWorldModel/LWM.git

Large World Model (LWM)是一个通用的大背景多模态自回归模型,使用RingAttention在多样化的长视频和书籍数据集上进行训练。它可以进行语言、图像和视频的理解和生成。

可扩展的扩散模型与Transformers

  • 创建周期:431 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:2682 个
  • Fork数量:210 次
  • 关注人数:2682 人
  • 贡献人数:3 人
  • Open Issues数量:34 个
  • Github地址:https://github.com/facebookresearch/DiT.git

Scalable Diffusion Models with Transformers (DiT)是官方PyTorch实现的一个项目,旨在利用transformers创建可扩展的扩散模型。

稳定扩散WebUI Forge

  • 创建周期:36 天
  • 开发语言:Python
  • 协议类型:GNU Affero General Public License v3.0
  • Star数量:1602 个
  • Fork数量:100 次
  • 关注人数:1602 人
  • 贡献人数:431 人
  • Open Issues数量:94 个
  • Github地址:https://github.com/lllyasviel/stable-diffusion-webui-forge.git

/images/lllyasviel-stable-diffusion-webui-forge-0.png

稳定扩散WebUI Forge是建立在稳定扩散WebUI之上的平台,旨在简化开发、优化资源管理和加速推理。它为不同的GPU配置提供了显著的加速,并引入了Unet Patcher,可以用最少的代码实现各种方法。Forge还添加了新的采样器,并承诺保持原始WebUI界面。后端已经重新设计以处理资源管理,并删除了CMD标志的使用,建议让Forge决定如何加载模型。

V-JEPA: 视频联合嵌入预测架构

  • 创建周期:8 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:908 个
  • Fork数量:51 次
  • 关注人数:908 人
  • 贡献人数:3 人
  • Open Issues数量:5 个
  • Github地址:https://github.com/facebookresearch/jepa.git

/images/facebookresearch-jepa-0.png

V-JEPA是Video Joint Embedding Predictive Architecture的官方PyTorch代码库,这是一种用于从视频中学习视觉表示的自监督学习方法。这些模型通过 passively 观察来自VideoMix2M数据集的视频像素进行训练,并产生多功能的视觉表示,在下游视频和图像任务上表现良好。