目录

Github 2024-07-22 开源项目周报 Top15

根据Github Trendings的统计,本周(2024-07-22统计)共有15个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言项目数量
Python项目7
TypeScript项目4
非开发语言项目2
Rust项目2
Jupyter Notebook项目1
C#项目1
JavaScript项目1
C++项目1

《Hello 算法》:动画图解、一键运行的数据结构与算法教程

  • 创建周期:476 天
  • 协议类型:Other
  • Star数量:63556 个
  • Fork数量:7731 次
  • 关注人数:63556 人
  • 贡献人数:137 人
  • Open Issues数量:20 个
  • Github地址:https://github.com/krahets/hello-algo.git
  • 项目首页: https://hello-algo.com

/images/krahets-hello-algo-0.png

《Hello 算法》是一本开源的、面向初学者的关于数据结构与算法的教程,采用动画图解和可运行的代码示例,支持多种编程语言。该项目旨在提供清晰易懂的内容,学习曲线平滑,引导初学者探索数据结构与算法的知识地图。鼓励读者互相学习,通常会在两天内回复问题和评论。

Prisma:Node.js和TypeScript的下一代ORM

  • 创建周期:1859 天
  • 开发语言:TypeScript
  • 协议类型:Apache License 2.0
  • Star数量:38247 个
  • Fork数量:1483 次
  • 关注人数:38247 人
  • 贡献人数:239 人
  • Open Issues数量:3113 个
  • Github地址:https://github.com/prisma/prisma.git
  • 项目首页: https://www.prisma.io

Prisma是Node.js和TypeScript的下一代ORM,提供Prisma Client用于自动生成和类型安全的查询构建,Prisma Migrate用于声明性数据建模和迁移,以及Prisma Studio用于查看和编辑数据库中数据的GUI。它可以用于任何Node.js或TypeScript后端应用程序,包括无服务器应用程序和微服务,支持各种类型的API。Prisma还提供Prisma Accelerate用于全局数据库缓存和可扩展的连接池,以及Prisma Pulse用于实时数据库事件和类型安全订阅。

后现代模态文本编辑器

  • 创建周期:1328 天
  • 开发语言:Rust
  • 协议类型:Mozilla Public License 2.0
  • Star数量:27484 个
  • Fork数量:1993 次
  • 关注人数:27484 人
  • 贡献人数:424 人
  • Open Issues数量:1159 个
  • Github地址:https://github.com/helix-editor/helix.git
  • 项目首页: https://helix-editor.com

一款用Rust编写的后现代模态文本编辑器,深受Kakoune和Neovim启发。它具有类似Vim的模态编辑、多重选择、内置语言服务器支持和智能的增量语法高亮。它主要是一个基于终端的编辑器,但旨在通过wgpu或skulpin探索自定义渲染器。

Tiptap编辑器:无头富文本编辑器套件

  • 创建周期:2154 天
  • 开发语言:TypeScript
  • 协议类型:MIT License
  • Star数量:25003 个
  • Fork数量:2093 次
  • 关注人数:25003 人
  • 贡献人数:320 人
  • Open Issues数量:550 个
  • Github地址:https://github.com/ueberdosis/tiptap.git
  • 项目首页: https://tiptap.dev

/images/ueberdosis-tiptap-0.png

Tiptap编辑器是一个无头、框架不可知的富文本编辑器,可以通过扩展进行定制和扩展。它基于ProseMirror库,提供了完全的设计自由度,没有固定的用户界面。它由协作开源后端Hocuspocus进行补充,两者共同构成了Tiptap Suite的基础。

/images/ueberdosis-tiptap-1.png

Langflow: 人工智能应用程序的动态图构建和部署工具

  • 创建周期:432 天
  • 开发语言:JavaScript, Python
  • 协议类型:MIT License
  • Star数量:16600 个
  • Fork数量:2464 次
  • 关注人数:16600 人
  • 贡献人数:87 人
  • Open Issues数量:140 个
  • Github地址:https://github.com/langflow-ai/langflow.git
  • 项目首页: http://www.langflow.org

Langflow是一个基于动态图的工具,用于构建和部署人工智能应用程序,具有模块化和交互式设计,鼓励快速实验和原型设计。它提供文档、社区和通过pip进行简便安装。用户可以通过将组件拖放到画布上创建流程,通过编辑参数进行探索,并将流程导出为JSON文件。此外,Langflow还提供了用于管理和配置的命令行界面(CLI)。

Tabby: 自托管的AI编码助手

  • 创建周期:310 天
  • 开发语言:Rust
  • 协议类型:Other
  • Star数量:15151 个
  • Fork数量:575 次
  • 关注人数:15151 人
  • 贡献人数:48 人
  • Open Issues数量:133 个
  • Github地址:https://github.com/TabbyML/tabby.git
  • 项目首页: https://tabby.tabbyml.com/

/images/tabbyml-tabby-0.png

Tabby是一款自托管的AI编码助手,提供了一个开源和本地化的GitHub Copilot替代方案。它是自包含的,无需DBMS或云服务,提供了OpenAPI接口,易于与现有基础设施(例如云IDE)集成,并支持消费级GPU。

FlashAttention和FlashAttention-2: 快速且内存高效的注意力机制

  • 创建周期:789 天
  • 开发语言:Python, C++
  • 协议类型:BSD 3-Clause “New” or “Revised” License
  • Star数量:12338 个
  • Fork数量:1094 次
  • 关注人数:12338 人
  • 贡献人数:71 人
  • Open Issues数量:469 个
  • Github地址:https://github.com/Dao-AILab/flash-attention.git

该存储库提供了FlashAttention和FlashAttention-2的官方实现,这些机制是快速且内存高效的精确注意力机制。FlashAttention专注于具有IO感知的快速和内存高效的精确注意力,而FlashAttention-2旨在通过更好的并行性和工作分区实现更快的注意力。

pytube: 轻量级、无依赖的YouTube视频下载工具

  • 创建周期:4503 天
  • 开发语言:Python
  • 协议类型:The Unlicense
  • Star数量:10881 个
  • Fork数量:2401 次
  • 关注人数:10881 人
  • 贡献人数:98 人
  • Open Issues数量:617 个
  • Github地址:https://github.com/pytube/pytube.git
  • 项目首页: https://pytube.io

pytube是一个轻量级的、无依赖的Python库和命令行实用程序,用于下载YouTube视频。它正在积极寻求贡献者,并欢迎通过问题报告或拉取请求提出改进意见。

STORM: 利用大型语言模型从零开始撰写类似维基百科的文章

  • 创建周期:22 天
  • 开发语言:HTML
  • 协议类型:MIT License
  • Star数量:1070 个
  • Fork数量:101 次
  • 关注人数:1070 人
  • 贡献人数:3 人
  • Open Issues数量:6 个
  • Github地址:https://github.com/stanford-oval/storm.git
  • 项目首页: https://arxiv.org/abs/2402.14207

STORM是一个由LLM驱动的知识整理系统,它研究一个主题并生成带引用的全文报告。该存储库包含了一篇在NAACL 2024上发表的论文的代码,题为“利用大型语言模型从零开始撰写类似维基百科的文章”的作者是Yijia Shao,Yucheng Jiang,Theodore A. Kanell,Peter Xu,Omar Khattab和Monica S. Lam。

Dev-Books存储库:开发和编程书籍精选

  • 创建周期:1275 天
  • Star数量:5552 个
  • Fork数量:1161 次
  • 关注人数:5552 人
  • 贡献人数:30 人
  • Open Issues数量:18 个
  • Github地址:https://github.com/free-educa/books.git

Dev-Books存储库是一个精心策划的与开发和编程相关的书籍收藏,迎合有志成为程序员的人、经验丰富的开发人员,或者对保持最新软件变化和趋势感兴趣的任何人。

Git凭据管理器(GCM)- 跨平台Git凭据存储

  • 创建周期:2067 天
  • 开发语言:C#
  • 协议类型:Other
  • Star数量:6031 个
  • Fork数量:1632 次
  • 关注人数:6031 人
  • 贡献人数:63 人
  • Open Issues数量:99 个
  • Github地址:https://github.com/git-ecosystem/git-credential-manager.git

Git凭据管理器(GCM)是一个安全的跨平台Git凭据存储,可用于GitHub、Azure Repos和其他流行的Git托管服务进行身份验证。它旨在为Windows、macOS和Linux提供一致且安全的身份验证体验,包括多因素认证。GCM支持Azure DevOps、Bitbucket、GitHub和GitLab,并取代了基于.NET Framework的Git凭据管理器(适用于Windows)和基于Java的Git凭据管理器(适用于Mac和Linux)。

Crawlee: Python网络爬虫和浏览器自动化库

  • 创建周期:186 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:1399 个
  • Fork数量:84 次
  • 关注人数:1399 人
  • 贡献人数:7 人
  • Open Issues数量:50 个
  • Github地址:https://github.com/apify/crawlee-python.git
  • 项目首页: https://crawlee.dev/python/

Crawlee是一个用于Python的开源网络爬虫和浏览器自动化库,可帮助构建可靠的爬虫。它可以提取用于人工智能、LLMs、RAG或GPTs的数据,并从网站上下载各种文件类型。它与BeautifulSoup、Playwright和原始HTTP一起工作,支持带代理轮换的headful和headless模式。该库覆盖了整个爬取和抓取过程,可以创建快速且几乎类似人类的爬虫,可以绕过现代机器人保护。它还提供丰富的配置选项,可进行定制。

Composio: 为代理商提供强大工具的开源项目

  • 创建周期:150 天
  • 开发语言:Python
  • 协议类型:Other
  • Star数量:2809 个
  • Fork数量:941 次
  • 关注人数:2809 人
  • 贡献人数:23 人
  • Open Issues数量:29 个
  • Github地址:https://github.com/ComposioHQ/composio.git
  • 项目首页: https://docs.composio.dev

Composio是一个开源项目,为代理商提供强大的工具来处理复杂的任务。它提供了关键功能,Python和JavaScript的入门指南,以及例如竞争对手研究者和待办事项到日历等示例。该项目还强调了贡献、行为准则、链接和许可信息。

LLM图构建器

  • 创建周期:189 天
  • 开发语言:Jupyter Notebook, TypeScript
  • 协议类型:Apache License 2.0
  • Star数量:1075 个
  • Fork数量:162 次
  • 关注人数:1075 人
  • 贡献人数:15 人
  • Open Issues数量:75 个
  • Github地址:https://github.com/neo4j-labs/llm-graph-builder.git
  • 项目首页: https://neo4j.com/labs/genai-ecosystem/llm-graph-builder/

LLM图构建器是一个开源项目,专注于使用语言模型模型(LLMs)从非结构化数据构建知识图。该项目旨在创建一个知识图构建应用程序,能够高效地从非结构化数据生成知识图。

MinerU - 开源高质量数据提取工具

  • 创建周期:144 天
  • 开发语言:Python
  • 协议类型:GNU Affero General Public License v3.0
  • Star数量:849 个
  • Fork数量:81 次
  • 关注人数:849 人
  • 贡献人数:9 人
  • Open Issues数量:16 个
  • Github地址:https://github.com/opendatalab/MinerU.git
  • 项目首页: https://opendatalab.com/OpenSourceTools

MinerU是一个开源数据提取工具,为PDF、网页和电子书提供高质量的提取支持。