vlambda博客
学习文章列表

2020年7月最热门的Python开源项目


来自:开源最前线(ID:OpenSourceTop) 

7月份GitHub上最热门的Python开源项目排行已经出炉啦,一起来看看上榜详情吧:



1
gpt-2

https://github.com/openai/gpt-2 Star 12650


GPT-2是一种基于transformer的大型语言模型,具有15亿个参数,在800万网页数据集上进行训练。


它是论文《语言模型是无人监督的多任务学习者》(Language Models are Unsupervised Multitask Learners)的代码实现。目前发布了GPT-2的小型(117M 参数)和中型(345M参数)版本,还没有发布更大的模型,但已经发布了一个数据集供研究人员研究行为。该存储库旨在成为研究人员和工程师尝试使用GPT-2的起点。


2
mmdetection

https://github.com/open-mmlab/mmdetection Star 11070


mmdetection是由商汤科技(2018 COCO目标检测挑战赛冠军)和香港中文大学开源的一个基于Pytorch实现的深度学习目标检测工具箱,支持Faster-RCNN,Mask-RCNN,Fast-RCNN等主流的目标检测框架,后续会加入Cascade-RCNN以及其他一系列目标检测框架。



3
fastapi

https://github.com/tiangolo/fastapi Star 18821


FastAPI是一个Rails库用来快速查询相互依存的数据集合并返回时候人类阅读的、标准的API输出。通过构造复杂的SQL查询并高效使用JOIN和子查询。



4
awesome-python

https://github.com/vinta/awesome-python Star 84932


该项目收集了一些各大网站登陆方式, 和一些网站的爬虫程序,有的是通过selenium登录,有的是通过抓包直接模拟登录,有的是利用scrapy。



5
airflow

https://github.com/apache/airflow Star 17621


Airflow是一个可编程,调度和监控的工作流平台,基于有向无环图(DAG),Airflow可以定义一组有依赖的任务,按照依赖依次执行。Airflow提供了丰富的命令行工具用于系统管控,而其Web管理界面同样也可以方便的管控调度任务,并且对任务运行状态进行实时监控,方便了系统的运维和管理。



6
python-cheatsheet

https://github.com/gto76/python-cheatsheet Star 15049


这是一个全面的Python备忘录。



7
rich

https://github.com/willmcgugan/rich Star 10254



Rich是一个Python库,可以为您在终端中提供富文本和精美格式。Rich API可以很容易的在终端输出添加各种颜色和不同风格。Rich还可以绘制漂亮的表格,进度条,markdown,突出显示语法的源代码及回溯等等,不胜枚举。



8
Background-Matting

https://github.com/senguptaumd/Background-Matting Star 2003


Background-Matting是一个基于背景抠图的工具,正如它的slogan:The World is Your Green Screen所说,只要你用Background-Matting即使你不会ps抠图,推理代码可以帮你更换图片中的背景。



9
AiLearning

https://github.com/apachecn/AiLearning Star 23968


这是号称最详细的AI学习路线,涵盖机器学习基础、深度学习基础、自然语言处理等等。



10
yfinance

https://github.com/ranaroussi/yfinance Star 1298


很多投资者都知道Yahoo提供了丰富的金融市场数据,不过获取这些数据很多时候需要自己去写一些网页爬虫。当然也有一些Python第三方库可以免除我们从头写爬虫的麻烦,几乎可以当作API来调用,yfinance就是其中一个。


附:


●输入m获取文章目录

推荐↓↓↓

人工智能与大数据技术