Github上的10个数据科学和机器学习知识库

作者 :Nabil Nalakath
来源:DeepHub IMBA

GitHub 不仅是目前最流行的代码管理工具之一,也是普及开源文化的最大贡献者的平台。

在本文中将介绍一些对数据科学和机器学习爱好者最有用的 Github 代码库。(排名顺序不分先后)

1、The Algorithm

数据结构是计算机科学中最流行的词,可能紧随其后的是数据科学。但是每个计算机科学专业的学生都必须了解数据结构,如果你打算在该领域从事长期职业,那么它是最重要的学习之一。无论您是 ML 工程师、Web 开发人员、移动开发人员还是本科生,这都是应该在书签收藏中拥有的一个repo。他们还有一个网站,用于查看和运行 10 多种流行语言的代码。

Github上的10个数据科学和机器学习知识库

2、100-Days-Of-ML-Code

这个 repo 的名称是不言自明,它包含一个 100 天的学习 ML 计划。它来自一群开源爱好者的一些非常有价值的贡献,并且在 repo 中包含了数据集。该repo 的另一个显着特点是每天的图形海报,就像每日学习计划的摘要,如果打印的海报能激励你保持正轨,这将非常有用。

Github上的10个数据科学和机器学习知识库

3、 data-science

这个repo为那些想要免费完成数据科学本科课程的人提供了一个机会,这些课程来自世界上一些最好的大学。在他们的课程中,更偏爱 MOOC(大规模开放在线课程)风格的课程,因为这些课程更适合自定进度的学习。

学生可以通过不同的社区渠道、GitHub 问题、repo 的 Discord 服务器等进行互动。它确实带来了集体学习的感觉,在当今开放世界的免费教育计划中应该是这样的路要走 而不是昂贵的课程。

Github上的10个数据科学和机器学习知识库

4、public-apis

它是可供各种开发人员使用的最佳公共 API 集合之一,它有一个以非常全面的方式分类的 API 列表,并提供了每个 API 的基本概念,关于每个 API 的 Auth、HTTP 和 CORS 状态,而无需阅读它们各自的文档。当计划为项目创建示例数据集时它会非常方便。


5、awesome-machine-learning

就像名字一样,这个repo包含一个精选的机器学习框架、库和软件列表。它具有用于各种语言和机器学习工具的框架和库的分类列表。

Github上的10个数据科学和机器学习知识库

6、project-based-learning

但是听几个小时的教程会让个人感到厌烦,从项目中学习的潜力要高得多。你需要面对实时问题并解决将来可能遇到的问题,所以必须尝试使用正在学习的语言或技能在至少一个好的项目中实施它们。

无论是 Web/移动开发、机器学习还是数据科学,这个repo都有很好的项目集合,可以参考这些项目以供学习和将来使用。该列表按语言分类,在每种语言下,可以找到来自不同主题的大量项目。

Github上的10个数据科学和机器学习知识库

7、Complete-Python-3-Bootcamp

Python 是一种如此流行的语言,以至于人们在听到这个词时不再想到爬行动物。它已成为数据科学、机器学习、人工智能甚至网络开发的首选语言。这个repo包含 Udemy 上最受欢迎、评价最高且完整的 Python 3 训练营课程之一的文件。

Github上的10个数据科学和机器学习知识库

8、awesome-python

如上所述,Python 在 2022 年的流行是毫无疑问的。这种流行的主要原因之一是数量庞大。这个repo有一个专门针对 python 的库、框架和资源的精选列表。无论是关于构建管理仪表板还是使用 Web 套接字,几乎涵盖了所有内容。

Github上的10个数据科学和机器学习知识库

9、DeepLearning-500-questions

顾名思义,这是关于深度学习和人工智能的综合知识体系。它包含一系列关于深度学习和人工智能的数学和技术方面的文章,这些文章将帮助您在各自领域建立坚实的知识基础。

Github上的10个数据科学和机器学习知识库

10、metrics

Metrics 可用于生成关于你的信息图表,因此你可以将它们嵌入到 GitHub 个人资料中,让其他用户更多地了解。显示你的 git 统计数据以及日历、收藏的音乐、网站、最后的推文、项目、语言等。这可能看起来有点花里胡哨,但如果使用得当,它确实可以帮助你的个人资料脱颖而出。

Github上的10个数据科学和机器学习知识库

评论

ddd

加油,2016!

最新文章