A curated list of awesome learning resources, blogs, books, videos and so on.
- Git 👬
- GitHub 👬
- Linux 🐧
- Algorithm (算法) 💡
- Tutorials & Blogs (教程博客) 🗨
- CheatSheets (速查表) 📑
- Math (数学) 📐
- Learning Websites (学习网站) 💻
- Learn by Game (寓教于乐) 👾
- Courses & Books (课程与书籍) 🎓
- Go Learning (Go 学习) 🇬🇱
- Python Learning (Python 学习) 🐍
- Python Projects (Python 项目) 👨💻
- Python Crawler (Python 爬虫) 🕷
- Jupyter Notebook 📔
- Machine Learning (机器学习) 🤖
- Fine-tuning (模型调参) 🔧
- Computer Vision (计算机视觉) 👁
- Reinforcement Learning (强化学习) 💪
- Graph Learning (图学习) 🗺
- Generative Adversarial Networks (GANs) 🤜 🤛
- Adversarial Attack and Defense ⚔🛡
- Model Compression (模型压缩) ⚙
- TensorFlow Learning (TensorFlow 学习) 🇹🇫
- Keras Learning (Keras 学习) 🇰🇷
- PyTorch Learning (PyTorch 学习) 🇵🇹
- Visualization (可视化) 👀
- English Learning (英语学习) 🗣
- Paper-Related (论文相关) 📝
- Download (下载) 📥
- Jobs & Interview (工作面试) 💼
- Dataset (数据集) 📊
- Code-related Toolkit 💻
- Other Unsorted (其它) ❓
- Last Update (更新时间) 🕰 :2020/04/06
- Git:Git官方教程
- Git Book:Git 官方教程电子书。中文版Git Book链接
- Learn Git Branching:一个用于学习 Git 的交互式学习网站,GitHub上收获了:star:10k+
- Githug :它其实是一个命令行工具,但更多的人喜欢称它为一个 Git 游戏,被设计出来的目的是用来练习我们的 git 技能。但是Githug 是运行在 ruby 上的,所以你要装完Git再安装个 ruby通关攻略。
- Flight rules for Git:Flight rules for Git,翻译过来是 Git 飞行规则,而飞行规则是记录在手册上来之不易的一系列知识,记录了某个事情发生的原因,以及怎样一步步进行处理。因此该项目用于补足你解决问题的能力。除此以外,对一些学习 Git 方面比较好的书籍、教程等都有所推荐。GitHub:star:33.3k。推荐等级::heart::heart::heart::heart:!
- 猴子老师Git教程:号称猴子都能懂的Git入门教程
- 廖雪峰Git教程:廖雪峰Git教程,号称史上最浅显易懂的Git教程
- Pro Git 第二版:这本书被誉为 Git 学习的圣经,作者是 Scott Chacon 和 Ben Straub。Scott Chacon 在 GitHub 工作,自称 Git 的布道者。你可以在网站上免费阅读这本书,也可以下载他们提供的电子版本
- git-recipes:童仲毅 (
geeeeeeeeek@github
) 对很多英文资料进行翻译、整理的集合教程。包含入门基础、进阶知识和应用范例。这些英文资料主要包括 GitHub 竞争者 Bitbucket 的 Git 教程 - Udacity Git 课程:谷歌无人车之父 Sebastian Thrun 创办的 优达学城(Udacity)上面的 免费 Git 课程。这门课程由优达学城与 GitHub 共同制作,介绍进行版本控制的基础知识,重点讲解 Git 版本控制系统以及 GitHub 协作平台
- happypeter1983 的 Git 视频教程:这份教程就更进阶了一些。讲到了一些高级命令的用法。当然还有其他学习资源。
- Oh shit, git!:这个网站整理了一些 Git 新手在使用 Git 时常会遇到的各种突发状况,并贴心的给出了应对方案。
- gitignore:GitHub 官方开源的一个项目,这个项目为开发者编写好特定的
.gitignore
规则,做成了模板。开发者只需选择好自己的项目类别,将文件内容复制粘贴放到自己项目里面就可以用了,在上面,你可以找到目前所有主流语言的 .gitignore 模板。在线生成网站 - Readme Md Generator:一名来自法国的小哥因为饱受重复编写 README 文档的折磨,在 GitHub 上开源了 readme-md-generator 这个工具。从项目名字便可以知道,它一个 README 文档生成器。其主要作用是通过命令行抓取项目的 package.json 和 git 配置信息,自动完成 README 文档的编写操作,Github上已获:star:5k+
- Repository Templates:为了避免开发者做一些无用的重复性工作,GitHub 发布的一个新功能 - 模板仓库(repository templates)。这个功能可以将以往创建过的仓库标记成模板(template),这样在你下一次创建仓库的时候,就可以使用这个模板功能,快速生成具有和原仓库一样的目录与文件内容,每个模板仓库在 URL 末端带上 /generate 后,还可以将模板仓库通过链接分享给其他人,其它人在打开链接之后,便可以快速通过这个模板来创建新仓库
- 《Beginning Git and GitHub》:Git与Github学习使用指南(Beginning Git and GitHub),GitHub。
- Gitstar Ranking:GitHub顶级项目排行榜
- Gitignore:GitHub 提供的各种项目的 gitignore 文件模板,省了自己写了
- GitHub Chinese Top Charts:Github中文项目排行榜,帮助你发现高分优秀中文项目、更高效地吸收国人的优秀经验成果;榜单每周更新一次。
- Lib4dev:一个超赞的在线网站,里面汇集了包含所有编程语言的开源项目和库,并可以链接到相对应的 GitHub 上。使用 lib4dev 可以查找任何编程语言的最佳库,它界面简单,基本上所有编程语言的库和开源项目都可以在上面找得到。推荐等级::heart::heart::heart:!
- HelloGithub:分享GitHub上有趣,入门级的开源项目
- GitHubDaily :每日不定时推送一批 GitHub 上优秀的开源项目给开发者, 帮助开发者们发现当下最火的开源项目
- GitHub漫游指南:关于如何在Github上如何构建一个好的项目。、研究用户的行为、找到一些感兴趣项目的指南。推荐等级::heart::heart::heart:!
- GitHub 帮助:GitHub官方中文帮助文档,全球最大的开源网站GitHub是每个程序员必须接触的,学习它的使用百利而无一害,同时也适合学习Git
- GitHub Help:GitHub官方英文帮助文档,由于中文文档是从英文文档翻译而来,可能有些内容不是最新,英语好的人应该看英文文档,才能实时获取最新内容
- GitHub Cli:GitHub 官方新发布了新命令行工具「GitHub CLI」,该工具能无缝对接 GitHub,把 GitHub 的操作体验,都搬到命令行中。开源地址,目前GitHub:star:5k+。
- FastText by FacebookResearch:GitHub上:star:20k,fastText是Facebook团队的一个开源和免费库,用于有效学习单词表示。它是轻量级的,允许用户学习文本表示和句子分类器。它适用于标准的通用硬件。模型可以减小尺寸,甚至适合移动设备。
- Logoly:不正经 Logo 生成器。这是一个在线的 PornHub 风格 Logo 生成工具,可以帮助你快速生成类似 PornHub 风格的 Logo。在线体验地址
- 坦克大战:GitHub 上实现的这个开源版本,可在 Web 上直接玩,还原度非常之高,并支持单台电脑,双人组队。
- 俄罗斯方块:这个项目不仅好玩,技术实现原理也讲解非常到位。它通过响应式与数据持久化,使得游戏体验的效果更佳,也让你可以直接在手机端上进行操作。
- Gameboy 模拟器:如果我说你能在终端上用 Gameboy 来玩游戏,你可能会大吃一惊。但,生命不息,折腾不止,这玩意确实被重庆大学的一位大二学生给整出来了。
- 扫雷:作为一款在当年霸屏 Windows 机器的小游戏,相信不少人都不会感到陌生。这款结合了当下比较新颖的 emoji 表情元素,重现了当年的经典。
- 在线玩中文 DOS:国内一位老玩家,出于对 DOS 游戏的怀念,在 GitHub 上开源了这个项目。
- Navi:一个神奇的命令行备忘录,GitHub上已获:star:3k+
- Checkm8:一位名为Axi0mx的开发人员发布的一个名为Checkm8的iPhone破解程序,而且是开源的。Github 上已经获:star:5k+。
- Lazynlp:英伟达工程师小姐姐Chip Huyen,在GitHub上开源了一个名为“lazynlp”的工具库。爬网页、清洗数据、创建数据集都可以搞定。她说,使用这个库,你应该能创建一个比大于40G的文本数据集,比OpenAI训练GPT-2时使用的还要大。开源仅一天,项目在GitHub上就获得了300多星,Twitter上获得上千次点赞。fast.ai创始人Jeremy Howard等人也转发推荐。而且,用这个工具库创建数据集的过程,也并不麻烦。
- Leon Sans:GitHub:star:6k+,一种字体,变成千姿百态艺术字,可尖可圆可开花,隔壁设计师馋哭了。GitHub传送门。
- BullshitGenerator:狗屁不通文章生成器,GitHub上,这个富有灵魂的项目名吸引了众人的目光。项目诞生一周,便冲上了趋势榜榜首。并且,不止名字被注入灵魂,生成的文字也有一股不可抗拒的力量。只要输入一句话,系统就会给你一篇狗屁不通的万字长文,网页版。
- Spleeter:来自法国的音乐流媒体公司 Deezer 开源了一个音轨分离软件 spleeter,只需输入一段命令就可以将音乐的人声和各种乐器声分离,支持 mp3、wav、ogg 等常见音频格式。GitHub:star:7k+。
- 996.ICU:996.ICU 是指 “工作 996, 生病 ICU” 。这是中国程序员之间的一种自嘲说法,意思是如果按照 996 的模式工作,那以后就得进 ICU 了。这个项目最早是某个中国程序员发起的,然后就火遍全网,甚至火到了全世界很多其他国家,其网站被翻译成了多种语言,GitHub获:star:250k+。网站地址。
- You-Get:可以通过一个命令下载网上的在线视频,GitHub获:star:28k。
- Postwoman:和 postman 一样,它能提供一些 API 的请求测试功能,HTTP 的请求方式和自定义 Header 都可以使用,而且它可以直接在线上就能运行,坊间有称它是 postman 的老婆。GitHub 获:star:10k+,体验地址。
- FastAPI:FastAPI 是一个基于 Python3.6+ 构建的高性能 web 框架,使用它可以很快的简单写一些 API 接口,GitHub 获:star:6k+。
- Fiora:你是否是社交软件的重度用户,并喜欢在网上与陌生人交流分享自己的观点呢?如果是的话,或许你可以考虑自己搭建一个多用户在线的实时聊天平台。要做到这一点并不难,借助一款叫 fiora 的开源软件便可以做到。fiora 是一款有趣的在线聊天应用。基于 node.js, mongodb, socket.io和 react 编写。GitHub 地址。
- 微信排版编辑器:这是一个专为微信公众号排版而生的前端编辑器,可直接在 Web 端打开写文章,在编辑完成后,可将其生成的富文本内容一键复制到公众号上,自动化完成排版操作,很是方便。
- AI Dungeon:15亿参数的终极版GPT-2,就是OpenAI那只编故事成瘾的AI,都能拿来做些什么?有人用它做了个文字冒险游戏,并赐以优美的名字,叫“AI地牢 (AI Dungeon) ”。大概是在说,你一旦进去就出不来了,里面的故事太迷人。现在,这座地牢进化出了2.0版本。有网友盛情安利,表示不可错过,推特11小时已有1600赞!游戏传送门,博客传送门
- Sorry:sorry 是一个很有意思的表情包斗图项目,源自"sorry,有钱事真的能为所欲为"这梗...
- Chinese Poetry:最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。GitHub ⭐26.7k。
- WechatMomentScreenshot:朋友圈转发截图生成工具 已获得微信“绿色网站”认证(滑稽)
- Demucs:《Music Source Separation in the Waveform Domain》论文代码,Facebook人工智能研究院提出的弱监督训练模型,基于受Wave-U-Net和SING启发的U-Net卷积架构。GitHub:star:1.1k。
- CatDCGAN :利用DCGAN生成猫的图片,由tf1.x实现。
- ThunderNet:轻量级目标检测网络ThunderNet。论文地址
- Nativefier:一条命令将网页转成电脑 App,GitHub:star:22.3k。
- PySimpleGUI:PySimpleGUI,它完全基于Python语言,能非常方便地开发GUI界面,代码量相比现有框架减少50%到90%。并且,它提供了极为友好的Python风格的接口,大大提升开发效率。GitHub:star:3.3k。
- DeepFaceLab:DeepFaceLab是一种利用机器学习来替换视频中的面部的工具。包括预先准备好的独立Windows 7,8,10二进制文件。GitHub:star:12.4k。
- Facewap:deepfake 的深度学习技术,这款工具本来的用途是用来识别和交换图片、视频中人物脸部图像的工具。GitHub:star:1.4k。
- Httpie:命令行调试接口的工具,相比 curl 来说,更加直观一点,对新手友好。GitHub:star:45.7k。
- thefuck:这个工具很有意思,当你在命令行敲错命令的时候,一定会心里默念一句: fuck. 现在你可以直 接再敲一遍 fuck,他会帮你猜出来你刚刚应该输入的正确命令。GitHub:star:52k。
- hacker-scripts:一个黑客的一些脚本,比如说如果九点之后还在开发机上登录的话就给老婆发个短信解释一下。GitHub:star:37.4k。
- Discourse:一个开源的论坛,GitHub:star:30k。
- EverydayWechat:微信助手:1.每日定时给好友(女友)发送定制消息。2.机器人自动回复好友。3.群助手功能(例如:查询垃圾分类、天气、日历、电影实时票房、快递物流、PM2.5等)。GitHub:star:7k。
- Google Cloud Vision:Google的VisionAPI,可以用来自己构建一个搜索引擎。
- Markdeep:Markdeep 是一个用来写纯文本的插件,它能以 Markdown 的语法与渲染方式纯文本,并在网页上展示。同时,除了 Markdown 语法,Markdeep 还额外支持图表、数学方程等扩展能力。只要你有纯文本编辑器,加上一条语句,瞬间它就可以成为 Markdown 编辑器。
- Real Time Person Removal:实时人物去除项目,这个项目的神奇之处在于,只需要在网络浏览器中使用 JavaScript,用 200 多行 TensorFlow.js 代码,就可以实时让视频画面中的人物对象从复杂的背景中凭空消失!GitHub:star:2.5k。Demo地址,只需要一台能上网的电脑和一个网络摄像头就能体验它。
- Generative Inpainting:自己的照片有路人甲入镜是常有的事,但有些未免太过抢镜,甚至盖过了主角的风头。P 图高手往往选择自己手动去掉背景里不相干的人,但开发者不想那么麻烦,于是开发了该项目来一键消掉路人甲。GitHub:star:1.6k。
- FaceMaskDetection:开源人脸口罩检测模型和数据 ,在线体验链接
- ChineseOCR_LITE:中文OCR开源项目,采用了轻量级的主干网络 PSENet,轻量级的 CRNN 模型和行文本方向分类网络 AngleNet,总体模型只有 17M。支持任意方向文字检测,在识别时会自动判断行文本方向。GitHub:star:1.7k。
- MNIST Clock:MNIST 是计算机视觉中不老的经典,GitHub 作者 Dheera Venkatraman 做了一面钟,里面的数字都是从 MNIST 数据集中采样的。24 小时随机抽万张不同的手写数字,每天都不带重样。
- streamlit:这是一款专为机器学习工程师创建的免费、开源 app 构建框架。这款工具可以在你写 Python 代码的时候,实时更新你的应用。GitHub⭐7.2k。
- The book of secret knowledge:该存储库是程序开发工作中用得到的材料和工具的集合,它包含了许多有用的信息,每个人都可以在这份清单里找到适合你的工具,它面向系统和网络管理员、DevOps、渗透测试人员和安全研究人员。GitHub:star:31.4k,推荐等级::heart::heart::heart:!
- Joplin:一个免费的,开源的笔记和待办事项的应用程序,可以处理笔记本组织成的大量笔记。笔记是可搜索的,可以直接从应用程序复制,标记和修改,也可以从自己的文本编辑器进行修改。笔记采用Markdown格式。通过.enex文件从Evernote导出的Notes 可以导入到 Joplin 中,包括格式化内容(转换为Markdown),资源(图像,附件等)和完整的元数据(地理位置,更新时间,创建时间等)。GitHub:star:14.1k
- System Design Primer:该项目是关于如何设计大型系统,以及如何应对系统设计面试。系统设计是一个很宽泛的话题。在互联网上,关于系统设计原则的资源也是多如牛毛。这个仓库就是这些资源的组织收集,它可以帮助你学习如何构建可扩展的系统。GitHub:star:85.2k,推荐等级:❤️❤️❤️❤️!
- Realworld:RealWorld应用程序是对Medium.com的完整克隆,已经通过各种各样的前端和后端技术实现。它可以对13个框架进行比较,并且比较的是比其他基准测试更大、更复杂的应用程序的实现。GitHub:star:38.3k
- Google research:Google Research是谷歌内部进行各种研究的部门,不过随着AI技术的广泛应用和高重要性,他们决定把两个主要部门结合,致力于解决当今和未来技术的计算机科学问题,该存储库包含Google AI Research发布的代码。GitHub:star:8.5k
- FALdetector:Adobe发布的“反向PS”利器,知道你修过哪里,还帮你修回去,让你一秒回到P图前。GitHub:star:788
- Godot:Godot是一个全新开发的游戏引擎,其功能集类似知名的跨平台游戏引擎Unity,可用于开发PC、主机、移动和Web游戏。GitHub:star:28.6k
- Cxxmatrix:4行代码在终端再现《黑客帝国》数字雨,还有众多其他语言实现的版本,例如Python实现
- COVID-19:在约翰霍普金斯大学,两位中国博士生和他们的导师一起,开发了一个可视化、可交互的全球疫情地图。这个项目已经发在了《柳叶刀》上,GitHub:star:8.3k
- Primg:用质数生成任意ASCII艺术
- Awesome Linux:一份让Linux变得更棒的项目和资源列表。
- Tldr:简化版本的 "Linux man" 可以很详细的为 Linux 命令提供例子说明,GitHub:star:26k
- Kmdr:Linux 命令解释工具
- the-art-of-command-line:本文是作者在 Linux 上工作时,发现的一些命令行使用技巧的摘要。有些技巧非常基础,而另一些则相当复杂,甚至晦涩难懂。这篇文章并不长,但当你能够熟练掌握这里列出的所有技巧时,你就学会了很多关于命令行的东西了。目前Github获:star:60k+。其他相关资源:
- awesome-shell:一份精心组织的命令行工具及资源的列表。
- awesome-osx-command-line:一份针对 OS X 命令行的更深入的指南。
- Strict mode:为了编写更好的脚本文件。
- shellcheck:一个静态 shell 脚本分析工具,本质上是 bash/sh/zsh 的 lint。
- Filenames and Pathnames in Shell:有关如何在 shell 脚本里正确处理文件名的细枝末节。
- Data Science at the Command Line:用于数据科学的一些命令和工具,摘自同名书籍。
- Lede:LEDE是基于OpenWrt的嵌入式Linux发行版,该项目教你如何编译自己需要的 OpenWrt 固件,GitHub:star:8.5k
- Algorithm Python:GitHub上:star:50k+的项目,使用Python实现了所有算法,推荐等级::heart::heart::heart:!
- Leet Code Animation:GitHub上:star:30k+的中文项目,用动画的形式呈现解LeetCode题目的思路
- Leet Code 题解:GitHub上:star:10k+的中文项目,记录了LeetCode上大多数题目的题解
- Algorithms:GitHub上一个全面的算法代码仓库,涵盖了大量常用的C++算法代码实现
- Algorithm Visualizer:算法在线交互式可视化平台,GitHub上收获:star:20k+!
- VisualGo:数据结构和算法动态可视化网站
- CSIE:算法学习网站,讲解、代码格式、图表都很规范,覆盖广
- Matrix67 Matrix67 的一些算法讲解类经典文章
- Beyond the Void:BYVoid 的计算机科学博客,详细介绍了不少算法
- 知乎:有哪些学习算法的网站推荐?:知乎上的一个问题,介绍了不少学习算法的网站、题库、OJ等
- 《The Algorithm Design Manual》:这本书里有最难的算法问题,这些问题可以提升你对数据结构的了解。
- 《Cracking the Coding Interview: 189 Programming Questions and Solutions》:适合短时间内准备编程工作面试。
- Data Structures and Algorithms: Deep Dive Using Java
- 10 Books to Prepare Technical Programming/Coding Job Interviews
- 10 Algorithm Books Every Programmer Should Read
- Top 5 Data Structure and Algorithm Books for Java Developers
- From 0 to 1: Data Structures & Algorithms in Java
- Data Structure and Algorithms Analysis—Job Interview
- Algorithms:算法和数据结构是高效代码和良好软件设计的基础。要成为一名优秀的程序员,就需要创建和设计出色的算法。该存储库的目标是演示如何以最简单,最优雅的方式正确实现常见的数据结构和算法。GitHub:star:3.6k,推荐等级:❤️❤️❤️!
- Fucking Algorithm:手把手撕LeetCode题目,扒各种算法套路的裤子。GitHub:star:13.4k。
- Understanding LSTM Networks:LSTM教程,推荐等级::heart::heart::heart:!
- Sebastian Raschka:一位国外小哥的个人网站,里面有各种机器学习、深度学习的博客及笔记等资源
- Sebastian Ruder:DeepMind的一位研究学者的博客,博客内容包括深度学习、机器学习和自然语言处理,对于其中一些知识点例如 An overview of gradient descent optimization algorithms 讲解得十分巧妙,推荐等级::heart::heart:!
- StackSoft:国外一个机器学习相关的博客网站,里面有各种常见的机器学习算法介绍
- A Visual Guide To Using Bert For The First Time/:BERT小学生级上手教程,从原理到上手全有图示,还能直接在线运行。代码,Colab,DistilBERT。作者博客主页Jay Alammar。
- Recurrent Neural Network Tutorial:RNN 教程,推荐等级::heart::heart::heart:!
- Recurrent Neural Networks:RNN 教程,Juergen Schmidhuber(博客)
- The Annotated Transformer:Attention is All You Need 论文解读及相关代码实现教程,详细介绍了注意力机制。相关博客,推荐等级::heart::heart::heart::heart:!
- The Illustrated Transformer:这篇文章将带你通过一个self-attention模块了解其中涉及的数学运算。读完本文,你将能够从头开始写一个self-attention模块。作者博客主页Jay Alammar。
- A Gentle Introduction to Graph Neural Networks (Basics, DeepWalk, and GraphSage):介绍了图神经网络的概念及其最新进展的博客
- Hands-on Graph Neural Networks with PyTorch & PyTorch Geometric:使用PyTorch和PyTorch Geometric(PyG),构建图形神经网络框架的教程博客。GitHub地址
- Seeing What a GAN Cannot Generate:GAN这个模型,不能生成哪些东西呢?来自MIT的David Bau等人,在ICCV 2019 上的文章《Seeing What a GAN Cannot Generate》,进行了一系列实验,尝试找到问题的答案。文章主页,文章代码地址。
- Chollet 推特:谷歌深度学习研究员、“Keras之父”François Chollet发表推特,总结了一份TensorFlow 2.0 + Keras做深度学习研究的速成指南。Google Colab Notebook地址
- Installing Keras For Deep Learning:安装Keras库进行深度学习,国外一篇比较火的博客,旨在演示如何安装Keras库进行深度学习。
- Rainbow is All You Need:一份用 Jypyter Notebook 写的深度强化学习(Deep Reiforcement Learning)笔记,背景理论、代码实现全都有,手把手教你从 DQN 到Rainbow 。 GitHub地址,推荐等级::heart::heart::heart:!
- TensorFlow 2.0 is Now Available:官方博客,介绍TensorFlow 2.0
- Scratch Mlp:GitHub的教程——神经网络的数学图解,详细介绍了浅层神经网络的定义、初始化、前向传播、反向传播的细节以及代码实现,和实验结果,手把手介绍其数学原理。
- TF-2.0-Hacks:该仓库包含了作者对新发布的TensorFlow 2.0的探索,里面有些相关资料很值得学习。
- Activation Functions Explained:优化神经网络;选择正确的激活函数,你的神经网络可以表现得更好。六大激活函数讲解。推荐等级::heart::heart::heart::heart:!
- Harvardnlp:内有大量NLP相关的教程和代码(PyTorch)实现,推荐等级::heart::heart::heart::heart:!
- From zero to research — An introduction to Meta-learning:关于Meta-Learning 的详细介绍教程和代码实现,推荐等级::heart::heart::heart::heart:!
- What everyone forgets about Machine Learning:机器学习是当下人工智能浪潮的核心技术,受到了工业界的广泛应用,为社会带来了巨大的产业价值。然而,如果机器学习系统受到攻击,将会带来怎样的严重后果?我们该如何分析、规避这种风险?下面,本文作者将基于 6 个月的研究心得,教给大家破解机器学习系统攻击的正确方式!
- The Will Will Web:記載著 Will 在網路世界的學習心得與技術分享
- Pytorch Internals:万字综述,核心开发者全面解读PyTorch内部机制。推荐等级::heart::heart::heart::heart:!
- Tutorial on Variational Autoencoders:一个很棒的教程,深入探讨了构建变分自编码器的细节
- Variational Autoencoder in TensorFlow:使用TensorFlow 1.x 实现VAE教程
- Soumith Chintala:Pytorch 创始人 Soumith Chintala 的GitHub主页,有许多值得学习的Pytorch项目。推荐等级::heart::heart::heart::heart:!
- pytorch-tutorial:PyTorch Tutorial for Deep Learning Researchers,GitHub ⭐15k,推荐等级:❤️❤️❤️❤️!
- 崔庆才个人站点:爬虫必看博客网站
- 《Go2-book》:《Go2编程指南》开源图书,重点讲解Go2新特性,以及Go1教程中较少涉及的特性
- 知乎:Flask 10天开发一个网站:一个Flask写网站的教程
- Do We Really Need Model Compression?:探索从零开始训练小模型所涉及的障碍,讨论为什么模型压缩有效,以及两种提高内存效率的训练方法:超参数化界限和一种能够减少或消除对事后模型压缩的需求的优化算法。
- Tensorflow vs Pytorch:用于 TensorFlow 和 PyTorch 的比较指南
- State Of The Art Shitcode:GitHub 上有一个新项目,它描述了「最佳垃圾代码」的十九条关键准则。从变量命名到注释编写。这些准则将指导你写出最亮眼的烂代码。
- Codelf:变量命名网站 Codelf,可以直接网站上搜索变量命名建议,也可以在自己用的编辑器里安装插件,支持 VS Code、Atom、Sublime Text 和 Chrome。同时,GitHub的issue里还提供了各种配置教程,目前GitHub:star:9k+。
- Implement Perceptron Algorithm Scratch Python/:JasonBrownlee的Machine Learning Mastery系列文章,其中一篇是《如何用Python从头开始实现感知器算法》,感知机原理
- Single-Layer Neural Networks and Gradient Descent:SebastianRaschka的博客,单层感知机和梯度下降
- The Unreasonable Effectiveness of Recurrent Neural Networks:Andrej Karpathy(博客)
- A Beginner's Guide to LSTMs and Recurrent Neural Networks:初学者的LSTM和RNN指南
- Building Autoencoder In Pytorch:利用 CIFAR-10 数据集通过 Pytorch 构建一个简单的卷积自编码器
- An Introduction to different Types of Convolutions in Deep Learning:介绍不同类型的卷积神经网络。
- Matplotlib Tutorial:快速入门Matplotlib教程
- Transfer Learning With Tensorflow:TensorFlow2 最新迁移学习教程和实战
- Introducing TensorFlow Datasets:TensorFlow Dataset 库的官方介绍博客。
- Python Logging Model:Python 线上环境如何优雅输出log日志
- 床长人工智能教程:床长人工智能教程,教程涉及到了人工智能的方方面面,从基础原理到现在很火的人脸识别,自动驾驶.,股票预测,金融分析…以及一些小众的特殊应用。
- Unveiling the Hidden Layers of Neural Networks:深度学习黑盒可视化指南,了解神经网络隐藏层的重要性,介绍如何可视化神经网络以及隐藏层的过程。
- Machine Learning: Step-By-Step:使用随机森林、PCA和超参数调优的Python机器学习分类的逐步学习指南。
- Modelling the coronavirus epidemic in a city with Python:Python新冠病毒传播建模教程。
- Building an Incremental Recommender System:利用CF Step python库,快速实现增量学习推荐系统,重现了Joao Vinagre等人发表的“Fast incremental matrix factorization for recommendation with positive-only feedback”的结果
- Machine Learning Notes:周志华《机器学习》手推笔记
- Clear and Creepy Danger of Machine Learning: Hacking Passwords:一位好奇的学者 Tikeswar Naik,通过简单的实验和讨论了机器学习技术的某一潜在滥用情况——使用 ML 来破解密码,希望通过这一介绍能够让更多人保持警惕,并找到减轻或防止滥用的方法。GitHub
- Ten Tips to Save you Time and Frustration When Programming: Jeff Hale 是 Medium 社区中非常有名的人工智能和技术领域的专栏作家。在这篇文章里,他给所有的编程者提供了 10 个真诚而且实用的建议以及快速解决编程错误的5个步骤。
- Visualizing LSTM Activations in Keras:在Keras中构建文本生成模型,还将可视化生成文本时某些单元格正在查看的内容。GitHub地址
- 科研小白入门指南:清华本科特奖获得者、清华计算机大四学生高天宇,如何写论文、做实验、与导师相处。高天宇博客首页
- A half-hour to learn Rust:据说很多开发者一天入门 Python,两天上手 Go,但到了 Rust 就会发现画风隐约有些不对。它从语法到特性,似乎都要复杂一些。本文介绍的就是 Rust,作者表示,通过解析大量代码,「半个小时」就能入门 Rust。
- 12 Amazing Pandas & NumPy Functions:数据和分析工程师 Kunal Dhariwal 为我们介绍了 12 种 Numpy 和 Pandas 函数,这些高效的函数会令数据分析更为容易、便捷
- Nuno-faria:一个具有创造力的作者主页,开源不少有趣的东西,例如 Tiler,Java写的推箱子,桌面足球等。
- Data Science Cheat Sheet:数据科学速查表,GitHub:star:8k+。内容几乎涵盖数据科学相关的所有领域,在理论应用方面包括大数据分析、数据挖掘、数据可视化、深度学习,机器学习等等;在编程语言与工具方面,包括Excel、SQL、Python、MATLAB、Linux;基础的学科知识包含统计学、数学、概率论。另外,就连面试问题都没放过
- Git 基本操作:一张 Git 基本操作的速查表(脑图)
- Python Data Science Cheatsheet:Python 数据科学速查表中文版,英文原版。
- Python 3 Cheat Sheet (PDF):Python 3 Cheat Sheet 由法国国家科学研究中心(CNRS)的法国机械工程与信息技术实验室(LIMSI)的工程师 Laurent Pointal 总结。Python 3 Cheat Sheet 一共包含两页,分成了多个框图,涉及基本的 Python 数据结构、数学运算、条件和循环语句、文件读写,以及异常值处理等
- Python Cheatsheet: 全面的Python备忘单,内含超全代码示例。基于Python 3.6打造,未来将会进一步丰富,添加Asyncio等内容。GitHub上获:star:4.6k。文本下载链接
- DS Cheatsheets:GitHub上:star:5k+的项目,一份数据科学备忘单
- Tips-of-Feature-engineering:机器学习实用的特征工程技巧
- Python 3 Cheat Sheet:Python 3 Cheat Sheet 由法国国家科学研究中心(CNRS)的法国机械工程与信息技术实验室(LIMSI)的工程师 Laurent Pointal 总结。这个简单的 Cheat Sheet 专注于从算法/编程开始所必需的语言部分,提供了学生入门所需的一般信息。注意:它不涉及面向对象的编程。PDF 地址
- Deep Learning cheatsheets for Stanford's CS 230:吴恩达CS230深度学习课小抄,清单主页。
- 《Python-Knowledge-Handbook》:《Python知识手册》 由 『Python数据之道』出品
- Matplotlib Cheatsheet:Matplotlib 3.1 cheat sheet,GitHub:star:1.5k
- Lihang Code:李航《统计学习方法》的代码实现,GitHub:star:8k+。推荐等级::heart::heart:!
- 统计学习方法:李航的《统计学习方法》的详细笔记,以及各章节机器学习算法详细的 Python 代码
- MIT线性代数课程精细笔记:该笔记总结了我们在学习MIT线性代数课程的学习经验和过程。课程顺序是按照麻省理工公开课的 Linear Algebra. 记录的学习笔记。知乎专栏。
- 《Convex Optimization》:经典教材 Convex Optimization by Boyd and Vandenberghe
- 《Mathematics for Machine Learning(机器学习数学基础)》:作者表示撰写这本书旨在激励人们学习数学概念。这本书并不打算涵盖前沿的机器学习技术,因为已经有很多书这样做了。相反,作者的目标是通过该书提供阅读其他书籍所需的数学基础。这本书分为两部分:数学基础知识和使用数学基础知识进行机器学习算法示例。Github地址
- 《An Introduction to Statistical Learning》:《统计学习导论》,它的内容会有点数学,但是也很容易阅读。对于机器学习这样一个广泛的领域,这本书能将篇幅控制在400页左右很不容易。唯一的缺点是代码是用 R语言而不是Python编写的。
- 《The Elements of Statistical Learning》:斯坦福《统计学习要素》一直是机器学习领域公认经典的教材,是一本在机器学习、统计推理和模式识别领域有影响力和被广泛研究的书。而这本书一直没有得到中文翻译。近期由szcf-weiya博士整理翻译的The Elements of Statistical Learning (ESL)的中文翻译、代码实现及其习题解答公开,非常值得学习!GitHub仓库
- 线性代数(Linear Algebra)中文笔记:该笔记总结了我们在学习MIT线性代数课程的学习经验和过程。课程顺序是按照麻省理工公开课的 Linear Algebra. 记录的学习笔记。
- 《Seeing Theory》:来自斯坦福大学的一位研究生和他的伙伴们开发了一本颇有新意的统计概率入门教材,与传统教材不同的是,这本书充分利用了数据可视化技术,交互性和趣味性都非常强,可以边读边玩。书籍下载地址
- 《Interactive Linear Algebra》:《交互式线性代数》,它的最大特点就是“交互式”,总共包含了 6 章内容,涵盖了线性代数的核心知识。离线 PDF 电子版下载地址。这份《交互式线性代数》在线网页,作者开源了所有代码,并发布在 GitHub 上。你可以修改程序中的源代码,实现更加个性化的体验。GitHub源码地址。
- A Beginner’s Guide to the Mathematics of Neural Networks:一份为初学者准备的指南,关于神经网络中的数学问题,帮助读者理解神经网络模型中的数学概念和应用。
- 面向机器学习的线性代数和微积分要点速览:斯坦福大学CS229课程中线性代数和微积分回顾,中文版
- 《Introduction to Applied Linear Algebra》:斯坦福大学Stephen Boyd教授与加州大学Lieven Vandenberghe教授合著的一本线性代数书籍。这本教科书结合了直观的解释和丰富的实例,让抽象的线性代数知识变得通俗易懂,并且你不需要任何线性代数基础就能看懂。斯坦福课程主页,UCLA课程主页
- 《Linear Matrix Inequalities in System and Control Theory》:斯坦福大学Stephen Boyd教授与加州大学Lieven Vandenberghe教授合著数学书之一
- 《Convex Optimization》:斯坦福大学Stephen Boyd教授与加州大学Lieven Vandenberghe教授合著数学书之一
- 《Linear Controller Design – Limits of Performance》:斯坦福大学Stephen Boyd教授与加州大学Lieven Vandenberghe教授合著数学书之一
- Professor Bingsheng He:南方科技大学何炳生教授个人主页,有许多数学讲解文章
- 网易云课堂:上面有许多不错的网课,并且经常有一些直播,不过一些精品课程需要收费
- 中国大学慕课:类似网易云课堂,收看网课
- 菜鸟教程:上面有许多教程,涵盖各类编程语言、开发工具等
- 多来码:类似菜鸟教程,但是课程较少
- 廖雪峰官方网站:上面主要是Python、Git、Java教程,都写得十分浅显易懂
- Programiz:国外的一个学习网站,主要包括Python、Java和等语言教程,讲得十分好
- 阿西河前端教程:该网站主要是前端教程,涵盖大量前端知识
- PowerShell教程:PowerShell在线中文教程
- SQL Bolt:国外的一个网站,通过简单的交互式练习学习SQL
- Regex101:一个在线正则表达式学习(转换)网站,还可以将你的正则表达式转换为各种语言的代码
- Learn Regex:无论你使用的是 Python、Java、Perl 还是 Shell,正则表达式是学习主流编程语言几乎绕不开的话题。有了它,就能帮你快速定位到符合筛选条件的文本内容。现在 GitHub 上的有个 24k:star:的项目 learn-regex 解决了初学者的困难。最近这个教程刚完成了汉化工作,还附有在线练习,帮助初学者快速入门正则表达式
- Brilliant | Math and Science Done Right:可以边打游戏边学习,包含数学、物理、逻辑、计算机
- 3Blue1Brown:深入浅出、直观明了地分享了数学之美。3Blue1Brown中国官方B站账号,用动画的形式生动讲解了微积分的本质,线性代数等数学原理,推荐等级::heart::heart::heart:!
- 斯坦福概率和统计:斯坦福概率和统计
- MIT线性代数:MIT线性代数
- 斯坦福卷积网络视觉识别:B站链接。
- 程序员深度学习实战:B站链接。
- 斯坦福深度学习自然语言处理:B站链接。
- 吴恩达机器学习课程:中文版。
- 斯坦福概率图模型专项课程:斯坦福概率图模型专项课程
- DeepMind强化学习导论:B站链接。
- 全栈深度学习训练营:B站链接。
- 可汗学院:可汗学院几乎涵盖所有机器学习相关概念,且可免费学习。你可以在注册可汗学院时选择想要学习的主题,这样就可以得到量身定做的理论学习路径了。
- 伯乐在线:伯乐在线翻译组,GitHub上翻译了多个学习资源仓库,内含大量学习资源
- Machine Learning: Coursera 上开设的另一门机器学习课程,相比于吴恩达的课程更加简单易懂。
- Latexstudio:Latex 学习网站
- SQL学习网:这个网站提供用于练习的两张数据表 user 与 user_ext,并在表的下方提供了表说明跟字段说明,配对的案例相对简单,直接输入运行即可。
- SQLFIDDLE:这玩意,名字听的我也不知道要表达啥,字面意思是可以随意「摆弄」SQL,打开看能支持多种目前主流的数据库,设计来看属于简洁明了的那种。
- SQLBOLT:一边学习,一边练习,从SQL是什么开始介绍。
- W3RESOURCE:从名字看就猜到可能内容包含不只是SQL的学习,打开看像是一本计算机相关的百科全书,值得大家收藏阅读。
- Learn Git Branching:一个用于学习 Git 的交互式学习网站,GitHub上收获了:star:10k+
- Nazo Game:这是一个在线解谜游戏,画风简洁,部分关卡需要具备一定的web知识。url地址直接访问,打开浏览器调试等操作都是解谜必要的。对于web开发人员来说非常值得一玩
- Robocode:Robocode是一款编程游戏,你可以通过开发代码来创造你自己的机器人坦克,用于消灭其他坦克。它主要使用Java语言来创建属于你自己的机器人。
- Coding Games:Coding games支持包括PHP、C、JavaScript在内的20多种编程语言。用户界面功能强大,可以定制。例如,你可以选择你的代码编辑器的风格:Emacs、Vim、Classic。如果你想提升编程技能,玩Coding games是一种有趣的途径
- CodeCombat(极客战记):CodeCombat 是一款网页编程游戏。这款编程游戏借鉴了游戏的很多设计元素,游戏剧情十分丰富。当你打开CodeCombat网站,你不会觉得这是一个让你看不懂的代码学习网站,因为他的网站外观看起来就像是一个魔兽争霸风格的线上游戏,而且当你实际玩玩看,你会发现过程真的就是英雄要去打怪、寻宝与解谜,只是搭配了程序语言的学习。CodeCombat能够学习 Python、JavaScript、Lua、CoffeeScript、Clojure 等不同程序语言,这些语言能够运用到游戏设计、网页应用、App 的开发上。极客战记(中国版CodeCombat)网址
- Screeps:如果你想学习JavaScript,那Screeps是一个很好的选择,Screeps 是一个为 JavaScript 程序员准备的大型多人在线游戏(MMO)。这个游戏是一个开放的策略游戏,游戏中你控制的单位被称为“creeps”,它可以帮你获得资源、建立自己的领地等等。作为一个多人在线游戏,游戏中你的creeps会被其他玩家的creeps包围
- Checkio:Check iO 是一个基于浏览器的游戏,你需要使用 Python 或 JavaScript 来解决问题才能将游戏进行下去(需要登录)
- Vim Adventures:顾名思义,这个网站让你通过玩游戏来学习 Vim
- Cyber Dojo:Cyber-dojo是一个提供给程序员们练习写程序的地方。支持 JavaScript、Java、Python、PHP、Ruby 等语言。源代码
- Code Monkey:CodeMonkey 是一款非常富有童趣的网页编程游戏,玩家通过编程向怪兽小猴子传达指令,帮助小猴子吃到香蕉就可以过关了。 CodeMonkey 以游戏闯关的方式进行教学,总共有300多个关卡,涉及到编程的各种概念
- Elevator Saga:电梯编程游戏,需要一步步解决问题过关。比如说第一关是在 60 秒内运输 15 个人。(编程语言为JavaScript)。代码
- Codewars:在战斗中进行学习。和其他人一起在真实的编程挑战中提升技巧,支持JavaScript、Python、C#、Java、Python等语言(支持的语言见下图)
- Ruby Quiz:Ruby Quiz是一个面向Ruby程序员的每周编程挑战项目,目前有156个测验项目
- Git-Game:Git-game是一个基于终端的游戏,它用来教授 git 中的那些非常酷的功能。游戏的主题内容是搜寻,通过 git 命令来找到线索,解开谜题
- Hacker.org:hacker.org 挑战赛是一系列的拼图、敲砖块、测试和智力题,用来测试你的黑客能力。要通过这一系列的考验,你需要学会解密、编码、渗透等等技能,揭开重重迷雾
- Code Hunt:Code Hunt 是一个由Microsoft Research开发的 HTML5 科幻主题游戏。在这个游戏中,你扮演一个代码猎人,负责修复代码,并使它它返回预期的结果。Code Hunt支持 Java 和 C# 两种语言。你可以学习到包括算法、循环和条件表达式等编程概念
- Fight Code:在 FightCode 中,通过编写 JavaScript 代码,你可以创建一个能够击败其他玩家机器人的机器人
- Human Resource Machine:Human Resource Machine 是一款非常有意思的移动端游戏。这款游戏由粘粘世界(World of Goo)的设计者和制作小小炼狱(Little Inferno)的团队共同制作,游戏虽是走解谜路线,但玩法相当新颖:玩家将扮演一个从基层做起的员工,需要通过指令代码来编写一条条程序,完成每个阶段的任务,最终走上职场巅峰
- CodeChef:在这里你可以解决实际问题、参加不同的比赛,这些比赛每月都会进行
- Pex for fun:这是微软开发的一个游戏,在这个游戏中你需要和其他的程序员进行比拼。而代码就是你的武器
- Rankk:你需要解决一系列由易到难的问题。这个游戏是对 Pyramid 游戏的复刻,Pyramid里面有很多逻辑和数学问题
- TopCoder:在这个游戏里你不光可以解决问题,还可以获取真金白银。来自全世界知名IT公司的程序员在这里互相挑战,为的就是赢得他们的奖品
- Google Code Jam:Google 大赛上已经解决的算法问题。在这里你可以自己试一试
- Python Challenge:玩家可以通过 Python 编程解决问题并提升等级
- Lumosity:一组能够训练大脑的游戏,由科学家和游戏设计师一同开发
- Algorithm Geeks:一个交流讨论算法的 Google 群组
- CodeKata:妙趣横生的编程问题
- LessThanDot:一个专门论坛,程序员在这里发布一些比较困难的编程挑战
- The Daily WTF:类似BYOD(Bring Your Own Device)模式,不过这里是BYOD(Bring Your Own Code)程序员们编写他们自己的代码片段放在这里,用来解决一些比较困难的问题
- Peking University JudgeOnline for ACIP/ICPC:这里包含了不同比赛中涉及到的不同的问题。你可以实时的解决问题并且查看结果,你的答案也会被验证是否正确
- University of Valladolid Online Judge:与北京大学OJ平台类似,但是包含了不同的问题
- Programming Praxis:这个博客每周都会出一些新的编程问题
- Project Euler:包含了很多复杂的数学问题,这让发烧友们感到非常开心
- 4Clojure:在这里你可以通过解决一些不同难易程度的问题来学习 Clojure
- Prolog Problems:你可以在这里练习逻辑编程
- Codingbat:由很多 Java 和 Python 的习题(难度各有不同)
- Sphere Online Judge:各种各样的编程问题
- Rosalind:通过解决实际问题来学习算法和生物信息学
- LeetCode:这个网站是为了帮助程序员准备面试而创建的。在这里你可以找到不同领域的典型问题
- Career Cup:程序员面试时最容易被问到的真实问题
- Kodable:Kodable是一款适用于 5 岁及以上儿童的教育型 iPad 游戏,适合为儿童进行编程启蒙
- Lightbot:Lightbot是一款移动端游戏,玩家通过控制机器人的移动在固定位置点亮灯泡。在线地址
- Box Island:Box Island 是一款经典且屡获殊荣的移动端编程冒险游戏,这款游戏在为孩子们带来令人兴奋的冒险体验的同时, 向他们介绍编程的基础知识。
- The Wandering Wraith:失落的幽灵在寻找平静的世界中徘徊。您会引导他回到他的坟墓中,以便他最终可以安息吗?
- Trick Parade:Trick Parade 是一款 RPG 游戏,它结合了一些游戏特性,您将会成为技巧和恐惧的大师。
- Daemon vs. Demon:Daemon vs. Demon 是 2017 年 Game Off 的获胜者,他们使用 W A S D 键移动并使用 J K 键砍断和砍击挑战各种英雄,以重返自己的世界。
- Murder at the Residence Gudul:以“我们现在要做什么?”为主题,几乎可以保证我们有一些经典的点击式冒险游戏。
- Mogee:这款像素化游戏仅用三天就开发完成了,并以64×64像素构建,能给你带来很大的挑战。
- Monster Pong:2017 年的 Game Off 混合了 Breakout 和 Pong ,会很有挑战。
- Witch ‘em up:仅限于CGA调色板,这款滚动射击游戏可能是 fantasy consoles 的完美介绍。
- Meteorite:低分辨率第一人称射击游戏中,巨大的浮动眼球会发射紫色激光束。此游戏有一个限制,即任何游戏最多只能有64×64像素时,这一点会给人留下深刻的印象。
- The Sucker:您能在僵尸的猛烈袭击中幸免吗?这款僵尸生存游戏的大小不到13kB。
- Dark Forest:只用了 10 天就开发完成,这个游戏会让您感到愉悦,当您从黑暗世界战胜恶魔时。
- Blood Worm:该游戏使您可以控制带有声音效果的蠕虫。
- Micromancer:这是 Ludum Dare 33 的另一个游戏,您将在其中扮演一名死灵法师之王,带领您的亡灵大军奋勇前进。****
- Johnny Smiter: Episode Zero:该游戏将您带入虚拟现实森林,您必须在其中收集符文并避免致命的蜘蛛的攻击。
- CS231n: Convolutional Neural Networks for Visual Recognition:斯坦福CS课程CS231:卷积网络视觉识别笔记
- 计算机科学速成课:翻译自Youtube上的计算机科学速成课,可在B站上观看中文版(带中英字幕)
- 北大课程资源:北京大学课程资料民间整理
- 中国科学技术大学课程资源:收录中国科学技术大学众多课程资源的笔记,总结,经验等学生原创内容
- 浙江大学课程攻略共享计划:浙江大学课程资源,至今为止收录了以下内容:选课攻略、电子版教材、平时作业答案、历年试卷、复习资料等
- 清华大学计算机系课程攻略:受浙江大学相关项目启发创立的项目
- 上海交通大学课程分享:上海交大课程学习资料
- Mlcourse.ai:mlcourse.ai是OpenDataScience提供的开源机器学习课程。你还可以参加课程中举行的几次Kaggle Inclass比赛。GitHub:star:6.6k。
- Hung-yi Lee:李宏毅老师的个人主页,内附有他的所有机器学习相关演讲课程
- 李宏毅机器学习(2017):B站上李宏毅机器学习的教程视频,已有几十万的播放量,李宏毅的教授水平真心觉得很高,对于机器学习的讲解十分有趣吸引人,思路清晰,适合初学者观看。课程讲义。
- 李宏毅机器学习2020:李宏毅老师新发布的2020机器学习视频,所有课程都有各种学习资源,视频、PPT、作业一项都不少。与其它只教授机器学习基础内容不同,按照惯例,李宏毅老师还会特别讲解当前最新的算法,并将其作为补充视频上传到网上。而且,李宏毅老师的课程涉及领域非常完整,从有监督、半监督、无监督到强化学习,都会有介绍。在最新的 2020 ML 课程中,他展示了完整的学习路径。推荐等级:❤️❤️❤️❤️!
- 斯坦福 吴恩达《CS229机器学习》):B站上吴恩达老师的机器学习教程,播放量已达到百万。吴恩达的教学视频虽然备受推崇,但其实并不适合作为入门视频,教授内容还是有一定深度的
- Coursera ML Py:吴恩达机器学习课程笔记,Python代码
- CourseraML:吴恩达机器学习课程笔记,Jupyter笔记本格式
- C++ 匠心之作 从0到1入门资料:C++ 匠心之作 从0到1入门资料,视频教程。
- 数据科学推荐阅读清单:一份数据科学推荐阅读清单,包含 10 本在线免费书籍
- MIT 6.824: Distributed Systems:MIT"分布式系统课程"(Distributed Systems),业内大名鼎鼎,新手入坑分布式系统的首选学习教程。B站地址
- A Self-Learning, Modern Computer Science Curriculum:国外一位工程师写的计算机自学指南,中文译名应为《现代化计算机科学自学指南》,内容包含着许多来自许多世界知名高校、顶尖的教授与技术专家所编著的计算机课程
- Virgilio:这个项目是 GitHub 上一位名为“维吉尔(Vigilio)”的开发者整理的一个:star:10k的项目,项目包括职业进阶路径、专业知识讲解、工具介绍等,着重强调,不走弯路,简明扼要。GitHub中文版链接。推荐等级::heart::heart::heart:!
- Leeml Notes:李宏毅老师的机器学习视频是机器学习领域经典的中文视频之一,也被称为中文世界中最好的机器学习视频。这个笔记是根据李宏毅老师机器学习视频的一个辅助资料,本笔记基本上完全复刻李老师课堂上讲的所有内容,并加入了一些和相关的学习补充资料和参考资料,结合这些资料一起学习,相信你会对机器学习有更加深刻的理解。在线阅读地址和配套视频。推荐等级::heart::heart::heart:!
- Spring 2019 Full Stack Deep Learning Bootcamp:深度学习全栈课程,这份课程主要可以学习到计算机视觉目标检测,机器学习项目通用流程,文本OCR识别, 深度学习工具全栈,数据管理,深度学习调试等等知识。
- 《语雀 IT 百科精品知识库》:这是由国内语雀团队出品的《语雀 IT 百科精品知识库》,这些精品知识库涵盖了互联网技术的主要领域,包含了实实在在的内容,都经过作者认真的整理和编辑,具有一定的学习和参考价值。对于想要投身互联网开发的朋友,这些都是很好的资料,值得收藏。
- 《Algebra, Topology, Differential Calculus, and Optimization Theory For Computer Science and Engineering》:宾夕法尼亚大学计算机和信息科学系教授 Jean Gallier 的开源书籍《Algebra, Topology, Differential Calculus, and Optimization Theory For Computer Science and Engineering》用一本书的容量涵盖了学习计算机科学所需要的数学基础
- OKAI:通过交互动画的形式来科普人工智能的历史,应用和主要算法(深度学习算法)的基础原理。OKAI摒弃了那些复杂的数学公式,采用轻松有趣的动画形式来讲解人工智能的相关概念。
- Deep Learning Drizzle:Deep Learning Drizzle 是一个深度学习相关课程/讲座视频的大合集,其中不乏学界知名大牛的亲授课程。目前该项目已经在Github收获了6000+星,Fork数也超过1.4K。仓库维护者整理了14个类目共计232门视频课程,并且这个数字还在不断增加。推荐等级::heart::heart::heart:!
- Computer Science:Github 50k ⭐的计算机专业课程,总结了从零开始成为计算机大牛的学习之路。课程主要分为两部分,即 CS 核心知识与 CS 进阶知识。CS 核心知识需要我们具备高中水平的理科知识,包括几何、代数、简要微积分等等。当然,如果我们还记得大学学过的高数,那么背景知识就已经非常充足了。对于 CS 进阶知识,我们应该首先掌握整个 CS 的核心知识体系,从而进一步选择想要进修的子领域,推荐等级:❤️❤️❤️!
- 如何赢取数据科学竞赛:跟顶级Kagglers学习:如何赢取数据科学竞赛:跟顶级Kagglers学习
- Berkeley-cs294-158-sp19:这份课程涵盖了两个无需标签数据的深度学习领域:深度生成模型(Deep Generative Models)和自监督学习(Self-supervised Learning)。生成模型的最新进展使得可以对高维原始数据进行逼真的建模,例如自然图像,音频波形和文本语料库;自我监督学习的进步已经开始缩小监督表征学习与无监督表征学习之间的差距,以微调未见任务。本课程将涵盖这些主题的理论基础及其新启用的应用程序,你可以观看 YouTube 讲座视频,还可以下载课件的 PDF 版。
- Machine Learning Study Path:从入门到进阶,所用到机器学习资料,包括书、视频、源码。
- The Craft of Selfteaching:自学的技巧,GitHub上10k的项目,作者是李笑来
- AppliedML:一个深入scikit-learn和机器学习的内容,免费。这套课程名叫AppliedML。
- Machine Learning Crash-Course:谷歌的《机器学习速成课程》 (内容已全部汉化,注重实践)
- 深度学习,统计学习,数学基础》人工智能算法工程师手册:市面上很多人工智能相关的书籍。大部分的书,面向小白,内容深度不够;小部分教材书或者科研书,内容艰深,又过于复杂。那么有没有,面向算法工程师(程序员)人群的,面向有一定数学基础、算法基础,能够快速上手写代码的人群的人工智能手册呢?有的!而且免费开源,非常有程序员范!《AI算法工程师手册》你值得拥有!推荐等级::heart::heart:!
- The Matrix Calculus You Need For Deep Learning:本文从简单函数求导到多元函数求偏导,再到矩阵的微积分运算,逐层深入,引导我们探索深度学习背后的学习规则与数学基础。本文试图解释理解深度神经网络的训练所需要的所有矩阵演算,本文适用于对神经网络基础有所了解的人,不过即使没有数学基础的同学也不要紧,作者提供了相关数学知识链接。在文末作者提供的参考部分,总结了这里讨论的所有关键矩阵演算规则和术语。
- 《Introduction to Applied Linear Algebra – Vectors, Matrices, and Least Squares》:斯坦福大学Stephen Boyd教授与加州大学Lieven Vandenberghe教授合著的应用线性代数导论:向量、矩阵和最小二乘法。这本书的目的是提供一个介绍向量,矩阵,最小二乘方法,应用线性代数的基本主题。目标是让学生通俗易懂,入门学习。让学习者了解在包括数据拟合、机器学习和人工智能,断层、导航、图像处理、金融、和自动控制系统的应用。是一本不可多得好教材。
- 《Machine Learning in Action》:以 Python 为基础的机器学习实战编程书籍:《Machine Learning In Action》,中文译为《机器学习实战》。本书代码地址,以及中文版代码仓库地址。
- 《Pattern Recognition and Machine Learning . Information Science and Statistics》:又名 “PRML”(书名首字母缩写),一本经典好书,以贝叶斯的视角为主,同时其难度可能很不适于缺乏数学基础的入门者。算法实现 PRML,GitHub:star:6k+。推荐等级::heart::heart::heart:!
- 《神经网络与深度学习》:这本《神经网络与深度学习》全中文版,大大降低了深度学习的语言门槛,让大家有更多的精力放在核心知识内容的学习上。内容上,它面向深度学习小白,从人工智能的基本概念开始讲起,可以说很友好了。此外,各种附加资料一站式配齐:从教材、讲解PPT、示例代码到课后练习,全方位无死角学习。这本书的作者邱锡鹏老师,目前是复旦大学计算机科学技术学院的博士生导师、自然语言处理与深度学习组的副教授。 PDF 讲义,课件 PDF,课程练习,推荐等级::heart::heart:。
- 《Natural Language Processing in Action》:自然语言处理(NLP)系统的开发已建立了通过人脑与人脑之间进行信息流和计算的多种技术。这本新书《Natural Language Processing in Action:Understanding, analyzing, and generating text with Python 》为我们提供了从基础知识到动手构建后端NLP系统的全套学习内容,希望对您开启NLP学习之旅有所帮助。GitHub代码地址。
- freeCodeCamp:开放源码代码库和课程。与数百万人一起免费学习编程。网站:https://www.freeCodeCamp.org (一个友好的社区,您可以在这里免费学习编码。它由捐助者支持、非营利组织运营,以帮助数百万忙碌的成年人学习编程技术。这个社区已经帮助 10,000 多人获得了第一份开发人员的工作。这里的全栈 Web 开发课程是完全免费的,并且可以自行调整进度。这里还有数以千计的交互式编码挑战,可帮助您扩展技能。)GitHub 获:star:300k。
- free programming books:免费提供的编程书籍。GitHub获:star:130k。
- Awesome:github 上很多的各种 Awesome 系列合集。GitHub 获:star:120k。众所周知,如果想要学习什么知识,只需要在GitHub上搜索"Awesome xxx" 即可获得一大堆相关的学习资源。推荐等级::heart::heart::heart::heart:!
- 《You-Dont-Know-JS》:您还不认识 JS(书籍系列)- 第二版。GitHub 获:star:110k。
- Design Patterns For Humans:GitHub上获:star:25k,一份超全的设计模式讲解(共 23 种),每一种设计模式解释都通俗易懂(中文版)。英文原版链接,推荐等级::heart::heart::heart:!
- Web 学习笔记:GitHub上:star:5k+的项目,超详细的Web前端学习图文教程
- Javascript:课程地址,这本教程由国外一个叫 iliakan 的小哥所著,并提供了英文、俄文、日文、中文等多个版本供读者免费在线查阅。如果你需要进行离线查阅,可付费购买该教程的 EPUB/PDF 版本。完整教程的购买只需要 60 元,可以说是非常良心了。如果你读完觉得这本教程不错,不妨也花钱支持一下作者。
- LaTeX-cn:目前最好的 LaTex 中文教程
- Google Machine Learning Crash Course:谷歌机器学习速成课程(招式)+机器学习术语表(口诀)+机器学习规则(心得)+机器学习中的常识性问题 (内功)。该资源适用于机器学习、深度学习以及TensorFlow研究人员参考!
- Halfrost-Field 冰霜之地:GitHub上的一个笔记仓库,包含了作者阅读开源框架源代码的心得记录。例如其中的机器学习模块,包含了吴恩达机器学习课程 11 周完整内容,每一周单独对应一个 Jupyter Botebook 文件。GitHub 获:star:4k+。作者主页。
- ML Paper Notes:机器学习/计算机视觉/ NLP论文的笔记和总结,推荐等级::heart::heart::heart:!
- 《Machine Learning Yearning cn》:Machine Learning Yearning 中文版 - 《机器学习训练秘籍》 - Andrew Ng 著。GitHub 已获:star:5k+
- 《Limitations of Interpretable Machine Learning Methods》:可解释机器学习的局限性《Limitations of Interpretable Machine Learning Methods》,阐述了可解释机器学习的概念、方法等,以及重要的是适用的边界,即可解释机器学习的局限,知道能与不能方能用好IML。本书共14章,是Christoph Molnar课题组最新成果,值得参阅。
- BigData-Notes:大数据入门指南,其中对大数据学习路线、技术栈思维导图、常用软件安装指南都给出了非常详细的介绍。GitHub 上已获:star:3k。
- CS 205L: Continuous Mathematical Methods with an Emphasis on Machine Learning:斯坦福大学最近新开设一门课程《Continuous Mathematical Methods with an Emphasis on Machine Learning》,以机器和深度学习为重点的计算机视觉和机器人学中连续数学方法的综述。虽然从机器学习的角度出发,但本课程将侧重于计算线性代数和优化等基础数学方法,以及反向传播自动微分、常微分方程动量法、CNNs、RNNs等专题。
- 《Introduction to Natural Language Processing》:Google AI研究科学家Jacob Eisenstein 博士的自然语言处理领域新书《Introduction to Natural Language Processing》由MIT出版社在10月份发行。在该教材最新版PDF 在 GitHub 上开放。这本书的内容主要分为四大章节,即 NLP 中监督与无监等学习问题、序列与解析树等自然语言的建模方式、语篇语义的理解,以及后这些技术最在信息抽取、机器翻译和文本生成等具体任务中的应用。整本开放书共四部分,19章,587页pdf,是了解最新自然语言处理进展的不可多得的教材。
- 《A Course In Machine Learning》:A Course in Machine Learning》属于入门级资料,它涵盖了现代机器学习的大多数主要方面(监督学习,无监督学习,大间隔方法,概率建模,学习理论等)。它的重点是具有严格基础的广泛应用。
- 《Bayesian Networks》:贝叶斯网络在经济学、人工智能、交通系统、医疗领域都有举足轻重的应用,许多研究表明,贝叶斯网络是可靠和稳定的因果关系表示。本书的写作者阐明了贝叶斯网络在各个领域的进展和应用。
- Project Based Learning:该资料主要汇总整理了一系列编程教程,教你如何从零开始构建一个应用,其中包含 C、C++、Java、PHP、JavaScript、Python 等主流编程语言教程。GitHub ⭐20k+。推荐等级:❤️❤️❤️❤️!
- Build your own X:该仓库收集了诸多计算机科学领域的教程资源,旨在从零开始,教授开发者构建一款完全属于自己的开发工具,其中包括增强现实、区块链、机器人、编辑器、命令行工具、神经网络、操作系统等几大领域。作为一名开发者,若能日拱一卒,沉下心来,跟着这个仓库里面的教程挨个做一遍,相信其技术水平定会有质的飞跃。GitHub ⭐50k+。推荐等级:❤️❤️❤️❤️!
- Tensorflow Data and Deployment:吴恩达创始的 deeplearning.ai 在 Coursera 上另外开设了一门课程,主要介绍使用 Tensorflow.js、TensorFlow Lite、TensorFlow Hub 等工具进行数据分析的方法。该专项课程已于今日开放注册。吴恩达对课程进行了转推。
- 机器学习中的神经网络:深度学习三巨头之一,Geoffrey Hinton通过twitter公布了自己在2012年准备的MOOC课程——机器学习中的神经网络。课程中详细介绍了神经网络的各种概念与特点,虽然来自于5年前,但仍不失为一份很有意义的讲解
- Practicalai:近期开源的自学深度学习 GitHub 项目,作者为每种具体算法提供了 Jupyter notebook 实现,可以轻易地在 Google Colab 上运行(免费提供云端 GPU 或 TPU)。所以想自学深度学习,不需要价格几千美元的 GPU,有一个 Chrome 浏览器就够了。这一套实践教程都能直接在 Colab 上运行,因此结合解释与代码,我们能更好地入门机器学习。推荐等级::heart::heart::heart::heart:!
- 《深度学习:Deep Learning》:深度机器学习的最新发展使视觉识别、语音和文本理解或自主智能体系统取得了前所未有的巨大进步。在此背景下,本课程将深入探讨深度学习架构的细节,重点是学习这些任务的端到端模型。学生将学习实施、训练和调试自己的神经网络,并对该领域的前沿研究有详细的了解。该课程还将介绍推理方法的最新创新,包括微分推理、对抗性训练和贝叶斯深度学习。
- 《贝叶斯深度学习: Deep Learning with Bayesian Principles》:来自东京RIKEN研究中心的Emtiyaz Khan给了关于以贝叶斯原理进行深度学习的教程《Deep Learning with Bayesian Principles》,共有86页ppt,以及撰写了最新的论文,讲述贝叶斯和深度学习如何结合到一起进行学习新算法,提出了一种基于贝叶斯原理的学习规则,它使我们能够连接各种各样的学习算法。利用这一规则,可以在概率图形模型、连续优化、深度学习、强化学习、在线学习和黑盒优化等领域得到广泛的学习算法。非常具有启发性,值得查看!视频地址。
- Introduction to Artificial Intelligence:Gilles Louppe Fall2019硬核课程:人工智能导论(Introduction to Artificial Intelligence),722页ppt,本课程的核心内容基于教科书:“人工智能:一种现代的方法”【第三版,作者:罗素 (Stuart J.Russell) / 诺维格 (Peter Norvig)】,某些课程和材料部分改编自加州大学伯克利分校的“人工智能入门”。
- 微软人工智能教育与学习共建社区:本社区是微软亚洲研究院(Microsoft Research Asia,简称MSRA)人工智能教育团队创立的人工智能教育与学习共建社区。平台开发团队在GitHub上表示,该平台是在教育部指导下,依托于新一代人工智能开放科研教育平台,微软亚洲研究院研发团队和学术合作部将为本社区提供全面支持。
- kaggle: Faster Data Science Education:想学Python 、机器学习、数据可视化……你可能会想Coursera上的在线教程,或者吴恩达大名鼎鼎的深度学习视频课,或者一些有名的网上社区,比如fast.ai,Udemy和EdX。但是你可能会因为时间不够就半途而废。Kaggle官网的一系列课程完美地解决了这个问题。只需要几个小时就可以学到最有用的技术。包含课程为:Python,机器学习入门,中极机器学习,数据可视化,Pandas,特征学习,深度学习,SQL入门,SQL进阶,地理空间分析,机器学习可解释性。推荐等级::heart::heart::heart::heart:!
- Introtodeeplearning:MIT 6.S191:全面、公开,还有业界反馈的深度学习课。每周更新一次课程视频,还提供了 PPT 和 Lab Session 的内容。在家闲着没事的你,也可以看看这些资料,感受下 MIT 的熏陶。推荐等级::heart::heart:!
- 《Python Tips for Data Scientist》:Wenqiang Feng, Xu Gao and Upendra Madam三位数据科学家撰写了一本《给数据科学家的Python技能秘籍》,简明扼要,非常实用,使用与数据科学家相关的详细演示代码和示例来共享一些用于数据科学家工作的有用python技巧,值得放在身旁学习查看!推荐等级::heart::heart::heart::heart:!
- CS512 Spring 2020 "Data Mining: Principles and Algorithms":UIUC韩家炜老师2020年新课:CS512 数据挖掘:原理与算法课程。本课程内容包括:网络概论、信息网络挖掘、序列与图数据挖掘、先进的聚类方法、离群点分析方法、数据流挖掘、时空数据挖掘、文本数据挖掘、Web数据挖掘等。个人主页。
- 实验楼:各种语言基础教程及相关项目。
- Python中文学习大本营:Python中文学习大本营
- 《Django By Example》:《Django By Example》中文翻译博客。
- 《Clean Python》:探索用Python编写代码的正确方法。GitHub。
- 《ThinkStats2》:统计思维:程序员数学之概率统计这本书的作者是美国计算机科学家Allen B. Downey。《统计思维》着重介绍了一些简单的技术,读者可以用真实的数据集对其进行探索。GitHub地址
- 《The Elements of Statistical Learning: Data Mining, Inference, and Prediction》:统计学习基础,斯坦福大学数学科学教授Trevor Hastie等人出品。这本书强调的是概念而非数学本身,内文采用大量图表来展示范例。本书涵盖的范围很广,从监督学习到无监督学习,均有涉及。
- 《Think Bayes: Bayesian Statistics Made Simple》:简明贝叶斯统计。关于贝叶斯统计的大多数书籍都是用数学符号来表达思想。这本书则用Python代码代替了数学符号,并用离散近似替代连续。此书同样附赠配套代码实现,还有人提供了IPython notebooks版本,可以在线修改、运行代码。Jupyter notebook
- 《Probabilistic Programming & Bayesian Methods for Hackers》:贝叶斯方法:概率编程与贝叶斯推断,这本书旨在从计算/理解第一,数学第二的角度介绍贝叶斯推断。作为一本入门书籍,本门适合非数学专业、对数学没有那么感兴趣的贝叶斯方法实践者。
- 《Computer Age Statistical Inference》:计算机时代统计推断,同样来自斯坦福大学,由Bradley Efron和Trevor Hastie两位老爷子共同打造。从经典推理理论开篇,以对统计和数据科学未来方向的推测作为结尾,这本书回顾了1950年以来数据分析革命的始末。生存分析、逻辑回归、经典贝叶斯、随机森林、神经网络、马尔可夫链蒙特卡罗方法……在这本书中,你都能找到。
- 《The Elements of Data Analytic Style》:这本书侧重于传统统计学课程和教科书容易遗漏的细节,可作为数据科学或数据分析入门课程教材。
- 《The Ancient Art of the Numerati》:程序员数据挖掘指南,这是一本入门向书籍,用于学习基本的数据挖掘知识。大部分关于数据挖掘的书都着重于理论知识的讲解,虽然理论知识非常重要,但还是有些让人望而却步。如果你是一名程序员,想对数据挖掘做一些初步的了解,那么可以选择这本书。本书采用“边学边做”的方式编写,作者强烈建议读者动手实践每一章结尾提供的练习题。中文版
- <《Social Media Mining: An Introduction》:社交媒体挖掘,本书将社交媒体、社交网络分析和数据挖掘集成在一起,为相关从业人员提供了一个方便的平台,以了解社交媒体挖掘的基础和潜力。这本书适合作为高年级本科生、研究生课程,以及专业短期课程的教材,内含难度系数不等的练习,可以帮助读者加强理解。
- 《The Art of Data Science》:数据科学的艺术,本书介绍了分析数据的过程。作者是约翰霍普金斯大学生物统计学教授Roger D. Peng和UT奥斯汀教授Elizabeth Matsui,他们在数据分析方面具有丰富的经验。
- 《The Data Science Handbook》:数据科学手册,这本书是25位杰出数据科学家深度访谈的汇编。其中,有来自领域专家的见解、故事和建议。
- 《Conversations On Data Science》:数据科学对话,约翰霍普金斯大学生物统计学教授Roger D. Peng,以及Stitch Fix数据科学家Hilary Parker的对话实录,主题是数据科学及其在现实世界中是如何发挥作用的。
- 《Object-Oriented Programming with Python》:Python面向对象编程,此书针对Python 3面向对象编程,是一本简明、权威的指南。语言简明,概念清晰。适合已经对Python有所理解的中级学习者。
- 《Automate the Boring Stuff with Python》:Python编程快速上手:让繁琐工作自动化,本书是一本面向实践的Python编程实用指南。不仅介绍了Python语言的基础知识,作者还希望通过项目实践,教会读者如何应用这些知识和技能。每一章的末尾都有习题和实践项目,附录部分提供了参考答案。适合编程基础薄弱的初学者。中文版
- 《Python Data Science Handbook》:Python数据科学手册,ython科学计算必备资料。这本书非常适合作为解决日常问题的参考书籍,包括:处理、转换和清除数据;可视化不同类型的数据;使用数据建立统计或机器学习模型。
- 《Learn Python, Break Python》:这本书由浅入深,从对编程的简要介绍开始,一步步引入更复杂的程序元素。面向初学者。
- 《Natural Language Processing with Python》:Python自然语言处理,本书对自然语言处理进行了易于理解的介绍。从中可以学习到如何编写适用于大量非结构化文本的Python程序。
- 《Data Science in Production》:产品中的数据科学,从初创企业到价值数万亿美元的大公司,数据科学正在最大化数据价值方面发挥着重要的作用。本书面向希望在多个云环境中构建数据产品,并开发应用数据科学技能的分析从业人员。
- 《Data Driven》:数据驱动,介绍了Google、Linkedln和Facebook如何利用自身数据,以及沃尔玛,UPS和其他公司是如何在大数据时代到来之前,就充分利用了数据资源的案例。
- 《Hands-on Machine Learning with Scikit-Learn and TensorFlow》:Scikit‑Learn与TensorFlow机器学习实用指南,通过具体的示例,最少的理论和scikit-learn、TensorFlow这两大工具,作者将构建人工智能系统的概念和工具直观地展示了出来。同样由浅入深循序渐进,从简单的线性回归开始,一路深入到神经网络。
- 《Understanding Machine Learning: From Theory to Algorithms》:深入理解机器学习:从原理到算法,本书讨论了学习的计算复杂度、凸性和稳定性、PAC-贝叶斯方法、压缩界等概念,并介绍了一些重要的算法范式,包括随机梯度下降、神经元网络以及结构化输出。适合有一定基础的高年级本科生和研究生学习,也适合作为IT行业从事数据分析和挖掘的专业人员以及研究人员参考阅读。
- 《Reinforcement Learning: An Introduction》:强化学习简介,本书对强化学习领域的关键思想和算法进行了简明清晰的说明。
- 《Deep Learning》:深度学习,Ian Goodfellow,Yoshua Bengio和Aaron Courville共同撰写。旨在帮助学生和从业人员全面了解机器学习,尤其是深度学习。讲课,练习,其它。MingchaoZhu 同学基于数学推导和产生原理重新描述了书中的概念,并用Python (numpy 库为主) 复现了书本内容,已在Github上开放: DeepLearning。推荐等级:❤️❤️❤️❤️!
- 《Machine Learning Yearning》:吴恩达出品。本书的重点不在于机器学习算法本身,而是如何让机器学习算法工作。GitHub
- 《D3 Tips and Tricks》:D3 Tips and Tricks介绍了如何利用d3.js这一工具,实现数据可视化。其中包含50多个可以下载的代码示例。
- 《An Introduction to Statistical Learning》:统计学习导论:基于R应用,这本书由南加州大学马歇尔商学院院长Gareth James等人出品,主要面向非数学专业的高年级本科生,硕士生和博士生。该书内容主要由R语言实现,并详细说明了统计学习方法在现实生活中的应用实例。
- 《Deep Learning》:深度机器学习的最新发展使视觉识别、语音和文本理解或自主智能体系统取得了前所未有的巨大进步。在此背景下,本课程将深入探讨深度学习架构的细节,重点是学习这些任务的端到端模型。学生将学习实施、训练和调试自己的神经网络,并对该领域的前沿研究有详细的了解。该课程还将介绍推理方法的最新创新,包括微分推理、对抗性训练和贝叶斯深度学习。
- 《Algorithm Design》:康奈尔大学Jon Kleinberg 与Éva Tardos 两位著名教授编著的算法设计《Algorithm Design》是关于算法经典的教科书。在普林斯顿大学wayne个人主页下配备了关于算法设计的相关课件,以及电子书864页pdf,值得查看学习。本文鼓励对算法设计过程的理解和算法在更广泛的计算机科学领域的作用的欣赏。
- 《Machine Learning Systems》:《机器学习系统》,本文首先介绍了反应性机器学习基础,然后介绍如何建立一个反应式机器学习系统(收集数据、生成特征、学习模型、评估模型、发布模型),最后介绍如何操作一个机器学习系统。
- CS234: Reinforcement Learning Winter 2020:斯坦福大学的最新课程CS234——强化学习,主讲人是斯坦福大学Emma Brunskill,她是斯坦福大学计算机科学助理教授,任职斯坦福大学人类影响力实验室、斯坦福人工智能实验室以及统计机器学习小组,主要研究强化学习。要实现人工智能的梦想和影响,需要能够学会做出正确决策的自主系统。强化学习是这样做的一个强有力的范例,它与大量的任务相关,包括机器人、游戏、消费者建模和医疗保健。本课程通过讲课、书面作业和编码作业的结合,学生将精通强化学习的关键思想和技术。
- Lectures for INFO8010 - Deep Learning:深度学习课程 PPT,深入探讨深度学习架构的细节,重点是学习这些任务的端到端模型。学生将学习实施、训练和调试自己的神经网络,并对该领域的前沿研究有详细的了解。该课程还将介绍推理方法的最新创新,包括微分推理、对抗性训练和贝叶斯深度学习。作者主页Gilles Louppe
- 《Python Tips for Data Scientist》:最近Wenqiang Feng, Xu Gao and Upendra Madam三位数据科学家撰写了一本《给数据科学家的Python技能秘籍》,简明扼要,非常实用,使用与数据科学家相关的详细演示代码和示例来共享一些用于数据科学家工作的有用python技巧,值得放在身旁学习查看!
- Free Books:阮一峰老师在 GitHub 上整理了他平时所发现的一些免费技术书籍。书籍列表包括 Web 开发、人工智能、系统管理等内容,覆盖面颇广
- Free Machine Learning Books:免费机器学习书籍下载
- 《Mastering Large Datasets with Python》:《用Python掌握大型数据集》,作者J.T. Wolohan向您介绍了如何使用Python编码的功能影响方法来处理小型项目并对其进行扩展。您将探索有助于清晰性和可伸缩性的方法和内置Python工具,比如高性能并行方法,以及支持高数据吞吐量的分布式技术。本实用教程中丰富的实践练习将为任何大型数据科学项目锁定这些基本技能。
- Deep Learning Books):一些机器学习、深度学习等相关话题的书籍。推荐等级::heart::heart::heart::heart:!
- CS-BOOK:计算机类常用电子书整理,并且附带下载链接,包括Java,Python,Linux,Go,C,C++,数据结构与算法,人工智能,计算机基础,面试,设计模式,数据库,前端等书籍。GitHub:star:1.5k。
- 《深度学习实践》:旷视研究院和北大数学科学学院机器学习实验室联合出品的中文深度学习课程,不仅有讲课视频、有PPT,而且还免费。
- 《Grokking-Deep-Learning》:《探索深度学习》教会你从头开始建立深度学习神经网络!经验丰富的深度学习专家 Andrew W. Trask 将向你展示了深度学习背后的科学,所以你可以自己摸索并训练神经网络的每一个细节。只使用 Python 及其数学支持库 Numpy,就可以训练自己的神经网络,将文本翻译成不同的语言,甚至像莎士比亚一样写作!完成后,您将准备好掌握深度学习框架。
- 《The Hundred-Page Machine Learning Book》:《百页机器学习》,这本书诞生于 LinkedIn 上的一个挑战(Andriy 是一个有影响力的人)。他的书不需要太多的介绍:亚马逊同类产品的畅销书,可能还是这一主题的最好的书面知识总结。
- 《Learn From Data》:如果你想开始学习机器学习的关键概念,那么你会喜欢这本书:简单易懂,简洁明了。这可能是继吴恩达课程之后最好的学习资源!这是我第一本关于机器学习的书和课程。
- 《Machine Learning Yearning》:《机器学习秘籍》,Andrew Ng 博士目前正在撰写的一本免费书籍,教你如何构造机器学习项目。 本书的重点不是教你如何使用 ML 算法,而是教你如何使用 ML 算法。
- Interpretable Ml Book:Christoph Molnar年初公开的《可解释的机器学习(Interpretable Machine Learning)》,带你打开机器学习的黑盒子。在线阅读链接,中文版链接。
- 《神经网络与深度学习》:神经网络是有史以来最漂亮的编程范例之一。在传统的编程方法中,我们告诉计算机要做什么,把大问题分解成许多小的、精确定义的任务,计算机可以轻松地执行这些任务。相反,在神经网络中,我们不会告诉计算机如何解决我们的问题。相反,它从观测数据中学习,找出自己解决手头问题的方法。
- Applied Machine Learning Spring 2020:哥伦比亚大学应用机器学习课程2020,GitHub, 视频。
- 《自然语言处理》:《自然语言处理》一书 pdf
- 《Structure and Interpretation of Computer Programs》:这是曾经 MIT 计算机系本科生的教材,用 Lisp 的一种极简的方言 Scheme 语言作为初学者编程语言 —— 而不是常用的 Java、Python、C,SICP 训练的是大家如何表达。
- 《The Art of Unix Programming》:Unix 有很多设计的智慧值得学习。
- 《Paul Graham‘s Essays》:Paul Graham 是硅谷著名的工程师、创业者、和投资人,创办了 Y Combinator,在他的主页上有一系列著名的文章。推荐等级:heart::heart::heart:!
- 《Optimization for Machine Learning》:机器学习最优化课程笔记
- Cambridge Textbooks:剑桥大学出版社免费开放了网页版高等教育教材,包含Cambridge Core(剑桥电子期刊和电子图书数据库)中超过700本教材,涵盖21个学科、领域。其中计算机领域提供了25本与计算机相关的高等教材。细分领域包括机器学习、数据科学、网络、编程等,而且教材大部分都特别新!
- Electrical Engineering and Computer Science:麻省理工学院(MIT)近日放出了 2400 门课程资料,其中也包括电气工程和计算机科学系的多门公开课。这个平台上课完全是为了解决自身知识盲区而来,它的各种 quiz、problem sets、project 等一系列辅助配套设施非常完善。线上教学的所有课件、教授所写的补充材料等都能下载下来以便随时复习。
- Ultimate Go:网友hoanhan101分享的一份完整Go语言学习笔记,里面记录了他从零开始学习Go语言时所用的方法,以及对应全部学习资料。Hackernews热度1天升至400,好评如潮
- Learn Go with Tests:Hackernews 上用户@olah_1推荐的一个Go语言课程,表示:Learn Go with Tests是我经历过的最好的编程语言课程
- Introducing Go:如果搞不明白Go是什么,可以去OReilly上查阅资料
- Gotraining:一个GitHub上:star:5k+的课程培训,Ardan Labs机构
- Roadmap:网友贡献自制Go学习思维导图
- Web Dev Golang Anti Textbook:学习如何在没有框架的情况下用Go语言编写web app
- hackernews讨论区:hackernews 上的 Go 讨论区
- The Go programming language:Go语言源码仓库
- Go 入门指南:《The Way to Go》中文译本,中文正式名《Go 入门指南》,Github上:star:近20k。在线电子书。
- Go指南: 该指南可以进行交互。点击 “运行”按钮(或按 Shift + Enter)可以在 远程服务器上 编译并执行程序。 结果展示在代码的下面。这些例子程序展示了 Go 的各个方面。在指南中的程序可以成为你积累经验的开始。
- Advanced Go Programming:Go语言高级编程,涵盖CGO、Go汇编语言、RPC实现、Web框架实现、分布式系统等高阶主题,针对Go语言有一定经验想深入了解Go语言各种高级用法的开发人员。
- Gopl-zh:Go语言圣经中文版,建议初学者先从该项目学起。
- 《Go2-book》:《Go2编程指南》开源图书,重点讲解Go2新特性,以及Go1教程中较少涉及的特性
- Python Patterns:如果说算法是一个程序员的九阳神功,那么设计模式就是你的乾坤大挪移。设计模式在日常工作中会经常用到,对于不同的场景会需要用到不同的模式。python-patterns是非常棒的一个项目,如果你可以跟着他一个个学的话,你回头看看昨天写代码,会有种“哪个傻逼写的垃圾代码啊”的错觉。GitHub:star:23.3k。推荐等级::heart::heart::heart::heart:!
- Python Weekly:一份免费的每周通讯,提供与Python相关的最佳手工策划的新闻、文章、新版本、工具和库、事件等,每周都会有更新。推荐等级::heart::heart::heart:!
- Pycrumbs:搜集了各种来自互联网的免费Python的资料,你可以收藏后慢慢看,GitHub:star:2.9k。推荐等级::heart::heart::heart::heart:!
- The Python Tutorial:Python官方文档(英文),官方文档无疑是最好学习Python的参考书
- Python 教程:Python官方文档(中文),适用于英文不好的人
- 《The Hitchhiker’s Guide to Python》:Python漫游指南(英文版),讲解了如何正确使用Python,是一本极佳的讲解Python实践的教程书。GitHub上收获了十分多的:star:
- Python最佳实践指南:Python漫游指南(中文版)
- 《Dive Into Python 3》:深入 Python3(英文版),网上大多人推荐的Python学习书
- 《深入 Python3》:深入 Python3(中文版)
- Learn Python:GitHub上一个:star:3k+的中文项目,以撸代码的形式学习Python,以Python代码加上注释作为教程,内容十分详细
- Python-100-Days:GitHub上一个:star:40k+的中文项目,带你100天从新手到大师
- Learn Python Programming:Programiz的 Python 教程
- What the fuck Python:GitHub上一个:star:15k的英文项目,讲述了一些有趣且鲜为人知的 Python 特性
- What the fuck Python-cn:What the fuck Python的中文版
- Pandas 教程:GitHub上一个:star:七百多的Pandas私人中文教程,适合初级到中级晋升者
- Pandas Profiling:十分简单轻松从panda DataFrame对象创建HTML分析报告,GitHub:star:4.4k,推荐等级:heart::heart::heart:!
- 知乎:哪些Python库让你相见恨晚?:知乎上的一个问题,下面许多大佬介绍了各种各样的Python库,一方面方便Python的使用,另一方面通过这些库可以更好地学习Python
- Practical Business Python:该网站旨在收集和传播关于如何在业务环境中更有效地使用python的想法,包括不少文章教程和代码。GitHub地址
- Develop with Python on Windows:在 Windows 上做 Python 开发太痛苦?微软最近发布了一系列官方教程,这些教程将指导使用者如何设置开发环境、是否在原生 Windows 或 Windows Subsystem for Linux (WSL) 系统上安装自己的工具,以及如何集成 VS Code、Git 等工具
- Awesome Python cn:Python资源大全中文版,包括:Web框架、网络爬虫、模板引擎、数据库、数据可视化、图片处理等,由伯乐在线持续更新。GitHub:star:15k,推荐等级::heart::heart::heart:!
- 30-seconds-of-python:一组有用的Python代码片段,可以在30秒或更少的时间内理解它们。
- Intro to Python Development:微软出品,文科生也能学得懂的Python免费入门视频。代码地址
- Python Tutorials Home:data-flair上推出的一个240多个的Python编程入门课程
- Intermediate Python:《Intermediate Python》,中文译名为《Python进阶》,该书对Python中的装饰器与推导式等高级用法做了详细说明,适合于掌握Python基础后的进一步提高。 中文译本
- Learn-python:Codeacademy 的教程,允许在浏览器内进行动手编程实践。这个 Python 入门课程涵盖 Python 基础语法、函数、控制流、循环、模块和类。
- Python Like You Mean It:掌握软件工程技能和最佳实践是明智的做法,这会使代码更具可读性和可扩展性。此外,当你开始将模型投入生产过程时,你需要写出高质量、测试良好的代码,并熟练使用版本控制等工具。「Python Like You Mean It」涵盖 PEP8 风格指南、文档,以及面向对象的编程。中文版。
- Python Is Cool:常常发资源的英伟达工程师小姐姐Chip Huyen,又发射了一套Python隐藏功能合集。里面都是她“从前没发现,或者从前不太敢用”的机器学习技巧,有notebook可以直接跑。合集名叫python-is-cool,推特宣布之后不到半天,已经收获了2400+赞。Notebook传送门。
- 利用 Python 进行数据分析 · 第 2 版:一本非常不错的 Python 数据分析入门系统教程。本书由 Python pandas 项目创始人Wes McKinney 亲笔撰写,详细介绍利用 Python 进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。第 2 版针对 Python 3.6 进行全面修订和更新,涵盖新版的 pandas、NumPy、IPython 和 Jupyter,并增加大量实际案例,可以帮助你高效解决一系列数据分析问题。翻译的 GitHub 地址, GitBook(有锚点功能),书籍下载地址,书籍代码的 GitHub 开源地址
- 《Deep Learning With Python》:一本很不错的学习 Python的书籍,书本代码是基于 Keras的,GitHub上已获:star:8k+,代码地址。
- Python Small Examples:Python小例子、小Demo一网打尽。Python基础、Web开发、数据科学、机器学习、TensorFlow、Pytorch,你能想到的基于Python的小Demo都在这里。在线网页版
- 《Classic Computer Science Problems in Python》:这本书不是对Python的介绍。相反,这本书假设您已经是一名中级或高级的Python程序员。尽管这本书需要Python3.7,但我们并不认为它能够精通最新版本的Python的每一个方面。事实上,这本书的内容是建立在这样一个假设上的:它将作为学习材料,帮助读者达到这样的掌握。另一方面,这本书不适合完全不熟悉Python的读者。
- Awesome Python:一个很棒的Python框架、库、软件和资源的列表,GitHub ⭐78k。推荐等级❤️❤️❤️❤️!
- Awesome Python in Education :关于Python的学习资源列表。
- 《Think Python》:Think Python》是很多计算机初学者的不二入门教材,受到广泛好评。该书原作者是美国 Olin 工程学院的教授 Allen B. Downey,目前该书的原版和中文版本都已免费开源。中文版地址。
- Python Tutor:Python Tutor 是由 Philip Guo 开发的一个免费教育工具,可帮助学生攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。通过这个工具,教师或学生可以直接在 Web 浏览器中编写 Python 代码,并逐步可视化地运行程序。如果你不知道代码在内存中是如何运行的,不妨把它拷贝到Tutor里可视化执行一遍,加深理解。
- Skulpt:Skulpt 是一个用 Javascript 实现的在线 Python 执行环境,它可以让你轻松在浏览器中运行 Python 代码。使用 skulpt 结合 CodeMirror 编辑器即可实现一个基本的在线Python编辑和运行环境。
- Awesome Python Applications:181 个 Python 开源项目,涵盖了 15 个领域。GitHub:star:10.8k,推荐等级:heart::heart::heart::heart:!
- 抖音机器人:使用 Python+ADB 做的 Python 抖音机器人。可以实现自动翻页、颜值检测、人脸识别、自动点赞、自动关注、随机防 Ban、自动评论等功能
- PythonRobotics:这是机器人算法的 Python 代码集合,尤其适用于自主导航。易于阅读并能快速理解每个算法的基本思想、选择被广泛使用和实用的算法、最低依赖性。
- Google Images Download:这是一个命令行 python 程序,用于搜索 Google Images 上的关键字 / 关键短语,并可选择将图像下载到本地计算机;还可以从另一个 python 文件调用此脚本。
- trape (stable) v2.0:Trape 是一种 OSINT 分析和研究工具,允许实时跟踪和执行智能社会工程学攻击。它的创建目的是向全世界介绍大型互联网公司如何获取机密信息,例如其网站或服务的会话状态,并通过浏览器控制用户,但它的发展是为了帮助政府和组织、公司和研究人员跟踪网络犯罪分子。
- xonsh:xonsh 是一个基于 Python 的跨平台,Unix shell 语言和命令提示符。该语言是 Python 3.4 + 的超集,带有额外的 shell 原语。xonsh(发音为 conch)适用于专家和新手的日常使用。
- rebound:Rebound 是一个命令行工具,可在收到编译器错误时立即获取 Stack Overflow 结果。只需使用 rebound 命令执行文件。
- GIF for Cli:接收 GIF,短视频或查询 Tenor GIF API 并将其转换为动画 ASCII 艺术。使用 ANSI 转义序列执行动画和颜色支持。
- Snips NLU:Snips NLU(自然语言理解)是一个 Python 库,允许解析用自然语言编写的句子并提取结构化信息。
- Social Mapper:ocial Mapper 是一种开源智能工具,它使用面部识别来大规模地关联不同站点的社交媒体配置文件。它采用自动化方法在流行的社交媒体网站上搜索目标名称和图片,以准确地检测和分组人员的存在,将结果输出到人类操作员可以快速查看的报告中。
- Sclack:命令行版 Slack,超酷
- Draw This:一个绘制漫画的宝丽来相机。拍照后会弹出一个涂鸦图片,这张图片是相机对它所见所闻的最佳诠释。相机是用于物体识别的神经网络、谷歌快速提取数据集、热敏打印机和树莓派的混搭。
- SimpleCoin:这是一个非常简单,不安全和不完整的用于 Python 中加密货币的区块链实现。该项目的目标是制定一种工作区块链货币,使其尽可能简单并用作教材。
- Lector:Qt 写的电子书阅读器。
- makesite.py:用 Python 中编写自己的简单、轻量级的静态站点生成器,完全控制静态网站 / 博客的生成。
- dbxfs:dbxfs 允许将 Dropbox 文件夹挂载,就像它是本地文件系统一样。它与官方 Dropbox 客户端的不同之处主要有两种:访问需要 Internet 连接;访问不需要磁盘空间,但如果磁盘空间可用,则会缓存。
- BabySploit:BabySploit 是一个渗透测试工具包,旨在让您轻松学习如何使用更大、更复杂的框架,如 Metasploit。通过一个非常易于使用的 UI 和工具包,任何经验级别的人都可以使用 BabySploit。
- ASCIIFY:使用 Python 的强大功能将图像转换为 ASCII Art。
- datasheets:datasheets 是一个用于与 Google 表格连接的库,包括从 Google 表格中读取、写入数据和修改 Google 表格的格式
- nonoCAPTCHA:一个异步 Python 库,使用 Mozilla 的 DeepSpeech,PocketSphinx,Microsoft Azure 和 Amazon 的 Transcribe Speech-to-Text API,通过音频自动解决 ReCAPTCHA v2。使用 Pyppeteer 构建 Chrome 自动化框架,与 Puppeteer 相似,PyDub 可轻松将 MP3 文件转换为 WAV,aiohttp 用于异步简约 Web 服务器,Python 内置 AsyncIO 以方便使用。
- Ubelt:Ubelt 是一个包含强大、经过测试、简单函数的可扩展 Python 标准库。
- pyCAIR:pyCAIR 是一个基于 Seam Carving for Content-Aware Image Resizing 的内容感知图像大小调整(CAIR)库。
- soundcloud-dl:以专辑封面和标签形式下载 128kbps 的 SoundCloud 音乐。
- Twitter Clean-up:Twitter 账户清理工具
- Face-tracking-with-Anime-characters:靠近摄像头,图片里的妹子会害羞的扭过头
- YouTube Download:Youtube 下载客户端。
- Spotify Playlist Generator:Spotify Playlist Generator 是一个 Python 脚本,每周都会使用新音乐自动构建一个新的 Spotify 播放列表。
- Depression and anxiety self-testing telegram bot:电报机器人用于抑郁和焦虑的自我测试。
- Face Recognition:GitHub上:star:20k+,世界上最简单的面部识别工具。它为Python和命令行提供了一个应用程序编程接口(API)。它对于识别和操纵图像中的面很有用。它使用dlib最先进的人脸识别算法构建。深度学习模型在Wild数据集中的Labeled Faces上具有99.38%的准确度。它还提供了一个简单的face_recognition命令行工具,可以让你用命令行本身图像文件夹进行人脸识别!
- Sherlock:神探夏洛特,全网查名!国外有个小哥在 GitHub 上开源了一个 Python 工具,借助这个工具,你便可以在各大社交网站上检索自己的用户名,看看自己的名称在哪几个网站上被占用了。在线体验地址
- PyRoyale:吃鸡版超级玛丽被复活 + 开源,用 Python 实现在线体验地址
- Deep Flow-Guided Video Inpainting:CVPR2019 一篇论文的开源代码,名叫光流引导 (Flow-Guided) 的视频修复算法,可以将视频中的人物抹去,而且毫无违和感,让人物消失的无影无踪
- Speech Driven Animation:进化版的造价AI,只要一张照片,说话唱歌视频自动生成,降维打击Deepfakes
- heartrate:一个由国外大神制作的 Python 神工具,可以实时动态地监控 Python 程序的运行情况,逐行追踪代码的运行时间,整个过程是可视化的
- Grid studio:GitHub上获:star:5k,一个基于网页的表格应用,完全结合了 Python 和 Excel 的优势,在一个界面上同时展示可视化表格与代码,而且同时通过表格与代码修改数据
- Dab And Tpose Controlled Lights:国外一个沙雕小哥写的Python项目,手把手教大家训练一个神经网络模型,用来识别摄像头拍下的“舞步”,从而控制灯的开关。上面还包括了作者已经搜集到的原始数据样例
- Python Handout:谷歌大脑出品的一款工具,只要敲代码,就能在任何文本编辑器里方便的转换成标题、代码、文本等各种样式,还能直接运行处Python代码的结果,相当于一个没有hidden state的Jupyter笔记本
- BossSensor:一个有趣的人脸识别项目,当老板靠近时,可以自动隐藏屏幕。
- DeepFool:DeepFool是一种在深度网络中寻找最小对抗性扰动的简单算法
- Fast-Generic-Face-Detector-1MB:用户 Linzaer 在 Github 上推出了一款适用于边缘计算设备、移动端设备以及 PC 的超轻量级通用人脸检测模型,该模型文件大小仅 1MB,320x240 输入下计算量仅 90MFlops。项目推出不久即引起了大家的关注,登上了最近的 Github trending。
- Cloud Annotations:GitHub ⭐ 2k+,比个手势,AI 自动识别 Emoji!
- BigBiGAN:DeepMind开源最牛无监督学习BigBiGAN预训练模型,开源代码可以在TF Hub上找到。论文地址以及预训练模型地址,示例使用。
- DRAW:最近,谷歌 DeepMInd 发表论文( DRAW: A Recurrent Neural Network For Image Generation),提出了一个用于图像生成的递归神经网络,该系统大大提高了 MNIST 上生成模型的质量。为更加深入了解 DRAW, Eric Jang 用 158 行 Python 代码实现该系统的思路,详细阐述了 DRAW 的概念、架构和优势等。代码地址
- Style2Paints:GitHub上:star:10k,为动漫线稿上色的一个工程!Demo
- Predictionio by Apache:GitHub上:star:10k,Apache PredictionIO是面向开发人员,数据科学家和最终用户的开源机器学习框架。 用户可以使用此框架构建真实的ML应用程序,部署和测试它们。它甚至支持事件收集,评估和查询预测结果。 它基于可扩展的开源服务,如Hadoop,HBase等。
- SickZil Machine:一群韩国小伙伴开发的一个完全自动消除漫画文字的 AI;但如果人类需要,也可以手动指定消除某一部分文字。
- rps_tfjs_demo:10 分钟内在浏览器中训练一个剪刀石头布识别模型教程,该项目使用了 TensorFlow.js,所有繁重的工作都发生在浏览器和 JavaScript 中。数据集地址
- Pedestrian Detection:本资源整理了一些目标检测的开放代码、论文列表、行人检测开源代码以及行人检测相关数据集。非常适合初学者与科研工作者。
- Celebrity-detection:GIPHY 开源了一个表情包识别器,可以分清楚超过 2300 个名人,而且它识别的还是动图,准确率超过 98%。良心的是,GIPHY 不仅把这个工具开源了,而且还直接用在了自己的网站上,不是 Demo,已经是成品。在线使用。
- ThunderNet:作者提出来一种名为ThunderNet的轻量级two-stage检测器,整体结构分成名为SNet的轻型Backbone(主干)和Detection(检测)部分,其中SNet是基于ShuffleNetV2网络,用于对象检测,Detection部分是基于Light-Head R-CNN,并进一步压缩RPN和R-CNN子网,并设计了两个模块:Context Enhancement Module (CEM) 和 SpatialAttention Module (SAM),CEM将多尺度的局部特征和全局特征进行整合,SAM引入RPN信息来再调整RoIwarping层的特征分布。ThunderNet在推理速度、精度均显著优于同类网络,可部署在ARM平台上实现实时检测。论文地址。
- Gaussian YOLOv3:在目标检测的落地项目中,实时性和精确性的trade-off至关重要,而YOLOv3是目前为止在这方面做得最好的算法。本文通过高斯分布的特性,改进YOLOv3使得网络能够输出每个检测框的不确定性,从而提升了网络的精度。论文地址。
- YOLO v3:停更许久的YOLOv3。论文及代码
- darknet]:目前该项目在github上已获得 5.8k ⭐,这个数量也相当之高,与原版YOLO区别在于:1. 提供Windows版本。2. 提供更详细的使用教程。3. 不停更新YOLOv3及衍生网络
- SimpleDet:SimpleDet 是一套简单且多功能的目标检测与实例分割的框架,其是基于MXNet开发完成。目前 SimpleDet 已获得 2.3k ⭐!
- mmDetection:mmDetection 是个非常强大的目标检测工具箱,也是基于PyTorch实现。目前 mmDetection 已获得 7.6k ⭐!
- Detectron2:Detectron2 前身就是鼎鼎大名的 Detectron,其实Detectron可以说是Facebook第一代检测工具箱,目前在github上获得 22.5k ⭐!
- PythonPlantsVsZombies:用 Python 实现植物大战僵尸代码
- Mario-Level-1:Python 和 Pygame写的超级马里奥第一关,GitHub:star:1.7k。
- PopMusicMaker:利用隐马尔科夫模型(HMM)和随机森林结构建立的流行音乐制作器。相关博客。
- TfPyth:一行代码切换TensorFlow与PyTorch,模型训练也能用俩框架
- Emotion-recognition:使用 Keras 实现的实时表情识别项目
- 自动微分法实现:200行写一个自动微分工具
- Autograd:自动微分的实现,有效地计算numpy代码的导数。
- AutodiffEngine:自动微分引擎,来源于华盛顿大学陈天奇的课程项目
- Taichi:太極(Taichi)是一个开源的计算机图形库,它旨在提供易于使用的计算机图形学基础架构,并提供了 40 多份计算机图形学重要研究的实现。出于效率的考虑,太極本身是由 C++ 构建的,但用 Python 包装了接口。GitHub:star:10.2k+。
- Difftaichi:微分太极。这一框架可以基于太極实现自动微分,在物理模拟优化方面有很高的性能和灵活性。GitHub:star:1.2k。ICLR论文
- Xlwings:xlwings是一个利用Python操作Excel 的库,在保持易用性的同时还具有相当快的处理速度。它适用于 Windows和 Mac上的 Microsoft Excel。GitHub:star:1.6k。
- Python Fire:Python Fire是一个用于从任何Python对象自动生成命令行接口(CLIs)的库,比其他命令行库更加方便易用。GitHub:star:16.3k。
- Pyforest:这是一个免费的Python库,使用Pyforest可在一行代码中导入所有python数据科学库。Pyforest目前可导入包括pandas、numpy、matplotlib等等众多的数据科学库。
- Pymatting:一键抠图,毛发毕现:这个GitHub项目助你快速PS
- RAdam:Radam是Adam的一个新变种,它可以校正自适应学习率的方差。这个版本带来了对Vanilla Adam优化器的一个实质性的改进,该优化器确实存在差异问题。GitHub:star:2k。
- LookAhead:图灵奖得主Hinton的团队同样在优化器上下了功夫,对SGD进行改进,提出了一种新的优化器LookAhead,在各种深度学习任务上实现了更快的收敛。
- Ranger:将RAdam和LookAhead结合在一起,RAdam的效果又进一步优化了,这一协同组合命名为Ranger。
- Real Time Voice Cloning:实时语音克隆,相关论文:《Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis》
- UGATIT:图像翻译,相关论文:《U-GAT-IT: Unsupervised Generative Attentional Networks with Adaptive Layer-Instance Normalization for Image-to-Image Translation》
- Dlrm:推荐系统,相关论文:《Deep Learning Recommendation Model for Personalization and Recommendation Systems》
- TecoGAN:生成式对抗网络,相关论文:《Learning Temporal Coherence via Self-Supervision for GAN-based Video Generation》
- Megatron-LM:语言模型
- TensorNetwork:张量网络,相关论文: 《TensorNetwork for Machine Learning》
- Python_autocomplete:代码自动补全
- Buffalo:推荐系统
- Realistic-Neural-Talking-Head-Models:图像生成,相关论文:《Few-Shot Adversarial Learning of Realistic Neural Talking Head Models》
- Python爬虫:一份十五天学会Python爬虫的教程。
- Python2爬虫学习系列教程:一份详尽的爬虫教程博客,涵盖入门、实战、进阶。
- Awesome Spider:GitHub上:star:8k+的项目,收集了各种爬虫的Python实现代码,推荐等级::heart::heart::heart:!
- Fuck Login:GitHub上:star:5k+的项目,模拟登录一些知名的网站,为了方便爬取需要登录的网站。
- Python Spider:Python3网络爬虫实战:VIP视频破解助手;GEETEST验证码破解;小说、动漫下载;手机APP爬取;财务报表入库;火车票抢票;抖音APP视频下载;百万英雄辅助;网易云音乐下载;B站视频和弹幕下载。
- 12306:这很可能是全GitHub最德高望重的购票小助手了,功能一直在更新,且现已支持Python 3.6以上版本。Github 获:star:20k,推荐等级::heart::heart:!
- Py12306:基于上述"12306"项目的另一个抢票项目,支持分布式抢票。Github 获:star:7k+
- 12306 code server:用于构建自托管的12306验证码识别服务器项目,GitHub ⭐2k
- easy12306:使用机器学习算法完成对12306验证码的自动识别的项目
- Photon:为 OSINT 设计的爬虫,速度极其夸张!
- XSStrike:XSStrike 是一个 Cross Site Scripting 检测套件,配备四个手写解析器,一个智能有效负载生成器,一个强大的模糊引擎和一个非常快速的爬虫
- Twitter Scraper:作者逆向了 Twitter 前端 API,消除了官方 API 速率限制,非常快。
- AutoCrawler:Google,Naver 多进程图像抓取工具(高品质,高速度和可自定义)。
- Scrapy Cookbook:Scrapy中文文档
- SourceCodeOfBook:《Python爬虫开发 从入门到实战》配套源代码
- Nbviewer: 在线渲染 Jupyter 文件的网页,只需要输入 Github 仓库地址即可。
- Nbdev:fast.ai 创始研究员 Jeremy Howard 撰文介绍了 fast.ai 最近提出的新型编程环境 nbdev,它基于 Jupyter Notebook 构建,并将 IDE 编辑器的优点带入 Jupyter Notebook,可以在 Notebooks 中开发而不影响整个项目生命周期。文档
- Reviewnb:Code Reviews for Jupyter Notebooks,Jupyter Notebook 的代码审查工具。介绍博客:Introducing ReviewNB: Code Reviews for Jupyter Notebooks
- Polynote:使用类似 Jupyter Notebook 进行数据分析和机器学习是近来较为方便灵活的开发方式,但是 Jupyter Notebook 缺乏对多种语言的原生支持,在管理笔记本内的依赖、数据可视化等方面有所欠缺。近日,NetFlix 公司将其数据分析和机器学习开发工具 Polynote 开源。这一工具支持多语言在一个笔记本程序内运行,还增加了很多新特性,值得尝试使用。推荐等级::heart:!
- Deepnote:对全世界的 Python 高手而言,Jupyter Notebook 是目前最流行的编程环境,但它也有一些令人难以忍受的缺点。为此,一个位于旧金山的小团队开发了一款名为 Deepnote 的笔记本工具,这是一种云协作、云硬件,上云的 Notebook 编程环境。Pindrop 的高级研究科学家 Anthony Agnone 认为,Deepnote 已经表现出了超越 Jupyter Notebook 的趋势。推荐等级::heart::heart::heart:!
- Awesome JupyterLab:Jupyter lab 插件和资源大全列表,GitHub::star:1k。
- Awesome Jupyter:Jupyter 插件和资源大全列表,GitHub::star:1.4k。
- A gallery of interesting Jupyter Notebooks:有趣的 Jupyter Notebooks 介绍
- Deep Learning Models:GitHub上:star:10.8k+的项目,rasbt在Github上整理了关于深度学习模型TensorFlow和Pytorch代码实现集合,含有100个,各种各样的深度学习架构,模型,和技巧的集合Jupyter Notebooks,从基础的逻辑回归到神经网络到CNN到GNN等,可谓一网打尽,值得收藏!推荐等级::heart::heart::heart::heart:!
- Awesome Machine Learning Jupyter Notebooks For Colab:机器学习和深度学习教程的列表,以Jupyter笔记本格式运行在谷歌Colab上,推荐等级::heart::heart:!
- Topic: Jupyterlab Extension:GitHub上关于Jupyter lab插件的话题讨论
- Topic: Jupyterlab:GitHub上关于 Jupyter lab的话题讨论
- Jupyterlab:Jupyterlab 官方仓库
- Jupytext:Jupytext,顾名思义,能够把 Jupyter Notebook 的内容转化成纯文本,用你最顺手的 IDE 打开。Jupytext 现在支持的语言还不能覆盖 Jupyter Notebook 的全部,但搞定了最流行的几种。它支持 Jupyter Notebook 和下面这些格式之间的相互转换:Julia 脚本(.jl)、Python 脚本(.py)、R 脚本(.R)、Markdown 文件(.md)、R Markdown 文件(.Rmd)。Jupytext 作者 Marc Wouts 在博客 Jupytext 1.0 highlights 展示了怎样借助这个工具在 IDE 或者编辑器里来编辑 Jupyter Notebook、进行版本控制。
- Marc Wouts:Jupyter 作者 Marc Wouts 的 Medium 博客主页。
- Tf2_course:官方推荐,用tf.keras和TensorFlow2.0做深度学习任务的Jupyter教程
- Feature-Engineering-Handbook:一份系统的特征工程教程,介绍了如何利用 scikit-learn 处理静态的连续变量,利用 Category Encoders 处理静态的类别变量以及利用 Featuretools 处理常见的时间序列变量。
- Jupyterlab Debugger:首款 Jupyter 官方可视化 Debug 工具,JupyterLab 未来可默认支持 Debug。虽然这只是第一版,但目前已经可以设置常见的断点 Debug,查看各种变量、执行模块等信息。博客文章:A visual debugger for Jupyter。
- Binder:可以将一个 Git repo 转换为一个交互式 Jupyter notebook 集合。
- Numpy Machine Learning:普林斯顿博士后 David Bourgin 最近在GitHub上开源的一个非常剽悍的项目,用 NumPy 手写所有主流 ML 模型,超过 3 万行代码、30 多个模型。推荐等级::heart::heart::heart:!
- 机器学习原理:GitHbu上:star:五百多的小项目,内容都是网上扒来的,前半部分关注数学基础,机器学习和深度学习的理论部分,详尽的公式推导。后半部分关注工程实践和理论应用部分
- 机器学习原理笔记整理:机器学习原理项目笔记
- 数据竞赛Top解决方案开源整理:涵盖大量数据竞赛的解题方案代码,适合作为学习机器学习的实践代码参考
- Librec:Librec是一个利用Java写的推荐系统库,涵盖了大量推荐系统常用算法
- Homemade Machine Learning:GitHub上:star:12k的项目,内容包含大多流行的机器学习算法的Python手工实现,并未使用常见的深度学习框架(TensofFlow等),便于理解算法原理,同时还附有数学原理以及Demo展示,十分适合自学的机器学习,作者博客:Jack Cui
- USF Data Institute:USF大学数据研究所主页,上面有许多关于机器学习的博客文章,有空看看十分涨知识
- Deep Learning Book:深度学习界的大佬Ian Goodfellow 和 Yoshua Bengio所著的深度学习书。中文版GitHub仓库已获20k+,PDF下载。推荐等级::heart::heart::heart:!
- Baidu AI Studio:百度的 AI 工作室,里面有各种机器学习数据集、文章、项目,可用作机器学习实践教程
- NLP Tutorial:一个很赞NLP入门代码练习库(含Pytorch和TensorFlow版本)
- 10 Minutes to pandas:官方文档,十分钟上手 pandas 教程
- Numpy developer guide:官方学习文档,Numpy 上手指南
- Pandas 中文文档:Pandas 官方中文文档的仓库。 域名访问。
- Numpy 中文文档:Numpy 官方中文文档的仓库。 域名访问。推荐等级::heart::heart::heart::heart:!
- Matplotlib 中文文档:Matplotlib 官方中文文档的仓库。 域名访问。
- Scipy developer guide:官方学习文档,Scipy 上手指南
- ICME2019 Bytedance Grand Challenge:抖音短视频推荐大赛小规模赛道Top8模型代码
- AI-神经网络基本原理简明教程:GitHub上微软人工智能教育与学习共建社区,微软Xiaowuhu根据自己亲身经历的学习轨迹,归纳出了以下教程,可以帮助小白做到真正的从入门到精通。通过以下循序渐进地学习与动手实践,一方面可以帮助读者深刻理解“深度学习”的基础知识,更好地理解并使用现有框架,另一方面可以助力读者快速学习最新出现的各种神经网络的扩展或者变型,跟上快速发展的AI浪潮
- Awesome Knowledge Distillation:作为模型压缩的一种方法,知识蒸馏能够利用已经训练的一个较复杂的模型,来指导一个较轻量的模型训练,从而在减小模型大小和计算资源的同时,尽量保持原始大模型的准确率的方法。Github上的dkozlov同学,整理了Knowledge Distilling的paper、教程、代码,看完这些资料,你一定有所收获
- Awesome Machine Learning cn:机器学习资源大全中文版,包括机器学习领域的框架、库以及软件。GitHub:star:3k
- Machine Learning Learning Notes:周志华《机器学习》的学习笔记,记录了作者在学习这本书的过程中的理解思路以及一些有助于消化书内容的拓展知识,笔记中参考了许多网上的大牛经典博客以及李航《统计学习》的内容
- Models – IBM Developer:IBM开放的预训练深度模型库,目前一共有32个模型,分为可部署和可训练模型两类,涉及18个领域
- SOTA:机器之心出品的机器学习中state-of-the-art论文和模型搜索工具
- Machine Learning Road:一份机器学习资源列表,内容包括课程资源及电子书下载链接。
- Super-Machine-Learning-Revision-Notes:一份长约 80 页的学习笔记,旨在总结机器学习的一系列基本概念(如梯度下降、反向传播等),不同的机器学习算法和流行模型,以及一些作者在实践中学到的技巧和经验。
- Data-Science-Competitions:一份kaggle竞赛的解决方案,集锦,汇集了多项回归、分类、时序分析、推荐系统、信号处理、语义分割等任务。
- Analytics Vidnya:一个国外的网站,有各类深度学习相关的教程,推荐等级::heart::heart::heart:!
- Machine Learning: a Probabilistic Perspective:谷歌研究员Kevin Patrick Murphy撰写的经典机器学习图书,由MIT出版社出版,自2012年发行以来就奉为经典机器学习书目。本书内容完整,讲解详细,便于阅读,方便工程使用。最近作者在Github上发布了关于本书的Python代码,更加方便使用!配套Python代码。
- Dataquest.io:Dataquest 提供完整的数据分析师、数据科学家和数据工程师学习路径。其中大量内容,尤其是数据分析师学习路径的内容可以免费获取。如果你资金充足,我强烈建议你付费订阅并学习这些内容。我学了这个课程,从中了解到数据科学的基础知识。数据科学家路径课程花费了我 6 个月时间。每个月的价格从 24.5 美元到 49 美元不等,这取决于你是否购买年费会员。资金充足的话,购买年费会员更划算
- Amueller:如果你已经学完了 Dataquest 上的数据科学课程,那么你应该对使用 Python 执行机器学习的基础知识有了充分了解。如果还没有,这方面也有很多免费资源。我推荐首先从 scikit-learn 开始学起,因为 scikit-learn 是目前最常用的机器学习 Python 库。很幸运,scikit-learn 核心开发者之一 Andreas Mueller 举办了为期两天的 workshop,同时发布了该课程的所有材料,包含幻灯片、课程笔记和 notebook。推荐大家先学习这份资料。
- Scikit-learn:接下来,我推荐大家学习 scikit-learn 官方文档中的一些教程。之后,大家就可以构建一些实际机器学习应用,学习模型运行背后的理论了。
- Scikit-learn 贡献指南:scikit-learn 贡献指南旨在促进开发者对 scikit-learn 库的贡献,但它实际上也涉及最佳实践。它包括 GitHub、单元测试、debug 等话题,而且其写作背景是数据科学应用。
- SpaCy:spaCy是一个超级有用且灵活的自然语言处理(NLP)库和框架,用于清理文本文档以进行模型创建。与用于类似任务的其他库相比,SpaCy更快。GitHub:star:15.8k。
- Fast.Ai:要想对深度学习有一个全面的了解,我觉得 fast.ai 是最好的选择,它完全免费且没有广告。该课程包含机器学习导论、深度学习实践、计算线性代数和自然语言处理导论(代码优先)。所有课程都以实践为先,强烈推荐大家学习这些课。深度学习课程Practical Deep Learning for Coders,推荐等级::heart::heart::heart:!
- Super Machine Learning Revision Notes:一份长约 80 页的学习笔记,旨在总结机器学习的一系列基本概念(如梯度下降、反向传播等),不同的机器学习算法和流行模型,以及一些作者在实践中学到的技巧和经验。推荐等级::heart::heart:!
- Machine Learning Course:Python 机器学习在线指南,本项目的目的是通过使用 Python 提供一系列简单而全面的教程来梳理机器学习的最重要方面。Github上:star:6k+。在线阅读,推荐等级::heart::heart:!
- Machine Learning Notes:一份机器学习的笔记,由哥伦比亚大学研究生张威整理。张威同学本科毕业于加拿大滑铁卢大学电子工程系,曾经联合带队参加 2016 年 IEEE 数字信号处理大赛获得前 10 的名次,也曾在微软亚洲研究院副院长郭百宁老师研究组和首席研究员曾文军老师研究组实习。在哥伦比亚大学,张威同学也担任过《Bayesian Model Machine Learning》这门机器学习进阶课程的助教。课程地址。推荐等级::heart::heart:!
- Dimensionality Reduction Alo Codes:网上关于各种降维算法的资料参差不齐,同时大部分不提供源代码。这个 GitHub 项目整理了使用 Python 实现了 11 种经典的数据抽取(数据降维)算法,包括:PCA、LDA、MDS、LLE、TSNE 等,并附有相关资料、展示效果;非常适合机器学习初学者和刚刚入坑数据挖掘的小伙伴。
- Edwardlib:Edward是一个用于概率建模、推理和评论的Python库。它是使用概率模型进行快速实验和研究的试验台,范围从小数据集上的经典层次模型到大数据集上的复杂深度概率模型。Edward融合了三个领域:贝叶斯统计和机器学习、深度学习和概率编程。
- OCR-IdentificationIDElement:2019CCF-BDCI大赛 最佳创新探索奖获得者 基于OCR身份证要素提取赛题冠军 天晨破晓团队 赛题源码
- PC-DARTS:在此论文中,来自上海交通大学和华为诺亚方舟实验室的研究人员提出了一种基于部分通道采样的内存高效的可微网络结构搜索方法方法,能够显著提升可微式搜索的速度和性能。该方法在 CIFAR10 数据集上,只需要 0.1 个 GPU 天(单卡 1.5 小时)就可以完成一次搜索过程,并且达到 2.57% 的测试错误率;即使在 ImageNet 数据集上直接搜索,该方法也只需要 3.8 个 GPU 天(8 卡 11.5 小时),并且在 ImageNet 的移动设定(600M 运算)中达到 24.2%/7.3% 的 top-1/top-5 测试错误率。难得的是,该方法展示出了在不同参数设定下的搜索稳定性,能够很容易地应用于不同的实际场景。GitHub地址
- SQLFlow:开源项目SQLFlow,它是SQL引擎(如MySQL、HIVE等)和机器学习引擎(如TensorFlow、XGBoost等)之间的桥梁。它扩展了SQL语义,使得它能够进行模型训练、预测和解释。GitHub:star:3.5k+
- ILearnDeepLearning.py:包含了与神经网络和深度学习相关的小项目,尝试只使用 NumPy 构建,通过解决简单的分类问题来测试模型,并将其与 Keras 构建的神经网络进行性能比较。推荐等级::heart::heart:!
- CDCS:CDCS 中国数据竞赛优胜解集锦,GitHub:star:1.6k
- PKUSeg:北大开源的一个中文分词工具包,名为PKUSeg,基于Python。工具包的分词准确率,远远超过THULAC和结巴分词这两位重要选手。GitHub:star:4.6k。
- JAX:JAX由谷歌提出,是TensorFlow的简化库。结合了针对线性代数的编译器XLA,和自动区分本地 Python 和 Numpy 代码的库Autograd,在高性能的机器学习研究中使用。GitHub:star:6.9k
- Trax:Trax 是一个开源项目,它的目的在于帮助我们挖掘并理解高一阶的深度学习模型。谷歌大脑表示,该项目希望 Trax 代码做到非常整洁与直观,并同时令 Reformer 这类高阶深度学习达到最好的效果。GitHub:star:3.4k。入门简介地址。最后,这个项目最重要的还是它的实现代码,我们并不是因为可以直接运行而使用它。相反,我们是因为它的代码直观简洁,能帮助我们一步步更深刻地理解模型而使用它。推荐等级::heart::heart::heart::heart:!
- TensorRT:TensorRT是一个C++库,用于NVIDIA GPU和深度学习加速器上的高性能推理。
- DeepCTR:深度学习点击率算法预测包,PyTorch版本。
- Data Science Group:一个通过机器学习来推动创新的学生组织,内有一些有趣的项目值得学习。
- Hashing Deep Learning:在该论文中采用的局部敏感哈希(Locality Sensitive Hashing)算法,并在神经网络中使用了自适应 dropout,在 Amazon-670K 这样的复杂分类数据集上,超一亿参数量的大型神经网络训练时间竟然是 SLIDE + CPU 最快,连 TensorFlow + Tesla V100 都要慢很多,而且从迭代步数上看,它们两者是等价的,表明模型的收敛行为是相同的。
- AutoML-Zero:AutoML是一种实现从数据集到机器学习模型的自动化方法,让你无需高深专业知识,就能自动部署ML模型。这一研究来自谷歌大脑的Quoc V.Le大神之手。AutoML-Zero 仅使用基本数学运算为基础,从一段空程序开始,即可自动发现解决机器学习任务的计算机程序。论文地址
- Neural Tangents:推导有限网络的无限宽度限制需要大量的数学知识,并且必须针对不同研究的体系结构分别进行计算。对工程技术水平的要求也很高。谷歌最新开源的 Neural Tangents,旨在解决这个问题,让研究人员能够轻松建立、训练无限宽神经网络。甚至只需要5行代码,就能够打造一个无限宽神经网络模型。这一研究成果已经中了ICLR 2020。戳进Colab链接,即可在线试玩。论文地址,Colab地址,GitHub地址
- Jittor:清华大学开发了一个名为计图(Jittor)的深度学习框架。这一框架有望为深度学习社区提供新的方案,也能够推动深度学习框架国产化的进程。据官网介绍说:「研究团队将神经网络所需的基本算子定义为元算子」,元算子非常底层,通过相互融合可以完成复杂的深度学习计算,体现出了易于使用的特点。并且研发团队表示,采用元算子的 Jittor 已超越 Numpy,能够实现更复杂更高效的操作。GitHub⭐1k+。
- MegEngine:旷视科技在北京发布了新一代人工智能生产平台天元(MegEngine),其「训练推理一体」、「动静合一」、「兼容并包」、「灵活高效」的强大性能或许将为 AI 领域带来新的风向。天元与目前流行的 TensorFlow、PyTorch 相似,旨在让更多的人可以在其基础上构建自己的应用,创造属于自己的价值。GitHub⭐600+
- MindSpore:MindSpore 是华为人工智能解决方案的重要组成部分,与 TensorFlow、PyTorch、PaddlePaddle 等流行深度学习框架对标,旨在大幅度降低 AI 应用开发门槛,让人工智能无处不在。源码
- MMT:港中文开源无监督学习框架MMT,提供更鲁棒的伪标签,旨在解决更实际的开放集无监督领域自适应问题,ICLR 2020 论文:《Mutual Mean-Teaching: Pseudo Label Refinery for Unsupervised Domain Adaptation on Person Re-identification》
-
Autokeras:它使用了高效神经架构搜索ENAS,只需使用 pip install autokeras 就能快速轻松地安装软件包,然后就能用自己的数据集来执行自己的架构搜索构建思路。相比谷歌 AutoML,两者构建思路类似,但不同的是,AutoKeras 所有代码都已经开源,可供开发者无偿使用。GitHub:star:6.6k。
-
TPOT:TPOT 是一个 Python 编写的软件包,利用遗传算法行特征选择和算法模型选择,仅需几行代码,就能生成完整的机器学习代码。在机器学习模型开发图中,TPOT 所完成的即通过利用遗传算法,分析数千种可能的组合,为模型、参数找到最佳的组合,从而自动化机器学习中的模型选择及调参部分。GitHub:star:6.7k。
-
Featuretools:这是一个用于自动化特性工程的开源 python 框架,它可以帮助开发者从一组相关数据表中自动构造特征。开发者只需要知道数据表的基本结构和它们之间的关系,然后在实体集(一种数据结构)中指明。然后在有了实体集之后,使用一个名为深度特征合成(DFS)的方法,在一个函数调用中构建出数千个特征。官网,GitHub:star:4.6k。
-
AdaNet:AdaNet 是由谷歌开源的一个轻量级的基于 TensorFlow 框架。AdaNet 易于使用,并能创建高质量的模型,为 ML 实践者节省了用于选择最佳神经网络架构的时间,实现了一种将学习神经架构作为子网络集合的自适应算法。官方文档,GitHub:star:3k。
-
NNI (Neural Network Intelligence):2018年9月,微软亚洲研究院发布了第一版 NNI (Neural Network Intelligence) ,目前已在 GitHub 上获得 ⭐3.8K ,成为最热门的自动机器学习(AutoML)开源项目之一。最新版本的 NNI 对机器学习生命周期的各个环节做了更加全面的支持,包括特征工程、神经网络架构搜索(NAS)、超参调优和模型压缩在内的步骤,你都能使用自动机器学习算法来完成。
-
NNI:有了 AutoML,特征工程、神经架构和超参搜索这些炼金基本功再也不用担心了。作为科技巨头,微软也在 AutoML 上开源了自己的 NNI 库,这个库在 GitHub 上非常流行,长期盘踞在每日项目 Trending 榜,GitHub:star:5.7k。根据 GitHub 项目上的介绍,NNI(Neural Network Intelligence)意图帮助用户使用自动机器学习算法、帮助进行算法加速、实现更好的超参数、神经架构和模型压缩,以及进行平台部署。
-
Keras Tuner:基于 Keras 的模型调参工具,GitHub:star:1.7k
-
AutoGluon:亚马逊AWS推出新的基于mxnet的开源库AutoGluon,只需三行代码,自动生成高性能模型,让调参、神经架构搜索等过程实现自动化,无需研究人员人工决策,大大降低了机器学习模型的使用门槛。官方文档。
-
Optuna:Optuna是一款为机器学习任务设计的自动超参数优化软件框架,是一款按运行定义(define-by-run) 原则设计的优化软件,允许用户动态地调整搜索空间,在同类软件中尤属首创,是下一代超参调优框架的代表。GitHub⭐1.9k,
-
Hyperopt:分布式异步超参数优化,GitHub:star:4.3k。
-
HungaBunga:Hungabunga项目将帮助你比大多数数据科学图书馆更快地找到答案。它贯穿全部的sklearn模型,使用所有可能的超参数,并使用交叉验证对它们进行排序
-
Auto sklearn:利用scikit-learn 进行自动机器学习,GitHub:star:4.4k。
- CV成长指南:一本长达81页的CV成长指南,能给你无微不至的关怀:从装Python、装OpenCV、入门深度学习,到人脸识别、目标检测、语义分割等等各种应用,都有进阶路线,里面包含了教程、案例、注意事项。甚至怎样把算法部署到树莓派之类的硬件上,也能找到经验。
- Mastering OpenCV 4:一本关于 OpenCV 4 的教材,就是《Mastering OpenCV 4 - Third Edition》,中文译为《精通 OpenCV 4》,对应的代码仓库。
- OpenCV-Python Tutorial:一份YouTube上最火的 OpenCV-Python 入门视频教程,该教程由CodeBind网站博主录制,从今年2月份到现在已经录制了38个主题。目前已有26万+人次观看,是目前 YouTube 上最受欢迎的OpenCV视频教程。
- ImageProcessing100Wen:图像处理入门 100 题,主要针对图像处理的一些基本操作,非常适合入门!该项目最大的特色就是 100 题循序渐进,基本涵盖了 OpenCV 的关键知识点。如果你正在入门 CV,正在学习 OpenCV,那么这个项目将会是一个不错的从入门到进阶的教程。
- OpenPose:OpenPose 人体姿态识别项目是美国卡耐基梅隆大学(CMU)基于卷积神经网络和监督学习并以 caffe 为框架开发的开源库。它可以实现人体动作、面部表情、手指运动等姿态估计。适用于单人和多人,具有极好的鲁棒性。是世界上首个基于深度学习的实时多人二维姿态估计应用,很多人体姿态估计实例都是基于它实现,如动作采集、3D 试衣、绘画辅助等。GitHub:star:15.9k。
- facenet:FaceNet 采用了深度卷积神经网络(CNN)学习将图像映射到欧式空间,也被称为通用人脸识别系统。该系统可从人脸中提取高质量的特征,称为人脸嵌入(face embeddings),可用于训练人脸识别系统,从而实现对人脸的验证。它在 LFW 数据集上测试的准确率达到了 99.63%,在 YouTube Faces DB 数据集上准确率为 95.12%。GitHub:star:10k。
- ShuffleNet Series:这是一个计算机视觉项目!shufflenet是一种计算效率极高的卷积神经网络(CNN)结构。它是为计算能力非常有限的移动设备设计的。这个github存储库包括多个shufflenet模型。
- AwesomeCV:记录state-of-art计算机视觉相关论文。
-
UCL Course on RL:David Silver 的强化学习课程。
-
《Reinforcement Learning: An introduction》:Richard Sutton 和 Andrew Barto的《强化学习:简介(第二版)》。书籍主页,代码地址,课后习题,David sliver中文字幕视频。推荐等级::heart::heart::heart::heart:!
-
《Reinforcement Learning》:Denny Britz 亲自 用 Python,OpenAI Gym 和 TensorFlow 实现了上述两份教材资源的大多数标准强化算法,并把它们都共享了出来,方便大家配合教材食用。在这份万星资源里,每个文件夹都对应着教材的一个或多个章节。除了练习和解决方案之外,每个文件夹下还包含了一系列学习目标,基础概念摘要,以及相关链接。GitHub已收:star:10k+
-
Rainbow is All You Need:一份用 Jypyter Notebook 写的深度强化学习(Deep Reiforcement Learning)笔记,背景理论、代码实现全都有,手把手教你从 DQN 到Rainbow 。 GitHub地址,推荐等级::heart::heart::heart::heart:!
-
Pg Is All You Need:手把手教你掌握 Policy Gradients 算法。
-
Practical_RL:Github上一份强化学习教程
-
DeepRL:由“深度强化学习实验室(DeepRL-Lab)”创建,希望能够为所有DRL研究者,学习者和爱好者提供一个交流平台。
-
DeepMind:DeepMind 发布了一系列新的开源技术,包括三种 DRL 框架:OpenSpiel、SpriteWorld 和 Bsuite,这些技术将有助于简化 DRL 方法的应用。
- OpenSpiel:OpenSpiel 是一系列环境和算法的集合,用于研究一般强化学习和游戏中的搜索/规划。OpenSpiel 的核心实现是基于 C++和 Python 绑定,便于在不同的深度学习框架中采用。该框架包含了一系列游戏组合,允许 DRL 智能体掌握合作和竞争行为。类似地,OpenSpiel 包含了多种 DRL 算法组合,例如:搜索、优化和单一智能体等。OpenSpiel 还包括分析学习动态和其他常见评估指标的工具。游戏和实用程序功能(例如:计算)是用 C++编写的。这些也可以使用 pybind11 python(2.7 和 3)绑定。
- SpriteWorld:SpriteWorld 是一个基于 python 的强化学习环境,它由一个可以自由移动的简单形状的二维竞技场组成。更具体地说,SpriteWorld 是一个二维方形竞技场,有不同数量的彩色 Sprites,可以自由放置和渲染,但不会发生碰撞。SpriteWorld 也可以用于强化学习以外的其他目的。
- bsuite:DeepMind试图将 bsuite(Behaviour Suite for Reinforcement Learning,强化学习行为套件)打造成为强化学习领域 的 MNIST。具体而言,bsuite 是一系列实验,旨在突出智能体可扩展性的关键点。这些实验都体现了一些基本的问题,例如「探索」或「记忆」,其实验方式可以很容易地进行测试和迭代。
-
Simple Beginner’s guide to Reinforcement Learning & its implementation:强化学习初学者教程,理论与代码实践。另一篇A Hands-On Introduction to Deep Q-Learning using OpenAI Gym in Python,推荐等级::heart::heart::heart:!
-
Awesome Reinforcement Learning:强化学习资源大全,Github:star:5k+,推荐等级::heart::heart::heart:!
-
21 Deep Learning Videos:21个强化学习教程视频(YouTube2016)。
-
RL Courser:YouTube上的强化学习公开课。
-
Reinforcement Learning:Theory and Algorithms:微软首席研究经理Alekh Agarwal、UIUC助理教授姜楠、华盛顿研究基金会数据科学主席Sham M. Kakade合编的新书《强化学习:理论与算法》,83页pdf,讲述了强化学习最新进展,包括MDP、样本复杂度、策略探索、PG、值函数等关键议题,是了解强化学习的材料。
-
Playing Games:深度强化学习的快速发展最直接的应用和体现就在“游戏”领域,目前DRL技术主要在视频帧游戏(Atari)、棋牌游戏(Go)、实时策略游戏、Board 游戏、球类(Football)等游戏中有广泛的研究,然而很多人看了领域大牛、顶级研究机构发的论文,一头雾水,主要原因是一方面自身coding能力不是足够高,另外一方面已发表的论文省略了众多细节,导致无法复现进行研究。该开源项目就是一些强化学习复现的论文及相关代码进行了汇总,从Paper到Coding, 一览深度强化学习挑战34类游戏。
-
《A Beginner's Guide to Deep Reinforcement Learning》:一份简明《深度强化学习初学者指南》实用的教程
-
《Deep Reinforcement Learning Hands On》:这本书提供了一个实际的方法,通过平衡理论和编码实践的RL。一本书,让你动起手来,但也有大量的知识,如何正确地做,并了解背后发生的事情。这是一本关于 RL 的最佳实践风格书。
-
JAX:JAX由谷歌提出,是TensorFlow的简化库。结合了针对线性代数的编译器XLA,和自动区分本地 Python 和 Numpy 代码的库Autograd,在高性能的机器学习研究中使用。GitHub:star:6.9k
-
HAIKU:DeepMind发布了Haiku和RLax两个库,都是基于JAX。Haiku是基于JAX的神经网络库,允许用户使用熟悉的面向对象程序设计模型,可完全访问 JAX 的纯函数变换。
-
RLAX:RLax是JAX顶层的库,它提供了用于实现强化学习代理的有用构件。它所提供的操作和函数不是完整的算法,而是强化学习特定数学操作的实现。
-
IntroRL:香港中文大学(CUHK)信息工程系助理教授周博磊就有了一个大胆的想法,他决定把自己每周的《强化学习》课程用中文在 B 站上进行直播。除了直播和课程视频之外,周博磊还会同步更新课程的代码,使用的编程语言为 Python,深度学习框架则是 TensorFlow 和 PyTorch 皆可(PyTorch 为主)。和常规的课程一样,《强化学习纲要》也会在每节课后留下一些作业。
-
Introduction to Reinforcement Learning:David Silver 在 UCL 讲授的强化学习入门课程。没错,就是来自 DeepMind 那个在 Nature 上发表了 DQN 论文,紧接着提出 AlphaGo 和 AlphaGo Zero,从此掀起深度强化学习研究浪潮的 Silver。他的课程深入浅出,在介绍强化学习概念的过程中穿插了很多例子,对初学者非常友好,建议作为第一个观看的入门视频课程。
-
Deep Reinforcement Learning:台大李宏毅的强化学习课程
-
OpenAI Spinning Up:从 VPG(Vanilla Policy Gradient) 到 TRPO(Trust Region Policy Optimization)、SAC(Soft Actor-Critic) 均有实现,关键是 OpenAI 出品,代码质量高。
-
Stable Baselines:大量深度强化学习算法优质实现,文档丰富,包含 Colab Notebook,深度强化学习入坑必看 repo。
-
Pieter Abbeel & Sergey Levine:两位在深度强化学习领域非常有名的科学家——Pieter Abbeel 与 Sergey Levine。他们长期致力于深度强化学习的教学、研究等工作,在其个人主页可以找到很多他们所讲授课程的链接。
-
SEED RL:Scalable and Efficient Deep-RL,即可扩展且高效的深度强化学习。谷歌在最新工作《SEED RL: Scalable and Efficient Deep-RL with Accelerated Central Inference》(为ICLR 2020 Oral 论文)中,提出的一个能够扩展到数千台机器的强化学习架构能够以每秒数百万帧的速度进行训练,计算效率显著提高。
-
Dreamer:Google AI 与 DeepMind 联合推出了 Dreamer,这是一种从图像中学习模型并用它来学习远见性(long-sighted)行为的 RL 智能体。通过模型预测的反向传播,Dreamer 能够利用它学得的模型高效地展开行为学习。通过从原始图像中学习计算紧凑模型状态,Dreamer 仅使用一块 GPU 即可以高效地从预测到的并行序列中学习。GitHub 博客地址,论文地址
-
Tianshou:训练模型的极速,与 1500 行源代码的精简,清华大学新开源强化学习平台「天授」。天授(Tianshou)是纯 基于 PyTorch 代码的强化学习框架,与目前现有基于 TensorFlow 的强化学习库不同,天授的类继承并不复杂,API 也不是很繁琐。最重要的是,天授的训练速度非常快,我们试用 Pythonic 的 API 就能快速构建与训练 RL 智能体。
- Innovations in Graph Representation Learning :Google图挖掘团队的两位高级科学家Alessandro Epasto和Bryan Perozzi在Google AI Blog上发表的《Innovations in Graph Representation Learning》,介绍了最新的一些图表示学习成果
- Awesome Graph Classification:这是一个野心勃勃的项目,涵盖了从深度学习、图形内核、到统计指纹和分解等领域的优秀论文以及对应的Python实现,作者表示会持续更新。GitHub ⭐2k+。
- Awesome Network Embedding:关于 Network Embedding 的相关论文合集,GitHub ⭐2k。
- Awesome Graph Neural Networks:GNN相关论文列表。
- Graph-based deep learning literature: GitHub上的一个项目,作者整理了包含近期基于图的深度学习会议论文
- Literature of Deep Learning for Graphs:GitHub上:star:2k的图神经网络的学习资源,里面整理了大量图深度学习论文,大多数都被顶会收录,数量有上百篇。这份资源最闪亮的地方,就是将这些不同方向已经发表的论文进行了整理,分门别类得放上了论文的标题、作者、关键词和地址链接。
- Must-read papers and continuous tracking on Graph Neural Network(GNN) progress:Github上的图神经网络必读论文和最新进展列表
- Plato:腾讯开源的高性能图计算框架 Plato,据介绍,Plato 可满足十亿级节点的超大规模图计算需求,将算法计算时间从「天」级缩短到「分钟」级,性能全面领先于其它主流分布式图计算框架,并且打破了原本动辄需要数百台服务器的资源瓶颈。
- Machine Learning with Graphs:斯坦福大学的最新课程CS224W——图机器学习,主讲人是斯坦福大牛Jure Leskovec,他是斯坦福大学计算机学院的副教授,也是图表示学习方法 node2vec 和 GraphSAGE 作者之一。
- Graph-based deep learning literature:图深度学习的论文集
- Open Graph Benchmark:在 NeurlPS 2019 大会的图表示学习演讲中,Jure Leskovec 宣布开源图神经网络的通用性能评价基准数据集 OGB(Open Graph Benchmark)。通过这一数据集,可以更好地评估模型性能等方面的指标。图表示学习演讲合集。
- Deep Graph Library (DGL):在现有DL框架的基础上构建的基于Pytorch的Python包,用于简化对图的深度学习,推荐等级::heart::heart::heart:!
- Pytorch Geometric (PYG):近几年来,图神经网络(GNN)在推荐系统、搜索引擎、计算机视觉等领域中都引起了较大的关注。Github有大量开源GNN实现,其中pytorch_geometric是最优秀的实现之一,曾被 Yann LeCun 推荐,GitHub上获:star:6k+,推荐等级::heart::heart::heart::heart:!
- TensorFlow Geometric (TFG):基于 Tensorflow 的高效友好的图神经网络库,受 Pytorch Geometric 启发。一个新开始的项目,GitHub:star:仅十几,但发展前景好。推荐等级::heart::heart::heart:!
- GraphEmbedding:GraphEmbedding 算法的实现库。
- StellarGraph:使用tf2.x写的图机器学习算法实现库。
- Euler:阿里妈妈开源大规模分布式图表征学习框架Euler,面向工业级用户和高级研究者,结合TF/XDL/PyTorch等深度学习基础工具,支持超大规模复杂异构图的模型训练。GitHub:star:2k+
- 《An introduction to machine learning on graphs》:《Introduction to graphs and machine learning》(《图机器学习导论》)为我们介绍了图机器学习的动机与发展,包括网络表示学习、图神经网络等图机器学习方法及其在问答、知识图谱等领域的应用。
- 《A Gentle Introduction to Deep Learning for Graphs》:《A Gentle Introduction to Deep Learning for Graphs》是图深度学习领域的教程导论,它倾向于对主流概念和架构的一致和渐进的介绍,而不是对最新文献的阐述。教程在介绍概念和想法时采用了自上而下的方法并保留了清晰的历史观点,为此,导论在第2节中提供了图表示学习的泛化形式,将图表示学习泛化为一种基于局部和迭代的结构化信息处理过程。同时,介绍了架构路线图,整个导论也是围绕该路线图进行开展的。导论聚焦于面向局部和迭代的信息处理过程,因为这些过程与神经网络的体系更为一致。因此,导论会淡化那些基于图谱理论的全局方法(假设有一个固定的邻接矩阵)。
- 《Deep Graph Similarity Learning: A Survey》:在许多将数据表示为图形的领域中,学习图形之间的相似性度量标准被认为是一个关键问题,它可以进一步促进各种学习任务,例如分类,聚类和相似性搜索。最近,人们对深度图相似性学习越来越感兴趣,其中的主要思想是学习一种深度学习模型,该模型将输入图映射到目标空间,以使目标空间中的距离近似于输入空间中的结构距离。在这里,本文提供对深度图相似性学习的现有文献的全面回顾。本文为方法和应用提出了系统的分类法。最后,本文讨论该问题的挑战和未来方向。
- 《Graph-Powered Machine Learning》:图驱动机器学习向您介绍图技术概念,强调图在机器学习和大数据平台中的作用。您将深入了解各种技术,包括数据源建模、算法设计、链接分析、分类和集群。在掌握核心概念之后,您将探索三个端到端项目,它们将演示体系结构、最佳设计实践、优化方法和常见缺陷。作者亚历山德罗·内格罗在构建基于图形的机器学习系统方面的丰富经验在每一章中都有所体现,你可以从他与真实客户合作的实例和具体场景中学习!
- GDE:图神经常微分方程(Graph Neural Ordinary Differential Equations,GDE),GDE 模型的主要目的是,提供一种数据驱动的方法为结构化系统建模,特别是当这个动态过程是非线性时,更是难以用经典的分析方法进行建模。论文 Graph Neural Ordinary Differential Equations。
- Karate Club :基于 NetworkX 的无监督图机器学习算法库,GitHub:star:300+。
- PyGSP:Python 图信号处理库,GitHub:star:100+。
- Awesome GCN:图卷积神经网络相关资源,GitHub:star:300+。
- Tf2 GNN:微软开源的图神经网络模型实现
- GNN papers:图神经网络必读论文列表
- Graph-based NN:总结关于基于图的神经网络和关系网络的重要资料,GitHub:star:700+。推荐等级::heart::heart::heart::heart:!
- Graph Nets:PyTorch 实现的各种图模型代码,包括GCN, ChebyNet, GAT, GraphSAGE。博客地址。
- Transformers are Graph Neural Networks:Transformer和GNN有什么关系?一开始可能并不明显。但是通过这篇文章,你会从GNN的角度看待Transformer的架构,对于原理有更清楚的认知。
- Benchmark GNNs:图神经网络 GNN-Benchmark,该框架为研究人员提供了方便地添加新数据集和模型的便利。作者团队:南洋理工大学&蒙特利尔大学(Bengio)等。推荐等级::heart::heart::heart::heart:!
- TigerGraph:企业用唯一可伸缩的图形数据库,现在可以作为云数据库服务使用
- Graph Learn:阿里巴巴开源的简化 GNN 应用的新框架 Graph-Learn。该框架可从实际案例中提取解决方案,应用于推荐系统、反欺骗等多个领域。GL 的可移植性和灵活性对于开发者来说十分友好,在该框架的基础上,开发者可以更轻松地实现 GNN 算法、自定义与图相关的运算符,并且更轻松地拓展现有模块。Container 和物理机上都可以安装 GL。
- igraph:igraph 是一组网络分析工具,集成了网络分析的诸多功能,可以在 R, Python, C/C+ 平台上使用。
- Python igraph:用于 igraph 的Python接口
- Generative Adversarial Networks:Ian Goodfellow2016年的GAN演讲视频
- Adversarial Nets Papers:GitHub上一个:star:4k+的项目,收录了生成对抗网络(GAN)诞生至今的论文和代码
- The GAN Zoo:GitHub上一个:star:5k+的项目,收录了GAN诞生至今所有GAN变体论文。
- Generative Adversarial Networks - The Story So Far:Reddit 出现的一个归纳 GAN 发展脉络的博客,作者在博客中详细梳理了过去几年的 GAN 发展历程,包含众多 SOTA 论文及其代码和对应的学习资源。
- CycleGAN Tutorial:官方资源帖,手把手教你在TensorFlow 2.0中实现CycleGAN,这份教程全面详细,想学CycleGAN不能错过这个。GitHub地址
- GAN Overview Chinese (pdf):万字综述之生成对抗网络(GAN)
- PyTorch-GAN:用Pytorch 实现的 GAN代码大全,GitHub ⭐5k+。
- 《GANs in Action》:牛津大学Jakub Langr 撰写了《GANs in Action Deep learning with Generative Adversarial Networks》的著作,囊括了关于GAN的定义、训练、变体等,全面叙述关于当下AI最重要的技术之一GAN的著作,是学习生成式对抗网络非常好的学习图书,是关于GAN的最好的书籍之一。
- DiscoGAN PyTorch:"Learning to Discover Cross-Domain Relations with Generative Adversarial Networks" PyTorch实现
- A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications:史上最全GAN综述2020版:算法、理论及应用。本文是一份出自陶大程、叶杰平老师等大牛之手的 GAN 详细综述,介绍了近年来有关 GAN 模型的相关研究进展,并指出了今后该领域的发展方向。
- Advertorch:对抗鲁棒性研究工具,实现了大多数的对抗攻防算法(CV领域)。
- Cleverhans:一个用于构建攻击、构建防御和基准测试的对抗性示例库。
- HackingNeuralNetworks:神经网络真的在软件层面上是安全吗? GitHub 趋势榜上有一个「骇入神经网络指南」项目。作者提供了一系列教学资料和代码,告诉了我们黑客会怎样对神经网络发起攻击。和对抗样本攻击不同,这些攻击都是从软件层面进行的,和使用对抗样本混淆模型能力的攻击不同。教程文章地址。
- Papers of Robust ML:Robust-ML的相关论文集
- Adversarial-DL:对抗深度学习的论文集
- One Pixel Attack Keras:"One pixel attack for fooling deep neural networks" 的Keras实现
- Adversarial Robustness Toolbox:IBM研发的关于对抗攻防机器学习的库,GitHub:star:1.2k。
- DeepRobust:密歇根州立大学开源的基于PyTorch实现的攻防算法库大全,包含
image
和Graph
两种领域的攻防算法,目前刚刚开源,值得关注。 - Adversarial Lab:生成并可视化对抗样本的工具。
- Must-read Papers on Textual Adversarial Attack and Defense:清华NLP组的同学们,在GitHub上开源的一个list,名为:文本对抗攻击与防御必读paper列表。
- Distiller:基于Pytorch 的模型压缩库,GitHub:star:2.6k
- Tensorflow Model Optimization:TensorFlow 官方模型优化工具,GitHub:star:600+。官网主页
- Distil*:包含了用于训练Distill*的原始代码,以及展示如何使用DistilBERT、DistilRoBERTa和DistilGPT2的示例。
- Apex:在PyTorch中实现简单的混合精度和分布式训练的工具,GitHub:star:3.4k。
- Sparse Learning Library:基于PyTorch的稀疏学习库,可以很容易封装任何PyTorch神经网络,以模拟稀疏神经网络的训练。
- Model Compression:基于pytorch实现模型压缩,博客,B站
- EfficientDet.Pytorch:EfficientNets是一种新的模型缩放方法,准确率比之前最好的Gpipe提高了0.1%,但是模型更小更快,参数的数量和FLOPS都大大减少,效率提升了10倍。该项目是一个哈佛数学系小哥哥Luke Melas-Kyriazi开源了自己的PyTorch实现,包含与训练模型和Demo。
- ALBERT:ALBERT模型是BERT的改进版,与最近其他State of the art的模型不同的是,这次是预训练小模型,效果更好、参数更少。GitHub:star:1.8k
- DeepSpeed:微软开源的DeepSpeed是一个深度学习优化库,它使分布式培训变得简单、高效和有效。GitHub:star:2.1k
- GAN Compression:来自麻省理工学院(MIT)、Adobe、上海交通大学的研究者提出了一种用于压缩条件 GAN 的通用方法。这一新技术在保持视觉保真度的同时,将 pix2pix,CycleGAN 和 GauGAN 等广泛使用的条件 GAN 模型的计算量减少到 1/9~1/21。该方法适用于多种生成器架构、学习目标,配对或非配对设置。论文地址
- TensorFlow 官方文档:TensorFlow 官方文档中文版
- TensorFlow Tutorials:TensorFlow官方英文教程文档
- TensorFlow Course:GitHub上:star:10k+的TensorFlow教程,教程、代码、笔记应有尽有
- TensorFlow Example:GitHub上:star:30k+对初学者友好的TensorFlow教程例子
- TensorFlow Example:GitHub上:star:500+的项目,各种从其他示例重新创建TensorFlow代码的例子
- TensorFlow Models:GitHub上:star:60k+的TensorFlow官方项目,内容包括各种使用TensorFlow写的模型和例子,一共分为两类:官方模型和研究模型。官方模型,是使用TensorFlow的高级API的示例模型的集合。研究模型,是研究人员在TensorFlow中实现的大量模型集合,推荐等级::heart::heart::heart::heart:!
- 简单粗暴TensorFlow:简单粗暴TensorFlow教程,基于TensorFlow最新的Eager Execution(动态图)模式,力图让具备一定机器学习及Python基础的开发者们快速上手TensorFlow。GitHub地址
- 深度学习 TensorFlow 教程(中文全集):B站上搬运的TensorFlow深度学习教程
- CS20SI - TensorFlow for Deep Learning Research:B站上搬运的斯坦福新开的TensorFlow课程
- TF Girls 修炼指南:B站上一个UP主的TensorFlow入门教程视频
- Awesome TensorFlow:TensorFlow中的教程和 ML 项目的集合,GitHub:star:14k
- TensorFlow Cookbook:这是一个易用的TensorFlow代码集,作者是来自韩国的AI研究科学家Junho Kim,内容涵盖了谱归一化卷积、部分卷积、pixel shuffle、几种归一化函数、tf-datasetAPI,等等
- Deep Learning With Keras Notebooks:Jupyter notebooks for using & learning Keras
- TfPyth:一行代码切换TensorFlow与PyTorch,模型训练也能用俩框架
- Float16 Quantization:TensorFlow模型优化工具包又一员新添大将,训练后的半精度浮点量化(float16 quantization)工具,有了它,就能在几乎不损失模型精度的情况下,将模型压缩至一半大小,还能改善CPU和硬件加速器延迟。Colab链接
- TensorFlow Hub:TensorFlow Hub是一个库,用于发布、发现和使用机器学习模型中可重复利用的部分。GitHub地址
- Model Zoo:这个平台,由新加坡名为Jing Yu Koh本科生牵头搭建。与上述的几个平台不同,这个平台上提供预训练模型,不仅仅只是完全针对于Pytorch或者TensorFlow,推荐等级::heart::heart:!
- RecQ:一个基于TensorFlow写的Python推荐系统框架
- Medium:基于TensorFlow 实现的PCA,t-SNE, AE, node2vec, LSTM算法
- 深度学习之TensorFlow工程化项目实战:《深度学习之TensorFlow工程化项目实战》是一本非常全面的、专注于实战的AI图书,兼容TensorFlow 1.x和2.x版本,共75个实例。本书结构清晰、案例丰富、通俗易懂、实用性强。适合对人工智能、TensorFlow感兴趣的读者作为自学教程。
- Tensorflow Practice:tensorflow 实战练习,包括强化学习、推荐系统、nlp等,GitHub:star:3.6k。
- tflearn:基于TensorFlow1.x的高级封装,但是不支持TensorFlow2.x。
- Tensorrt:Tensorrt 的 TensorFlow 集成
- Tensorflow Tutorials using Jupyter Notebook:使用Jupyter Notebook运行的TensorFlow教程,教程是基于Jupyter Notebook开发环境的Tensorflow教程,Jupyter Notebook是一款非常好用的交互式开发工具,不仅支持40多种编程语言,还可以实时运行代码、共享文档、数据可视化、支持markdown等,适用于机器学习、统计建模数据处理、特征提取等多个领域。
- Tensorflow exercise:Tensorflow代码练习,一个从易到难的Tensorflow代码练习手册。非常适合学习Tensorflow的小伙伴。
- TensorFlow 2.0 迁移指南:近期 TensorFlow 2.0正式版已经推出,如果你使用过tensorflow 1.x,这是一个迁移到2.0的官方指南
- tf upgrade v2:为了帮助你(自动地)将代码从 keras 更新为 tf.keras,Google 发布了一个名为 tf_upgrade_v2 的脚本。顾名思义,这个脚本可以分析你的代码并报告需要改动的行,该脚本甚至可以替你完成升级过程。
- Community:存储TensorFlow开发人员社区使用的文档,推荐等级::heart::heart:!
- Effective tf2:一个方便的指南,了解如何有效使用TensorFlow 2.0中的所有新功能
- Models and Datasets:为了简化TensorFlow 2.0的入门工作,官方发布了几个使用2.0 API的常用ML模型的参考实现
- Introduction TensorFlow:免费 TensorFlow 课程
- Intro To TensorFlow For Deep Learning Ud187:另一个免费 TensorFlow 课程
- TensorFlow 2.0:GitHub上 TensorFlow 2.0 源码
- Hands-on TensorFlow 2.0:TensorFlow 2.0 实操教程
- TensorFlow 2.0 + Keras Overview for Deep Learning Researchers:Keras之父出品:Twitter超千赞的TF 2.0 + Keras速成课程。需要翻墙查看。推荐等级::heart::heart:!
- Transformer Chatbot:【TensorFlow2.0】Transformer聊天机器人教程。GitHub地址
- TensorFlow Examples v2.0:GitHub 中:star:30k+项目
TensorFlow examples
的一个子项目,更新了一些2.0的样例 - 《Deep Learning with TensorFlow book》:一本基于TensorFlow 2.0 正式版的中文深度学习开源书,GitHub趋势日榜排名全球第一,已斩获:star:3k+,并且还在不断增长。从目录章节构成来看,理论与编程并不是独立分开,而是随着难度的递增,循序渐进、穿插编排的,除此之外,每个章节里的内容编排也是理论与实战相结合。配套代码,TensorFlow 2.0 实战案例。推荐等级::heart::heart::heart:!
- 简单粗暴TensorFlow 2.0:一份全中文教学的快速上手指南,基于Keras和Eager Execution(动态图)模式,北大学霸出品,获得TensorFlow官方认可。其名为,简单粗暴TensorFlow 2.0。GitHub地址,推荐等级::heart::heart::heart:!
- 《Hands On Machine Learning》:这本书非常棒,可以带你更深入TF2.0,记得要看第二版。GitHub上已获:star:4k+,代码地址。推荐等级::heart::heart::heart:!
- Tf2 Course:"Deep Learning with TensorFlow 2 and Keras" 课程笔记
- TensorFlow 2.0 中文教程:该教程主要由tensorflow2.0官方教程的作者个人学习复现笔记整理而来,并借鉴了一些keras构造神经网络的方法,中文讲解,方便喜欢阅读中文教程的朋友。知乎专栏。
- Awesome Tensorflow 2:Tensorflow 2.x资源,如教程,博客,代码和视频。推荐等级::heart::heart::heart::heart:!
- 《动手深度学习 (TensorFlow2.0)》:《动手学深度学习》(Dive into Deep Learning) TensorFlow 2.0版本代码实现。在线阅读地址。推荐等级::heart::heart::heart:!
- TensorFlow Tutorials:TensorFlow 官方文档示例教程,使用2.0实现了一些经典模型,GitHub仓库。推荐等级::heart::heart::heart:!
- 《Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow, 2nd Edition》:Scikit-Learn,Keras,Tensorflow是机器学习工具链的重要组成部分。本书的作者,根据上述三个机器学习工具箱,融汇贯通成一个个机器学习实例,让即使对人工智能了解不多的程序员也可以使用简单高效的工具来实现机器学习任务。本书Sklearn,Keras与Tensorflow机器学习实用指南(第二版)涵盖大量上述三个工具和机器学习的相关内容。书内代码
- Tensor2Tensor:tensor2tensor(t2t)是google基于tensorflow新开源的深度学习库,该库将深度学习所需要的元素(数据集、模型、学习率、超参数等)封装成标准化的统一接口,在使用其做模型训练时可以更加的灵活。GitHub ⭐ 9.4k。
- 《Deep Learning Pipeline: Building a Deep Learning Model with TensorFlow》:根据最新的TensorFlow方法而不是过时的工程概念来构建自己的Pipeline。这本书向你展示了如何为真实的TensorFlow项目建立一个深度学习Pipeline。
- 《Accelerating training, inference, and ML applications on NVIDIA GPUs》:Maggie Zhang,Nathan Luehr,Josh Romero,Pooya Davoodi和Davide Onofrio深入研究了用于加速深度学习训练和推理的通用深度学习和机器学习工作负载的技术。 通过本教程将了解DALI如何消除现实应用中的I/O和数据处理瓶颈,以及自动混合精度(AMP)如何轻松地在Volta GPU上的训练性能提高3倍。 您将看到使用Horovod进行多GPU和多节点扩展的最佳实践。 他们使用深度学习探查器来可视化TensorFlow操作并确定优化机会。 本教程将教读者学习使用TensorRT(TRT)中的INT8量化来部署这些训练过的模型,所有这些都将在TensorFlow框架的新型便捷API中进行。
- TensorFlow From Zero To One:TensorFlow 从0到1学习资料大全,含入门指南、在线博客、视频教程、书籍推荐和实战项目等。
- Tensorflow 官方Youtube:Tensorflow 官方Youtube
- Tensorflow 官方博客:Tensorflow 官方博客
- TensorFlow Tutorial For Beginners:Tensorflow 新手教程
- TensorFlow Addons:相当于以前的
tf.contrib
的官方实现,里面有许多新的自定义函数和类,源码值得观摩学习。 - TensorFlow Datasets:TensorFlow Datasets 是可用于 TensorFlow 的一系列数据集的集合。所有数据集都显示为
tf.data.Datasets
,可以提供易于使用且具有高性能的输入流水线。 - TensorFlow Hub:TensorFlow Hub 是一个库,用于发布、发现和使用机器学习模型中可重复利用的部分。模块是一个独立的 TensorFlow 图部分,其中包含权重和资源,可以在一个进程中供不同任务重复使用(称为迁移学习)。
- TensorFlow Official Models:大多数模型的TensorFlow官方实现。
- Examples:官方的 TensorFlow examples库,GitHub:star:2.5k。
- TensorFlow/TPU:这个存储库是云TPU使用的参考模型和工具的集合,里面实现了大量的模型。GitHub:star:3k。
- AttentioNN:关于各种 Attention 的 TensorFlow 实现。
- TFGAN:2017 年,谷歌推出了用于训练和评估 生成对抗网络 (Generative Adversarial Networks, GAN) 的轻量级库 TF-GAN。自那时起,TF-GAN 便在大量极具影响力的论文和项目中被广泛应用。
- Machine Learning Zero to Hero (Google I/O'19):机器学习: 从零到一学习 TensorFlow,来自 TensorFlow 团队的 Laurence Moroney 从开发人员的角度,制作一个系列视频,向大家介绍机器学习到底是什么。
- Learn Tensorflow 3:卷积神经网络学习及如何利用 TensorFlow 构建卷积神经网络
- LaserTagger:LaserTagger是一种文本编辑模型,它预测一系列标记级编辑操作,以将源文本转换为目标文本。
- TensorFlow Quantum:谷歌最新开源的TensorFlow Quantum,专注于处理量子数据,及构建量子-经典混合模型(hybrid quantum-classical models)。类似于TensorFlow ,TFQ 作为一个开源库,将直接降低量子机器学习的门槛,让我们能够快速构建量子机器学习模型。论文:TensorFlow Quantum:A Software Framework for Quantum Machine Learning
- TensorFlow 2.0 Complete Course - Python Neural Networks for Beginners:TensorFlow2.0机器学习7小时免费视频课程,专为码农服务。推荐等级::heart::heart::heart::heart:!
- TensorFlow Certificate:TensorFlow官方开发者认证:考试费100美元,5小时完成5个模型
- Eat tensorflow2 in 30 days:30天吃掉那只 TensorFlow2.0 ,推荐等级::heart::heart::heart::heart:!
- Tensorflow Constrained Optimization:TensorFlow 约束优化库,可根据多种不同指标(例如,某些特定群体成员的精度、某些国家/地区居民的真阳率 (True Positive),或者取决于年龄和性别的癌症诊断的召回率)来配置和训练机器学习问题。通过为用户提供最小化和约束指标任意组合的功能,TFCO 可轻松阐述并解决公平性社区尤其是机器学习社区特别关注的诸多问题(例如均衡赔率和预测性平价等)。
- EfficientNet-lite:EfficientNet-Lite 为边缘设备带来了 EfficientNet 上强大的性能,并且提供五个不同版本,让用户能够根据自己的应用场景灵活地在低延迟与高精度之间选择。
- Keras:Keras官方手册,非常详细的官方文档,文档中详细的介绍了从Keras每个知识点的用法,一步步带你从入门到精通。
- Keras-cn:Keras中文官方手册,该中文官方手册是对对Keras英文官方手册最好的还原,适合所有阶段的Keras学习者阅读。
- Keras中文文档:另一个非官方的Keras中文文档,笔者花了近两年的时间在维护,文档也一直在更新,包含ConvLSTM2D、SimpleRNNCellKeras、GRUCell等最新的内容,非常用心的一份Keras文档。
- Deep Learning With Keras Notebooks:黄海广博士力荐的Keras github项目,这个github的repository主要是博主在学习Keras的一些记录及练习,满满都是干货,建议大家看一下。
- keraschina:磐创AI Keras系列教程总结,从CNN到RNN,以入门、基础为主的讲解,适合小白学习。
- Waterloo:Waterloo大学关于Keras的课程,该视频在YouTube上有很高的播放率,课程质量非常高
- CERN:CERN使用Keras进行深度学习系列教程,比较详细、权威的一个Keras系列教程视频。
- 莫烦Keras:莫烦Keras视频教程,莫烦老师的视频在B站、YouTube上都有很高的播放量,强烈推荐给大家。
- Sentdex Keras:YouTube上另一个大佬Sentdex的Keras教学视频,还配套有相应的文本教程和笔记。文本教程笔记
- IMDB LSTM:用LSTM在IMDB影评数据集做文本分类
- REUTERS MLP:路透社主题分类
- LSTM Text Generation:LSTM做文本生成
- FastText IMDB:在IMDB数据集上使用FastText
- BABI LSTM:基于LSTM的BABI数据集网络
- Pretrained Word Embeddings:预训练词向量
- CNN:字符级卷积神经网络做文本分类
- LSTM Gender Predictor:LSTM预测一个人的性别
- CNN MNIST:使用CNN进行MNIST
- Inception V3:Inception V3
- VGG16:VGG16
- FractalNet:FractalNet
- Visual QA:可视问答
- ResNet 50:ResNet 50
- NNProject DeepMask:对象分割
- Image Segmentation Keras:fcn、segnet、u-net等常用的图像分割模型
- RocAlphaG:这个项目是DeepMind 2016年《自然》杂志的一个学生主导的实施项目,使用了Python+keras实现,代码清晰性更好。
- BetaGo:项目是使用keras的深度学习Go机器人
- DeepJazz:使用Keras深度学习驱动的爵士乐生成系统
- dataset-sts:语义文本相似度数据集集线器
- NMT-Keras:利用球面进行神经机器翻译
- Headline Generator:利用循环神经网络独立生成新闻标题的实现
- Deep Learning With Python:一本很不错的学习 Python的书籍,书本代码是基于 Keras的,GitHub上已获:star:8k+,代码地址。推荐等级::heart::heart::heart:!
- Keras Ocr:Keras作者François Chollet近期在Twitter上推荐了Github上的一个基于tf.keras的OCR项目Keras-OCR。该项目开箱即用,可直接执行OCR,也提供了端到端训练的流水线。
- PyTorch 中文文档:PyTorch是使用GPU和CPU优化的深度学习张量库,查看中文文档有助于学习这个火爆的机器学习框架
- PyTorch Discuss:PyTorch 论坛,关于该框架的大部分问题都可以在上面找到答案,会有热心的开发者答疑解惑!
- PyTorch 123:PyTorch 是近年来较为火爆的深度学习框架,然而其中文版官方教程久久不来。近日,一款完整的 PyTorch 中文版官方教程出炉,作者来自 pytorchchina.com。教程根据 PyTorch 官方版本目录,完整地还原了所有的内容。包括简单的环境搭建、快速入门相关 API、高级操作、图像处理实战、文本处理实战、GAN 和强化学习等,基本涵盖了目前所有深度学习相关的知识点。推荐等级::heart::heart::heart:!
- PyTorch Tutorials:PyTorch 官方英文文档
- PyTorch Tutorial:PyTorch Tutorial for Deep Learning Researchers。GitHub上已收获:star:10k+
- Awesome Pytorch list:GitHub上一个:star:9k+的项目,收集了GitHub上PyTorch相关内容以及不同的模型实现、帮助文档、教程,使用PyTorch的学习。中文版。推荐等级::heart::heart::heart::heart:!
- 《Hands-on tour to deep learning with PyTorch》:dataflowr 最近推出的一门五天初步掌握深度学习的实战教程(实战使用 PyTorch 框架),有知识点有实例有代码。GitHub地址
- Existential Pontification and Generalized Abstract Digressions :万字综述,核心开发者全面解读 PyTorch 内部机制
- Python Autocomplete:一个利用 PyTorch 写的自动补全代码的小项目
- TfPyth:一行代码切换TensorFlow与PyTorch,模型训练也能用俩框架
- PyTorch Hub:PyTorch Hub是一个简易API和工作流程,为复现研究提供了基本构建模块,包含预训练模型库。PyTorch Hub支持Colab,能与论文代码结合网站Papers With Code集成,用于更广泛的研究。GitHub地址
- Model Zoo:这个平台,由新加坡名为Jing Yu Koh本科生牵头搭建。与上述的几个平台不同,这个平台上提供预训练模型,不仅仅只是完全针对于Pytorch或者TensorFlow,推荐等级::heart::heart:!
- PyTorchDocs:PyTorch 官方中文教程包含 60 分钟快速入门教程,强化教程,计算机视觉,自然语言处理,生成对抗网络,强化学习。
- Deep Learning 60min Blitz:入门 PyTorch 深度学习需要多久?PyTorch 的一份官方教程表示:只需要 60 分钟。
- SpeedTorch:机器学习中,有一个限制速度的环节,那就是从 CPU 到 GPU 之间的张量迁移。很多计算只能在 CPU 上进行,然后迁移到 GPU 进行后续的训练工作,因此迁移中如果速度太慢,则会拖累整个模型的训练效率。近日,有一位开发者开源了针对 PyTorch 的 CPU->GPU 迁移工具,相比原版加速了 110 倍之多。
- 《动手深度学习》:动手深度学习(Dive into Deep Learning)一书仓库,Github ⭐10k+。面向中文读者、能运行、可讨论。英文版即伯克利“深度学习导论”教材。原书地址,课程B站视频,官网。推荐等级::heart::heart::heart:!
- 《动手学深度学习 (PyTorch)》:该项目将《动手学深度学习》(Dive into Deep Learning)原书中的MXNet实现改为PyTorch实现,在线版本。然而,源项目由于写的是 Markdown ,公式和代码显示不太方便阅读。一位中国海洋大学大三学生将上面 PyTorch 版本的《动手深度学习》编译成完整的 PDF 文件。方便大家阅读以及解决 GitHub 上公式显示不全的问题。GitHub 地址 Dive-into-DL-PyTorch.pdf。推荐等级::heart::heart::heart:!
- 《Deep Learning With Pytorch》:Pytorch官网Pytorch.org最近发布了一本开源书深度学习《Deep Learning with PyTorch》,共141页pdf,限时开放,涵盖了深度学习和Pytorch库的介绍,预训练网络,张量,学习机制,数据神经网络学习。书里面有详实的代码,是入门学习Pytorch深度学习必备器物,不得不看!GitHub仓库代码。推荐等级::heart::heart:!
- PyTorch: An Imperative Style, High-PerformanceDeep Learning Library:NIPS 2019接收为poster的论文,由PyTorch 开发项目组发表,完整且系统地介绍了 PyTorch 本身。推荐等级::heart::heart::heart:!
- 高效入门pytorch视频教程:南开大学王老师强烈推荐的《高效入门pytorch视频教程》(33集完整版),推荐等级::heart::heart::heart:!
- Pytorch Playground:Pytorch中的基本预训练模型和数据集(MNIST、SVHN、CIFAR10、CIFAR100、STL10、AlexNet、VGG16、VGG19、ResNet、Inception、SqueezeNet),GitHub:star:1.9k
- Pytorch Handbook:pytorch handbook是一本开源的书籍,目标是帮助那些希望和使用PyTorch进行深度学习开发和研究的朋友快速入门,其中包含的Pytorch教程全部通过测试保证可以成功运行。GitHub:star:10.3k。
- Pytorch Examples:PyTorch 简单项目,GitHub:star:3.4k+。
- Learn2learn:learn2learn 是一个用于实现元学习的 Pytorch 库,我们只需要加几行高层 API,就能为一般的机器学习流程添加元学习能力。
- Pytorch Optimizers:PyTorch 实现的优化器大全。推荐等级::heart::heart::heart::heart:!
- Pytorch Lightning:对于PyTorch开发者来说,Google Colab上的TPU资源不能用,恐怕是最遗憾的事情了。Google的云计算资源眼看着不能用,转TensorFlow又是不可能的。现在福利来了,一个叫做Pytorch Lightning的项目,可以让你几乎不修改代码的情况下用上TPU,同时该项目还具有很多原生PyTorch未实现的功能。Colab演示。
- PolyGames:Polygames是Facebook开源的一个研究框架,通过自我游戏的方式来训练深度学习网络。Polygames基于著名的“零学习”概念,即允许代理无需进行任何预先设定的训练,而是通过与环境交互来掌握环境。
- PyTorch3D:PyTorch3D是Facebook开源的一个高度模块化和优化的库,具有独特的功能,旨在让使用PyTorch的3D深度学习更容易。PyTorch3D为快速可微的3D数据提供了一组常用的3D操作符和损失函数,以及一个模块化可微绘制API,使研究人员能够立即将这些函数导入当前最先进的深度学习系统。
- Hiplot:HiPlot是Facebook开源的一个交互式可视化工具,它帮助人工智能研究人员发现高维数据中的相关性和模式,并使用平行图和其他图形方式来表示信息。HiPlot使用一种称为平行图的技术,这是一种可视化和过滤高维数据的方便做法。
- Efficient-PyTorch:使用PyTorch训练大型数据集的最佳实践
- torchprof:用于呈现PyTorch模型细节的库,推荐等级::heart::heart:!
- Pytorch Cifar:在CIFAR10 数据集上用PyTorch实现的CV模型,GitHub:star:2.7k
- Pytorch Tricks:使用
PyTorch
的过程中总结的一些小trick
- Bokeh:一份用 Python 做交互式图形的资源,官方介绍称,它能读取大型数据集或者流数据,以简单快速的方式为网页提供优美、高交互性能的图形,官方提供了一个通过Jupyter使用Bokeh的教程:Bokeh Tutorial 以及 Quickstart,Bokeh官网地址
- Plotly:Python开源的交互式图形库,GitHub:star:6.1k。
- Plotnine:Plotnine是Python中图形语法的一种实现,它基于ggplot2。语法允许用户通过显式地将数据映射到构成图的可视对象来组成图。GitHub:star:2.1k
- Cufflinks:Cufflinks 基于 Plotly 做了进一步的包装,可以绘制一个交互式、可缩放、可扩展的全景图呢
- Scikit Plot:这是另一个机器学习的画图神器,几行代码就能画出高大上的机器学习图,作者当年的博士论文也是靠这个画图的
- Effectively Using Matplotlib:如何高效使用 Python 可视化工具 Matplotlib。GitHub地址
- Matplotlib Gallery:一个Matplotlib图表库网站,里面有各式各样好看的图表及Python实现代码,可以帮你画出更好的图表以及快速上手学习Python中的Matplotlib库
- ECharts Gallery:由百度开源的数据可视化工具,基于JavaScript编写,一个强大的,交互式的图表和浏览器可视化库,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可
- PyCharts:Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。简而言之,这是一个类似Matplotlib,可以利用Python画图的工具库
- Draw Convnet:画卷积神经网络(ConvNet)结构图的Python脚本
- ConvNet Drawer:描述卷积神经网络(CNN)结构的Python脚本。灵感来自上述的Draw Convne项目
- NN-SVG:这个工具可以非常方便的画出各种类型的图,开发者来自于麻省理工学院弗兰克尔生物工程实验室, 该实验室开发可视化和机器学习工具用于分析生物数据。可以绘制的图包括以节点形式展示的FCNN style,这个特别适合传统的全连接神经网络的绘制。github地址
- PlotNeuralNet:这个工具是萨尔大学计算机科学专业的一个学生开发的,使用的门槛相对来说就高一些了,用LaTex语言编辑,所以可以发挥的空间就大了。类似工具:tikz_cnn
- ConvNetDraw:ConvNetDraw是一个使用配置命令的CNN神经网络画图工具,开发者是香港的一位程序员
- Draw_Convnet:这一个工具名叫draw_convnet,由Borealis公司的员工Gavin Weiguang Ding提供。简单直接,是纯用python代码画图的,核心工具是matplotlib,图不酷炫,但是好在规规矩矩,可以严格控制,论文用挺合适的。类似工具:convnet-drawer
- Netscope:caffe的网络结构可视化工具,大名鼎鼎的netscope,由斯坦福AILab的Saumitro Dasgupta开发
- Vis Conv:一个有意思的画图工具,不是画什么正经图,但是把权重都画出来了
- Matplotlib 入门教程:一个私人Matplotlib 入门教程项目
- kepler.gl:一款强大的开源地理空间分析工具,用于大规模数据集
- Graphviz:程序员的绘图利器,一个由AT&T实验室启动的开源工具包。Graphviz就是用来处理Dot(一种非常简单的图形描述语言)的工具
- GraphvizOnline:一个可以使用 Graphviz 在线画图的网页工具
- Manim - Mathematical Animation Engine:Manim 是解释性数学视频的动画引擎。用于以编程方式创建精确的动画,如 3Blue1Brown 的视频中所展示的样例。
- pixelhouse:一个极简的绘图库,用于在 python 中制作精美的动画。
- render-py:一个用 Python 编写的软件 3D 渲染器,旨在让每个人都能轻松理解。
- pyray:Python 中使用 POV ray 渲染复杂的 3D 对象和场景,动画以及更多普通的香草 Python。
- SandDance:SandDance 是 Microsoft Research 最受欢迎的数据可视化工具,由微软研究院的可视化和交互式数据分析(VIDA)小组创建,通过提供了触控式的界面,实现使用者和 3D 信息图表进行互动,已经作为 GitHub 上的开源项目重新发布。在线体验。
- Coblis Color Blindness Simulator:色盲模拟器,来看看你的配色能否被色盲人群分辨出来,以防颜色设置不妥。
- ColorBrewer:这个工具的配色非常经典,几乎就是office里的默认配色。
- Data Color Picker:用于生成两种颜色的渐变,可以自由选择需要多少种颜色过渡。
- Chroma.js Color Palette Helper:可以制作顺序调色板或者发散调色板,根据不同需要调整调色板的渐变过程。
- Color Thief:我们知道许多自然情景中的颜色都是让人感到舒服的配色,这款工具就可以帮你把照片中的颜色提取出来。
- Viz Palette:Viz Palette
- Draw.io:一免费制图神器来袭!名为draw.io,打开网页就能使用,支持中文版,也不会给你上水印。不只是能让你创建空白图,官方还提供了133个模板,覆盖了商务、工程图、流程图等13个类别。如此神器,好评自然如潮。有人说,这是一个开发人员可以使用的、最有用的100%免费软件工具。推荐等级::heart::heart::heart:! GitHub地址 以及 桌面版下载地址。
- Yellowbrick:可视化利器Yellowbrick,这是一款基于sklearn+matplotlib模块构建的更加高级的可视化工具,能够更加方便地完成很多数据探索、分词与展示工作。中文文档地址
- G6:G6 是一个图可视化引擎。它提供了图的绘制、布局、分析、交互、动画等图可视化的基础能力。旨在让关系变得透明,简单。让用户获得关系数据的 Insight。基于 G6,用户可以快速搭建自己的 图分析 或 图编辑 应用。
- CoreDraw:CorelDRAW Graphics Suite是加拿大Corel公司的平面设计软件;该软件是Corel公司出品的矢量图形制作工具软件,这个图形工具给设计师提供了矢量动画、页面设计、网站制作、位图编辑和网页动画等多种功能。
- Origin:Origin是由OriginLab公司开发的一个科学绘图、数据分析软件,支持在Microsoft Windows下运行。Origin支持各种各样的2D/3D图形。Origin中的数据分析功能包括统计,信号处理,曲线拟合以及峰值分析。Origin中的曲线拟合是采用基于Levernberg-Marquardt算法(LMA)的非线性最小二乘法拟合。Origin强大的数据导入功能,支持多种格式的数据,包括ASCII、Excel、NI TDM、DIADem、NetCDF、SPC等等。图形输出格式多样,例如JPEG,GIF,EPS,TIFF等。内置的查询工具可通过ADO访问数据库数据。
- visdom:visdom是一款用于创建、组织和共享实时大量训练数据可视化的灵活工具。相较于TensorFlow的可视化工具TensorBoard,visdom 则是对应于PyTorch的可视化工具。
- Gource: Gource 将软件项目以动画树的形式展现,根目录为中心,目录为分支,文件为叶子,当一颗 “树” 华丽丽地舒展开,减去旧枝、添加新叶,也就意味着,开发人员为这一软件项目做出的贡献越来越丰富。 并且,这棵 “树” 不仅能展示软件版本的更迭,还可以显示有多少开发者参与其中。
- Logstalgia:Logstalgia是一个流量可视化网站,它可以回放或流媒体web服务器访问日志
- 《D3 Tips and Tricks》:D3 Tips and Tricks介绍了如何利用d3.js这一工具,实现数据可视化。其中包含50多个可以下载的代码示例。
- Manifold:Uber推出了一款ML可视化调试工具Manifold(流形),可以帮助开发者发现让模型不能准确预测的数据子集,通过不同子集之间的特征分布差异来解释模型性能不佳的可能原因。Maniflod可以为机器学习工作流程提供可解释性和可调试性。官方博客。
- Tensorboardx:Pytorch 可视化工具, Pytorch 版本的 Tensorboard
- Chaco:由Enthought开发的一个绘图工具包,它既可以绘制静态图又可以生成交互式图形。它非常适合用复杂的图形化方式表达数据的内部关系。跟matplotlib相比,Chaco对交互的支持要好得多,而且渲染速度很快。如果要创建交互式的GUI应用程序,它确实是个不错的选择。官方文档
- Mayavi:mayavi项目是一个基于开源C++图形库VKT的3D图形工具包。跟matplotlib一样,mayavi也能集成到IPython以实现交互式使用。通过鼠标和键盘进行操作,图形可以被平移、旋转、缩放。我相信它能成为WebGL(以及相关产品)的替代品,虽然其生成的图形很难以交互的形式共享。
- Flashtorch:FlashTorch是PyTorch中用于神经网络的开源特征可视化工具包。
- AntV:AntV是Ant Financial(Ali)的一组数据可视化语法,它似乎是中国第一个使用名为The Grammar Of Graphics的理论的可视化库。Antv附带了一系列数据处理API。它可以处理和分析简单数据,因此许多公司将其用作BI平台的底层工具。
- Highcharts:当我们提到Echarts时,我们通常会将它与Highcharts进行比较。它们之间的关系有点像WPS和Office之间的关系。Highcharts也是一个可视化库。而且你需要交钱买商业版本。它的优点是它有详细的文档,示例和详细的CSS。通过使用该软件学习和开发,您可以节省时间和精力。它具有很强的产品稳定性。
- FineReport:它是一个用于做报告的软件和企业级应用程序,用于开发业务报告和数据分析报告。它还可以与OA,ERP,CRM和其他应用程序系统集成,以构建数据报告模块
- Tableau:几乎每个数据分析师都会提到Tableau。它具有通用的内置分析图表和一些数据分析模型。您可以快速进行数据分析,探索价值并生成数据分析报告。它解决的问题更倾向于商业分析。使用Tableau,您可以快速制作动态交互图表,其图表和配色方案非常棒。
- FineBI:FineBI是一种自助式BI工具,是一种用于数据分析的成熟产品。它有丰富的内置图表。您可以直接拖放以制作图表而无需使用代码。FineBI可用于快速分析业务数据,制作仪表板或构建大屏幕。
- PowerBI:它是Microsoft在Excel之后推出的BI产品。Power BI可以无缝连接到Excel以创建个性化数据仪表板。
- Power Map:许多工具都有数据地图,例如Echarts,FineReport,Tableau等。在这里,我强烈推荐Power Map 2016.您可以尝试一下。这真是太神奇了。
- Hiplot:HiPlot是一个交互式可视化工具,它帮助人工智能研究人员发现高维数据中的相关性和模式,并使用平行图和其他图形方式来表示信息。HiPlot使用一种称为平行图的技术,这是一种可视化和过滤高维数据的方便做法。
- Plotnine:python数据可视化的新星包:plotnine ,python数据可视化版ggplot2,GitHub:star:2.1k。推荐等级::heart::heart::heart:!
- A communal catalogue reveals Earth’s multiscale microbial diversity:Earth Microbiome Project 基因研究的论文,其数据分析和可视化代码总共加起来上万行,值得学习,GitHub代码地址。推荐等级::heart::heart::heart:!
- Everyone Can Use English:Github上一个:star:3k+多的英语学习项目,力图使得人人都能用英语
- A Programmers Guide to English:GitHub上一个:star:7k+的英语学习项目,专为程序员编写的英语学习指南。在线阅读链接
- English level up tips for Chinese:Github上一个:star:17k的英语学习项目,可能是让你受益匪浅的英语进阶指南。GitBook地址
- Chinese Programmer Wrong Pronunciation:GitHub上一个:star:近10k的英语学习项目,收集了中国程序员容易发音错误的单词
- Google Scholar:谷歌学术
- SemanticScholar:如果你还在用 Google Scholar 来检索计算机相关的学术论文,不妨试下这款搜索引擎,相信它能给你带来前所未有的体验。引用斯坦福大学神经生物学家 Andrew Huberman 对此说的一句话:「这将彻底改变整个信息检索引擎的游戏规则」。推荐等级::heart::heart::heart::heart:!
- DBLP:计算机论文搜索学术库
- acronymify:取名网站,只需在上面的框中输入您的单词,然后按search生成可能的缩写词列表。
- Paperswithcode:如其名,收录了大量带有源代码的论文,Github同名项目,推荐等级::heart::heart::heart::heart:!
- ArXiv Sanity:类似Paperswithcode,旨在提升获取研究成果的效率与体验
- arXiv Vanity:Vanity将来自arXiv的学术论文呈现为响应性网页,这样你就不用眯着眼睛看PDF了
- 易搜搭:专业英文论文写作助手,只需要输入你想表达的中文句子,该网站会检索各种论文找出相似英文表达,使你的英文论文写作不再生硬,推荐等级::heart::heart::heart::heart:!
- Academic Phrasebank:对于写作新手来说的神器网站,里面按不同条目分类罗列了各种英语表达。推荐等级::heart::heart::heart::heart:!
- Conference List:计算机各领域会议的时间表
- AI Conference Deadlines :查看各个AI顶会的 Deadline
- Latex 代码转换器 - Mathpix:如果你经常用 latex 编写文档,那你一定得安装下 Mathpix。这款工具能将带数学公式的截图一键转成 latex 代码,帮你省下很多时间,堪称神器!(可惜现在收费了)
- Image2LaTeX:这一工具的名称是「Image2LaTeX」。顾名思义,这是利用 OCR 技术从图像中提取文字,并转换为 LaTex 代码的工具。无论是 OCR 还是自动转码,速度都是非常快的,准确性也很高。重点是,一个月可以免费使用1000次!(Mathpix 一个月只能免费使用50次)
- Grammarly:Grammarly 是一款非常强大的语法改错软件,帮助润色英文表达。
- Ginger:Ginger 号称是世界上最好用的英文写作润色工具,除了提供单词拼写、语法检查功能外,还提供句子改写、翻译、词典和朗读功能。
- 1Checker:1Checker 是一款中文本土用于进行英语文本的纠错(包括拼写、语法、样式和句子不完整)和润色的软件,界面是中文的,简单易懂,操作方便。
- 谷歌学术镜像:一个谷歌学术的镜像网站,如果上不了谷歌学术的话可以用它作为替代
- Mathtex Tutorial:LaTex 数学公式在线转换,包括一些常用数学公式教程
- Tablesgenerator:LaTex 表格在线生成器
- Codecogs:在线Latex公式编辑器
- AOE TIME:“地球上的任何地方”(AoE)是一个日历名称,表示当日期在地球上的任何地方经过时,一段时间就结束了。许多会议(期刊)截稿时间都采用AOE时间
- PDFresizer:PDF剪裁工具,当你的图片出现白边的时候可以使用这个工具进行剪裁
- Arxiv国内镜像:Arxiv国内镜像。如
https://arxiv.org/pdf/1512.03385.pdf
下载很慢,换成http://xxx.itp.ac.cn/pdf/1512.03385.pdf
, 即可体验光速下载,注意 https 要换成 http。 - Semantic Scholar:查论文神器
- Overleaf:在线Latex编辑器,可以多人协作,堪称写论文利器
- Mendeley:论文管理工具,全平台,还有网页版,很方便,高度安利
- Sci-Hub:对于科研民工们,肯定很多人接触过sci-hub这个网站,一个很神奇的免费下载文献的网站。
- SwiftLaTeX:一个名为 SwiftLaTeX 的可视化编辑器。该项目最大的亮点在于:你编写的 LaTeX 代码能够立刻展示实际的效果,所见即所得。这个编辑器还是基于浏览器的,还支持云文件存储。在线体验版本。
- Face Detection:人脸识别方面的相关论文合集。
- NeurIPS 2019 Notes:布朗大学的博士生 David Abel 公开了他的 NeurIPS 2019 参会笔记,他从深度学习理论、强化学习、博弈论和元学习等主题出发记载参会的一些亮点与主要内容。个人主页
- Awesome Papers:机器学习,深度学习,自然语言处理,计算机视觉方面的顶级期刊会议论文集
- Tableconvert:在线表格转换工具,实现将 EXCEL, CSV, URL, HTML, JSON, MARKDOWN 格式的文件转换为 Markdown, CSV/TSV, JSON, XML, YAML, SQL, HTML 表格,LaTex 表格, Plain Text 表格等格式。
- AsciiMath:在浏览器中编辑你想要的数学公式,支持在浏览器中直接编辑和前端代码中实现。
- Linggle:Linggle,英语写作学习搜索引擎,可以帮我们解决一切语言搭配的问题,是我们英文写作的得力助手。
- Netspeak:帮助你搜索你还不知道的单词,论文写作好帮手之一。
- Microsoft Aim Writing:亚洲研究院研发升级了以前的作文打分功能,命名为“微软爱写作”(Microsoft Aim Writing)。从小学到到雅思托福的作文都可以改。
- 《论文是怎样炼成的》:来自厦门大学林子雨博士的报告《论文是怎样炼成的》,共125页ppt,虽然快有十年之久,但里面干货经典,部分集成周志华老师的PPT 《如何做研究,如何写论文》,至今仍有重大价值。
- RSPapers:必读推荐系统论文列表,GitHub:star:2k。
- ACM Digital Library:ACM 数字图书馆,ACM(美国计算机协会)作为全球最大的计算机相关学会,每年都会出版大量计算机科学的专门期刊、举办国际顶会。
- 如何撰写毕业论文:一篇来自中国科学院自动化研究所模式识别国家重点实验室宗成庆老师的报告《如何撰写毕业论文》,27页ppt,讲述了毕业论文要注意的各种要点,非常值得我们学习,帮助大家写出更好的论文。宗成庆老师个人主页:http://www.nlpr.ia.ac.cn/cip/english/zong.htm
-
MSDN:十分齐全、靠谱的Windows系统、软件资源下载网站
-
N软网:提供互联网前沿资讯及软件下载
-
DownGit:Git文件下载工具,只需输入连接即可下载GitHub上的文件
-
OmegaXYZ:既有各种高级语言的教程,也有机器学习的教程,以及各种算法实现,还有提供一些软件资源下载。GitHub上还有许多关于Python的学习项目
-
视频鱼:一个输入视频网址即可下载视频的网站
-
Awesome Windows:GitHub上:star:9k+的项目,收列了Windows上优质&精选的最佳应用程序及工具
-
Awesome Macos:GitHub上:star:9k+的项目,为macOS整理了一份很棒的应用程序、软件、工具和亮点的列表
-
Library Genesis:一个电子书网站,可以免费下载外文电子书。
-
IPTV:PTV(Internet Protocol Television)即网络协议电视,可通过宽带网络向订阅者推送数字电视节目。直白点说,就是一种可以让你在电脑上看电视的技术。有好心人在 GitHub 上开放了自己汇总整理的,在全球范围内高达 8000+ 的公共的 IPTV 直播源,领域覆盖历史、教育、商业、电影、音乐...基本上你想看啥类型的电视节目都能在上面找到,目前该项目在 GitHub ⭐ 10k+。
-
Motrix:Motrix 号称是一款全能的下载工具,支持 HTTP、FTP、BT、磁力链、百度网盘等资源。除了功能强大,它还是是全平台支持!也就是说不管你是 Windows、macOS 还是 Linux,统统支持!!!目前GitHub获:star:17.2k。
-
Firefox Send:除了开发最广为人知的 FireFox 火狐浏览器以外,Mozilla 也会做一些开源项目,比如 FireFox Send 这个一次性文件传输共享服务。浏览器是 FireFox Send 发挥作用的主战场,虽然是火狐出品,但它支持了 Chrome、Edge、Safari 等几乎所有的主流浏览器如 ,并不局限于 Firefox 自身。另外,FireFox Send 在 iOS、Android 等移动平台上也能直接访问网页使用,支持 PWA,这种基于浏览器的特性使得使用体验几乎没有割裂感。
-
Send Anywhere:对于一款文件分享服务而言,支持的平台非常重要,因为会直接影响到使用者是否受自己的设备限制。正如它的名字一样,Send Anywhere 在平台支持上十分给力,覆盖面非常广。
-
Filemail:Filemail 是一款协助使用者传输大型文件的网络服务,Filemail 官网给自己的这款服务的描述是「the best way to securely send large files」。
-
WeTransfer:WeTransfer 是一个简单、免费的文件共享网站,一次可以发送多达 2GB 的数据,并且一次共享的文件数量也没有限制。使用 WeTransfer 无需注册或者登陆任何账户,只需输入收件人的电子邮件地址(最多可同时分发给三位)、你的电子邮件地址,即可快速分享。
-
奶牛快传:奶牛快传创建于2016年,是一款专注于即用即走的在线大文件传输服务,也是目前本土化做的最好的,无论是界面还是操作上都十分地通俗易懂。在上传速度方面,据奶牛快传称,无论是上传还是下载,都没有速度限制,完全依托于用户本地网络的带宽。
-
Alternativeto:有时候会为了找一个软件而头疼不已,这里找那里问,就是为了找一个类似的软件来替代,好不容易找到了,还可能不支持手头上的平台。如果是这样,那么该网站就是一个很好的选择。这个网站支持按照平台来搜索,Windows, Mac, Linux 和Web 等平台都可以。在搜索框中键入软件名字然后按下Enter键. 页面加载后,第一眼就可以看到你搜索的软件,往下一拉,就可以看到一大堆的类似软件,可以通过软件授权类型或系统平台来缩小搜索范围。
- Interview Internal Reference:2019年最新总结,阿里、腾讯、百度、美团、今日头条等国内互联网大厂的面试题,还配备有答案和出题人分析等信息。这个项目或许对大家找工作面试有所帮助,推荐等级::heart::heart::heart:!
- Python Interview Question:GitHub上一个:star:3k左右的中文项目,介绍了各种Python相关面试题,可以作为一个Python学习教程
- Interview Code Practice Python:GitHub上的一个项目,用 Python 实现的各类面试题
- Algorithm Interview Notes Chinese:2018/2019/校招/春招/秋招/算法/机器学习(Machine Learning)/深度学习(Deep Learning)/自然语言处理(NLP)/C/C++/Python/面试笔记 ,GitHub 上 ⭐24k
- Coding Interview University:GitHub:star:100k的项目,原名「Google 面试大学」。这份指南里面包含 Google 相关的介绍视频、面试过程、教学资源,同时也有数据结构、算法、密码学等计算机专业的知识讲解。中文版指南链接,推荐等级::heart::heart::heart:!
- CS-Notes:GitHub上:star:70k,Tech Interview Guide 技术面试必备基础知识、Leetcode 题解、Java、C++、Python、后端面试、操作系统、计算机网络、系统设计。在线阅读链接
- Tips for interviewing at Google:谷歌大脑高级软件工程研究员、强化学习框架「多巴胺」(Dopamine)作者 Pablo Samuel Castro 分享了他拿到谷歌 offer 的经验。这份「谷歌面经」不仅适用于谷歌的软件工程师职位,对申请其他公司的软件工程师及其他职位(如研究科学家)也有帮助。
- Hacking a Google Interview:谷歌面试编程题及解题技巧(MIT版),重点介绍科技公司在面试时经常出现的计算机科学问题,其中包括时间复杂度、哈希表、二进制树搜索,以及 MIT「算法设计与分析」(MIT 6.046)课程中会出现的内容。但是,大部分时间都会专注于你不会在课堂上学到的内容,例如刁钻的按位逻辑和解决问题的技巧。
- A-to-Z-Resources-for-Students:GitHub:star:7k,一位国外小哥整理的一份超级全面的计算机学习资源,主要面向人群是学生,但其实上面的内容也可以适用于普通程序员,推荐等级::heart::heart:!
- Awesome-algorithm-interview:算法工程师(人工智能cv方向)面试问题及相关资料的网站收集
- Awesome Interview Questions:这个精选的面试题库不仅全,而且对提交的面试题会进行审核,并且会不定期对链接进行审核,提剔除失效链接,GitHub:star:30k+。推荐等级::heart::heart::heart:!
- Interactive Coding Challenges:20个交互式Python编码面试挑战(算法和数据结构),GitHub:star:19k+。推荐等级::heart::heart::heart:!
- Coding Interviews:《剑指Offer》题目汇总&常考题总结(Python实现)
- 50+ Data Structure and Algorithms Interview Questions for Programmers:Java语言算法和编程面试题精选TOP50,附解决方案。
- 955.WLB:与 996.ICU 相呼应,955 公司白名单。旨在让更多的人逃离 996,加入 955 的行列。GitHub 获:star:20k。
- SoftwareArchitect:高级架构师 Justin Miller 在 GitHub 上创建项目,介绍自己关于「如何成为更好的软件架构师」的想法。该项目发布一天即获得 1.4k ⭐,现在已有 ⭐3.8k。
- DLInterview:上海科技大学 AI 实验室开源的一份深度学习面试题集锦,它从数学基础、经典机器学习算法、深度学习算法以及编程语言等方面提供了众多面试题。此外,这一个项目是作者在准备 2018 年春招实习过程中的总结,内容以计算机书籍的学习笔记为主,在整理重点知识的同时会尽量保证知识的系统性。
- Resume:利用 GitHub 上的信息生成简历的工具。GitHub:star:43.5k。
- ResumeSample:程序员简历模板系列。包括PHP程序员简历模板、iOS程序员简历模板、Android程序员简历模板、Web前端程序员简历模板、Java程序员简历模板、C/C++程序员简历模板、NodeJS程序员简历模板、架构师简历模板以及通用程序员简历模板。GitHub:star:20.8k。
- How to Make More money:程序员如何优雅的挣零花钱,GitHub:star:9.3k
- Coding:国内接项目外包平台,国内首个一站式云端软件服务平台,你可以简单把 Coding 理解为中国版 GitHub,Coding 旗下的一款产品:码市,就是 Coding 的创始人牵头搞起来的,专注于做互联网软件外包服务平台。目前在该平台上,累积对接外包金额 3 亿多人民币,1 万多个项目,15 万开发者。
- 开源众包:国内接项目外包平台,「垂直技术社区 10 年沉淀 350 万 + 活跃开发者 海量行为数据智能匹配」,打开其官网,首先引入眼帘的便是这句话。
- 程序员客栈:国内接项目外包平台,程序员客栈当前累积注册开发者近 40 万,覆盖多个技术领域,各种社会稀缺人才、大厂工程师,都能在上面找到。只要有钱,他们都将为你所用。
- Upwork:国外接项目外包平台,upwork 前身为 Elance-oDesk,与 freelancer 一样,该平台上也为多种不同行业提供服务,而不仅局限于软件外包。诸如微软、Airbnb 等知名企业,都跟 upwork 有过合作。
- Freelancer:国外接项目外包平台,目前是全球影响力最大的自由职业与众包平台,公司创办于 2010 年,总部位于澳大利亚悉尼,员工遍布 240+ 个国家,拥有 4000+ 万的雇主与自由职业者。从软件设计、开发、测试到营销、会计、法律服务,你都能在上面找到对应的合作方,其业务覆盖范围不可谓不广
- Fiverr:国外接项目外包平台,同 freelancer 一样,Fiverr 也创建于 2010 年,不同的是,该公司经营业务较小,主打写作、翻译、图形设计、视频剪辑、软件编程。
- Google Dataset Search: 谷歌提供的数据集搜索工具,可以搜到绝大多数的公开数据集
- Open Images V6:Open Images是谷歌在2016年推出的大规模图像数据集,包括大约900万张图片,标注了数千个图像类别。目前是第六版,新增了507444个局部叙事。博客介绍
- Tencent Ml Images:腾讯开源的超大型多标签图像数据集及模型训练代码
- Machine learning datasets:这个网站上共收集到了100多个业界最大型的数据集。根据任务类别,这些数据集中又分为三大类:计算机视觉(CV)、自然语言处理(NLP)和音频数据集
- Networkrepository:第一个具有实时可视化分析功能的交互式数据和网络数据存储库。里面有许多Graph相关的数据集
- LINQS:提供了一些Graph结构的数据集
- Network Repository:一个交互式科学网络数据仓库,里面含有大量的图结构数据集
- Stanford Network Analysis Project:斯坦福开放的图相关数据集。
- Awesome Public Datasets:GitHub上一个列举了大量公开数据集的仓库,已获:star:30k
- KONECT:一个收集所有类型的大型网络数据集以进行网络科学和相关领域的研究的项目
- Multi-label Datasets & Code:这个页面提供了基准数据集和代码,可以用来评估多标签分类算法的性能。
- Google Trends:同样来自于Google,使用此工具,你可以搜索关键字并查看相关数据集的各种信息。你可以选择不同的选项,包括要查看的国家(或全球),将其缩小到各个类别,或将搜索范围限制在所有网站、图片、新闻、购物或 YouTube 上。
- 微软数据集:在2018年7月,微软与外界研究社区一起,发布了微软研究开发数据。它包含了云服务器中的数据存储库,致力于促进全球研究社区的协作,并在其中提供了一系列用于已发表研究的数据集内容。
- 中文NLP数据集搜索:一项新的中文 NLP 数据搜索项目,它可能是目前最全的中文 NLP 数据集信息收集项目。该项目收集了一百多条中文 NLP 数据信息,并以搜索的形式展示结果。我们只要键入关键词,或者数据集所属的领域等信息,就能找到对应的数据集。GitHub项目地址。
- Awesom Public Datasets:本数据集列表中,按主题整理了大量的数据集内容,例如:生物学、经济学、教育等。其中列出的大多数数据集都是免费的,但在使用任何数据集之前,均需检查数据集的许可要求。
- Amazon数据集:这个数据集中包含了不同领域的数据内容,例如:公共交通、生态资源、卫星图像等。同时提供了搜索功能,以帮助用户找到所需的数据集,还有各种数据集的描述信息以及用例,非常易于使用。数据集存储在Amazon Web Services(AWS)资源中,对于使用AWS构建自己机器学习实验的用户来说,传输速度将非常块。
- U.S. Census Bureau:你可以从这个数据集中获得与人口、经济和地理相关的信息,也可以按主题或搜索进行浏览。如果你需要统计内容,这会是一个很好用的工具。它们有一些很好的可视化效果,你也可以将其嵌入到内容中。
- EU Open Data Portal:这是一个既可搜索又可浏览的平台。可用数据包括:地理,金融,统计学,选举结果,法案,有关犯罪、交通、健康、环境和科学研究的信息等。
- 美国 Data.gov:作为美国政府开放数据的主页,该网站允许访问联邦、州、地方和部落政府提供的各种主题信息。
- 英国 Data.gov:与美国的 Data.gov 类似,该网站允许访问各种主题的数据。这些数据由中央政府、地方当局和公共机构提供
- 欧洲政府数据集:欧洲政府数据集
- 新西兰政府数据集:新西兰政府数据集
- 印度政府数据集:印度政府数据集
- 北爱尔兰公共数据集:北爱尔兰公共数据集
- Health Data:该网站可搜索的主题包括医疗设备、环境卫生、药物滥用、精神健康等等。
- The World Factbook:该数据集包含 267 个国家和地区的信息,这是一个数据宝库,每周更新一次有关全球的信息。你可以选择要查看的国家,然后点击你喜欢的任何主题(如经济或交通)。该网站是可检索的。它还有一个关于世界领导人和一个关于 CIA Maps 的专栏。
- Altmetric:Altmetric 有些数据是需要付费的,但它们还提供每年发布的最具热度的前 100 篇文章,这非常有用。
- Open Corporates:Open Corporates 是全球最大的公司开放数据集,可让你访问超过 1 亿家公司的信息。
- National Center for Environmental Information:这个数据集涵盖地球物理学、大气和海洋数据。他们目前是世界上最大的气候和天气信息提供商。他们还提供了旧工具的链接,这些工具目前可能在网站上不可使用,但可用于其他地方。
- Reddit:虽然你需要注册,但它是免费的。你可以搜索数据集并查找提供信息和请求信息的人。总的来说,Reddit 也是一个寻找信息并了解行业趋势的好地方。
- Kaggle 数据集:Kaggle 目前有将近 16,000 个数据集。你可以找到从运动队球员统计到洛杉矶停车引语任何范畴的数据。
- NASA 的 Earth Data:NASA 的 Earth Data
- Pew Internet:如果你需要的是社会学数据,这是一个很好的数据源。你还可以通过浏览找到一些有趣的文章。虽然需要注册才能查看和下载数据集,但它也是免费的。
- Centers for Disease Control and Prevention:该网站包括各种健康主题,可让你访问大量可浏览和可搜索的数据。甚至可以通过各种与主题相关的网站创建自己过滤的数据集。
- Bureau of Labor Statistics:你可以在这里找到有关美国劳动力市场活跃度、工作条件和价格变化的数据。
- Five Thirty Eight:这个网站有关于政治、体育、科学、健康、经济和文化方面的数据。
- Group Lens:Group Lens 上有几个可用的数据集,这些数据集对特定的项目很有用。一些数据集已有十多年的历史。你可以在这里得到很多关于书籍和电影的信息。
- BuzzFeed News:这个网站给你提供了来自 Buzzfeed 的数据。如果你想了解 2016 年至 2018 年期间的假新闻,那么这个就是你的最佳选择。
- find-free-images-online:一个很好的免费图像来源列表。
- UCI机器学习库:这是网络上最早的数据集来源之一,是寻找各种有趣数据集的第一选择。虽然用户提供的数据集的清洁度不太一样,但绝大多数都是干净的。我们可以从 UCI 机器学习库直接下载数据,无需注册。
- UCI机器学习数据集:这个数据集来自于加州大学信息与计算机科学学院,其中包含了100多个数据集。根据机器学习问题的类型对数据集进行分类,可找到单变量或多变量时间序列数据集,以及分类、回归或推荐系统的数据集。
- VisualData:在这里计算机视觉数据集按类别分组,并且支持搜索查询。
- Quandl:里面有很多经济和金融数据,你可以使用这些数据建立预测经济指标或股价的模型。
- 世界银行开放数据(World Bank Open Data):涵盖世界各地人口统计、大量经济和发展指标的数据集。
- 货币基金组织的数据(IMF Data):国际货币基金组织公布关于国际金融、债务率、外汇储备、商品价格和投资的数据。
- 英国金融时报金融时报市场数据(Financial Times Market Data:):里面有来自世界各地的最新金融市场信息,包括股票价格指数、商品和外汇。
- 数据美国(Data USA:全面的、可视化的美国公共数据。
- 食品环境地图集(Food Environment Atlas:当地的食物选择如何影响美国饮食的数据。
- 学校系统财务状况(School system finances:这里有美国学校系统财务状况的调查。
- 慢性病数据(Chronic disease data:美国各地慢性病指标的数据。
- 美国国家教育统计中心 (The US National Center for Education Statistics):来自美国和世界各地的教育机构和教育人口统计数据。
- 英国数据服务:英国最大的社会、经济和人口数据收集机构。
- 美国经济协会(AEA):这里你可以找到美国宏观经济的相关数据。
- Labelme:数据集中包含大量有标注的图像数据。
- ImageNet:是一个用于视觉对象识别软件研究的大型可视化数据库。超过1400万的图像URL被ImageNet手动注释。根据 WordNet 层次结构来组织,其中层次结构的每个节点都由成百上千个图像来描述。
- LSUN:场景理解与许多辅助任务(房间布局估计,显着性预测等)
- MS COCO:通用图像的理解和文字描述。
- COIL 100:在 360 度旋转中以各个角度成像的 100 个不同的物体。
- 视觉基因组:非常详细的视觉知识库,配以大量带有文字描述的图像。
- 谷歌的Open Images:知识共享”(Creative Commons)下的900万个图像网址集合,已标注超过6,000个类别的标签。
- Labelled Faces in the Wild:13,000个人脸标记图像,用于开发涉及面部识别的应用程序。
- Stanford Dogs Dataset:包含20580张图片和120个不同的狗品种类别。
- 室内场景识别(Indoor Scene Recognition):这是一个非常细化的数据集,由于大多数在“户外”场景中表现良好的场景识别模型在室内表现不佳,因而这个数据集非常有用。内有 67 个室内类别,共 15,620 张图像。
- 多域情感分析数据集(Multidomain sentiment analysis dataset):一个比较有历史的数据集,里面还有一些来自亚马逊的产品评论。
- IMDB:影评,也是比较有历史的二元情绪分类数据集、数据规模相对较小,里面有 25,000 条电影评论。
- 斯坦福情感树银行(Stanford Sentiment Treebank):带有情感注释的标准情绪数据集。
- Sentiment140:一个流行的数据集,它使用16万条推文,并把表情等等符号剔除了。
- Twitter 美国航空公司情绪数据集 (Twitter US Airline Sentiment):自 2015 年 2 月以来美国航空公司的 Twitter 数据,分类为正面、负面和中性推文。
- 安然数据集:里面有安然集团高级管理层的电子邮件数据。
- 亚马逊评论:里面有3500万条来自亚马逊的评论,时间长度为18年。数据包括产品和用户信息、评级等。
- Google Books Ngram:来自Google书籍的词汇集合。
- 博客语料库:从blogger.com收集的681,288篇博客文章。每个博客至少包含200个常用的英语单词。
- 维基百科链接数据(Wikipedia Links data):维基百科全文。该数据集包含来自400多万篇文章,近19亿字。你可以对字、短语或段落本身的一部分进行搜索。
- Gutenberg电子图书列表:Project Gutenberg的附加注释的电子书列表。
- 加拿大议会的文本块(Hansards text chunks of Canadian Parliament):来自第36届加拿大议会记录的130万对文本。
- 危险边缘 (Jeopardy):来自问答游戏节目《危险边缘》(Jeopardy) 的超过 20 万个问题的存档。
- 英文SMS垃圾邮件收集(SMS Spam Collection in English):包含5,574条英文垃圾邮件的数据集。
- Yelp评论(Yelp Reviews):Yelp发布的一个开放数据集,包含超过500万次评论。
- UCI的垃圾邮件库(UCI’s Spambase):一个大型垃圾邮件数据集,用于垃圾邮件过滤。
- Berkeley DeepDrive BDD100k:这是目前最大的自动驾驶 数据集。里面有超过 1,100 多个小时驾驶体验的视频,包含10 万个在一天中不同时段以及在不同天气条件下的数据。
- 百度 Apolloscapes:大型数据集,定义了26种不同的语义项,如汽车,自行车,行人,建筑物,路灯等。
- Comma.ai:超过7个小时的高速公路驾驶视频。里面的数据包括汽车的速度、加速度、转向角和GPS坐标。
- 城市景观数据集:记录50个不同城市的城市街道场景的大型数据集。
- CSSAD数据集:包含自动车辆的感知和导航等数据,但着重于发达国家的道路。
- 麻省理工学院AGE实验室(MIT AGE Lab:):在AgeLab收集的1,000多小时多传感器驾驶数据集的样本。
- LISA:智能和安全汽车实验室,加州大学圣地亚哥分校数据集:该数据集包括交通标志,车辆检测,交通信号灯和轨迹模式。
- 博世小型交通灯数据集(Bosch Small Traffic Light Dataset):用于深入学习的小交通灯数据集。
- Lara交通灯识别(LaRa Traffic Light Recognition):巴黎交通灯的数据集。
- WPI 数据集:交通灯、行人和车道检测的数据集。
- The Best Public Datasets for Machine Learning and Data Science:上述的大部分资料都来自于该网址,经过数小时的网络搜集,作者为高质量和多样化的机器学习数据集创建了一个伟大的备忘单。
- 开源数据集(机器之心整理):skymind.ai 发布的一份非常全面的开源数据集。内容包括生物识别、自然图像以及深度学习图像等数据集,经机器之心整理。
- Awesome-Cybersecurity-Datasets:网络安全数据集列表大全。
- Code Reviewer:
- Review Assistant:Review Assistant 是 Visual Studio 的一个扩展。它支持 Visual Studio 2019、2017、2015、2013、2012 和 2010。Review Assistant 可以帮助创建审查请求并能在不离开 IDE 的情况下对请求做出响应。它支持 TFS、Subversion、Git、Mercurial 以及 Perforce。Review Assistant 将“代码审查板(Code Review Board)”窗口添加到 IDE 中。该窗口可用于管理用户所有可用的审查。
- Reshift:Reshift 是一个基于 SaaS(Software-as-a-Service,软件即服务)的软件平台,它可以帮助软件开发团队在部署代码到生产环境之前,更快地识别出代码中更多的漏洞。可以减少发现和修复漏洞的成本和时间,可以识别数据泄露的潜在风险,并能帮助软件公司达到合规性和法规要求。
- Gerrit:这是一个开源的轻量级工具,它是基于“Git 版本控制系统”来进行构建的。在所有用户都是受信提交者的项目环境中,该工具非常有用,因为该工具允许用户检查项目中所做的总体变更。
- Codestriker:Codestriker 是一个开源的在线源码审查 Web 应用程序。此代码审查工具可以帮助我们在数据库中记录问题、注释和决策。它也可以用于代码检查(Code Inspections)。
- Phabricator:Phabricator 是一个开源的源码扫描程序。它还包括了基于 Web 的轻量级代码审查、规划、测试、bug 发现等功能。
- Crucible:Crucible 是一个基于 Web 的代码质量工具。开发人员利用它来进行代码审查、bug 及缺陷发现、变更讨论和知识共享。该工具可以帮助他们捕获主要缺陷并改进他们的代码架构。
- Review Board:Review Board 是一个安全的代码审查工具。它可用于开源项目和公司的代码审查和文档审查。
- Barkeep:Barkeep 是一个友好的代码审查系统工具。它提供了一种最简单的方法来审查代码。它允许我们查看任何 Git 库的提交、查看差异点并编写注释。
- Reviewable:Reviewable 是一个轻量级的、功能强大的代码分析工具,它使代码审查更快、更全面。它通过用户界面清理、bug 发现以及语法高亮显示来帮助我们提高代码质量。
- Peer Review Plugin:Peer Review Plugin 消除了耗时的代码审查会议的需求,因为它使我们可以在基于 Web 的用户友好的环境中审查代码。
- Codacy:Codacy 工具通过静态代码分析自动识别问题。在每个拉取(pull)和提交(commit)请求中,它能快速地告诉用户有关安全性问题、代码重复和代码复杂度的信息。
- CodeFactor.io:使用 Code Factor 工具,我们可以了解整个项目的代码质量、最近提交的内容以及问题最多的文件。我们可以针对每次提交(commit)和拉取(pull)的请求进行跟踪及问题修复。
- Helix swarm:Helix swarm 是一个代码审查工具,它可以安排审查、共享内容并查看代码审查变更。它支持持续集成部署。它可以帮助我们监控进度、自动化设计过程并提高项目的发布质量。
- Rhodecode:Rhodecode 是一个开源的、安全的企业级源码管理工具。该工具可作为 Git、Subversion 和 Mercurial 的集成工具。
- Veracode :Veracode 是一个代码审查和静态分析工具。它是基于 SaaS 模型构建的。此工具允许我们从安全性的角度分析代码。该工具使用二进制代码 / 字节码,并能保证 100% 的测试覆盖率。
- JArchitect:JArchitect 是一款易于使用的代码审查工具,可用于分析 Java 代码。每次审查后,它都会发送一份项目开发相关的报告。该工具还可以帮助我们提高代码的可维护性。
- SonarQube:SonarQube是市场上最受欢迎的代码质量和安全性分析工具。它在开源社区的支持下,目前可以分析和产生对超过25种编程语言的输出,这比市场上大多数工具都要高。它具有免费的社区版本和其他付费版本。
- Kritika:Kritika.io是一款出色的在线代码分析工具,可直接为你分析公共和私有存储库。
- DeepScan:DeepScan擅长扫描Javascript代码存储库。它能够处理几乎所有javascript框架的动态代码质量检查。
- Klocwork:Klocwork可以对几乎任何大小的项目执行静态代码分析。使用Klocwork的主要好处是它可以轻松地与Visual Studio Code IDE,Eclipse,IntelliJ等集成。这使开发人员更容易使用Klocwork。此外,它也可以集成到CI/CD管道中,以确保交付前的代码质量。它支持C,C#,C ++和Java。
- CodeSonar:CodeSonar是一种统计代码分析工具,可以从计算角度分析代码。它能够从你的代码中开发模型,分析它们的潜在执行威胁,例如锁死,内存溢出,空指针,数据泄漏以及可能难以捕获的许多此类程序错误。
- Bandit:Bandit是一个Python安全漏洞扫描工具,可扫描python软件包中的安全漏洞。它是数据科学家和AI专家中流行的工具,用于构建符合组织标准的代码。Bandit可用于命令行界面。
- Fortify:Micro Focus的Fortify专注于扫描代码库中的安全漏洞。它着眼于已知的安全漏洞以及可能存在问题的任何恶意软件或损坏文件的存在。
- Codecov:Codecov是用于管理代码库以及使用单个实用程序进行构建的综合工具。它分析推送的代码,执行所需的检查,并在需要时自动合并它们。
- Lepton:一个很好用的开源代码片段管理软件,基于GitHub Gist。GitHub:star:6.8k,推荐等级::heart::heart:!
- Codeimg.io:Codeimg.io 是一个仍在测试中的创建代码图像的工具,目前发布了创建代码图像所需的基本功能:按照常用社交平台 Facebook、Twitter、Instagram 及自定义创建项目、支持 JPG、PNG 和 SVG 项目格式、调整字体大小、保存用户定义的设置等。
- Carbon:Carbon 是由 Dawn Labs 创建开发的一个代码转图像的开源项目,目前在 GitHub 上拥有 ⭐200k+。
- Glorious Demo:Glorious Demo 是一个开源的 JavaScript 库,它提供了一个简单的 API 来为你的代码示例创建动画。目前在 GitHub 拥有:star:3k。GitHub
- CodeZen:CodeZen 是一个非常简约的代码转图像工具,就像操作文本编辑器一样简单,能快速将你的源代码导出为具有语法风格的图像。
- StarHistory:查看某个项目的 star 的增长趋势,Github:star:1.6k
- Pure Bash Bible:这是一位澳大利亚的工程师在Github上开源了一本书——《pure bash bible》,本书收集汇总了编写 bash 脚本经常会使用到的一些代码片段,无论是常见和不太常见的方法都可以在这书里找到,通过书中的代码片段,可以删除脚本中的依赖项,并且在大多数情况下可以让程序运行的更快。GitHub:star:23.9k。推荐等级:heart::heart::heart::heart:!
- VS Code Debug Visualizer:写代码,难免会遇到各种神奇的问题,代码短我们在脑海中「运行」一遍也就差不多能找出原因。但代码要是比较长,错误就会隐藏比较深了,这个时候,不论你是采用 print() 大法,还是善用 assert 语句,或者干脆设置断点,DeBug 总是一条慢慢排除的道路。那么能不能有一种更优雅的 DeBug 方式,以更简洁的信息快速帮我们找到代码的问题所在?这就是 VS Code 最新推出的可视化 DeBug,它能以图的方式快速展示数据结构。但目前遗憾的是它并不支持Python。
- Awesome:各种Awesome 资源大全,GitHub ⭐123k,推荐等级❤️❤️❤️❤️!
- Web Develope Roadmap:web 开发者学习路线图,GitHub ⭐93.2k,推荐等级❤️❤️❤️❤️!
- Let's Build A Simple Interpreter:加拿大工程师Ruslan Spivak写的如何利用Python自己写一个编译器文章的博客,适合用于学习编译原理。GitHub代码
“如果你不知道编译器是如何工作的,那么你就不知道计算机是如何工作的。 如果你不是100%确定你是否知道编译器是如何工作的,那么你就不知道它们是如何工作的。“ - Steve Yegge
- Let’s Build A Web Server:加拿大工程师Ruslan Spivak写的如何利用Python自己写一个网络服务器的博客,适合用于学习Web server。GitHub代码
- StackOverFlow:这个就不用介绍了,应该是世界上最大的问答网站了
- Mathematics Stack Exchange:Mathematics Stack Exchange是一个类似StackOverFlow的问答网站,主要提供数学问答
- Emoji Homepage:一个Emoji大全的网站,里面有各式各样的Emoji大全,点击想要的Emoji即可复制,用于写文章加入 Emoji 十分方便
- Tiler:像文字云一样,用各种小图拼出大的图片,构建一个像素风的世界。GitHub:star:4k。
- Moji, Moji, Emoji:这是一个可根据图片配色,将图片转为用 emoji 填充的工具。在线体验地址
- Greasy Fork: 一个提供用户脚本的网站,浏览器安装好 TemperMonkey 后,使用这些脚本上网简直不要爽到飞起
- Remove.bg:一个可以在线免费消除图片背景的网站,并且提供API供批量处理图片使用(收费),简单方便(只需几秒钟,但效果强大
- Advanced Java:GitHub:star:25k,互联网 Java 工程师进阶知识完全扫盲:涵盖高并发、分布式、高可用、微服务等领域知识,后端同学必看,前端同学也可学习,推荐等级::heart::heart::heart:!
- Windows Keyboard Shortcuts:微软官方:Windows 中的键盘快捷方式
- Naptha:一位来自MIT的学生Kevin Kwok用计算机视觉算法写了个Chrome插件Naptha,可以直接识别网页图片中的文字,并直接对它们进行高亮、复制粘贴、翻译、修改等操作。Chrome插件下载地址
- PDFresizer:只需几下点击,允许对PDF文件分割和合并,优化,裁剪,调整大小,进行在线转换。
- Xg2xg:前 Google 工程师出品,最佳开发工具大全,这份清单中列出的开源软件,不仅解决了硅谷大厂前员工的难处,也能为其他所有码农解除困惑。在这套大全的指导下,任何一个工程师,都能获得类似在谷歌内部写代码的体验。目前Github上获:star:7k+。推荐等级::heart::heart::heart:!
- Learn SQL:想成为数据科学家,SQL 是必不可少的一项技能,因为抽取数据是数据建模的基础流程之一。这通常需要对数据库运行 SQL query。如果你没有学完上述 Dataquest.io 数据科学课程,那么这里有一些免费资源可供选择。Codeacamdemy 有一门 SQL 入门课程,这门课实践性很强,学习过程中你可以在浏览器内进行编程。如果你还想了解基于云的数据库查询,那么 Google Cloud BigQuery 是不错的选择。它有免费试用方案,你可以免费尝试 query、大量公共数据集,以及阅读官方文档。
- Learn-R:要想成为全面的数据科学家,只学 Python 还不够。推荐大家学习一门 R 语言入门课程。Codeacademy 就有一门免费入门课程。
- Dism++:Dism++ 是一款 Windows 系统管理优化工具,它解决了我们安装、维护系统的一大痛点问题——自定义设置和优化。相当于一个 “一站式” 管理优化工具集。
- HackMD:為工程師文件而生的協作平台,HackMD 主打即時文件協作(real-time collaboration)
- Google Drive:谷歌云盘,随时随地使用所有文件
- Notion:付费过印象笔记,用过其他一些笔记软件,应该说没有一个满意的,直到最近发现了这个,notion,你值得拥有,已经付费使用了,喜欢这种 All in one 的理念,而且排版和功能性都一级棒
- Wolfram Alpha:Wolfram Alpha,是由 Wolfram Research 公司推出的一款在线自动问答系统。其特色是可以直接向用户返回答案,而不是像传统搜索引擎一样提供一系列可能含有用户所需答案的相关网页
- ChromeAppHeroes:这个项目中总结的”Chrome 插件英雄榜” 详细地为大家整理、介绍了一些实用性的插件。Github:star:10k+。
- 谷歌插件网:因为一些冲所周知的原因,谷歌浏览器上面很多实用的插件都用不了,但是有了这个网站之后,无需科学上网也可以下载chrome浏览器插件。
- Production Level Deep Learning:众所周知,深度学习模型仅仅只是构建 AI 产品的重要步骤,但并不是全部。一个互联网产品(如 APP)想要集成深度学习能力,往往还需要走完很多设计、开发和测试方面的工作。如何部署深度学习往往成为了系统设计中更关键的问题。近日,GitHub 上有这样一个项目,专门介绍了如何将深度学习算法和模型融入到互联网产品中。项目基本以流程、架构图为主,目前仍在完善中,适合产品经理和开发者学习。
- Google Colab:Google Colab是帮你快速了解Python代码的利器,你可以直接在上面运行一些好玩好用的Jupyter Notebook项目。对于初学机器学习的人,即使你没有很好的硬件,也可以利用谷歌的免费资源来跑程序。同时上面还有很多GitHub相关技术教程汇总。推荐等级::heart::heart:!
- Awesome Google Colab:GitHub上的一个新项目,Colab资源汇总。作者还自己建了非官方的colab网站,收集了大量学习资源。同时上面还有很多GitHub相关技术教程汇总。推荐等级::heart::heart::heart:!
- Microsoft To-Do:微软打造的PC版 TODO 工具
- Marmoset:Marmoset 是一款 Chrome 应用程序,可以让你以透视的方式截取你的代码截图。
- Material Design:图标设计大全,GitHub:star:7.1k。
- Fontawesome:字体和图标库,GitHub⭐66k+。
- AutoFlip:谷歌开源的智能视频剪裁框架,其基于谷歌 MediaPipe 框架,从此裁剪视频不用愁,其能够实现自动剪辑。视频尺寸、精彩内容通通自动化,文档地址。GitHub:star:4.7k。
- Cpp-Primer:《C++ Primer 第五版》英文版习题解答。
- Cpp_Primer_Answers:《C++ Primer 第五版》中文版习题解答
- Cpp_Primer_Practice:《C++ Primer 第五版》笔记和课后练习答案
- AI Portraits Ars:MIT和IBM沃森联合实验室,发布了这只画师,名叫AI Portraits Ars,可以在线玩耍。但由于生成的画像过于形神兼备,上线即遭网友大规模涌入,不到三天服务器就崩坏了。
- SpeedCoder:你打特殊符号的次数越多,你打字速度就越快。然而,你只要做一件小事就能很大程度上加快这个过程——学习好的触摸打字方式。这是一个练习快速打代码的网站。
- Halo: 一个优秀的开源博客发布应用,无论你是想搭建个人博客还是单纯学习,这套开源项目都值的你去细细评味。GitHub:star:13.7k,推荐等级::heart::heart:!
- bewindoweb:某个同学把他大部分能想到的、有用的网站都整理成了书签,其中包括了写论文必备、程序员通用、数据源下载、在线工具网站、设计素材、办公常用、学生常用.......你能想到的,想不到的有用的网站都收集在这里面了,一共100多个,当你需要学习工作的时候,直接去对应的网站找到你想要的东西,大大提升你的效率,推荐等级::heart::heart::heart::heart:!
- User.me:不需要安装,就可以在线编辑Office,使用PS、Visio、Xmind、Matlab、Jupyter等等大型软件。还有CAD、WPS、SPSS等,有了它,我们的PC上就不需要装那么多软件了。
- Office Converter:office文档格式、视频格式、音频格式、图片格式、电子书格式.......只有你想不到,没有你找不到,有所的格式都可以在这个网站上转换。
- freecomputerbooks:这是一个专注于计算机、变成、数学、电子工程、软件工程等技术书籍的网站,所有资源均可免费下载。网站的分类做得非常棒,资源也很丰富,还能看到不少2019年新出版的新书。