数据可视化 | vis.zone数据可视化

代码库

编码工具,主流语言是 JavaScriptPython

其它语言如 R、SAS、Ruby, 在市场量级上不上两者

Python 多用于 数据分析 , 侧重 精确性解释性

JavaScript 多用于 网页展示 , 侧重 美观性交互性

基础知识
  • 在网页上绘图,一般使用 画布SVG
  • 3D图形基于 WebGl 技术
  • 一般情况 不直接使用基础API ,而是通过工具库绘制
  • 如果定制库高,才使用
CanvasSVGWelGL
D3 ( JavaScript )
  • 全能型 库,可以绘制任意 2D 可视化
  • 特点 :只是一个数据驱动工具,不直接绘制图形
  • 一般用来驱动 SVG,也提供了 Canvas 支持
  • 缺点 :难度较高,比较基础,需要大量代码进行构造
官网DemoAPI ReferenceGithubSlack
Antv
  • 阿里出品,近几年投入力度很大,已走向成熟
  • 普通图形 : G2 (普通页面)/ F2(移动页面)
  • 关系流程 : G6 (图数据)/ X6(流程/层级数据)
  • 地理位置可视化 :L7
  • 都是蚂蚁团队研发,API规范比较接近,系统性较强,熟悉的话,后续出新可视化库也可很快入门
官网G2F2G6X6L7
ECharts
  • 百度出品,后贡献给 Apache
  • 特点 : 通过配置项配置生成图形
  • 优点 : 比较老牌,网络资源多,针对性插件、扩展较多
  • 缺点 : 灵活性低,高级需求很难定制
  • 有GL插件可配置3D图像,但BUG较多
官网GithubDemo配置项手册GL
MatPlotLib ( Python )
  • 综合性库,可创建静态、动画和交互式可视化效果。
  • API简单,功能也很强大
  • 生产力工具,与 iPython/Jupyter 等完美结合
官网Demo文档
Seaborn ( Python )
  • 基于 MatPlotLib, MatPlotLib 高级版
  • Pandas 的数据结构完美集成,更加方便
  • 解释性 API,更易使用
官网DemopandasNumpy
Easy Visual ( JavaScript )
  • 本人开发的可视化库,代码丑陋,且没时间维护,暂不开源,请谨慎使用
  • 基于 D3.js SVG,支持 Dom / React
  • 内置常用 皮肤/样式/滤镜/纹理 等,可直接使用
查看Demo
一些其它库

工具 & 软件

分析师将数据变成作品的工具

种类较多,一般分为 通用型专用型

有入门门槛, 除了需要学习使用方法外

还需要 理论基础 结合 业务知识 进行创作

Tableau
  • 知名度最高的可视化工具之一
  • Public 免费版本功能比较有限
  • 优点 :上手容易, 功能强大, 且公司比较专业
  • 客户端、移动端、云云台等全平台覆盖、
  • 社区活跃,网络资源,教程也很多
官网教程
Microsoft Power BI
  • Microsoft 出品,与 Office 集美好
  • 版本 :Desktop(免费), Pro, Premium.
  • 优点 : Office交互操作方式,界面漂亮
  • 缺点 :门槛略高,但灵活度高于 Tableau
官网
MataBase ( Clojure )
  • 开源数据分析工具,轻量但强大!
  • 通过Question提炼数据, 不要求会写SQL
  • 极大降低 “数据分析” 的成本
  • 支持近20种数据库
官网Github文档
Kibana ( Nodejs )
  • ELK 三件套之一,Elastic Search 必备
  • 可以做为 ES 数据开发与探索工具
  • 优点也是缺点,仅支持 ES
  • 与 MataBase 一样,即可免费下载代码,也可直接使用服务
官网Github文档Elastic
Microsoft Excel
  • Office 软件,具备可视化高阶功能
  • 优点 :Office生态覆盖广,PC、Mac、Andorid、IOS 全通
  • 缺点 :复用较难,且部分功能需要打开者也可安装扩展
  • 适用与简单事务、个人事务,商业化应用一般不会使用
官网
ProcessOn.com
  • 一款 在线作图 工具,打开网页即用
  • 流程图、思维导图非常方便、胜于客户端软件
  • 免费功能基本够普通用户使用
工具首页Demo : 数据可视化
其它
  • Cite Space : 文献可视化分析工具, 学术最爱
  • Spotfire : 与 Tableau 功能类似,国内使用较少
  • Splunk [中文] : 成熟的日志处理可视化分析产品

课程

精挑细选相关课程,不定期更新,不存在利益关系

可视化是综合学科,会涉及各方面的知识,需结合应用

基本为 理论课,网络上 实战课 众多,多为大厂专家教授

根据情况报班学习,课堂应该是给你省时间,而不是消耗你时间的

可汗学院 ( 免费看,认证需付费 )
  • 全世界学数学 最好的地方
  • 课程质量实在太高,但主要是英文,部分有字幕
  • 浅层次入门看有道版本公开课,几分钟讲清一个概念
官网统计与概率数据分析统计学(公开课,有道)
慕课平台
  • 学堂在线 : 清华主办,合作者也是顶级名校
  • 数据科学相关课程质量不低于 CourseraEdx
  • 中国大学 :相对学堂在线较互联网化,学科类目可做为补充
  • 坚持很重要,个人不在乎认证证书(可能以后会后悔)
数据挖掘数据可视化
得到 ( 付费 )
  • 得到课程在国内,质量上上层,远超其它教育平台
  • 更多讲授思维方式,用思考方法指导行动
  • 下面课不错,即便高手听一听,也会有收获
  • 建议对着文稿边看边听边思考
数据思维课(宣明栋)概率论(刘嘉)

书籍

下面所有书籍,都满足以下三个条件

我自己看过 : 所有的书,我都买过纸版读过( 技术类暂不建议读电子版 )

感觉有收获 : 虽然技术书不谈思想,但还是有大量的书太浅薄,浪费时间,已经过滤

豆瓣 8分 以上,评价人数不能太少

数据可视化
  • 豆瓣 8.3
  • 非常全面,即可当读物,也可当工具书
  • 前四章含金量非常高
豆瓣去购买
商务与经济统计
  • 豆瓣 9.2
  • 概率统计教科书:真正的从入门到精通,一书全包
  • 案例丰富,推导清晰,但后半部分骗难,需要数学基础
豆瓣去购买
机器学习
  • 豆瓣 8.7
  • 机器学习相关的书太多,推荐周老师这本《西瓜书》
  • 理论分析与实用结合,小白也能大致了解原理
豆瓣去购买
数据分析思维
  • 豆瓣 8.3
  • 偏实用,讲解分析思路及方法,如果解决问题
  • 介绍了不少行业知识,相应分析思路
豆瓣去购买
用数据讲故事
  • 豆瓣 8.4
  • Google分析团队出品,总体质量还可以
  • 结合视觉科学、心理学、认知学等理论
豆瓣去购买
设计的125条通用法则
  • 豆瓣 8.9
  • 字典工具书,列了 125 个设计原则
  • 感觉没灵感时,可以随便翻翻找灵感
豆瓣去购买
WebGL编程指南
  • 豆瓣 8.9
  • 目前 WebGL 方面,讲解最好的书
  • 偏基础,略难,需要结合计算机图形学
豆瓣去购买
SQL必知必会
  • 豆瓣 8.5
  • SQL 入门书,通俗易懂
  • 书如其名,内容都是SQL的必备知识
豆瓣去购买
数据可视化分析:Tableau原理与实践
  • 豆瓣 8.9
  • Tableau 工具入门书
  • 逻辑清晰,由浅入深
豆瓣去购买

其它资源

数据科学 / 可视化周边 / 发现有趣的东西

不定期更新 / 投稿 ada87at163dotcom

综合网站
机构
数据集
商业应用