QQ-Plot
QQ代表分位数-分位数图 。 这是一种直观地检查数值变量是否符合正态分布的方法 。
Violin Plot
小提琴图和箱形图是相关的 。 从小提琴图中可以得到的另一个信息是密度分布 。 简单地说它是一个与密度分布集成的箱形图 。
Boxen Plot
Boxen Plot是seaborn库引入的一种新型箱形图 。 对于箱线图的方框是在四分位上创建的 。 但在Boxen plot中 , 数据被划分为更多的分位数 。 它可以提供了关于数据的更多见解 。
Point Plot
点坐标图包含了一些名为误差线的线的折线图 。
通过上图所示的点的位置来表示数值变量的集中趋势 , 误差线表示变量的不确定性(置信区间) 。 绘制折线图是为了比较数值变量在不同类别值下的变异性 。
Swarm plot
分簇散点图是另一个受“beeswarm”启发的有趣图表 , 我们可以了解不同的分类值如何沿数值轴分布。
Word Cloud
在单云图中 , 所有的单词都被绘制在一个特定的区域 , 频繁出现的单词被高亮显示(用较大的字体显示 。
Sunburst Chart
旭日图是环行图或饼图的定制版本 , 它将一些额外的层次信息集成到图中 。
地理空间数据可视化地理空间数据可视化侧重于数据与其物理位置之间的关系 , 地理空间可视化的独特之处在于其规模都不较大 。
地理可视化将变量叠加在地图上 , 使用纬度和经度来显示信息 。
地图是地理空间可视化的主要焦点 。 它们的范围从描绘街道、城镇、公园或分区到显示一个国家、大陆或整个星球的边界 。 它们充当额外数据的容器 。 它们可以帮助识别问题、跟踪变化、理解趋势 , 并执行与特定地点和时间相关的预测 。 所以这里单独将其提出说明
一些用于地理空间数据可视化的python库和工具
tableau power b.i. ,ArcGIS QGIS等都可以用于复杂的地理空间数据可视化 。 python中也有很多也非常适合地理空间数据可视化的库 , 例如
- Geoplot
- Folium
- Geopandas
- PySAL
- rworldmap
- rworldxtra
- etc.
这里使用了HIFLD的医院数据集 , 其中包含医院位置和其他医院信息 。 根据授权信息这个数据是可以被公开展示的
主数据集中有34个特征 。 出于演示目的 , 我将使用“ADDRESS”、“STATE”、“TYPE”、“STATUS”、“POPULATION”、“LATITUDE”、“LONGITUDE”这些特征 。 其中“LATITUDE”和“LONGITUDE”将用于确定医院在地图上的位置 , 而其他列如STATE、TYPE和STATUS用于过滤 , 最后ADDRESS和POPULATION用作自定义地图上的标记的元数据 。
绘制基本地图
导入绘制地图所需的库 。
import pandas as pdimport foliumfrom folium.plugins import MarkerCluster
加载数据集 。
hosp_df = pd.read_csv('/work/Hospitals.csv')
过滤数据 。
WORKING_COLS = [\"ADDRESS\" \"STATE\" \"TYPE\" \"STATUS\" \"POPULATION\" \"LATITUDE\" \"LONGITUDE\"
STATE = \"CA\"hosp_df = hosp_df.loc[hosp_df[\"STATE\"
== STATE WORKING_COLS
hosp_df.head(5)
一些数据预处理 。
hosp_df = hosp_df[hosp_df[\"POPULATION\"
>= 0
hosp_df.describe()
绘制地图
Folium提供了.Map(), 它将位置参数作为包含一对纬度和经度的列表 , 并围绕给定位置生成一个地图 , 自动将生成的地图会围绕数据居中 。
m=folium.Map( location=[hosp_df[\"LATITUDE\"
.mean() hosp_df[\"LONGITUDE\"
.mean()
zoom_start=6)m
- 三星|数据出炉,台积电狂赚5000亿,失去华为后,台积电为何越来越好?
- 数据库|裁剪视频画面的软件叫什么?视频画面裁切软件大分享
- AMD|不拼核战 intel第四代至强CPU如何稳住数据中心王座?
- 算法|手把手教你搭建数据指标体系
- 雨水情自动测报系统,水雨情远程监测系统-数据实时监测
- 算法|恒讯科技分析:如何解决云服务器上MySQL数据库的常见问题?
- ZOL科技早餐:英特尔6GHz睿频处理器上架,苹果新春电影《过五关》发布
- 社会机构|我国首个超大城市区块链基础设施支持数百亿条数据共享
- RTX 4080|1500元以下入门机型怎么推荐?权威机构数据来了
- excel|Excel如何将多个单元格数据保留并合并单元格