Seaborn库绘制单变量分布和双变量分布

Matplotlib虽然已经是比较优秀的绘图库了,但是它有个今人头疼的问题,那就是API使用过于复杂,它里面有上千个函数和参数,属于典型的那种可以用它做任何事,却无从下手。

Seaborn基于 Matplotlib核心库进行了更高级的API封装,可以轻松地画出更漂亮的图形,而Seaborn的漂亮主要体现在配色更加舒服,以及图形元素的样式更加细腻。

不过,使用Seaborn绘制图表之前,需要安装和导入绘图的接口,具体代码如下:

#安装 pip3installseaborn
#导入 importseabornassns

Seaborn库的可视化数据分布

当处理一组数据时,通常先要做的就是了解变量是如何分布的。

对于单变量的数据来说采用直方图或核密度曲线是个不错的选择,对于双变量来说,可采用多面板图形展现,比如散点图、二维直方图、核密度估计图形等。

针对这种情况,Seaborn库提供了对单变量和双变量分布的绘制函数,如displot()函数、jointplot()函数,下面来介绍这些函数的使用。

绘制单变量分布

可以采用最简单的直方图描述单变量的分布情况。Seaborn中提供了distplot()函数,它默认绘制的是一个带有核密度估计曲线的直方图。distplot()函数的语法格式如下。

seaborn.distplot(a,bins=None,hist=True,kde=True,rug=False,fit=None,color=None)

上述函数中常用参数的含义如下:

(1)a:表示要观察的数据,可以是Series、一维数组或列表。

(2)bins:用于控制条形的数量。

(3)hist:接收布尔类型,表示是否绘制(标注)直方图。

(4)kde:接收布尔类型,表示是否绘制高斯核密度估计曲线。

(5)rug:接收布尔类型,表示是否在支持的轴方向上绘制rugplot。

通过distplot())函数绘制直方图的示例如下。

importnumpyasnpsns.set()np.random.seed(0)#确定随机数生成器的种子,如果不使用每次生成图形不一样arr=np.random.randn(100)#生成随机数组
ax=sns.distplot(arr,bins=10,hist=True,kde=True,rug=True)#绘制直方图

上述示例中,首先导入了用于生成数组的numpy库,然后使用seaborn调用set()函数获取默认绘图,并且调用random模块的seed函数确定随机数生成器的种子,保证每次产生的随机数是一样的,接着调用randn()函数生成包含100个随机数的数组,最后调用distplot()函数绘制直方图。

运行结果如下图所示。

上图中看出:

直方图共有10个条柱,每个条柱的颜色为蓝色,并且有核密度估计曲线。

根据条柱的高度可知,位于-1-1区间的随机数值偏多,小于-2的随机数值偏少。

通常,采用直方图可以比较直观地展现样本数据的分布情况,不过,直方图存在一些问题,它会因为条柱数量的不同导致直方图的效果有很大的差异。为了解决这个问题,可以绘制核密度估计曲线进行展现。

核密度估计是在概率论中用来估计未知的密度函数,属于非参数检验方法之一,可以比较直观地看出数据样本本身的分布特征。

通过distplot()函数绘制核密度估计曲线的示例如下。

#创建包含500个位于[0,100]之间整数的随机数组array_random=np.random.randint(0,100,500)#绘制核密度估计曲线sns.distplot(array_random,hist=False,rug=True)

上述示例中,首先通过random.randint()函数返回一个最小值不低于0、最大值低于100的500个随机整数数组然后调用displot()函数绘制核密度估计曲线。 运行结果如图所示。

从上图中看出,图表中有一条核密度估计曲线,并且在x轴的上方生成了观测数值的小细条。

本文来自投稿,不代表重蔚自留地立场,如若转载,请注明出处https://www.cwhello.com/367039.html

如有侵犯您的合法权益请发邮件951076433@qq.com联系删除

(0)
黑马程序员黑马程序员订阅用户
上一篇 2023年8月29日 16:08
下一篇 2023年8月29日 16:17

相关推荐

  • 教你网站SEO优化中最重要的一些要素。

    SEO中真正重要的是什么?什么东西让你的网站SEO排名更高?什么让你的百度排名更好?排名的秘诀是什么?小编与您谈谈网站SEO优化中最重要的一些要素。1.SEO优化关键词关键词很重要,因为它们会使网站在搜索引擎中具…

    2023年3月10日
    01
  • 小编教你SEO优化的日常工作是什么。

    大多数企业网站都会通过SEO这样一套基于搜索引擎的营销思路,为网站提供生态式的自我营销解决方案,让网站在行业内占据领先地位,从而获得品牌收益。那么seo优化的日常工作是什么呢?我们要具备哪些能力呢?seo需要…

    2023年3月13日
    00
  • Python教程:全局变量和局部变量

    变量的作用域始终是Python学习中一个必须理解掌握的环节,下面我们从局部变量和全局变量开始全面解析Python中变量的作用域。  所谓局部变量,指的是定义在函数内的变量。定义在函数内的变量,只能在函数内使用,…

    2023年7月13日
    00
  • 怎么通过数据分析seo优化 分析外部可统计查询数据

    你们知道怎么通过数据分析seo优化吗?首先你要分析对手网站的统计查询数据,然后通过这些数据与自己的企业对比下,如果发现有许多不足,可以及时参照别人的来更新修改。 数据分析 成功者半九十,辛苦通过各种渠道观…

    2022年5月21日
    0194
  • 小编分享直通车数据差怎么办。

    首先要了解质量分的组成:创意质量、相关性、买家体验。创意质量:影响因素包括创意的点击率,点击反馈即点击转化率。一些淘宝卖家开通了直通车之后也会天天去分析店铺的数据,但是却发现数据很差,出现这种情况应…

    2023年11月4日
    00
  • 聊聊千牛流失竞店的数据是当天的吗。

    对于淘宝商家们来说,必须要关注自己淘宝店铺的运营情况,像一些数据都是时时刻刻需要去关注的,其中千牛流失竞店数据是不是指当天的呢?下面的内容中为大家进行介绍。千牛流失竞店的数据是当天的吗?生意参谋中的流…

    2023年10月21日
    03
  • 小编分享SEO优化需要剖析的数据有哪些。

    做网站seo优化便离不开对网站数据分析,针对网站的具体数据确定未来的优化方向,以及发现网站的问题进行修改优化。如果不清楚这些的话,优化的工作就会很被动,因为你不知道你的哪些操作是有效的,哪些操作是不利于…

    2023年6月27日
    00
  • 我来教你大数据时代下SEO优化的新要求是什么。

    大数据时代的到来与信息技术的发展是分不开的。通过系统自动分析客户的喜好,从而精准的推送相关网站推广链接,真正做到按需定制的服务。大数据、云计处成为主流,对于网站优化来提供更为灵活的抓取模式,真正是投…

    2023年6月23日
    06

联系我们

QQ:951076433

在线咨询:点击这里给我发消息邮件:951076433@qq.com工作时间:周一至周五,9:30-18:30,节假日休息