数据挖掘-matplotlib、numpy、pandas

news/2024/9/21 5:43:46

文章目录

  • matplotlib

matplotlib

import matplotlib.pyplot as pltprint(plt.matplotlib_fname()) # 将会获得 matplotlib 的安装路径import random
# %matplotlib inline
plt.figure(figsize=(20,8),dpi=80)#1.图形尺寸 2.清晰度
plt.plot([1,2,3,4,5,6,7],[17,15,16,18,12,11,13])#三个点:(1,4).(0,5).(9,6).plt.savefig("shujutupian1.png")
plt.show()
'''
matplotlib的三层结构
1:容器层1.画板层Canvas2.画布层Figure---可以有多个绘图区/坐标系 axes:plt.subplots()2:辅助显示层
3:图像层'''

在这里插入图片描述

import random
import matplotlib.pyplot as plt
# plt.figure(figsize=(20,8),dpi=80)
figure,axes=plt.subplots(nrows=1,ncols=2,figsize=(20,8),dpi=80)# import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号x=range(60)
y_shanghai=[random.uniform(15,18) for i in x]
# 添加北京天气
y_beijing=[random.uniform(1,3) for i in x]
#添加显示网格axes[0].plot(x,y_shanghai,color="r",linestyle="--",label="sahnghai")
axes[1].plot(x,y_beijing,color="g",linestyle="-",label="beijing")
# plt.legend(loc="upper left")
axes[0].legend()
axes[1].legend()
'''
设置图形风格
颜色字符:r 红色g 绿色b 蓝色w 白色c 青色 m 洋红y 黄色k 黑色
线条:- 实线-- 虚线-. 点画线: 点虚线‘’ 留空 空格# 介绍各个折线所代表的含义放在哪个位置:plt.legend(loc="upper left")
upper rightupper leftlower leftlower rightrightcenter leftcenter rightlower centerupper centercenter
'''# 修改x/y刻度
x_lable=["11h{}min".format(i)for i in x]
# plt.xticks(x[::5],x_lable[::5])
# plt.yticks(range(0,40,5))#y刻度在0~40,每隔5
axes[0].set_xticks(x[::5],x_lable[::5])
axes[0].set_yticks(range(0,40,5))
axes[1].set_xticks(x[::5],x_lable[::5])
axes[1].set_yticks(range(0,40,5))
# 添加显示网格
# plt.grid(linestyle="--",alpha=0.5)
axes[0].grid(linestyle="--",alpha=0.5)
axes[1].grid(linestyle="--",alpha=0.5)# 添加描述信息
# plt.xlabel("时间变化")
# plt.ylabel("温度")
# plt.title("城市温度变化")
axes[0].set_xlabel("时间变化")
axes[0].set_ylabel("温度")
axes[0].set_title("城市温度变化")
axes[1].set_xlabel("时间变化")
axes[1].set_ylabel("温度")
axes[1].set_title("城市温度变化")plt.savefig("shujutupian4.png")
# 函数图
import  numpy as np
x=np.linspace(-1,1,1000)
y=2*x*x
plt.figure(figsize=(20,8),dpi=80)
plt.plot(x,y)
plt.grid(linestyle="--")
plt.savefig("shujutupian3.png")
# 散点图绘制
x=[1,2,3,4,5,6,7,8,9]
y=[8,3,5,3,1,9,6,1,5]
plt.figure(figsize=(20,8),dpi=80)
plt.scatter(x,y)
plt.savefig("shujutupian2.png")plt.show()
import matplotlib
print(matplotlib.matplotlib_fname()) # 将会获得 matplotlib 的安装路径

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

# 柱状图
# 1.准备数据
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
movie_names=['雷神3-诸神昏暗','阿凡达','寻梦环游记','美丽心灵','肖生客的救赎','三湾改编','驯龙高手3','复联4','蜘蛛侠-英雄远征']
tickets=[88888,77777,66666,78965,92345,65435,85236,25874,96321]
# 2.创建画布
plt.figure(figsize=(20,8),dpi=80)# 绘制柱状图
x_ticks=range(len(movie_names))
plt.bar(x_ticks,tickets,color=('b','r','g','y','c','m','y','k','g'))# 修改x刻度
plt.xticks(x_ticks,movie_names)#
plt.grid(linestyle="--",alpha=0.5)
plt.title("部分电影票房")
plt.savefig("shujutupian5.png")movie_names2=['美丽心灵','肖生客的救赎','三湾改编']
first_day=[10587.6,10062.5,1275.7]
first_week=[36224.9,34497.6,11830]plt.figure(figsize=(20,8),dpi=80)
plt.bar(range(3),first_day,width=0.2,label="首日票房")
plt.bar([0.2,1.2,2.2],first_week,width=0.2,label="首周票房")
plt.grid(linestyle="--",alpha=0.5)
plt.legend()# 修改刻度
plt.xticks([0.1,1.1,2.1],movie_names2)plt.savefig("shujutupian6.png")# 饼图
place_count=[60605,54546,45819,28246,13270,9945,7679,6799,20105]
plt.figure(figsize=(20,8),dpi=80)
plt.pie(place_count,labels=movie_names,colors=['b','r','g','y','c','m','y','k','g'],autopct="%1.2f%%")plt.legend()
plt.axis('equal')
plt.savefig("shujutupian8.png")
plt.show()

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

# 直方图
# 电影时长分布状况
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号time=[120,118,124,135,156,158,159,169,147,158,168,123,147,159,146,168,158,157,143,127,138,139,134,156,167,182,193,110,147,158,124,132,147,124,151,161,182,143,163,153,175,185,195,164,156,143,134,126,186,172,193,120,150,103,140]plt.figure(figsize=(20,8),dpi=80)distance=5group_num=int((max(time)-min(time))/distance)plt.hist(time,bins=group_num,density=True)plt.xticks(range(min(time),max(time)+2,distance))
plt.grid(linestyle="--",alpha=0.5)
plt.savefig("shujutupian7.png")plt.show()

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pgtn.cn/news/17663.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

使用Python绘制粽子消消乐,素描图,词云图,字符画图及提取轮廓

这篇博客将介绍如何使用Python绘制粽子消消乐,素描图,词云图,字符画图及提取轮廓。 使用Python绘制端午dragboat消消乐 美轮美奂的界面效果 1. 效果图 选了我最爱的小林老师的漫画图~ 纵有千种风情,更与谁人说。 端午粽子原始…

数据挖掘-matplotlib、numpy、pandas(二)

文章目录NumpyPandasNumpy # 数值化计算库import numpy as np scorenp.array([[80,81,82,83,84],[78,96,95,94,93],[85,83,86,81,89],[78,75,71,73,76],[96,94,93,97,91]]) score.size type(score) ndarray属性 shape ndimsize dypeitemsize 在创建ndarray的时候,如…

概率论与数理统计--第三章

文章目录概率论与数理统计--第三章概率论与数理统计–第三章

2021-08-29概率论—第四章随机变量的数字特征

文章目录随机变量的数字特征数学期望方差常见分布的E(X)与D(X)协方差与相关系数随机变量的数字特征 数学期望 方差 常见分布的E(X)与D(X) 协方差与相关系数

使用TensorFlow、Keras和深度学习实现像素无序超分辨率

使用TensorFlow、Keras和深度学习实现像素无序超分辨率》 pixel shuffle Super Resolution 像素无序/洗牌超分辨率 Deep Learning Super Sampling(DLSS 深度学习超级采样) Redisual Dense Blocks RDB残差密集块 当图像的大小(在空间上沿着宽度…

概率论—随机变量的数字特征、大数定律及中心极限定理

文章目录概率论4、5章随机变量的数字特征大数定律及中心极限定理概率论4、5章 随机变量的数字特征 大数定律及中心极限定理

概率论与数理统计--样本及抽样分布

文章目录总体和样本统计量三大分布四大定理总体和样本 统计量 三大分布 四大定理

使用Tesseract OCR引擎和层次聚集聚类(HAC)对多列数据进行OCR

这篇博客将介绍如何使用Tesseract OCR引擎和层次聚集聚类(HAC)对多列数据进行OCR。包括学习一些OCR多列数据的提示和技巧,最重要的是,将文本的行/列关联在一起。 层次聚集聚类(HAC hierarchical agglomerative cluster…