新网创想网站建设,新征程启航
为企业提供网站建设、域名注册、服务器等服务
小编给大家分享一下Python爬取数据并将数据保存到excel中的方法,希望大家阅读完这篇文章后大所收获,下面让我们一起去探讨吧!
创新新互联,凭借十多年的成都网站制作、成都网站设计经验,本着真心·诚心服务的企业理念服务于成都中小企业设计网站有上千案例。做网站建设,选创新互联公司。这次主要是爬了京东上一双鞋的相关评论:将数据保存到excel中并可视化展示相应的信息
主要的python代码如下:
文件1
#将excel中的数据进行读取分析 import openpyxl import matplotlib.pyplot as pit #数据统计用的 wk=openpyxl.load_workbook('销售数据.xlsx') sheet=wk.active #获取活动表 #获取大行数和大列数 rows=sheet.max_row cols=sheet.max_column lst=[] #用于存储鞋子码数 for i in range (2,rows+1): size=sheet.cell(i,3).value lst.append(size) #以上已经将excel中的数据读取完毕 #一下操作就你行统计不同码数的数量 '''python中有一个数据结构叫做字典,使用鞋码做key,使用销售数量做value''' dic_size={} for item in lst: dic_size[item]=0 for item in lst: for size in dic_size: #遍历字典 if item==size: dic_size[size]+=1 break for item in dic_size: print(item,dic_size[item]) #弄成百分比的形式 lst_total=[] for item in dic_size: lst_total.append([item,dic_size[item],dic_size[item]/160*1.0]) #接下来进行数据的可视化(进行画饼操作) labels=[item[0] +'码'for item in lst_total] #使用列表生成式,得到饼图的标签 fraces=[item[2] for item in lst_total] #饼图中的数据源 pit.rcParams['font.family']=['SimHei'] #单独的表格乱码的处理方式 pit.pie(x=fraces,labels=labels,autopct='%1.1f%%') #pit.show()进行结果的图片的展示 pit.savefig('图.jpg')