用python绘制一张炫酷的玫瑰图！

vlambda
2022-05-03

用python绘制一张炫酷的玫瑰图！

网上冲浪时看到了一张很炫酷的南丁格尔玫瑰图，显示了国外主流流媒体平台的订阅人数排行，顿时来了兴趣，咱也用python 来绘制一张！

话不多说，先上原图：

再来看下代码复现的效果：

可以看到，图形主体得到了完美的复现，仅需要在此基础上增加标题、文字说明和服务商logo即可，这些步骤可以在PS 或 AI 中进行，修图可以让你的玫瑰图更完美！

本文介绍使用pyecharts 绘制南丁格尔玫瑰图的过程，即代码实现部分，不过在绘制之前需要获取网页数据，所以，整篇文章分为数据获取和图形绘制两部分。预计阅读时间9分钟。

获取网页数据

以上是图表和数据来源网页，其数据是以分页形式展示的，需要进行翻页，点击next 看到所有数据。

这里，我们获取网页数据的工具是Selenium, 这是一款超级好用的自动化测试工具，可以模拟人类对浏览器的操作，实现对所有网页元素的定位和抓取，即可见即可得。

首先安装 selenium(pip install selenium)和浏览器驱动程序webdriver（建议下载与谷歌浏览器和对应版本的chrome webdriver)。

安装好之后，对数据的获取可以分3步走：

启动webdriver, 打开网页
定位标题和下载图片
获取当前页数据，并实现翻页，获取所有数据

代码展示：

from selenium import webdriverfrom selenium.webdriver.common.by import Byimport requestsimport csvimport time# 01. 启动 webdirver, 打开网页browser = webdriver.Chrome('/usr/local/chromedriver')# 此处填入自己的webdriver exe 的文件路径browser.get('https://www.visualcapitalist.com/which-streaming-service-has-the-most-subscriptions/')browser.implicitly_wait(5) # 等待内容加载完毕# 02. 获取标题和下载图片title = browser.find_element(By.CSS_SELECTOR,'#mvp-post-head > h1').text + '.jpg'pic = browser.find_element(By.CSS_SELECTOR,'#mvp-post-head > span > p:nth-child(1) > img').get_attribute('src')res = requests.get(pic).contentimagepath = './' + titlewith open(imagepath, 'wb') as fp: fp.write(res)time.sleep(2)# 03. 点击翻页，获取所有数据with open('./data.csv', 'a') as f: writer = csv.writer(f) writer.writerow(['services', 'subscribers','types'])for i in range(1,4): services = browser.find_elements(By.CSS_SELECTOR, '#tablepress-1461 > tbody > tr > td.column-1') types = browser.find_elements(By.CSS_SELECTOR, '#tablepress-1461 > tbody > tr > td.column-2') subscribers = browser.find_elements(By.CSS_SELECTOR, '#tablepress-1461 > tbody > tr > td.column-3') column1 = [] column2 = [] column3 = [] for service in services: column1.append(service.text.strip()) for subscriber in subscribers: column2.append(subscriber.text.strip()) for type in types: column3.append(type.text.strip()) lis = [] for i in zip(column1, column2,column3): lis.append(list(i)) with open('./data.csv','a') as f: writer = csv.writer(f) writer.writerows(lis) next_button =browser.find_element(By.XPATH,'//*[@id="tablepress-1461_next"]')    next_button.click()# 以上两行实现翻页，获取所有数据print('数据成功获取')browser.quit()# 获取完毕，关闭网页

成功获取的数据存在csv 文件中：

绘制玫瑰图

有了数据，自然就可以使用工具来绘制玫瑰图了，这里我们使用的是pyecharts 里的饼图类 Pie.

import pandas as pdfrom pyecharts.charts import Piefrom pyecharts import options as opts
# 01. 读取并整理数据data = pd.read_csv('data.csv',header=1)data = data.drop_duplicates(keep=False)data = data.reset_index(drop=True)data['subscribers'] = data['subscribers'].str.replace('M','')data['subscribers'] = data['subscribers'].astype('float').round()x_data = data['services']y_data = data['subscribers']# 自定义颜色，根据服务商类型提供4种颜色，可以在ps中打开原图，获取颜色的十六进制代码color_dic = {'Video':'#fbf3dc', 'Audio':'#1b1718', 'Video/Audio':'#833100', 'News':'#f1a15c' }data['colors'] = data['types'].map(color_dic)# 准备数据对data_pairdf = [list(z) for z in zip(x_data,y_data)]# print(df)# 02. 使用 pyecharts Pie 绘制玫瑰图pie = Pie(init_opts=opts.InitOpts(bg_color='#d66f0a',width='650px',height='1000px'))pie.add(series_name='services', data_pair=df, radius=['12%','200%'],#设置内圆和外圆的半径 center=['35%','70%'], #设置圆的位置 rosetype='area',) # 关键步骤！设置类型为area， 会展示为玫瑰图pie.set_global_opts( legend_opts=opts.LegendOpts(is_show=False), #不显示图例 )pie.set_series_opts( label_opts=opts.LabelOpts(position='inside', # 标签位置 rotate = 45, font_size = 14, # 字体大小 formatter="{c}",color = '#d66f0a') # 标签格式 )pie.set_colors(list(data['colors'])) # 渲染颜色pie.render('streaming war.html') #出图