数据分析-航空公司

航空公司数据分析

简介

为便于组织运输生产,每个航班都按照一定的规律编有不同的号码以便于区别和管理,这种号码称为航班号。

参考资料

航班号编排方式参考 2004 年中国民用航空局发布政府公文:关于印发《中国民航航班号分配和使用方案》的通知

航班号组成

航空公司代码由民航局规定发布,包含 IATA 发布的二字码ICAO 发布的三字码,航班号使用的是二字码加四或三位阿拉伯数字组成(不同的设备可能使用不同的标准),还有各个航空公司向民航局自己登记的呼号,用于无线电通讯中使用的代号。

爬虫地址

  1. 携程旅行 32x32 864个有效图标
    http://pic.c-ctrip.com/AssetCatalog/airline/32/MU.png
  2. 同程旅行 SVG 66个有效图标
    https://m.elongstatic.com/flight/configmng/prod/airline/logo/MU.svg
  3. 飞友科技(字母小写) 50x50 313个有效图标
    https://static.variflight.com/assets/image/aircorp/mu.png

爬虫代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
# _*_coding:utf-8_*_
import requests
import re
import os

class GetImage(object):
def __init__(self, url):
self.url = url
self.headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'
}
self.dir_path = os.path.dirname(os.path.abspath(__file__))
self.path = self.dir_path+'/imgs'
isExists = os.path.exists(self.dir_path+'/imgs')
# 创建目录
if not isExists:
os.makedirs(self.path)

def download(self, url):
try:
res = requests.get(url, headers=self.headers)
return res
except Exception as e:
print(url+'下载失败,原因:'+e.args)

def save(self, res_img, file_name):
if res_img:
with open(file_name, 'wb') as f:
f.write(res_img.content)
print(url+'下载成功')

def run(self):
# 下载图片
res_img = self.download(self.url)
name = self.url.strip().split('/').pop()
file_name = self.path+'/'+name
# 保存
self.save(res_img, file_name)

if __name__ == '__main__':
url_list = []
Letter = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L',
'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', '1', '2', '3', '4', '5', '6', '7', '8', '9', '0']
for i in Letter:
for j in Letter:
url_list.append(
"http://pic.c-ctrip.com/AssetCatalog/airline/32/" + i + j + ".png")

for url in url_list:
print(url)
text = GetImage(url)
text.run()

航空公司信息查询

下载:航空公司信息.xlsx