香港十大上市公司市值 上市公司市值查询

01 背景介绍
看完这篇文章,你会学到以下知识 。

香港十大上市公司市值 上市公司市值查询

文章插图
前不久朋友给我发了两张图片(如下图),都是表格数据,包括最新的中国上市公司500强 。
目的:我想从图片中提取表格数据 。
所以,有了这些数据,我写了这篇文章 。
香港十大上市公司市值 上市公司市值查询

文章插图
要想分析这些数据,首先要想到如何从图片中获取这些数据 。当然,我这里借用了百度的表识别api 。
然而,这里还有一个问题 。虽然有500行数据,但是图片只有两张,而且每一张都太大了,无法识别 。因此,考虑在识别图片的表格数据之前对图片进行分割 。
获取图片表数据的整个思路是这样的,我们直接编码吧!
1
图象分割法
下面的分割算法是基于每张图片中的860个像素,而不是开始,并在图片中添加25个像素,以确保每个单元格在每张图片中完全出现 。
【图像分割代码,源自肖晓明写的算法几十个测试】
从pil导入数学导入图像img=image.open('top500.png') w,h=img. sizeheight=860 r=math. ceil(h/height)img_ splits=forIinrange(r): start=height* Iend=height*(I1)ifendh3360 end=hifI!=0: start-=25 box=(0,开始,w,结束)img_ split=img. crop(box)print(I)display(img_ split)img_ splits. append(img_ split)结果如下:
香港十大上市公司市值 上市公司市值查询

文章插图
2
图像表格数据识别
用于表格文本识别的百度api:
https://ai.baidu.com/tech/ocr_others/table
最重要的是注册百度AI账号,创建应用后在应用列表中获取ak和sk 。
拿到ak和sk后,我们来测试一下,看看识别效果 。
将熊猫导入为pdrequest_url=
f"https://aip.baidubce.com/rest/2.0/solution/v1/form_ocr/request?access_token={access_token}"headers = {'content-type': 'application/x-www-form-urlencoded'}
base64_str = image_to_base64(img_splits[0])params = {"image": base64_str, "is_sync": "true", "request_type": "excel"}json_data = https://www.dzlps.cn/requests.post(request_url, data=params, headers=headers).jsondf = pd.read_excel(excel_url, header=None)df
结果如下:

香港十大上市公司市值 上市公司市值查询

文章插图
上面只是其中一张图片,接着需要对所有图片分别进行识别,做一个数据拼接,即可得到最终的数据 。

香港十大上市公司市值 上市公司市值查询

文章插图
02 数据分析
7月1日,万得2021上半年中国上市企业市值 500 强榜单正式公开发布,统计时间截止2021年6月30日 。
接着,我们读取上述获取到了数据,进行数据分析 。
读取到的数据源,大致如下:

香港十大上市公司市值 上市公司市值查询

文章插图
1
基本信息统计
本次编制的500强,入围门槛为市值492亿元 (公司简称"知乎"),市值最大的为46626亿元 (公司简称"腾讯控股"),500强上市公司总市值约98.78万亿 。

香港十大上市公司市值 上市公司市值查询

文章插图
2
万亿市值公司都在哪些?
我们分别对总市值大于10000的公司,做个统计:

香港十大上市公司市值 上市公司市值查询

文章插图
从结果中可以看到,在500强榜单中,有13家万亿市值公司 。
接下来,我们分别筛选出这13家万亿市值公司 。

香港十大上市公司市值 上市公司市值查询

文章插图
根据榜单数据显示: 这13家万亿市值公司,分别是腾讯控股、阿里、台积电、贵州茅台、工商银行、美团、招商银行、建设银行、宁德时代、中国平安、五粮液、农业银行、拼多多 。
我们又分别按照地域分组,发现在这13家万亿市值公司中,北京有4家(工行、美团、建行、农行),广东(深圳)有3家(腾讯、招行、中国平安),上海1家(拼多多),浙江1家(阿里),台湾1家(台积电),贵州1家(茅台),福建1家(宁德时代),四川1家(五粮液) 。

香港十大上市公司市值 上市公司市值查询

文章插图
宁德时代是指宁德时代新能源科技股份有限公司,这是一个位于三四线城市的小企业 。宁德时代创办于2011年,凭借新能源汽车热潮,仅用六年的时间就坐上全球新能源电池第一供应商的“龙头椅” 。
3
千亿市值公司都在哪些?
【香港十大上市公司市值 上市公司市值查询】我们分别对总市值大于1000的公司,做个统计:

香港十大上市公司市值 上市公司市值查询

文章插图
从结果中可以看到,在500强榜单中,有254家千亿市值公司 。
接下来,我们分别筛选出这254家万亿市值公司 。

香港十大上市公司市值 上市公司市值查询

文章插图
我们分别按照地域分组,发现在这254家千亿市值公司中,北京59家、广东40家、香港27家,上海25家、深圳24家、台湾19家......

香港十大上市公司市值 上市公司市值查询

文章插图
对于不同城市的上市公司,我这里也为大家总了一个简单的统计,数据如下图所示 。

香港十大上市公司市值 上市公司市值查询

文章插图
4
中国上市公司500强分布地图
观察地图,可以发现北京、广东、上海、香港、台湾、浙江的上市公司较多,而有些城市,像黑龙江、甘肃、青海、西藏、广西、海南没有一个上市公司 。

香港十大上市公司市值 上市公司市值查询

文章插图
我们现在来看看具体的数据,你有什么想说的?

香港十大上市公司市值 上市公司市值查询

文章插图
5
中国上市公司500强行业词云图
我们按照行业分组,分别对行业数据做一个词云图统计,发现电子、医药生物、信息技术、房地产、银行、汽车、证券经纪等行业较多 。

香港十大上市公司市值 上市公司市值查询

文章插图
我们来看一个具体的数据,你又有什么想说的?

香港十大上市公司市值 上市公司市值查询

文章插图
香港十大上市公司市值 上市公司市值查询

文章插图
- End -