@Author : Runsen
高德地图【东莞理工学院】如下链接为从高德地图获取【东莞理工学院】这个区域边界经纬度坐标点的链接
https://ditu.amap.com/service/poiInfo?query_type=TQUERY&keywords=%E4%B8%9C%E8%8E%9E%E7%90%86%E5%B7%A5%E5%AD%A6%E9%99%A2
可以发现,访问该链接返回的数据是以json格式存储的,如果直接存储返回的网页,那么默认保存格式应该为json
目标是将该json文件中区域边缘点的经纬度坐标提取出来
import requests
data = requests.get(url='http://ditu.amap.com/service/poiInfo?query_type=TQUERY&keywords=东莞理工学院')
data.text
import json
js = json.loads(data.text)
在这里插入图片描述js['data'].keys()
dict_keys(['codepoint', 'code', 'suggestion', 'timestamp', 'lqii', 'is_general_search', 'result', 'keywords',
'message', 'total', 'busline_list', 'bus_list', 'general_flag', 'bounds', 'version', 'busline_count', 'magicbox_data', 'interior_count', 'poi_list'])
js['data']['poi_list']
以下是全代码import requests
data = requests.get(url='http://ditu.amap.com/service/poiInfo?query_type=TQUERY&keywords=东莞理工学院')
import json
js = json.loads(data.text)
points1 = js['data']['poi_list'][0]['bound']
points2 = js['data']['poi_list'][1]['bound']
points= points1.split('_')
import pandas as pd
df = pd.DataFrame(points,columns=['lat_lng'])
df['longitude'] = df['lat_lng'].apply(lambda s:s.split(',')[0])
df['latitude'] = df['lat_lng'].apply(lambda s:s.split(',')[1])
df = df.drop('lat_lng',axis = 1)
df.to_csv('./data/scau.csv',index = False)
现在试下抓取的数据 用的