常用操作 - cpca库获取省市区地址 - 《python学习》

方法
详情

方法

import cpca
location_str = ["南京市浦口区南京泉城房地产开发有限公司",]
df = cpca.transform(location_str,)
print(df)
print("省份：" + df.iat[0,0])
print("城市：" + df.iat[0,1])
print("区域：" + df.iat[0,2])
print("详细：" + df.iat[0,3])

转化为列表形式

import cpca
a = ['广东省揭阳市惠来县沙贝街23号御景园七单元255室j', ]
print(cpca.transform(a).values.tolist())
输出: [['惠来县', '揭阳市', '广东省', '沙贝街23号御景园七单元255室j']]

详情

import cpca
location_str = ["南京市浦口区南京泉城房地产开发有限公司",]
df = cpca.transform(location_str,)
print（df)

adcode为官方地址编码

   省     市    区          地址              adcode
0 上海市 上海市  徐汇区     虹漕路461号58号楼5楼  310104
1 福建省 泉州市  洛江区     万安塘西工业区        350504
2 北京市 市辖区  朝阳区     北苑华贸城               110105

如果只给出区的范围没有用上级的地址则匹配出来的可能不准确，可以使用umap函数来进行增加上级提示

import cpca
cpca.transform(["朝阳区汉庭酒店大山子店"])
#     省    市    区        地址  adcode
#0  吉林省  长春市  朝阳区  汉庭酒店大山子店  220104
cpca.transform(["朝阳区汉庭酒店大山子店"],umap={"朝阳区":"110105"})
#     省    市    区        地址  adcode
#0  北京市  市辖区  朝阳区  汉庭酒店大山子店  110105

转化为列表形式

import cpca
a = ['广东省揭阳市惠来县沙贝街23号御景园七单元255室j', ]
print(cpca.transform(a).values.tolist()[0])
输出: ['惠来县', '揭阳市', '广东省', '沙贝街23号御景园七单元255室j']

从一段文本中提取多个地址，注意结果“地址”列是空的

import cpca
df = cpca.transform_text_with_addrs("分店位于徐汇区虹漕路461号58号楼5楼和泉州市洛江区万安塘西工业区以及南京鼓楼区")
df
    省     市     区    地址   adcode
0  上海市  市辖区  徐汇区       310104
1  福建省  泉州市  洛江区       350504
2  江苏省  南京市  鼓楼区       320106