方法
import cpcalocation_str = ["南京市浦口区南京泉城房地产开发有限公司",]df = cpca.transform(location_str,)print(df)print("省份:" + df.iat[0,0])print("城市:" + df.iat[0,1])print("区域:" + df.iat[0,2])print("详细:" + df.iat[0,3])
转化为列表形式
import cpcaa = ['广东省揭阳市惠来县沙贝街23号御景园七单元255室j', ]print(cpca.transform(a).values.tolist())输出: [['惠来县', '揭阳市', '广东省', '沙贝街23号御景园七单元255室j']]
详情
import cpcalocation_str = ["南京市浦口区南京泉城房地产开发有限公司",]df = cpca.transform(location_str,)print(df)
adcode为官方地址编码
省 市 区 地址 adcode0 上海市 上海市 徐汇区 虹漕路461号58号楼5楼 3101041 福建省 泉州市 洛江区 万安塘西工业区 3505042 北京市 市辖区 朝阳区 北苑华贸城 110105
如果只给出区的范围没有用上级的地址则匹配出来的可能不准确,可以使用umap函数来进行增加上级提示
import cpcacpca.transform(["朝阳区汉庭酒店大山子店"])# 省 市 区 地址 adcode#0 吉林省 长春市 朝阳区 汉庭酒店大山子店 220104cpca.transform(["朝阳区汉庭酒店大山子店"],umap={"朝阳区":"110105"})# 省 市 区 地址 adcode#0 北京市 市辖区 朝阳区 汉庭酒店大山子店 110105
转化为列表形式
import cpcaa = ['广东省揭阳市惠来县沙贝街23号御景园七单元255室j', ]print(cpca.transform(a).values.tolist()[0])输出: ['惠来县', '揭阳市', '广东省', '沙贝街23号御景园七单元255室j']
从一段文本中提取多个地址,注意结果“地址”列是空的
import cpcadf = cpca.transform_text_with_addrs("分店位于徐汇区虹漕路461号58号楼5楼和泉州市洛江区万安塘西工业区以及南京鼓楼区")df省 市 区 地址 adcode0 上海市 市辖区 徐汇区 3101041 福建省 泉州市 洛江区 3505042 江苏省 南京市 鼓楼区 320106
