方法

  1. import cpca
  2. location_str = ["南京市浦口区南京泉城房地产开发有限公司",]
  3. df = cpca.transform(location_str,)
  4. print(df)
  5. print("省份:" + df.iat[0,0])
  6. print("城市:" + df.iat[0,1])
  7. print("区域:" + df.iat[0,2])
  8. print("详细:" + df.iat[0,3])

转化为列表形式

  1. import cpca
  2. a = ['广东省揭阳市惠来县沙贝街23号御景园七单元255室j', ]
  3. print(cpca.transform(a).values.tolist())
  4. 输出: [['惠来县', '揭阳市', '广东省', '沙贝街23号御景园七单元255室j']]

详情

  1. import cpca
  2. location_str = ["南京市浦口区南京泉城房地产开发有限公司",]
  3. df = cpca.transform(location_str,)
  4. printdf)

adcode为官方地址编码

  1. 地址 adcode
  2. 0 上海市 上海市 徐汇区 虹漕路46158号楼5 310104
  3. 1 福建省 泉州市 洛江区 万安塘西工业区 350504
  4. 2 北京市 市辖区 朝阳区 北苑华贸城 110105

如果只给出区的范围没有用上级的地址则匹配出来的可能不准确,可以使用umap函数来进行增加上级提示

  1. import cpca
  2. cpca.transform(["朝阳区汉庭酒店大山子店"])
  3. # 省 市 区 地址 adcode
  4. #0 吉林省 长春市 朝阳区 汉庭酒店大山子店 220104
  5. cpca.transform(["朝阳区汉庭酒店大山子店"],umap={"朝阳区":"110105"})
  6. # 省 市 区 地址 adcode
  7. #0 北京市 市辖区 朝阳区 汉庭酒店大山子店 110105

转化为列表形式

  1. import cpca
  2. a = ['广东省揭阳市惠来县沙贝街23号御景园七单元255室j', ]
  3. print(cpca.transform(a).values.tolist()[0])
  4. 输出: ['惠来县', '揭阳市', '广东省', '沙贝街23号御景园七单元255室j']

从一段文本中提取多个地址,注意结果“地址”列是空的

  1. import cpca
  2. df = cpca.transform_text_with_addrs("分店位于徐汇区虹漕路461号58号楼5楼和泉州市洛江区万安塘西工业区以及南京鼓楼区")
  3. df
  4. 地址 adcode
  5. 0 上海市 市辖区 徐汇区 310104
  6. 1 福建省 泉州市 洛江区 350504
  7. 2 江苏省 南京市 鼓楼区 320106