A package for parsing Vietnamese address
- Xử lỹ những tên viết tắt thông dụng
- Sửa chính tả
- Sửa lỗi thứ tự tên đơn vị hành chính
- Thêm prefix (xã, huyện, tỉnh, ...)
pip3 install vnaddress
from vnaddress import VNAddressStandardizer
address = VNAddressStandardizer(raw_address = "Dicjh Vongj Haaju", comma_handle = True)
address.execute()
# output
# phường Dịch Vọng Hậu, quận Cầu Giấy, thành phố Hà Nội
address = VNAddressStandardizer(raw_address = "Dicjh Vongj Haaju, ", comma_handle = True, detail=True)
address.execute()
# output
# {'result': 'phường Dịch Vọng Hậu, quận Cầu Giấy, thành phố Hà Nội', 'match': {'match_address': 'Dịch Vọng Hậu, Cầu Giấy, Hà Nội', 'match_percent': 100}, 'missing': ['TTP', 'QH'], 'detail': {'PX': 'Dịch Vọng Hậu', 'QH': 'Cầu Giấy', 'TTP': 'Hà Nội'}}
- Handling common abbreviations
- Edit the spelling
- Correct the order of administrative unit names
- Add prefix (commune, district, province, ...)
pip3 install vnaddress
from vnaddress import VNAddressStandardizer
address = VNAddressStandardizer(raw_address = "Dicjh Vongj Haaju", comma_handle = True)
address.execute()
# output
# phường Dịch Vọng Hậu, quận Cầu Giấy, thành phố Hà Nội
address = VNAddressStandardizer(raw_address = "Dicjh Vongj Haaju, ", comma_handle = True, detail=True)
address.execute()
# output
# {'result': 'phường Dịch Vọng Hậu, quận Cầu Giấy, thành phố Hà Nội', 'match': {'match_address': 'Dịch Vọng Hậu, Cầu Giấy, Hà Nội', 'match_percent': 100}, 'missing': ['TTP', 'QH'], 'detail': {'PX': 'Dịch Vọng Hậu', 'QH': 'Cầu Giấy', 'TTP': 'Hà Nội'}}