Let's geocode the data!
asiripanich opened this issue · 3 comments
While the team and the kaogeek community are working together to make the data more accurate, I would like to continue to add more value to the data.
Would be great if we can extract all addresses from the data, and MAYBE even geocode them. For geocoding, we can use Google Geocoding API (again) to do this. Happy to contribute, but I can't promise when. :)
Here are some item descriptions that we can geocode. This would allow us to visualise the spatial distribution of the next year budget.
ชุดเครื่องมือผ่าตัดจุลศัลยกรรมกระดูก แขวงตลาดบางเขน เขตหลักสี่ กรุงเทพมหานคร 1 ชุด
ชุดเครื่องมือผ่าตัดผ่านกล้อง หู คอ จมูก แขวงตลาดบางเขน เขตหลักสี่ กรุงเทพมหานคร 1 ชุด
ชุดเครื่องมือผ่าตัดหมอนรองกระดูกสันหลังผ่านกล้อง แขวงตลาดบางเขน เขตหลักสี่ กรุงเทพมหานคร 1 ชุด
ชุดเครื่องมือสำหรับงานกายอุปกรณ์เสริมและกายอุปกรณ์เทียม แขวงตลาดบางเขน เขตหลักสี่ กรุงเทพมหานคร 1 ชุด
ชุดประมวลผลสัญญาณภาพอัลตราซาวด์ในระบบทางเดินอาหาร แขวงตลาดบางเขน เขตหลักสี่ กรุงเทพมหานคร 1 ชุด
ชุดสว่านเจาะกระดูก ตำบลโป่งตาลอง อำเภอปากช่อง จังหวัดนครราชสีมา 1 เครื่อง
ชุดส่องกล้องตรวจและผ่าตัดในข้อ แขวงตลาดบางเขน เขตหลักสี่ กรุงเทพมหานคร 1 ชุด
ชุดอุปกรณ์ประกอบเพิ่มเติมเครื่องทำลายเนื้อเยื่อ ด้วยวิธีการรวมศูนย์คลื่นเสียงความถี่สูง (Exablate 4000 Upgrade module for Neuro: MRGFUS) แขวงตลาดบางเขน เขตหลักสี่ กรุงเทพมหานคร 1 ชุด
ชุดอุปกรณ์สว่านไฟฟ้าความเร็วรอบสูงสำหรับการการะดูก โพรงจมูกและตัดกระดูกบริเวณใบหน้า แขวงตลาดบางเขน เขตหลักสี่ กรุงเทพมหานคร 1 ชุด
เตียงผ่าตัดและเก้าอี้ผ่าตัด ส \| บ แขวงตลาดบางเขน เขตหลักสี่ กรุงเทพมหานคร 1 ชุด
เตียงผู้ป่วยภาวะวิกฤตชนิดควบคุมด้วยระบบไฟฟ้า แขวงตลาดบางเขน เขตหลักสี่ กรุงเทพมหานคร 32 ชุด
UU Digital Slide Scanner Server แขวงตลาดบางเขน เขตหลักสี่ กรุงเทพมหานคร 1 ระบบ
ค่าควบคุมงานก่อสร้างอาคารอ่านวยการอุทยานวิทยาศาสตร์ภูมิภาค ภาคตะวันออกเฉียงเหนือตอนล่าง ตำบลสุรนารี อำเภอเมืองนครราชสีมา จังหวัดนครราชสีมา 1 แห่ง
ค่าควบคุมงานก่อสร้างอาคารอ่านวยการอุทยานวิทยาศาสตร์ภูมิภาค ภาคตะวันออกเฉียงเหนือตอนล่าง ตำบลสุรนารี อำเภอเมืองนครราชสีมา จังหวัดนครราชสีมา 1 แห่ง
ค่าควบคุมงานก่อสร้างอาคารอ่านวยการอุทยานวิทยาศาสตร์ภูมิภาค ภาคตะวันออกเฉียงเหนือตอนล่าง ตำบลสุรนารี อำเภอเมืองนครราชสีมา จังหวัดนครราชสีมา 1 แห่ง
ค่าควบคุมงานก่อสร้างอาคารอ่านวยการอุทยานวิทยาศาสตร์ภูมิภาค ภาคตะวันออกเฉียงเหนือตอนล่าง ตำบลสุรนารี อำเภอเมืองนครราชสีมา จังหวัดนครราชสีมา 1 แห่ง
ค่าก่อสร้างอาคารอำนวยการอุทยานวิทยาศาสตร์ภูมิภาค ภาคตะวันออกเฉียงเหนือตอนล่าง ตำบลสุรนารี อำเภอเมืองนครราชสีมา จังหวัดนครราชสีมา 1 แห่ง
ค่าก่อสร้างอาคารอำนวยการอุทยานวิทยาศาสตร์ภูมิภาค ภาคตะวันออกเฉียงเหนือตอนล่าง ตำบลสุรนารี อำเภอเมืองนครราชสีมา จังหวัดนครราชสีมา 1 แห่ง
ค่าก่อสร้างอาคารอำนวยการอุทยานวิทยาศาสตร์ภูมิภาค ภาคตะวันออกเฉียงเหนือตอนล่าง ตำบลสุรนารี อำเภอเมืองนครราชสีมา จังหวัดนครราชสีมา 1 แห่ง
ค่าก่อสร้างอาคารอำนวยการอุทยานวิทยาศาสตร์ภูมิภาค ภาคตะวันออกเฉียงเหนือตอนล่าง ตำบลสุรนารี อำเภอเมืองนครราชสีมา จังหวัดนครราชสีมา 1 แห่ง
Hi @asiripanich, your idea is so great! I do feel your enthusiasm to make this data more valuable.
I think the Expected Output Format (V2)
stated in README.md
is needed to be revised to support the geocoding you proposed.
Please feel free to create a PR when you think that the spec is ready.
Khob Khun Mak Krub =/|\=
I extracted provinces (จังหวัด), districts (เขต/อำเภอ), and sub-districts (แขวง/ตำบล) from the item_description
field (only the low-hanging fruit ones). Overall they look okay, but it is still a work in progress at best. You guys can check it out here: https://docs.google.com/spreadsheets/d/1rKR1kLuSDssT0_xLpGE_oRm2tPD5ZRhzErWq-8UzH6A/