基于网络爬虫Scrapy框架及BeautifulSoup模块等爬取数据,基于正则表达式及Xpath进行解析。
调研药品数据网站,基于网络爬虫搭建药品数据库,含中成药和化学药品信息共计10万余条。
爬取国家食品药品监督管理局药品数据对药源网数据进行修正。
基于Selenium等工具应对反爬,爬取ICD-9等数据供研究使用。
调研药品数据网站。基于网络爬虫爬取药源网药物数据,搭建药品数据库。含中成药和化学药品信息共计10万余条。爬取国家食品药品监督管理局药品数据对药源网数据进行修正。基于Selenium等工具应对反爬,爬取ICD10等数据共研究使用。
Python