/Web-crawler

调研药品数据网站。基于网络爬虫爬取药源网药物数据,搭建药品数据库。含中成药和化学药品信息共计10万余条。爬取国家食品药品监督管理局药品数据对药源网数据进行修正。基于Selenium等工具应对反爬,爬取ICD10等数据共研究使用。

Primary LanguagePython

Web-crawler

基于网络爬虫Scrapy框架及BeautifulSoup模块等爬取数据,基于正则表达式及Xpath进行解析。

调研药品数据网站,基于网络爬虫搭建药品数据库,含中成药和化学药品信息共计10万余条。

爬取国家食品药品监督管理局药品数据对药源网数据进行修正。

基于Selenium等工具应对反爬,爬取ICD-9等数据供研究使用。