Bilibili 用户精确数据爬虫

个人科研用的，用来快速判断一个用户视频创作者还是消费者，即有没有投稿过视频。

一个爬取b站用户信息的Python爬虫。

不会是获赞数4579.7万，而是获赞数45796729。
可用于定期监测，分析up主数据的变化。

运行环境和依赖

安装依赖： pip install selenium openpyxl webdriver_manager

断点续爬：允许您在程序意外中断或手动停止后从上次中断的地方继续爬取数据，不用改动user_ids.txt手动删除已爬取的部分，为任务量较大的爬虫任务提供了方便。

实现方式：

首先，检查输出文件（例如 'output.xlsx'）是否存在。如果不存在，程序将创建一个新的工作表并添加标题行。如果文件存在，程序将加载现有的工作表。
计算已经爬取的用户数量（即Excel表格中的行数减去标题行），并将其赋值给num_count。
当遍历用户ID列表以获取数据时，程序会从上次爬取的用户ID之后继续爬取。这是通过在循环中使用user_ids[num_count:]来实现的，这样可以从用户ID列表的num_count位置开始遍历。
每次爬取一个用户的数据后，程序会将数据写入Excel文件。这意味着即使程序在某个时刻中断，您仍然保留了所有已经爬取的数据。
当您重新运行程序时，它将自动从上次中断的地方继续爬取数据。