/IADB_Scholar

信分基建 🚧 学术数据库

Creative Commons Attribution Share Alike 4.0 InternationalCC-BY-SA-4.0

信分基建 🚧 学术数据库

0. 目录

1. 如何贡献?

1.1 获取权限

  • PS:在申请权限前,首先确认你已经加入飞书协作群
  • 如何获取 Airtable 权限并加入协作?
    • 第一步:点击 👉 链接,注册 Airtable 账户:
    • 第二步:注册账户时,姓名和头像需更改为与微信一致:
      • 你可以在 Last Name 填入一个空格;
      • 然后把你的微信昵称填入 First name 中;
    • 第三步,打开 👉 ✔️ 任务追踪表,选择任务。
      • 你可以在 1-100 中的十个小组任选一个加入。然后在小组里面分配任务。
    • 第四步,把 Airtable 加入你的登山工具的代理里。
  • 如何获得 GitHub 权限?
    • 你需要注册一个 GitHub 账户,注意昵称与微信群同步。
    • 把你的 Email 或者 ID 发给 Alex,他会邀请你加入本仓库

1.2 你在 2021-05-09 要交付的东西

  • 你要把收集到的学者元数据填入 Airtable 对应表格。把表格中没有的数据(自然语言)填入其他笔记。
  • 你在探索收集中,记录使用的信息源以及行动步骤(放在自己的本地笔记里)。在下一次会议时交流。讨论出一个添加词条的通用步骤。
  • 你在探索收集中,积累可以被自动化抓取的元数据(如,谷歌学术作者主页的标签分类)
  • 你在探索收集中,思考现有表格的元数据是否科学。

1.3 软件相关教程

2. 项目目标

项目不是什么?简单的人肉爬虫,你需要加入的是信息分析视角挖掘出的反常识信息。

所以,我们项目数据框架先不定死。收集前 100 学者,可以带各自的风格。(未来在汇总之后,再定个稳定具体的模板之后,再严格执行)

其次,希望大家,在收集元数据时候记录可以自动化的地方。(记录检索清单、记录痛点)记录,如何形成一个学者的最小全局认识(控制在 30 分钟里)。

3. 项目里程碑

  • 里程碑 1:建立包含 100 个学者的数据库
    • 要确定大时间周期稳定的元数据(空间、时间、变量)
    • 要确定添加一个词条的最佳实践。(如何快速准确的信息分析一个学者)
    • 思考 3 个使用场景。比如如何展示数据……
  • 里程碑 2: 建立包含 500 个学者的数据库
  • 里程碑 3 建立包含 1000 个学者的数据库
    • 数据源的交叉验证放在项目后期

4. 项目节奏

  • 任务分工:
    1. 参考会议纪要中的行动点;
    2. 参考任务分配看板
  • 本项目有旁观者淘汰机制,2021-05-30 时淘汰不积极参与项目的同学。

5. 信息流动图

小队微信群/私下会议/独立探索/ ... 任何即时场景中
        ^ \
        |  +- 触发创想/改进点/卡片创意/疑问点/...
        |   \               
        |    *- => Issues 进行具体描述/追踪/讨论/...
        ^   / \         +- https://github.com/Spehhhhh/IADB_Scholar/issues
        |   |  \            +- 自动提醒 -> #TODO 需要配置
        |   ^   +- 定期 腾讯会议/飞书会议 交流嗯哼
        |   |   |       +- #TODO 需补充会议号
        |   ^   +- 定期 Airtable 发布任务 (*wd0 2042)
        |   |   |       +- https://airtable.com/tbl7cdh4nRbSfzxsH/viw6gIMROhVAa0pFH
        ^   ^   +- 笔记 追踪在 https://github.com/Spehhhhh/IADB_Scholar/
        |   |   |     +- 可以存放在专有 Orphan Branch 中
        |   |   |         +- 提交规格 Commit Message 
        |   |   |             +- 含对应 Issue 标号
        |   |   |            /
        |   +---+-----<---<-+ (将自动匹配增补到对应 Issue 时间线事件中)
        |       |       
        ^       +- 知识点/经验/手册 沉淀到 Wiki 在完全配置之前暂放于 Master Branch 
        |      /      +- https://github.com/Spehhhhh/IADB_Scholar/wiki
        +---<-+       +- https://github.com/Spehhhhh/IADB_Scholar/tree/master

6. 协作工具与绝对坐标

7. 作品展示

最终呈现在 Master Branch,方式待未定,可能以 Web 作品呈现。

9. FAQ

  • Airtable 访问慢怎么办?
  • 我不会爬虫会不会不适合这个项目?
    • 不会,你只需要有信息分析的热情就行。

ChangeLog

  • 210425 Alex init;