/vocabuilder

A vocabulary builder for (cur English) L2 learners

MIT LicenseMIT

Vocabuilder

A vocabulary builder for (cur English) L2 learners

理念

  • L2学习者对目的语词汇的习得不是二元分布(会/不会、认识/不认识 等),其中还包含多个状态。

  • 对某个词__完全的习得__应能够在口语/书面中自如、恰当地使用。

  • 从完全陌生到完全习得,中间可包括

    • A 陌生
    • B 即视感(感到似曾相识,但无法识别其意义)
    • C 辨认(传统意义的“认识”,能够正确回答单词的基本义,但在阅读中常需要反应出该词在学习者母语中的对应词)
    • D 潜认(无需借助母语即可理解, 可能在口语及写作中开始使用)
    • E 习得

    例,某新闻标题: Rochester Cancels Fireworks After Terror Plot Thwarted
    对于我:Rochester/NE Cancels/E Fireworks/E After/E Terror/D Plot/D Thwarted/B
    其中,NE 为命名实体(Named Entity),A-E分别对应上述各状态

  • 词汇学习的目标是尽可能探知学习者对一个单词所处的状态,针对状态为A-C的词汇,通过各种手段推动其的习得状态。

  • 基于以上,词汇的习得亦应区分层次,A/B状态的词汇需要向L2学习者更多地复现,B状态词汇还需让学习者主动意识到该词所处的习得状态,推动其通过翻查字典等方式得知意义;C状态词汇需通过填句练习,鼓励学习者尝试在其口语与习作中使用该词。

设计

  • APP或者WebApp形式,以移动端为主。
  • 以日为组块,但弱化用户每天完成任务(如打卡、combo等)概念,鼓励用户在学习中断后再次继续学习。
  • 每日组块的核心是一篇300-500词左右的文章,该文章大部分词汇对其应在D状态或以上,以保证其能够基本通顺地理解文章大意。而文中状态为A/B/C的单词则为组块主要标的。
  • 用户开始组块后,首先通读文章,并把其中自己“不认识的”(状态A)以及“感觉见过,但就是想不起来意思的”(状态B)单词全部标示出来,每当用户标示一词,就会返回一个__仅有基本义__的单词释义,在本阶段不要求用户掌握这部分词汇。
  • 通读后完成填句练习,不提供母语翻译的情况下,给出包含C状态词原文句子,鼓励用户尝试填出C状态词(也允许用户选择“想不起来了”)
  • 要求用户写50-100词的笔记,主要学习其是否运用了文中出现的C状态词。
  • 根据用户对组块的表现,更新对其词汇能力的估计。
  • 将估计值反馈给用户。

TODO

  • 找出一个文章的命名实体,置灰(NLTK NER)
  • 剩余的单词可以选择,选中后弹出基本释义(有没有API??)