/WordFrequency

WordFrequency_词频统计

Primary LanguageC

WordFrequency

词频统计

2018/6/16

  • 加快检索速度,单词统计按照字母顺序输出。(将单链表存储,更换为A-Z对应的26条链表。)
  • 封装单词处理的重复步骤,精简代码。

2018/6/15

  • Records.txt文件用于文段内全部单词的输出。
  • 支持对文本中单词与符号连在一起时,单独统计单词。忽略如Auto-Machine一类的中间符号,仅去除词前与词尾。
    • 如句尾英文模式下的‘.’与单词连在一起。e.g.: This is the ending.会提取ending,忽略.句号之后的空格也会被忽略。
    • 如一些被修订过的文本中的(was)或者 [colour] 等。仅提取单词,忽略符号。
    • 单词首字母大小写忽略,全大写单词转换为小写,当做相同单词统计。

  • GUI待制作。
  • 添加可选排序,例如:使用字母排序,词频多少排序,单词长度排序,并使用函数指针。
  • 函数定义与主文件分离,并封装成动态库,让C#可以实现调用。