2018/6/16
- 加快检索速度,单词统计按照字母顺序输出。(将单链表存储,更换为A-Z对应的26条链表。)
- 封装单词处理的重复步骤,精简代码。
2018/6/15
- Records.txt文件用于文段内全部单词的输出。
- 支持对文本中单词与符号连在一起时,单独统计单词。忽略如Auto-Machine一类的中间符号,仅去除词前与词尾。
- 如句尾英文模式下的‘.’与单词连在一起。e.g.: This is the ending.会提取ending,忽略.句号之后的空格也会被忽略。
- 如一些被修订过的文本中的(was)或者 [colour] 等。仅提取单词,忽略符号。
- 单词首字母大小写忽略,全大写单词转换为小写,当做相同单词统计。
- GUI待制作。
- 添加可选排序,例如:使用字母排序,词频多少排序,单词长度排序,并使用函数指针。
- 函数定义与主文件分离,并封装成动态库,让C#可以实现调用。