/utils

存放一些工具函数

Primary LanguagePython

utils

存放一些工具函数

函数说明

  • plot_scatter_fig.py

    • 将高维数据降维,以散点图显示
  • measure.py

    • 多分类数据结果评估
  • money_format.py

    • 将汉字金额或者阿拉伯金额转化为统一格式
  • edit_distance.py

  • simhash.py

    • 采用‘tf-idf’计算文本关键词权重,采用SimHash计算文本相似度
  • lda_topic_words.py

    • 利用lda提取主题关键词
  • kenlm_train_lm.py

  • gunicorn_http_server.py

    • 采用gunicorn提升Http服务处理高并发的能力
    • 使用命令
      • gunicorn -b 10.28.100.164:5001 -k gevent -w 20 guncorn_http_server:app
    • 常用参数
      • -w 设置启动python app worker进程的数量
      • -k 运行模式(sync, gevent等等)
      • -b gunicorn 启动绑定的host和port
      • --max-requests 最大处理量, 单woker进程如果处理了超过该数量的请求, 该woker会平滑重启
    • 参考
  • trie_tree.py

    • 构建trie树,包含插入、删除、查询、保存
  • kashgari.py

  • sort.py

  • Xgboost.py

    • xgboost结合sklearn训练分类模型、回归模型
    • 参考
  • bert_model_deploy.py

    • bert fine-tune model 部署
    • 参考
  • word_cloud.py

    • 采用wordcloud生成词云
  • multiprocess_pool

    • python 多进程
  • wechat_boom.py

    • 微信消息轰炸
  • get_requirements.md

    • 如何生成requirements.txt