Pinned Repositories
analyzer-profile
多种分词器的封装,重点修改了原IK分词器和mmseg4j分词器,并适用于Lucene4.8、Solr4.8版本
android-upload-service
Easily upload files (FTP / Multipart / Binary) in the background with progress indication notification
ansj4solr
solr的ansj分词器,支持4.3以上
ansj_seg
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
ansj_solr_plugin
Ansj的Solr插件,支持1.2版本以上的Ansj分词和4.3版本以上的Solr
avidemux2
awesome-java
A curated list of awesome Java frameworks, libraries and software. Inspired by awesome-python.
bbc-ingex
Clone of the Ingex CVS repository on SourceForge
cloudfs
将阿里云OSS对象存储挂载为Linux本地目录的工具软件; 是目前为止阿里云OSS最稳定、最快速、功能最强大的挂载软件。官方地址见http://git.oschina.net/weiweibaba2007/cloudfs
elasticsearch
Open Source, Distributed, RESTful Search Engine
dluobo's Repositories
dluobo/bbc-ingex
Clone of the Ingex CVS repository on SourceForge
dluobo/ansj4solr
solr的ansj分词器,支持4.3以上
dluobo/ansj_solr_plugin
Ansj的Solr插件,支持1.2版本以上的Ansj分词和4.3版本以上的Solr
dluobo/chinese-corpus
中文相关词典和语料库。
dluobo/cws_evaluation
Java开源项目cws_evaluation:中文分词器分词效果评估
dluobo/DistributeCrawler
基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类
dluobo/distributedCrawler
华南理工大学高英实验室进行的分布式爬虫项目,除了实验室内部人员外,不得私自传播.
dluobo/DistributedCrawler-1
DistributeCrawler的Maven版
dluobo/elasticsearch-analysis-ansj
dluobo/flowdesign
Jquery WEB流程设计器
dluobo/HtmlExtractor
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件。
dluobo/ingex
Clone of the Ingex CVS repository on SourceForge
dluobo/MediaHarmony
Mirror of the MediaHarmony CVS repository
dluobo/nlpir
A rubygem wrapper of chinese segment tools ICTCLAS2014 for linux_x86
dluobo/nutch-htmlunit
基于Apache Nutch和Htmlunit的扩展实现AJAX页面爬虫抓取解析插件
dluobo/parse-video
dluobo/parse-video-interface
dluobo/parse_video_stream_url
parse stream url
dluobo/parseVideo
解析国内各大视频网站视频 php 2013年
dluobo/SinaMicroBlogCrawl
新浪微博模拟登陆2014-04-01版
dluobo/TaobaoCrawler
淘宝商品评价的爬虫
dluobo/VideoUrlParser
VideoUrlParser是一款基于PHP根据视频URL抓取视频信息的工具,支持优酷、土豆、酷六、56、乐视、搜狐、腾讯、新浪
dluobo/web-video-parser
一个 Ruby Gem 目前用于解析主要视频网站的视频参数。用于 eshare 项目中。
dluobo/WeiboCrawler
新浪微博搜索工具
dluobo/word
Java分布式中文分词组件 - word分词
dluobo/Word2VEC_java
word2vec java版本的一个实现