Pinned Repositories
-python-BAT-
针对常见的BAT公司中的大数据面试和笔试问题,列出解决思路,并使用python来实现
2016CCF_BDCI_Sougou
【源码以及PPT分享】2016CCF大数据与计算智能大赛:精准营销中搜狗用户画像挖掘
2016CCF_StateGrid_UserProfile
1st Place Solution for【2016CCF大数据竞赛 客户画像赛题(用户画像)】
2017-JDD-Global-Data-Explorer-Competition
2017京东金融全球数据探索者大赛(3rd place)
2018-CCF-BDCI-China-Unicom-Research-Institute-top2
2018-CCF大数据与计算智能大赛-面向电信行业存量用户的智能套餐个性化匹配模型联通赛-复赛第二名解决方案
2018-KUAISHOU-TSINGHUA-Top13-Solutions
2018**高校计算机大赛--大数据挑战赛 Top 13-Solutions
alibaba-middleware-race-preliminary
2016年阿里中间件性能挑战赛初赛题,RocketMQ+JStorm+Tair实时统计双11交易金额
alibaba-mom
2015 ali中间件比赛项目,1. 通信模块: 涉及到了消息架构设计,每一个主题分配1-2个队列,这个是可以横向增加,考虑到了一个主题有多个消费者订阅,而且还有过滤条件,为了负载均衡,对应的队列投递消息是根据随机数对队列数取膜完成的。以上是内存队列。 2. 持久化系统:因为考虑到机器坏掉,broker不可用等等原因导致的消息丢失,就需要每次收到的消息必须及时落盘,这个就是比赛优化的重中之重。为此设计了一个小型的文件系统,借鉴阿里的rocketmq. 用一个大的日志文件,一般1G大小每个,和内存队列的结构映射到实体队列。整个日志文件是顺序文件,每条消息固定大小,里面有对应的队列号,消息号,还有长度等等。这个方便恢复消息到实体队列用的。 同步刷盘,异步刷盘,持久化必须可靠,所以一般是同步刷盘到日志文件,日志文件定时异步刷盘到实体队列,实体队列里面是索引,消息的本体在日志文件里面。为了加快大面积的写入速度,用了内存映射:内存映射文件首先将外存上的文件映射到内存中的一块连续区域,被当成一个字节数组进行处理,读写操作直接对内存进行操作,而后再将内存区域重新映射到外存文件,这就节省了中间频繁的对外存进行读写的时间,大大降低了读写时间
aliMusic
🎼天池阿里音乐流行趋势预测大赛,项目中涵盖了从初赛到复赛的全部核心代码。复赛的聚合数据可以在百度网盘下载,更详细的思路介绍欢迎访问我的博客。
ansj_seg
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典
bjgyl's Repositories
bjgyl/2018-CCF-BDCI-China-Unicom-Research-Institute-top2
2018-CCF大数据与计算智能大赛-面向电信行业存量用户的智能套餐个性化匹配模型联通赛-复赛第二名解决方案
bjgyl/arthas
Alibaba Java Diagnostic Tool Arthas/Alibaba Java诊断利器Arthas
bjgyl/awesome-dubbo
Dubbo resources collection
bjgyl/big_data_architect_skills
一个大数据架构师应该掌握的技能
bjgyl/BigDataMining
大数据分析与数据挖掘 百度云资源持续更新中,欢迎点赞star Min's blog 欢迎访问我的博客主页!(Welcome to my blog website !)https://liweimin1996.github.io/
bjgyl/CS-Notes
:books: Computer Science Learning Notes
bjgyl/DataX
bjgyl/DeepLearning-500-questions
深度学习500问,以问答形式对常用的概率知识、线性代数、机器学习、深度学习、计算机视觉等热点问题进行阐述,以帮助自己及有需要的读者。 全书分为15个章节,近20万字。由于水平有限,书中不妥之处恳请广大读者批评指正。 未完待续............ 如有意合作,联系scutjy2015@163.com 版权所有,违权必究 Tan 2018.06
bjgyl/flash-netty
掘金小册对应源代码 https://juejin.im/book/5b4bc28bf265da0f60130116
bjgyl/funNLP
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌&零件词库、时间抽取、连续英文切割、中文词向量大全、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据。
bjgyl/incubator-dubbo
Apache Dubbo (incubating) is a high-performance, java based, open source RPC framework.
bjgyl/inmap
大数据地理可视化
bjgyl/Java-Interview-Advanced
中华石杉--互联网Java进阶面试训练营
bjgyl/JDK
JDK源码阅读笔记
bjgyl/JvmDemo
bjgyl/learning-java
Java编程之路:+1::heart:
bjgyl/milvus-docs
This repository is for Milvus technical documentation update and maintenance. Visit Milvus.io for fully rendered technical documents.
bjgyl/mini-rpc
Spring + Netty + Protostuff + ZooKeeper 实现了一个轻量级 RPC 框架,使用 Spring 提供依赖注入与参数配置,使用 Netty 实现 NIO 方式的数据传输,使用 Protostuff 实现对象序列化,使用 ZooKeeper 实现服务注册与发现。使用该框架,可将服务部署到分布式环境中的任意节点上,客户端通过远程接口来调用服务端的具体实现,让服务端与客户端的开发完全分离,为实现大规模分布式应用提供了基础支持
bjgyl/mytest002
bjgyl/nacos
an easy-to-use dynamic service discovery, configuration and service management platform for building cloud native applications.
bjgyl/netty-1
源码解析中文地址:http://www.iocoder.cn/Netty/Netty-collection?github
bjgyl/NettyRpc
A simple RPC framework based on Netty, ZooKeeper and Spring
bjgyl/Python-100-Days
Python - 100天从新手到大师
bjgyl/python-api-tesing
python中文库-python人工智能大数据自动化接口测试开发。 书籍下载及python库汇总https://china-testing.github.io/
bjgyl/Spring
Spring源码阅读
bjgyl/storm
Mirror of Apache Storm
bjgyl/tlog-homepage
bjgyl/tomcat-jdbc-notes
Tomcat自带数据库连接池源码阅读
bjgyl/xxl-api
A api management platform.(API管理平台XXL-API)
bjgyl/xxl-job
A lightweight distributed task scheduling framework.(分布式任务调度平台XXL-JOB)