欢迎关注博客虫微信公众号“数据虫巢(微信号blogchong)”,个人微信号mute88。

[置顶] 数据虫巢-提供专业的大数据解决方案

作者: blogchong | 分类: 原创-Hadoop大数据 | 评论:0人 | 浏览:

[置顶] 米特吧大数据技术沙龙第二期干货分享

作者: blogchong | 分类: 原创-我的互联网简历 | 评论:4人 | 浏览:

[置顶] 米特吧大数据技术沙龙第一期干货分享

作者: blogchong | 分类: 原创-我的互联网简历 | 评论:1人 | 浏览:

[置顶] 我所理解的大数据个性化推荐

作者: blogchong | 分类: 原创-我的互联网简历 | 评论:2人 | 浏览:

[置顶] 这些年,这些挖掘机算法,这些反思

作者: blogchong | 分类: 原创-我的互联网简历 | 评论:8人 | 浏览:

[置顶] 数据平台架构草案

作者: blogchong | 分类: 原创-Hadoop大数据 | 评论:3人 | 浏览:

在校学习Hadoop等大数据相关技术对找工作能否有帮助?

作者: blogchong | 分类: 原创-Hadoop大数据 | 评论:0人 | 浏览:

随着大数据潮流的风靡,或者说大数据潮流的进一步扩散,如今大数据看起似乎有一种势不可挡的趋势了。于是,很多人就开始不淡定了。

之所以有“在校学习Hadoop等大数据相关技术对找工作能否有帮助?”这个话题,一方面确实存在大数据技术席卷全球的风潮,另一方面也是因为身边确实也发生了很多这种情况。

More...

Learning storm book 笔记8-Log Processing With Storm

作者: EXEC | 分类: 原创-Storm实时处理 | 评论:1人 | 浏览:

有代码的书籍看起来就是爽,看完顺便跑个demo,感觉很爽!我只是个搬运工,不喜也允许喷!

场景分析

主要是利用apache的访问日志来进行分析统计 如用户的IP来源,来自哪个国家或地区,用户使用的Os,浏览器等信息,以及像搜索的热词等信息的统计 这里日志信息如下

More...

Storm系统中的Nimbus高可用

作者: blogchong | 分类: 原创-Storm实时处理 | 评论:0人 | 浏览:

在做架构的时候,一个重要要素需要考虑的就是:系统的高可用!

关于Storm的高可用,有以下几个方面:

(1)数据利用阶段可以通过ACK机制保证数据被处理;

More...

博客虫资料分享第二期《数据挖掘进阶》

作者: blogchong | 分类: 原创-博客虫资料分享 | 评论:0人 | 浏览:

博客虫资料分享第二波来袭,依然是数据挖掘,不过是进阶版的~

博客虫资料分享主要是分享前沿IT领域的相关资料、高清PDF文档、书籍。站长收集,绝对精品!

More...

川流不息的地下铁啊

作者: blogchong | 分类: 原创-与挨踢无关 | 评论:2人 | 浏览:

看着一波又一波的人涌进地铁,随着人流被挤压,轰隆声起,臃肿的地铁一头扎进地洞中,黑暗蔓延,一点一点地临近窒息~~

好一个大沙丁鱼罐!

看着这负重不堪又止停不息的地下铁,我想,或许它也很无奈吧?

More...

实时处理系统Storm的进程通信机制详解

作者: 大数据编辑 | 分类: Storm|DM|Hadoop|NoSql | 评论:0人 | 浏览:

在Storm中,worker进程内部的thread通信与worker进程间的通信有一些差别,worker间的通信经常需要通过网络跨节点进行,Storm使用ZeroMQ或Netty(0.9以后默认使用)作为进程间通信的消息框架。worker进程内部通信或在同一个节点的不同worker的thread通信使用LMAX Disruptor来完成。

对于worker进程来说,为了管理流入和传出的消息,每个worker进程有一个独立的接收线程(对配置的TCP端口supervisor.slots.ports进行监听)。参数topology.receiver.buffer.size代表接收线程一次最多能接收多少条消息,用户可以自定义配置。接收线程将收到的消息传递给对应的executor(一个或多个)的incoming-queues。

More...

手机APP界面开发中的一些实用技巧

作者: 移动互联网编辑 | 分类: 移动互联网领域 | 评论:0人 | 浏览:

在手机APP的界面设计中,有些实用技巧如果掌握了,对你的APP开发有着很大的帮助。

下面我们来看看,有哪些技巧是需要注意的,又有哪些技巧是你已经掌握了的。

手机APP界面设计实用技巧:

More...