欢迎关注“数据虫巢(微信号blogchong)”,个人微信号mute88,数据虫巢私密群启动招募啦!

[置顶] 数据虫巢-提供专业的大数据解决方案

作者: blogchong | 分类: 原创-Hadoop大数据 | 评论:0人 | 浏览:

[置顶] 米特吧大数据技术沙龙第二期干货分享

作者: blogchong | 分类: 原创-我的互联网简历 | 评论:4人 | 浏览:

[置顶] 米特吧大数据技术沙龙第一期干货分享

作者: blogchong | 分类: 原创-我的互联网简历 | 评论:1人 | 浏览:

[置顶] 我所理解的大数据个性化推荐

作者: blogchong | 分类: 原创-我的互联网简历 | 评论:2人 | 浏览:

[置顶] 这些年,这些挖掘机算法,这些反思

作者: blogchong | 分类: 原创-我的互联网简历 | 评论:8人 | 浏览:

[置顶] 数据平台架构草案

作者: blogchong | 分类: 原创-Hadoop大数据 | 评论:3人 | 浏览:

博客虫资源分享系列一:Hadoop大数据相关资源

作者: blogchong | 分类: 原创-Hadoop大数据 | 评论:0人 | 浏览:

资源分享第一弹:分享米特吧|大数据论坛(www.mite8.com)资料区hadoop板块资源,各种大数据相关大会PPT资料、hadoop生态相关的PDF书籍、他人分享的大数据相关资源。


More...

两座城池

作者: blogchong | 分类: 原创-与挨踢无关 | 评论:0人 | 浏览:

休假ing,所以不谈技术,哈哈,客串一下文艺青年,来一盅心灵鸡汤~~

--致《围城》


More...

大数据猿们,是时候想想这几个问题了

作者: blogchong | 分类: 原创-经验之谈 | 评论:0人 | 浏览:

处于技术交流的这个圈子,有些东西真心不吐不快,希望大家能从中得到有一些东西,不光是技术交流的小话题,甚至是做事的态度~~

More...

热度TopN排名算法的设计

作者: blogchong | 分类: 原创-数据挖掘 | 评论:1人 | 浏览:

最近开始在简书上混,今日在首页上不经意间看到一篇《从豆瓣电影评分算法说起》,感觉有点眼熟,就点了进去。

其实阿北的那篇《豆瓣电影评分八问》,我也是刚看过,这可能也是让我觉得眼熟的原因。

其他的不多说,其实让我耳目一新的是作者说的用户投票排名算法。

我之所以说是耳目一新,那是因为类似这种热度TopN排名的算法,在一年前接触过,也设计过排名算法,并且,至今然仍在用,那就是“极客头条"的最热排行榜。

而现在,总算是接触到比较完整的算法描述了,对排名算法也有了一个比较系统的认知,所以甚是感激。

More...

你们是不是很缺大数据工程师?

作者: blogchong | 分类: 原创-Hadoop大数据 | 评论:2人 | 浏览:

缘起 之所以有这个话题,是因为周末加班中午吃饭与一个同行朋友聊起了这个话题,之后再细细地结合一些其他接触的东西,确实是有些感触的。

并且对于行业的一些现状,也的确有些自己的看法,对不对先不论,这玩意儿也没有对错之分,每个人都有自己想法,当然也包括我博客虫了。

所以,有些东西、有些想法我还是愿意分享出来的,畅所欲言吧~~

More...

文本主题特征抽取实践与构想

作者: blogchong | 分类: 原创-数据挖掘 | 评论:1人 | 浏览:

缘起

     其实开展文本主题特征抽取这个方面的工作,已经近一个多月了。在此之前,部门内部对于数据挖掘、机器学习这块的积累还是比较薄弱的。

      经过一个多月在这方面的实践、与行业内相关同行的交流以及经历接触的一些东西,我发现还是有些东西可以拿出来做分享的。

      虽然有些东西看起来并不是很高端的东西,但是,从工程化的角度来说,个人认为还是值得借鉴参考的。

More...

米特吧大数据技术沙龙第一期举办感想以及现场照片/PPT分享~~

作者: blogchong | 分类: 原创-我的互联网简历 | 评论:0人 | 浏览:

第一次发起并且组织的线下技术沙龙,从筹备到举办总共花了两个多星期,在12月5号下午于朝阳区望福码大厦B座7楼的随身云会议室举行(再次感觉随身云提供的会议室)。

来自新浪、百度、搜狐、乐视、CSDN、新东方、亚信等数十个公司的技术经理、开发人员近40人参加了技术沙龙活动,当然,也有少部分非在职人士,比如来自中传媒大学大数据方向的几位博士和硕士也参与活动。

整个活动不止有技术的分享,也有技术的自由交流,整个过程感觉还是很nice的,正真体现到了这不是一个简单的技术分享,而是一个技术沙龙,有交流有探讨。

分享的朋友分别来自CSDN(俺算一个,哈哈)、乐视云、亚信、以及随身云,主题分别为《沙龙开题:进步始于交流,收获源于分享--再唠一唠Storm》、《海量数据处理之大跃进--天到实时》、《BigData in 中华万年历》、《BI内容分享》等。

在分享与交流之后,最后沙龙活动以参与活动的各自自我介绍收尾,并且相互之间留下了联系方式,以备技术的继续交流。

《米特吧大数据技术沙龙》第一期算是圆满收工,作为第一次发起并且组织线下的大数据技术沙龙活动来说,个人感觉还是很不错的,我希望“进步始于交流、收获源于分享”的理念能够持续下去~~

第一期已经有了,我想第二期还会远吗?

技术沙龙PPT分享:

More...