关注 已有 4 人关注
相关领域:
技术 移动开发
数据挖掘
数据处理指的是将输入的数据信息进行加工、整理,计算各种分析指标,变为易于被人们所接受的信息形式,并将处理后的信息进行有序贮存,现在所属的大数据、云计算等也在此归类中,常见的数据库工具为Oracle,DB2,MySQL等。
墨记
新媒体课程工场|新媒体培训课程收集——102号 岛书
线上新媒体培训课程:一、第九课堂:课程上线平台:自有网站(通过自有网站发布课程,发布的课程为各行各业精英的经验与技能,别人可以从这里获得干货,自然也会包括一些新媒体的知识)链接:http://www.dijiuke.com/learn?categoryId=startup二、汇学教育:(...
理想国|新媒体课程工场第三课:ZMO新媒体课程竞品分析
DT浪潮下,自助式数据分析在国内的落地和实践
本文来自诸葛io联合创始人赵乾坤在拓扑社的分享。作者拥有深厚的数据挖掘技术背景和十余年的互联网行业经验,是大数据在传统企业和互联网领域应用的设计师和实践者。我们认为“自助式数据分析”会是后续数据分析的一个发展方向。目前,诸葛io也是在朝着这个方向转换和发展。在做诸葛io之前,我们最开始实际上也在给企...
加速协作体验 诸葛io看板功能升级
进入数据时代,能跑在互联网时代超车道上的企业,一定对他们的用户有着深刻的认识和理解。互联网发展至今,数据对企业客户的重要性已经上升到战略层面。数据情况和趋势需要时常关注,因此集成各项核心数据指标的可视化“看板”再方便不过了。不同于传统统计工具,诸葛io关注用户全生命周期流程,帮助客户捕获颗粒度极细的...
「内容&社区」行业实战 | 教你如何激发80%用户的深层需求
诸葛君的学长——大龙,是个超级理性的直男,他说一旦他发现在某款App上花费的时间过多的时候,就果断卸载这个App,因为他不想被一个App所控制和占用。所以,大龙学长至今依然单身不是没来由哒(蜜汁微笑)。事实上,80%的用户其实并不知道自己想要的是什么,只有20%的人知道自己想要什么,大龙就是那典型的...
MapReduce设计模式之数值概要
一.引言如果你开始阅读了此专题,那么默认你已经了解了Hadoop、分布式计算原理和MapReduce计算原理。并且你能够使用MapReduceJavaAPI编写MapReduce程序。MapReduce不仅仅是一个工具,更是一个框架。我们必须拿问题的解决方案去适配...
更多墨记...
站点
孙豪杰的博客,多年Java领域工作经验,专注java开发,Java项目架构,Java培训,电子商务解决方案实现
互联网开发孙豪杰,专注java开发,电子商务解决方案实现,多年java开发工作经验,对电商项目非常熟悉,设计过多个电商项目。参与京东交易系统的多次重大改版,设计了万达电商的交易支付系统,设计了金山云新版电商业务系统。帮助多个创业团队开发电商项目和互联网金融项目。对Java技术有深刻的认识,开发多套Java教程。
粉丝日志
跨界的IT博客,核心IT技术包括:Hadoop,R,RHadoop,Nodejs,AngularJS,KVM,NoSQL,IT金融
博客虫
专注于前沿IT技术,荟萃原创技术博文,范围涵盖实时处理、大数据、数据挖掘、移动互联网等技术领域。关于网站的名字,其实屌丝站长名字中有个chong字,然后博客虫读起来也算朗朗上口,于是就有了~~哈哈若是你感觉博客虫对你有所帮助,加入收藏夹吧,时常来看看,原创文章会及时更新~~
老蔡博客 | 专注云平台虚拟化技术
本博是一个从事IT运维工作者的个人网站.它记录了博主老蔡在工作中遇到的疑难杂症及最终的解决方案,它还展示了博主老蔡不平凡的人生.在这里老蔡博客期待结实更多志同道合的朋友.
微拓ASO
微拓ASO工具提供了苹果应用商店的主要数据分析服务,包含关键词覆盖、权重查询、关键词分类、竞品分析等服务;并且独家提供了高价值关键词查询、基于机器学习算法的app关键词扩展和联想等功能,帮助app的运营者覆盖更多相关流量,是app开发的必备工具。
2016年中国互联网金融发展报告 | 人人都是产品经理
本文主要内容分为4点:政策收紧,互联网金融野蛮生长告一段落;理财用户很快进入饱和,信贷用户尚需进一步开发;互联网金融是各类资产变现的新天堂;卡与虚拟卡并存,银行业或进入账卡号双轨制时代。值得一读。一. 浪潮褪去:互联网金融概念的破灭逐渐失去活性的中国金融
更多站点...
文章
Oozie简介
在Hadoop中执行的任务有时候需要把多个Map/Reduce作业连接到一起,这样才能够达到目的。[1]在Hadoop生态圈中,有一种相对比较新的组件叫做Oozie[2],它让我们可以把多个Map/Reduce作业组合到一个逻辑工作单元中,...
Lucene学习总结之一:全文检索的基本原理
一、总论根据http://lucene.apache.org/java/docs/index.html定义:Lucene是一个高效的,基于Java的全文检索库。所以在了解Lucene之前要费一番工夫了解一下全文检索。那么什么叫做全文检索呢?这要从我们生活中的数据说起。我们生活中的数据总体分为两种:结构化数据和非结构化数据。结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等。非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等。当然有的地方还会提到第三种,半结构化数据,如XML,HTML等,当根据需...
GitHub Top 100的Android开源库
本文是我一位粉丝「G军仔」整理并投稿,一位大爱Google、热爱开源的大三学生,GitHubID「Freelander」。之前这篇文章「Android学习资料收集」就是来自他的投稿,整理的很全很棒。投稿之后反响很好,很受鼓舞,于是他准备再整理下GitHub上前100的Java开源库,但是我建议他Java应用的领域太广了,不如就直接整理跟Android相关的开源库吧,没想到小伙执行...
hadoop 2.0 详细配置教程
Hadoop是apache的开源项目,开发的主要目的是为了构建可靠,可拓展scalable,分布式的系统,hadoop是一系列的子工程的总和,其中包含1.hadoopcommon:为其他项目提供基础设施2.HDFS:分布式的文件系统3.MapReduce:Asoftwareframeworkfordistributedprocessingoflargedatasetsoncomputeclusters。一个简化分布式编程的框架。4.其他工程包含:Avro(序列化系统),Cassandra(数据库项目)等
从入门到精通:如何用图表做好数据分析?
随着精细化运营的概念不断深入人心,数据分析已经成为了互联网人的必修课。相比于高深的概率统计、算法模型,简单、直观的图表工具得到了更为广泛的应用。那么图表都有哪些类型?不同类型的图表又该怎么用?来,让我们深入浅出,看图说话。-初阶-维度和指标初阶的图表简单易懂,能满足简单的数据分析需求,具体包括趋势、频数、比重、表格等类型。图表数据分析的前提就是将自己需要呈现的指标,以一定的维...
Hadoop 之 MapReduce 框架演变详解
上面的这幅图我们暂且可以称谓Hadoop的V1.0版本,思路很清晰,各个Client提交Job给一个统一的JobTracker,然后JobTracker将Job拆分成N个Task,然后进行分发到各个节点(Node)进行并行协同运行,然后再将各自的运行结果反馈至JobTracker,进而输出结果。但是,这种框架有它自身的限制性和局限,我们来简单的分析几点:1、单点故障,首先,单点故障也是最致命的一点,从上图中可以看到所有的Job的完成都得益于JobTracker的调度和分配,一旦此节点宕机就意味着整个平台的瘫痪,当然,在实际中大部分通过一个JobTrackerslaver来解决。但是,在一个以分布式运算为特性的框架中,将这种核心的计算集中与一台机器不是一个最优的方案。
更多文章...
分享
×
  • 图书
  • 课程
  • 站点
  • 工具
  • 文章
×
确定
温馨提示
×
这条资源已经被分享过了
点击查看
用户名不正确!
下次自动登录