2013-03-20
NoSQL与大数据NoSQL最早出现时,主要是Twitter这些社交媒体网站在用。因为他们需要处理每时每刻用户上传的海量图片、视频等非结构化数据。大数据概念提出之后,由于其在非结构化数据方面的优势,迅速融入大数据整体平台。为什么之前XML数据库没有成功?NoSQL的数据反而成功了?郑玮提到NoSQL给了大家一个平台,可以用通用的技术去找数据,也可以去搜索那个数据。优点的地方应该是可以很快地去寻找你...
人大统计学院毕业生工作单位类型数据可以看到,政府和国企吸收了过半数的统计学毕业生,外资企业(例如四大会计师事务所)吸收了近四分之一。而民营企业只占15%的份额。在这些毕业生最近经常运用的有统计功能的软件中,大致数据如下:Excel占据半壁江山,SPSS第二,其他工具瓜分了剩下的份额。这样的数据会有一些不权威,但也反映出中国目前在数据分析软件方面,还处在一个相对低水平的位置。对大数...
【51CTO精选译文】编辑注:本文作者是BugSense公司的创始人兼首席技术官Jon Vlachogiannis。BugSense是一家专门报告错误、度量质量的服务商,每天跟踪成千上万个应用程序。移动应用程序崩溃时,BugSense可以帮助开发人员准确查明问题,并解决问题。这家新兴公司的客户包括VMWare、三星、Skype以及数千家独立应用软件开发商。跟踪2亿多种设备需要有一套运行速度快、容错性强、成本又低廉的基础设施。...
如果你的网站拥有数以千万计的活跃用户,如果网站上拥有数以百计的产品服务,如果这些服务以多媒体的形式在多个网络终端上运行,如果正在或者打算尝试走向云计算和WEB2.0架构,那就恭喜你了,因为你已经不知不觉地成为大数据时代的先行者或受害者。 按照维基百科上的定义,所谓大数据(big data)在当今的互联网业指的是这样一种现象:一个网络公司日常运营所生成和积累...
因为关注大数据,也写过若干关于大数据的文章,做过若干关于大数据的演讲,所以对有关这一主题的论文和书籍非常有兴趣。过去几年,在这方面读过十几本书,上百篇论文和文章。相对而言,舍恩伯格的《大数据时代》是迄今为止我读过的最好的一本专著,中英文都算上。 此书的一大贡献是在大数据方兴未艾,众说纷纭的时刻,进一步阐述和厘清了大数据的基本概念和特点,这对许多以为大数据就是数...
本文转载自《人民日报》2013年02月22日记者:余建斌 赵展慧 1.移动互联时代,数以百亿计的机器、企业、个人随时随地都会获取和产生新的数据 即便是在摩尔定律每18个月芯片性能将提高1倍的支撑下,硬件性能进化的速度也早已赶不上数据增长的速度,并且差距越来越巨大。 1分钟之内,新浪微博发送数万条微博,苹果应用商店下载次数以万计,淘宝卖出了几万件商品,百度产生了百万次搜索查询&...
大数据正在贯穿从宏观社会到中微观市场的影响,中国要跟进,还得从打破信息壁垒与体制封闭开始 财新记者 朱以师 在2009年甲型H1N1流感爆发的前几周,谷歌公司的工程师们在《自然》杂志上发表了一篇令公共卫生官员和计算机科学家感到震惊的文章,声称谷歌能够预测冬季流感的传播不仅能预测到全美范围的传播,甚至可以将流感传染目标锁定到地区和州。 原来,谷歌是通过观察人们在网上的搜索记...