-
bzoj 3100 K大数查询 树套树
所属栏目:[大数据] 日期:2020-12-31 热度:142
外层权值线段树,对于每个权值线段树节点,建立区间线段树。但是内层这样普通建树会TLEMLE。仔细想会发现,区间线段树不用都建出来,用到哪个点就开哪一个点,每次操作最多经过logn个权值线段树节点,访问每个权值线段树节点时,最多修改logn个区间线段树节[详细]
-
[bigdata-019] 禅道在linux上的安装
所属栏目:[大数据] 日期:2020-12-31 热度:113
1. 在ubuntu 14.04上安装部署禅道 ?? 2. 禅道有多种安装方式。有一键安装包。但如果你已经有了一个mysql数据库,就不能使用一键安装了。本文主要说明在已有mysql数据库下的安装。 3. 官方参考 http://www.zentao.net/book/zentaopmshelp/239.html 4. 下载,[详细]
-
从0到1构建数据生态系列之六:数据价值挖掘
所属栏目:[大数据] 日期:2020-12-31 热度:160
文·blogchong 这估计《 从0到1构建数据生态系列 》的最后一篇,主题是数据价值。 在之前,我们所有做的一切一切,都是基础,那么其最终的目的是什么? 当然,结果很明显,就是数据价值,那么,作为数据生态的最上层,所谓的数据价值又是以什么形式体现的呢[详细]
-
这5种必知的大数据处理框架技术,你的项目到底应该使用其中的哪
所属栏目:[大数据] 日期:2020-12-31 热度:60
大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性、规模,以及价值在最近几年才经历了大规模扩展。 本文将介绍大数据系统一个最[详细]
-
[bigdata-020]用python3+pymogo 操作 mongodb数据库
所属栏目:[大数据] 日期:2020-12-31 热度:161
1. 安装pymongo pip install pymongo 2. 写一个例子 #!/usr/bin/env python3#! coding:utf-8 -*-import pymongoimport timeclient = pymongo.MongoClient('localhost',27017)db = client.get_database('user-behavior-data')print(db.name)backend = db.get_[详细]
-
bzoj 3110 K大数查询 整体二分
所属栏目:[大数据] 日期:2020-12-31 热度:169
#includecstdio #includeiostream #define maxn 50005 #define LL long long using namespace std; int n, m ;struct Que{ int op,l,r, x ,id; void read () { scanf( " %d %d %d %d " ,op,l,r, x ); if (op== 1 ) x +=n+ 1 ; }} q[50005] ;Que q1[maxn],q2[[详细]
-
电商数据分析:用七句话学会用数据监控类目销售
所属栏目:[大数据] 日期:2020-12-31 热度:167
要想全盘掌握商品的销售情况,用数据监控类目是最科学的,标准化且可复制。具体怎么做? 本文作者总结了七句话: 销售是目标、毛利是根本、商品为核心、供应牢把控、行为是金矿、新品是未来、订单是纽带 。理解这七句话,并付诸实践,将每句话都拆解成具体的[详细]
-
Kahan#39;s Summation Formula原理—它是如何避免大数吃小数的
所属栏目:[大数据] 日期:2020-12-30 热度:110
Kahan求和公式原理: ? ? ? ?首先,这个算法就是用来求和的,求a1+a2+a3+...为什么不直接相加呢,而要用Kahan求和公式呢,这个算法的用武之地在哪呢,一一道来 ? ? ? ?kahan求和算法能避免大数吃小数的情况。 ? ? ? ?大数吃小数是什么意思呢?举个例子,我们[详细]
-
盘点丨2016年乐视开过的发布会和许chui过的愿niu景bi
所属栏目:[大数据] 日期:2020-12-30 热度:125
在辞旧迎新之际,2016盘点系列也将接近尾声,今天我们来盘点一下 乐视在2016年开过的那些发布会和许chui过的愿niu景bi。 北京时间1月12日,乐视在北京798艺术区召开主题为“生态世界”的全球品牌升级新闻发布会,公布了乐视生态及7大子生态的全新Logo,宣布[详细]
-
分析工具很难选? 看他们如何挖掘大数据价值
所属栏目:[大数据] 日期:2020-12-30 热度:191
点击上方蓝色字体关注。 您还可以搜索公众号“ D1net ”选择关注D1net旗下的各领域(云计算,数据中心,大数据,CIO,企业协作,网络数通,信息安全,企业移动应用,系统集成,服务器,存储,呼叫中心,视频会议,视频监控等)的子公众号。 ======= 预测建模[详细]
-
传统企业在大数据分析上所面临的关键问题
所属栏目:[大数据] 日期:2020-12-30 热度:157
实现数据驱动有两个关键环节:一是数据采集,二是数据分析。对于传统企业来说,往往是这两点都不太具备条件。? 数据采集的痛点 前一段知乎上有人提问,说大家都在讨论大数据与互联网、金融、政府等领域的结合,为什么谈农业大数据的这么少?相关的公司这么少[详细]
-
[bigdata-017] 用Hive操作hbase
所属栏目:[大数据] 日期:2020-12-30 热度:68
1. 在hbase创建一个表 ivt_mny_pro 2. 在hive创建一个外部表ivt_mny_pro_2_hive create external table ivt_mny_pro_2_hive(key string,idx bigint,beginTime timestamp,endTime timestamp,userid string) row format serde 'org.apache.hadoop.hive.hbase.H[详细]
-
FP-Growth序列频繁模式挖掘
所属栏目:[大数据] 日期:2020-12-30 热度:90
1算法设计目标 输入不同的命令是用户使用Linux服务器的基本途径,通过长时间采集不同用户在使用服务器过程中所使用的命令序列,挖掘其中频繁出现的命令序列,可以帮助我们了解用户使用该服务器的基本规律。 此外,如果存在多台服务器,那么我们可以分析挖掘[详细]
-
[bigdata]小象幫幫忙,Hadoop 能幫什麼忙?
所属栏目:[大数据] 日期:2020-12-30 热度:180
https://dotblogs.com.tw/rickyteng/2012/12/11/85556 [bigdata]小象幫幫忙,Hadoop 能幫什麼忙? Hadoop 文獻探討 微軟巨量資料策略轉向,全面支援Hadoop http://www.ithome.com.tw/itadm/article.php?c=77576 微軟表示,全面支援 Apache Hadoop,這消息說[详细]
-
资讯 |大数据统计分析教学培训班(第二轮通知)
所属栏目:[大数据] 日期:2020-12-30 热度:60
大数据统计分析教学培训班 暨首届高校青年教师统计教学创新研讨会 第二轮通知 尊敬的老师和同学,您好! 自此次培训班/研讨会第一轮通知发出至今,得到了广大青年教师、研究生与高年级本科的积极响应,来信或来电咨询,报名踊跃。今天再发一次通知,对培训班[详细]
-
[bigdata-015] apache nifi 官方文档摘要
所属栏目:[大数据] 日期:2020-12-30 热度:125
1NIFI 概览 |NIFIOverView 1.1NIFI 是什么 |Whatis Apache NIFI NIFI 的设计目标,是让各系统之间自动进行数据流交换。企业通常有多个系统,有的系统生产数据,有的系统消费数据。 dataflow 。 dataflow 涉及到的主要问题: 系统失效:网络失效,硬盘失效,[详细]
-
Algorithm学习笔记 --- 寻找 K 大数
所属栏目:[大数据] 日期:2020-12-30 热度:91
Q: 给你一个无序的序列,要你找出第K大的数是什么? Answer: Answer 1: 利用Hash,桶排序等方式,是第一个想到的(编程珠玑中所记) 假设数列中最大数为max,最小数为min,那么首先做一个数组长度为max – min + 1, 然后做散列函数为an – min,对于冲突[详细]
-
7本书从小工到数据分析专家
所属栏目:[大数据] 日期:2020-12-30 热度:81
帮助您的书学数据分析的基础知识,并接近成为在数据分析方面的专家。 在过去的几年里,我读了相当数量的书籍上的数据分析,确定了七个,在我看来,其中最好的。一起,这些书的研究数据分析的基[详细]
-
浅谈大数的进制转换
所属栏目:[大数据] 日期:2020-12-30 热度:56
http://www.voidcn.com/article/p-fpnokpkx-yn.html http://www.cnblogs.com/bhlsheji/p/5104558.html http://www.cnblogs.com/phinecos/archive/2009/09/11/1564975.html[详细]
-
太多选择——企业如何选择合适的BI工具?
所属栏目:[大数据] 日期:2020-12-30 热度:144
文 | keira-杨红 在没认清现状前,企业当然不能一言不合就上BI。 BI不同于一般的企业管理软件,不能简单归类为类似用于提高管理的ERP和WMS,或用于提高企业效率的OA、BPM。BI的本质应该是通过展现数据,用于加强企业各环节的管控,帮助快速制定科学的决策。[详细]
-
[bigdata-016] python happybase 操作hbase
所属栏目:[大数据] 日期:2020-12-30 热度:104
1. 用happybase库 操作 hbase ??? http://happybase.readthedocs.io/en/latest/ 2. cdh集群的hbase集群有三个节点 ??? hbase的版本是HBase 1.2.0 3. hbase base的log目录小于5g,导致报警,目录在/var/log/hbase,准备清空它。 ?? 删除不需要的log之后,所有[详细]
-
22本数据分析、挖掘的好书推荐—绝对干货,不看后悔!
所属栏目:[大数据] 日期:2020-12-30 热度:132
1. 深入浅出 数据分析 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。 难易程度:非常易。 2.啤酒与尿布 通过案例来说事情,而且是最经典的例子。 3.数据之美 一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解[详细]
-
pyhive 连接 Hive 时错误
所属栏目:[大数据] 日期:2020-12-26 热度:117
一、User: xx is not allowed to impersonate xxx' 解决办法:修改 core-site.xml 文件,加入下面的内容后重启 hadoop 。 property namehadoop.proxyuser.xx.hosts/name value*/value/propertyproperty namehadoop.proxyuser.xx.groups/name value*/value/pr[详细]
-
分布式基础通信协议:paxos、totem 和 gossip(转载)
所属栏目:[大数据] 日期:2020-12-26 热度:59
背景: 在分布式中,最难解决的一个问题就是多个节点间数据同步问题。为了解决这样的问题,涌现出了各种奇思妙想。只有在解决了如何进行信息同步的基础之上才衍生出形形色色的应用。这里开始介绍几种分布式通信协议。 简单即有效——totem协议: totem协议也[详细]
-
Hive 导入 parquet 格式数据
所属栏目:[大数据] 日期:2020-12-26 热度:171
Hive 导入 parquet 数据步骤如下: 查看 parquet 文件的格式 构造建表语句 倒入数据 一、查看 parquet 内容和结构 下载地址 社区工具 GitHub 地址 命令 查看结构: java -jar parquet-tools-1.6.0rc3-SNAPSHOT.jar schema -d activity.201711171437.0.parque[详细]

浙公网安备 33038102330457号