-
置顶 数据分析入门指导服务
要学习数据分析的时候,我们需要学习Excel、数据可视化、数据库知识、Python和R语言、统计知识、分析思维、业务知识,学会了这些知识才能够做好数据分析工作。 很多同学都倾向自己…
-
Python缺失值预处理——复杂缺失值填补方法
复杂的缺失值填补方法,会考虑到数据的整体情况,然后在对有缺失值的数据进行填充,本小节将会介绍3种复杂的缺失值填补方法。 数据准备 ## 输出高清图像 %config InlineB…
-
【Python-机器学习】数据缺失值的插补:Sciki-Learn VS pandas
常见的数据框缺失数据插补有3种方式: pandas 中简单粗暴的替换取值; pandas 中的 fillna 函数; sklearn 机器学习包中的 Imputer。 经过一番对比…
-
你所应该知道的 A/B 测试 (A/B Test You Should Know)
范叶亮 / 2021-10-17 什么是 A/B 测试 A/B 测试是一种随机测试,将两个不同的东西(即 A 和 B)进行假设比较。A/B 测试可以用来测试某一个变量两个不同版本的…
-
数据分析学习笔记——归因分析
1 什么是归因分析? 在复杂的数据时代,我们每天都会面临产生产生的大量的数据以及用户复杂的消费行为路径,特别是在互联网广告行业,在广告投放的效果评估上,往往会产生一系列的问题: 哪…
-
通过R语言实现基金Brinson归因分析
最近学习了Brinson模型,发现网上关于这方面的资料挺少,所以结合个人学习过程,总结一下如何通过R实现Brinson归因分析。 关于Brinson分析的原理不再说明,网上有一些资…
-
SPSS-Modeler安装
1. 安装SPSS 64位软件包,解压安装安装步骤即可: 链接:https://pan.baidu.com/s/1t48M16ZUdpnfWemceOQc8g 提取码…
-
五个常见客户满意度测评模型
好长时间没写东西了,前段时间一直忙着做客户满意度提升相关的工作,作为一个理论先行派,在开干之前,先了解了一下“别人家的”客户满意度评测模型,今天就把这份资料分享一下。 一、四分图模…
-
MySQL:互联网公司常用分库分表方案汇总!
、数据库瓶颈 不管是IO瓶颈,还是CPU瓶颈,最终都会导致数据库的活跃连接数增加,进而逼近甚至达到数据库可承载活跃连接数的阈值。在业务Service来看就是,可用数据库连接少甚至无…
-
学大数据应该怎么入门 — 大数据学习之路
前置知识 编程语言 至少应该掌握一门编程语言,计算机专业的同学大多学的第一门编程语言是 C 语言,然后再学 Java 语言,对于零基础的同学,可直接学习 Java 语言,至少应该把…
-
普华永道全息图解机器学习
普华永道三年前推出了一系列机器学习图解,无奈网上流传的图都不清晰,自己从网上找到了清晰版,配合文字再整理下。 一、机器学习概览 什么是机器学习? 机器通过分析大量数据来进行学习。比…
-
23张图,带你入门推荐系统
做广告业务1年多时间了,但是平时的工作主要和广告工程有关,核心的广告算法由 AI 部门支持,对我们而言可以说是「黑盒般」的存在,只需要对训练好的模型进行调用即可。 近期,我打算系统…
-
SQL Server 2019 安装教程(详细免费,自定义安装)
一、下载安装SQL: 1、下载SQL Server 2019 Developer 官方网址: https://www.microsoft.com/zh-cn/sql-server/…
-
DAX基础入门 – 30分钟从SQL到DAX — PowerBI 利器
有没有面对着稀奇古怪的DAX而感到有点丈八金刚摸不着头脑或者干瞪眼?! 有没有想得到某个值想不出来DAX怎么写而直跳脚!? 看完这篇文章,你会恍然大悟,捂脸偷笑。呼呼呼~ &nbs…
-
networkx:一款构建图网络可视化的 Python 工具包!
作者:俊欣,链接:Python社交网络可视化 我们平常都会使用很多的社交媒体,有微信、微博、抖音等等,例如在微博上面,我们会关注某些KOL,同时自己身边的亲朋好友等等也会来关注我们…
-
一文带你了解DAX Studio
DAX在使用上可以分为两大类,一类以DAX计算为核心,另一类以DAX查询为核心,本文主要介绍的就是DAX 查询。而DAX Studio,其主要就是用于DAX代码的编辑和查询。 下面…
-
超详细!Python 制作一个优雅的词云其实特简单!
文:酷头 来源:印象python 什么是词云 “词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”。从而过滤掉大量的文本信息,使浏览…
-
连续随机变量的熵
信息论中的熵对于离散的随机变量是比较直观的,也就是信息量的数学期望,具体来说,就是: (1) 但是对于连续的随机变量,熵的概念就要复杂得多,这篇文章来探讨一下。 现实世界中有很多…
-
手把手教你使用 Python 做 LDA 主题提取和可视化
前言 信息时代的高速发展让我们得以使用手机、电脑等设备轻松从网络上获取信息。但是,这似乎也是一把双刃剑,我们在获取到众多信息的同时,又可能没有太多时间去一一阅读它们,以至于“收藏从…
-
使用gensim 框架 实现 LDA主题模型
0、原理 LDA文档主题生成模型,也称三层贝叶斯概率模型,包含词、主题和文档三层结构。gensim流程如图所示: 整体过程就是:首先拿到文档集合,使用分词工具进行分词,得到词组序列…
- 点击查看更多