数据科学是一个团队游戏,必然需要有些人去把数据收集到一起,有些人去转移这批数据,有些人来分析它们,有些人来把分析的结果和想法大声地告诉世界。
——DJ Patil
美国第一位首席数据科学家
曾任eBay首席架构师和研究科学家
数据时代 智能时代

最新课程

空间计量方法

课程特色

特色

描述

多语言支持

Stata、PythonR

实时交互教学

支持重点内容的交互性教学

丰富的可视化

通过空间可视化来支持教学

大数据支持

提供基于大数据的空间分析演示

论文级应用案例

论文级别案例分析与演示

 

浏览量:643 2021-04-27
统计学习基础

课程特色

 

特色

描述

多语言支持

PythonR

实时交互教学

支持重点内容的交互性教学

大数据支持

采用实时数据和多样化数据

竞赛与应用案例

真实竞赛与实际应用案例分析与演示

浏览量:286 2021-04-27
Python基础入门

Python是一种计算机程序设计语言。你可能已经听说过很多种流行的编程语言,比如非常难学的C语言,非常流行的Java语言,适合初学者的Basic语言,适合网页编程的JavaScript语言等等。

那Python是一种什么语言?

Python 的创史人Guido van Rossum ,1989年在荷兰创造了python,网络流传是因为他喜欢英国肥皂剧《Monty Python 飞行马戏团》,所以用python来命名。语言分为编译型语言和解释型语言,python 是一门解释型语言,何为解释型语言;

编译型语言:c、c++等   解释型语言有:Python、Php等

以下表格是两类语言的优缺点介绍

语言 优点 缺点
解释型语言 可跨平台、开发效率高 运行效率低
编译型语言 依赖编译平台,不能跨平台,开发效率低 运行效率高

比如,完成同一个任务,C语言要写1000行代码,Java只需要写100行,而Python可能只要20行。

所以Python是一种相当高级的语言。

你也许会问,代码少还不好?代码少的代价是运行速度慢,C程序运行1秒钟,Java程序可能需要2秒,而Python程序可能就需要10秒。

那是不是越低级的程序越难学,越高级的程序越简单?表面上来说,是的,但是,在非常高的抽象计算中,高级的Python程序设计也是非常难学的,所以,高级程序语言不等于简单。

 

但是,对于初学者和完成普通任务,Python语言是非常简单易用的。连Google都在大规模使用Python,你就不用担心学了会没用。

浏览量:1363 2021-04-20
Python可视化
数据分析能力是一项非常重要的能力,尤其是在分析股票数据时,挖掘其中的有用信息是成功的必要因素。而数据可视化可谓是秀数据分析能力的最好方式,本章内容主要介绍python的matplotlib模块和seaborn模块,让你的数据分析结果,show出来!
浏览量:1247 2021-04-20
计量经济学

计量经济学是经济金融类研究生必修专业课程之一。课程内容主要包括线性回归分析、时间序列、面板数据模型、反事实因果框架等,旨在培养学生的实证研究能力。课程注重实践,会在课程期间同时教授Python和R在实证研究中的应用。

浏览量:730 2021-04-15
为什么学习数据科学

  从四个方面介绍为什么要学习数据科学:

1、迅速崛起的数据科学与大数据技术;

2、大数据时代下的数据科学人才市场状况 ;

3、大数据驱动的金融科技与管理决策 ;

4、大数据助力区块链

浏览量:490 2021-04-20
数据科学中的R语言

  R语言基础介绍

浏览量:434 2021-04-20
聚类分析

 聚类分析指将物理或抽象对象的集合分组为由类似对象组成的多个类的过程。利用python编程技术将数据对象分类到不同的类或者簇,同一个簇中的数据对象有较大的相似性,不同簇间的数据对象有较大的相异性。聚类分析是数据挖掘的主要任务类型之一,也是其他数据挖掘任务的重要前序分析过程。聚类分析应用场景非常广泛,典型的应用场景有:商业领域客户群划分、互联网文档归类管理、动植物种群分析等。
本课程将介绍典型的聚类分析算法及原理,学习利用python编程对数据对象进行聚类分析及结果展示,介绍并使用sklearn库中的聚类分析方法。

浏览量:423 2021-04-19

优秀案例

2014-2019年高考数据分析与可视化

 本项目使用主要使用Python中的Pandas和Pyecharts工具包,利用2014-2019年中国各省份本科分数线,以及各大学的招生分数线数据,对高考近几年在各省的情况作出分析。

浏览量:1179 2021-04-20
新冠疫情对保险业影响分析及行业发展预测

 2019年末的新冠疫情对中国各行各业均造成了一定的影响,特别是对第二和第三产业的影响更剧烈。本人研究生期间研究方向为保险学,所以想引入2019年和2020年1-5月的数据探讨此次疫情对保险行业的具体影响情况,并对2020年保险行业的发展做出预测分析。

浏览量:611 2021-05-20
深交所上市公信息披露评级的可视化和决策树分析

 本案例基于爬取深圳证券交易所公布的上市公司(包括主板市场、中小板市场和创业板市场上市公司)信息披露评级数据,研究深交所上市公司的信息评级差异以及上市公司的地区分布及结构,同时采用决策树分析地区、企业规模在影响上市公司信息披露评级的作用。

浏览量:345 2021-05-20
二手车交易价格保值率影响因素分析

 (新增变量)二手车的价格保值率 = 二手车报价/汽车原价

 
该新增变量反映了二手车与一手车的价格差距
 
数据预处理部分进行了描述性统计和特征工程
 
剩余部分主要研究了二手车价格保值率主要受哪些因素影响
 
主要方法是可视化分析和使用回归树进行回归分析
浏览量:336 2021-04-20
当前我国保险精算师的薪酬水平和就业前景分析

 本案例基于职位(保险精算师)截面数据(全国数据、地区数据、学历数据)研究当前(2020年7月)我国保险精算师的薪酬水平、就业要求以及发展前景。案例主要包括以下几点:1.全国保险精算师岗位的总体工资分布情况并做出图表直观分析情况。2.不同城市工资分布的情况并做出图表直观分析情况。3.不同学历的分布情况并做出图表直观分析情况。4.观察北上广深对保险精算师职位的需求量。5.做出招聘公司所处行业的词云图分析,让求职者面向相关企业投递简历,尽快获得工作机会。

浏览量:274 2021-05-20
消费者投诉举报咨询信息挖掘分析

 本案例数据包含了12315消费者投诉举报咨询等信息共65535条,本案例旨在研究针对消费者繁杂的投诉数据,将数据进行分类整理,并进行词云可视化的呈现。目的是为了挖掘出繁杂的投诉信息中,消费者主要关注商品的哪些地方,找出消费者在哪方面进行投诉并分析投诉原因。

浏览量:94 2021-04-20
关于员工缺勤时长的因素分析

 21世纪是竞争日益激烈的时代,时间就是金钱,各个公司都对员工的工作时间做了严格要求,员工缺勤不仅会影响了自身的薪资水平,还会间接影响到整个企业的利益。本文使用UCI数据库的缺勤数据集,建立多元回归模型,分析了个体特征、工作压力、生育状况与缺勤时长之间的关系,结果表明:员工的年龄和孩子数量对其缺勤时长有着显著的影响。

浏览量:60 2021-04-20
深圳地区二手车价格分析及预测

 由于二手车市场管理混乱,车辆品质良莠不齐,经常有劣币驱逐良币的情况出现,由于信息不对称的原因,买方和卖方均对价格设定有一定疑惑。本文爬取了深圳地区二手市场的车辆状况和价格,对其进行分析。采用机器学习的线性回归的方法对二手车价格进行预测。然后进行结巴分词,利用pyecharts做了词云。可以得出二手市场网站对于车辆的一些描述。

浏览量:39 2021-04-20

知识锦囊

新手在python中踩得那些坑!
浏览量:6 2021-06-09
单引号or双引号 ?
浏览量:3 2021-06-10
异常点的处理(二)
浏览量:3 2021-06-22
缺失值处理与异常值处理总结
浏览量:3 2021-06-22
jupyter常用快捷键
浏览量:2 2021-06-10
python优势与潜在问题
浏览量:2 2021-06-21
为什么选择python?
浏览量:1 2021-06-09
python如何快速上手?
浏览量:1 2021-06-09

云平台的优势

支持富媒体教学

能够很好地支持文字、图片、视频、音频等富媒体信息,满足教学内容呈现需要

支持不同客户端

用户可以通过电脑、手机、平板上的浏览器访问、创建、编辑内容、以及运行代码

便捷的内容组织形式

一体化管理富媒体信息、代码、数据、实验报告输出等内容,既可用于教学实践,也可用于科学研究

强大的兼容能力

支持Python、R、Stata、MATLAB等数据分析语言及其他多种编程语言内核,支持多种数据导入方式

它解决了什么问题

不受时间地点限制,随时随地学习、实验、记录、协作
可以直接使用,无需配置实验环境,不受本地计算资源限制
集课程内容、数据、实验过程、输出于一体,友好便捷
记录学习过程;积累共享学习资源;拓展改进内容和教学过程