Files
Yangzhuoran Yang dc97b19112 update book
2021-08-08 09:26:20 +08:00

127 lines
4.2 KiB
Plaintext
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: 'R语言数据分析组队学习'
author: "张晋、杨佳达、牧小熊、杨杨卓然、姚昱君"
site: bookdown::bookdown_site
documentclass: book
link-citations: yes
knit: (function(inputFile, ...) {
bookdown::render_book(inputFile, output_format = "all", ...) })
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE,
warning=FALSE,
message=FALSE,
collapse=FALSE,
eval = TRUE,
cache = TRUE)
Sys.setlocale(locale = "Chinese")
```
# 欢迎! {#welcome .unnumbered}
欢迎来到由DataWhale主办的R语言数据分析组队学习课程。
## 贡献者信息 {-}
<!-- | 姓名 | 介绍 | 个人主页 | -->
<!-- | ------ | ------------------------------- | ------------------------------- | -->
<!-- | 张晋 | Datawhale成员算法竞赛爱好者 | https://blog.csdn.net/weixin_44585839/ | -->
<!-- | 杨佳达 | 数据挖掘师Datawhale成员目前在国内某第三方数据服务公司做数据分析挖掘及数据产品 | https://github.com/yangjiada | -->
<!-- | 牧小熊 | 华中农业大学研究生Datawhale成员Datawhale优秀原创作者 | https://www.zhihu.com/people/muxiaoxiong| -->
<!-- | 杨杨卓然 | 混吃等死统计休学穷酸书生 | https://yangzhuoranyang.com | -->
<!-- | 姚昱君 | 悉尼大学Datawhale成员 | https://blog.csdn.net/Yao_June | -->
```{r, echo = FALSE, eval = TRUE}
library(tidyverse)
do.call(tibble::tribble, c(
~姓名, ~介绍, ~个人主页,
"张晋", "Datawhale成员算法竞赛爱好者", "https://blog.csdn.net/weixin_44585839/" ,
"杨佳达", "数据挖掘师Datawhale成员目前在国内某第三方数据服务公司做数据分析挖掘及数据产品", "https://github.com/yangjiada",
"牧小熊", "华中农业大学研究生Datawhale成员Datawhale优秀原创作者", "https://www.zhihu.com/people/muxiaoxiong",
"杨杨卓然", "混吃等死统计休学穷酸书生", "https://yangzhuoranyang.com",
"姚昱君", "悉尼大学Datawhale成员", "https://blog.csdn.net/Yao_June")) %>%
knitr::kable()
```
## 课程简介 {-}
- 课程设计成员:**张晋**、杨佳达、牧小熊、杨杨卓然、姚昱君
- 学习周期16天每天平均花费时间1小时-3小时不等根据个人学习接受能力强弱有所浮动。
- 学习形式:理论学习 + 练习
- 人群定位对数据科学有基本了解希望学习R语言的同学。
- 先修内容:无
- 难度系数:⭐⭐
## 课程大纲 {-}
**Task00熟悉规则与R语言入门1天**
- 安装
- 环境配置
**Task01 数据结构与数据集 3天**
- 编码基础
- 数据类型
- 特殊数据类型
- table like 数据类型
- 加载数据 (csv, rds, excel, Rdata)
- 实例
**Task02 数据清洗与准备 3天**
- 重复值处理
- 缺失值识别与处理
- 异常值识别与处理
- 特征处理
- 规范化与偏态数据
**Task03 基本统计分析 3天**
- 多种方法获取描述性统计量
- 分组计算描述性统计
- 频数表和列联表
- 相关
- 方差分析
**Task04 数据可视化3天**
- ggplot2包介绍
- 散点图
- 直方图
- 柱状图
- 饼状图
- 折线图
- ggplot2扩展包主题
**Task05 模型3天**
- 回归模型
- 分类模型
## 关于 Datawhale {-}
Datawhale 是一个专注于数据科学与AI领域的开源组织汇集了众多领域院校和知名企业的优秀学习者聚合了一群有开源精神和探索精神的团队成员。Datawhale 以 “For the learner和学习者一起成长” 为愿景,鼓励真实地展现自我、开放包容、互信互助、敢于试错和勇于担当。同时 Datawhale 用开源的理念去探索开源内容、开源学习和开源方案,赋能人才培养,助力人才成长,建立起人与人,人与知识,人与企业和人与未来的联结。 本次数据挖掘路径学习,专题知识将在天池分享,详情可关注 Datawhale
```{r, echo = FALSE}
insert_logo <- function(){
knitr::include_graphics("image/logo.png")
}
insert_logo()
```